172 9 6MB
German Pages 260 Year 2006
Linguistische Arbeiten
503
Herausgegeben von Peter Blumenthal, Gereon Mller, Ingo Plag, Beatrice Primus, Klaus von Heusinger und Richard Wiese
Martina Penke
Flexion im mentalen Lexikon
Max Niemeyer Verlag Tbingen 2006
n
Fr Eva Lilli, die Sprachforscherin
Bibliografische Information der Deutschen Bibliothek Die Deutsche Bibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet ber http://dnb.ddb.de abrufbar. ISBN 13 978-3-484-30503-8 ISBN 10 3-484-30503-7
ISSN 0344-6727
) Max Niemeyer Verlag, Tbingen 2006 Ein Unternehmen der K.G. Saur Verlag GmbH, Mnchen http://www.niemeyer.de Das Werk einschließlich aller seiner Teile ist urheberrechtlich geschtzt. Jede Verwertung außerhalb der engen Grenzen des Urheberrechtsgesetzes ist ohne Zustimmung des Verlages unzul:ssig und strafbar. Das gilt insbesondere fr Vervielf:ltigungen, ;bersetzungen, Mikroverfilmungen und die Einspeicherung und Verarbeitung in elektronischen Systemen. Printed in Germany. Gedruckt auf alterungsbest:ndigem Papier. Druck: Laupp & G@bel GmbH, Nehren Einband: N:dele Verlags- und Industriebuchbinderei, Nehren
Danksagung
Das Sammeln und Auswerten der Daten, auf denen dieses Buch beruht, und das Schreiben dieses Buches haben sich über einige Jahre erstreckt. Während dieser Jahre haben viele daran teilgehabt, die Fertigstellung dieser Arbeit jeweils ein Stückchen weiter voranzubringen. Zuerst zu nennen ist die DFG, die von 1997 bis 2002 mein Forschungsprojekt „Neurolinguistische Untersuchungen zur Flexionsmorphologie“ im Sonderforschungsbereich „282 Theorie des Lexikons“ finanzierte und es mir so ermöglichte, mit Ulrike Janssen, Marion Krause, Claudia Hegenscheidt, Eva Neuhaus und Oliver Saueressig ausgezeichnete Mitarbeiterinnen und Mitarbeiter einzustellen, die durch ihre Arbeit dieses Buch letztlich überhaupt erst ermöglicht haben. Mein Dank gilt auch Harald Clahsen, Sonja Eisenbeiss, Janet Grijzenhout, Peter Indefrey, Thomas Münte, Gert Westermann und Helga Weyerts für die gemeinsam durchgeführten Untersuchungen und anregenden Diskussionen. Sehr profitiert habe ich auch von Lilo Fielenbach, Ingo Plag, Albert Ortmann, Anette Rosenbach, Carsten Steins und Barbara Stiebels, die stets bereit waren, mir mit ihren Fachkenntnissen auszuhelfen. Sie alle haben das Ihre getan, an meinen Irrtümern haben sie keinerlei Anteil. Besonders anregend waren für mich stets die Kommentare von Dieter Wunderlich. Insbesondere seine über die Jahre behutsam dosierten, immer leicht spöttischen Bemerkungen haben meine Sicht auf die Psycho- und Neurolinguistik geprägt. Zu Dank verpflichtet bin ich ihm aber auch für die Großzügigkeit, mit der er mir in meiner Arbeit immer freie Hand ließ. Mein besonderer Dank gilt den Teilnehmern der von uns durchgeführten Untersuchungen für ihre vertrauensvolle und immer bereitwillige Mitwirkung an unseren – meist nicht sehr interessanten – Experimenten. Danken möchte ich auch denjenigen, die wertvolle Hilfe bei der Vermittlung von Versuchsteilnehmern oder der Bereitstellung von Untersuchungsräumen für die Durchführung der Experimente leisteten. Hier sind insbesondere Rüdiger Seitz von der MNR-Klinik der Universität Düsseldorf, Rudi Koch von der Aphasiker Selbsthilfegruppe Köln, Frau Achterwinter von der Williams-Beuren Selbsthilfegruppe Hilden, Achim Winkelmann von der Lehranstalt für Logopädie Köln, Ursula Schädler von der neurologischen Rehabilitationsklinik Burg Landshuth sowie die logopädischen Praxen Helfert und Fröling-Jendro zu nennen. Auf dem letzten Wegstück der Fertigstellung dieses Arbeit haben mir schließlich Alexandra Kiefer beim Layout und der Erstellung Pdf-kompatibler Graphiken, Katrin Schrader bei der Literatursuche und –beschaffung sowie Klaus Fielenbach und Nicole Altvater-Mackensen beim Korrekturlesen wertvolle Hilfe geleistet. Die ganze Wegstrecke konnte ich jedoch nur bewältigen, weil mir die Unterstützung und Geduld meiner Familie immer sicher war. Danke!
Inhalt
Liste der Abbildungen und Tabellen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . IX 1 Einleitung: Flexion – ein kontroverser Gegenstand . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 1.1 Kontroversen zur Repräsentation der Flexion. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 1.1.1 Berechnung oder Speicherung? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 1.1.2 Flexion zwischen Lexikon und Syntax . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 1.1.3 Berechnungs- und Speicherökonomie. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 1.2 Zum Verhältnis von theoretischer Linguistik und Psycho-/Neurolinguistik . . . . . . 15 1.3 Einführung in die relevanten Bereiche der deutschen Flexion. . . . . . . . . . . . . . . . . . 17 2 Methoden zur Erforschung des mentalen Lexikons . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.1 Psycholinguistische Verfahren. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.1.1 Off-line Verfahren – Elizitation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.1.2 On-line Verfahren – Reaktionszeitexperimente . . . . . . . . . . . . . . . . . . . . . . . . 2.1.2.1 Frequenzeffekt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.1.2.2 Priming-Effekt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.1.2.3 Ungrammatikalitätseffekt. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.1.3 Zusammenfassung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2 Bildgebende Verfahren der Neurolinguistik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2.1 Ereigniskorrelierte Potentiale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2.2 Positronenemissionstomographie und funktionelle Magnetresonanz-. . . . . . . tomographie 2.3 Die Untersuchung selektiver Defizite bei Sprachstörungen . . . . . . . . . . . . . . . . . . . .
23 23 23 25 26 28 31 32 33 34 38
3 Assoziative Netze – Speicherstrukturen für flektierte Formen. . . . . . . . . . . . . . . . . . . . . . 3.1 Die U-Kurve im Flexionserwerb . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.2 Frequenzeffekte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.3 Phonologische Ähnlichkeitseffekte. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.4 Ein alternatives Modell zur Erfassung der Familienähnlichkeit . . . . . . . . . . . . . . . . 3.5 Zur neuronalen Repräsentation assoziativ gespeicherter Wörter. . . . . . . . . . . . . . . .
51 51 57 64 73 76
4 Unterschiede zwischen regulär und irregulär flektierten Formen . . . . . . . . . . . . . . . . . . . 4.1 Experimentelle Befunde zur Distinktion von regulärer und irregulärer Flexion . . . . 4.1.1 Für regulär flektierte Formen zeigen sich keine Frequenzeffekte . . . . . . . . . 4.1.2 Für regulär flektierte Formen zeigen sich keine phonologischen. . . . . . . . . . Ähnlichkeitseffekte 4.1.3 Für regulär flektierte Formen zeigt sich ein Dekompositionseffekt . . . . . . . 4.1.4 Für regulär flektierte Formen zeigen sich Morphemgrenzeffekte . . . . . . . . . 4.1.5 Regulär und irregulär flektierte Formen sind neuronal distinkt . . . . . . . . . . . repräsentiert
81 82 82 88
43
90 92 93
VIII 4.1.6 Regulär und irregulär flektierte Formen sind selektiv störbar . . . . . . . . . . . 4.1.6.1 Selektive Beeinträchtigungen der regulären Flexion . . . . . . . . . . . 4.1.6.2 Selektive Beeinträchtigungen der irregulären Flexion . . . . . . . . . . 4.1.7 Zusammenfassung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.2 Die Debatte zwischen Symbolisten und Konnektionisten . . . . . . . . . . . . . . . . . . . . 4.2.1 Der Aufbau konnektionistischer neuronaler Netze. . . . . . . . . . . . . . . . . . . . . 4.2.2 Der Wettstreit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.2.3 Eine aktuelle Kontroverse - die Simulation selektiver Schädigungen. . . . . 4.2.4 Pros und Kontras – die Diskussion um konnektionistische Netze . . . . . . . . 4.2.5 Zusammenfassung und Diskussion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
101 102 107 112 113 114 116 119 124 132
5 Affixeinträge . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.1 Haben Affixe lexikalische Einträge? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.1.1 Theoretische Kontroversen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.1.2 Psycho- und neurolinguistische Evidenz für Affixeinträge. . . . . . . . . . . . . . 5.2 Wie sehen Affixeinträge aus? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.2.1 Input-Spezifizierung. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.2.2 Unterspezifikation morphosyntaktischer Merkmale. . . . . . . . . . . . . . . . . . . . 5.3 Ordnungsstrukturen für Affixe. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.3.1 Repräsentation der Subjekt-Verb-Kongruenzflexion des Deutschen . . . . . 5.3.2 Empirische Befunde zur Organisation von Flexionsaffixen . . . . . . . . . . . . . 5.4 Zusammenfassung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
137 137 137 142 147 147 154 160 160 166 179
6 Neuroanatomische Lokalisation der Flexion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.1 Eine kurze Einführung in Anatomie und funktionale Organisation des Gehirns . . . 6.2 Ein Vorschlag zur Lokalisation der Flexion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.3 Evidenz gegen die von Ullman vorgeschlagene Lokalisationstheorie . . . . . . . . . . 6.3.1 Bildgebende Studien zeigen widersprüchliche Ergebnisse . . . . . . . . . . . . . . 6.3.2 Broca-Aphasie ohne selektives Defizit der regulären Flexion . . . . . . . . . . . 6.4 Was unterscheidet englischsprachige Broca-Aphasiker von anderen? . . . . . . . . . . 6.5 Zusammenfassung und Diskussion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
181 181 183 190 190 195 200 206
7 Erwerb und Repräsentation der Flexion im mentalen Lexikon – eine Skizze . . . . . . . . 209 Literatur. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 223
Liste der Abbildungen und Tabellen
Tab. 1.1:
Traditionelles Paradigma der Subjekt-Verb-Kongruenzflexion . . . . . . . . . . . . 20
Abb. 2.1:
Experimentelles Design bei einer auditiven lexikalischen Entscheidungs- . . 27 aufgabe
Abb. 2.2:
Frequenzeffekt bei deutschen -er-Pluralen (nach Penke & Krause 2002) . . . 28
Abb. 2.3:
Priming-Effekt bei -s-Pluralen (nach Sonnenstuhl, Eisenbeiss & . . . . . . . . . . 30 Clahsen 1999)
Abb. 2.4:
Experimentelles Design bei einem crossmodalen priming-Experiment . . . . . 30 (Sonnenstuhl, Eisenbeiss & Clahsen 1999)
Abb. 2.5:
Experimentelles Design bei einer Satzpaar-Vergleichsaufgabe . . . . . . . . . . . . 31
Abb. 2.6:
Ungrammatikalitätseffekt bei Verletzung der nominalphraseninternen . . . . . 32 Kongruenz (nach Penke, Janssen & Eisenbeiss 2004)
Abb. 2.7:
Schematische Darstellung einer N400 auf semantisch passende bzw. . . . . . . 36 unpassende Satzvervollständigungen
Abb. 2.8:
LAN bei starken Verben mit regulärem Partizipsuffix (nach Penke et al. . . . 37 1997)
Abb. 2.9:
Vorgehen bei der Erstellung gemittelter Differenzbilder. . . . . . . . . . . . . . . . . . 41 (Raichle 1994: 59)
Abb. 3.1:
U-förmige Verlaufskurve der Korrektheitswerte für irreguläre past tense . . . 53 Formen
Abb. 3.2:
U-förmige Verlaufskurve korrekt flektierter Partizipformen starker . . . . . . . . 54 Verben für Eva im Beobachtungszeitraum zwischen 1;6 und 2;0
Abb. 3.3:
Übergeneralisierungsrate und Verwendungshäufigkeit irregulärer . . . . . . . . . 56 Partizipien in Abhängigkeit von ihrer Frequenz (nach den Angaben in Weyerts 1997)
Tab. 3.1:
Frequenzverteilung und Reaktionszeiten für irreguläre Partizipien . . . . . . . . . 58 (nach Clahsen, Eisenbeiss & Sonnenstuhl 1997)
Tab. 3.2:
Frequenzverteilung (Partizip- und Lemmafrequenz) und Reaktionszeiten. . . 59 für irreguläre Partizipien (nach Clahsen, Eisenbeiss & Sonnenstuhl 1997)
Abb. 3.4:
Frequenzverteilung und Reaktionszeiten für irreguläre Partizipien . . . . . . . . . 59 (nach Clahsen, Eisenbeiss & Sonnenstuhl 1997)
Tab. 3.3:
Frequenzverteilung der Verben im Testmaterial von Penke, Janssen . . . . . . . 60 & Krause (1999)
Abb. 3.5:
Frequenzverteilung der Suffixfehler bei irregulären Partizipien. . . . . . . . . . . . 61 (nach Penke, Janssen & Krause 1999)
X Abb. 3.6:
Korrelation zwischen Partizipfrequenz und Fehlerrate für starke. . . . . . . . . . . 62 Verben in den Daten agrammatischer Broca-Aphasiker
Tab. 3.4:
Frequenzverteilung für zehn irreguläre Partizipien im Testmaterial . . . . . . . . 62 von Penke, Janssen & Krause (1999).
Abb. 3.7:
Frequenzverteilung und Fehlerraten für zehn starke Verben. . . . . . . . . . . . . . . 63
Abb. 3.8:
Lexikalische Verbindungen der past tense Formen eines Teils der . . . . . . . . . 67 strung-Klasse (nach Bybee 1988: 135)
Tab. 3.5:
Rate der nach Schema produzierten bzw. regulär flektierten Partizip- . . . . . . 69 formen für reimende und nicht-reimende Kunstverben
Abb. 3.9:
Verlauf der Fehlerrate in Abhängigkeit von der Anzahl irregulärer . . . . . . . . 71 Reimwörter
Abb. 3.10: Verlauf der Fehlerrate in Abhängigkeit von der aufsummierten . . . . . . . . . . . 72 Partizipfrequenz der irregulären Reimwörter Tab. 4.1:
Wort- und Pluralfrequenzen für die getesteten Pluraltypen. . . . . . . . . . . . . . . . 83 (nach Penke & Krause 2002)
Abb. 4.1:
Reaktionszeiten für reguläre (-s) und irreguläre (-er, -nnonfem). . . . . . . . . . . . . . 84 deutsche Pluralformen (nach Penke & Krause 2002)
Tab. 4.2:
Frequenzverteilung der regulären Verben im Testmaterial von Penke,. . . . . . 85 Janssen & Krause (1999)
Abb. 4.2:
Frequenzverteilung der Suffixfehler aphasischer Sprecher bei irregu- . . . . . . 86 lären und regulären Partizipien (nach Penke, Janssen & Krause 1999)
Abb. 4.3:
EKPs bei korrekt und inkorrekt flektierten irregulären und regulären. . . . . . . 95 Partizipien an der Elektrodenposition F7 (nach Penke et al. 1997)
Abb. 4.4:
EKPs für mit -n bzw. mit -s flektierte korrekte und inkorrekte Plural- . . . . . . 97 formen an den Elektrodenpositionen F7 und Cz (nach Weyerts et al. 1997)
Abb. 4.5:
Fehlerraten für -s-Plurale im Vergleich zu anderen Nominalpluralen . . . . . . 104
Abb. 4.6:
Fehlerraten für reguläre und irreguläre Partizipien und Nominalplurale. . . . 106 bei zehn deutschsprachigen Patienten mit Morbus Parkinson
Abb. 4.7.
Fehlerraten bei der Produktion regulärer und irregulärer Partizipien . . . . . . 109 (nach Penke, Janssen & Krause 1999)
Tab. 4.3:
Ergebnisse für reguläre und irreguläre Partizipien bei deutschsprachigen . . 111 Jugendlichen mit Williams Syndrom und Kontrollkindern (nach Penke & Krause 2004)
Abb. 4.8:
Skizze eines neuronalen Netzes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115
Abb. 4.9:
Architektur des konnektionistischen Netzes von Westermann zu Beginn . . 118 der Lernphase
XI Abb. 4.10: Die Entwicklung der internen Schicht in Westermanns konstruktivis- . . . . . 119 tischem Netzwerkmodell Abb. 4.11: Leistungen des konstruktivistischen Netzes Westermanns bei der. . . . . . . . . 123 Produktion deutscher Partizipien in Simulationen mit globaler Schädigung des Netzes Abb. 4.12: Schematische Darstellung des peak-shift-Effekts (nach Mackintosh 1997) . . 130 Tab. 5.1:
Beispiel des Stimulusmaterials von Clahsen et al. (2001) . . . . . . . . . . . . . . . . 142
Tab. 5.2:
Reaktionszeiten im lexikalischen Entscheidungstest von Clahsen. . . . . . . . . 143 et al. (2001)
Abb. 5.1:
Korrelation zwischen Affix-Frequenz und durchschnittlichen Fehler- . . . . . 146 raten agrammatischer Broca-Aphasiker für fünf reguläre Flexionsaffixe des Deutschen
Tab. 5.3:
Mittlere CELEX-Frequenz der getesteten -n-Plurale (nach Penke & . . . . . . 149 Krause 2002)
Abb. 5.2:
Fehlerraten für -nnonfem und -nfem-Plurale bei Broca-Aphasikern . . . . . . . . . . . 150 (Penke & Krause 2002)
Abb. 5.3:
Frequenzverteilung der Fehler bei Pluralen auf -nnonfem und -nfem . . . . . . . . . . 150 (Penke & Krause 2002)
Tab. 5.4:
Wort- und Pluralfrequenzen für die getesteten -n-Plurale (nach Penke. . . . . 151 & Krause 2002)
Abb. 5.4:
Frequenzeffekte für vier deutsche Pluralformen (nach Penke & . . . . . . . . . . 152 Krause 2002)
Abb. 5.5:
Reaktionszeiten für korrekt und inkorrekt flektierte Adjektive . . . . . . . . . . . 157 (nach Penke, Janssen & Eisenbeiss 2004)
Tab. 5.5:
Traditionelles Paradigma der Subjekt-Verb-Kongruenzflexion . . . . . . . . . . . 161
Abb. 5.6:
Reaktionszeiten für korrekt und inkorrekt flektierte Artikel . . . . . . . . . . . . . . 167 (nach Penke, Janssen & Eisenbeiss 2004)
Abb. 5.7:
Darstellung der Kongruenzfehler agrammatischer Broca-Aphasiker im. . . . 170 Paradigma der Kongruenzflexion des Deutschen
Abb. 5.8
Organisation der Affixe der Subjekt-Verb-Kongruenzflexion des. . . . . . . . . 172 Deutschen in einem Vererbungsbaum
Abb. 5.9
Eine alternative Vererbungsbaumrepräsentation . . . . . . . . . . . . . . . . . . . . . . . . 172
Abb. 5.10: Darstellung der Kongruenzfehler agrammatischer Broca-Aphasiker in . . . . 173 den vorgeschlagenen Vererbungsbaummodellen Abb. 5.11: Prozentualer Anteil der korrekten Verwendungen von unmarkierten . . . . . . 175 sowie mit -t und -n markierten Verbformen in Kontexten für diese Verbformen in den Längsschnittdaten von Simone
XII Abb. 5.12: Erwerbsreihenfolge der Affixe der Subjekt-Verb-Kongruenz . . . . . . . . . . . . 177 Abb. 6.1:
Skizze einiger relevanter Kortexareale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 183
Abb. 6.2:
Ergebnisse der Untersuchungen von Ullman et al. (1997, 2005) für . . . . . . . 184 die Aphasiker FCL und JLU
Abb. 6.3:
Lokalisation der Hirnläsionen bei den Patienten FCL und JLU . . . . . . . . . . . 185
Abb. 6.4:
Prozentanteil korrekt produzierter regulärer und irregulärer Partizipien. . . . 196 bei deutschen und niederländischen Broca-Aphasikern
Abb. 7.1:
Skizze der Entstehung von Flexionsschemata innerhalb der starken. . . . . . . 212 Verben des Deutschen
Abb. 7.2:
Skizze der Entstehung von Flexionsschemata innerhalb der schwachen . . . 214 Verben des Deutschen
1 Einleitung: Flexion – ein kontroverser Gegenstand
Wie flektierte Wörter zu repräsentieren sind, hat wie kaum eine andere Frage Kontroversen sowohl in der theoretischen Linguistik als auch in der Psycholinguistik sowie in den Kognitionswissenschaften ausgelöst. Kontroversen haben sich dabei unter anderem an folgenden Fragestellungen entzündet: Werden flektierte Formen durch Anwendung einer Berechnungsoperation (wie etwa einer Flexionsregel) gebildet oder sind sie als flektierte Formen im mentalen Lexikon gespeichert? Was ist ökonomischer: die Speicherung flektierter Formen oder ihre Berechnung? Sind Operationen, die abstrakte Symbole manipulieren, wie beispielsweise Flexionsregeln der Art ‚V + -ed → past tense’, überhaupt Teil unserer Kognition? Wie und wo sind Flexionsaffixe in der Grammatik repräsentiert: Haben sie eigenständige Einträge im mentalen Lexikon, oder ist Flexion gar nicht im Lexikon, sondern an der Schnittstelle zwischen Syntax und Phonologie anzusiedeln, in der morphosyntaktische Merkmale phonologisch ausbuchstabiert werden? Welche Informationen sind in Affixeinträgen aufgeführt und wie sind Affixeinträge im mentalen Lexikon organisiert? Welchen Organisationsprinzipien folgt die Speicherung flektierter Wörter? Wie wird Flexion erworben und wie und wo ist Flexion im menschlichen Gehirn lokalisiert? Als Folge dieser Diskussionen hat sich in der theoretischen Linguistik das traditionelle Bild von mentalem Lexikon als einem unstrukturierten Speicher idiosynkratischer Informationen und Grammatik, der Regelkomponente, mit der die Einheiten des Lexikons zu komplexen Wörtern oder Phrasen kombiniert werden können (z.B. Bloomfield 1933, Chomsky 1965 sowie den Überblick in Aronoff 2000), gewandelt. Zudem haben psycho- und neurolinguistische Untersuchungen in den letzten 20 Jahren eine Fülle an Erkenntnissen zur Repräsentation, zur Verarbeitung, zum Erwerb und zur neuronalen Lokalisation flektierter Wörter geliefert. Ziel dieses Buchs ist es, die oben angerissenen Kontroversen zu erläutern und die Erkenntnisse, die in so verschiedenen Disziplinen wie der theoretischen Linguistik, der Psycholinguistik, der Neuro- und klinischen Linguistik sowie der Computerlinguistik gewonnen wurden, zusammenzutragen. Theoretische und experimentelle linguistische Disziplinen werden zuweilen als völlig unabhängig voneinander angesehen. Während sich die theoretische Linguistik mit der Erforschung der menschlichen Sprachkompetenz, der language faculty im Chomskyschen Sinn (Chomsky 1980a, b, 2002), beschäftigt, wird als Gegenstand der experimentellen Disziplinen wie der Psycho- und Neurolinguistik die Untersuchung der Vorgänge bei der Sprachverarbeitung, dem language processing, gesehen. Dementsprechend werden Ergebnisse der Neuro- und Psycholinguistik in der theoretischen Linguistik häufig als irrelevant angesehen, da diese nur die Sprachverarbeitung erfassten. Umgekehrt wird theoretischen Arbeiten in den experimentellen Disziplinen die Relevanz mit dem Argument abgesprochen, die dort postulierten theoretischen Konstrukte hätten keine psychologische Realität, d.h. sie hätten keinen Bezug zu den realen Sprachverarbeitungsprozessen in der Kognition und den Gehirnen von Sprechern und Hörern. Die wechselseitige Ignoranz, die aus diesen Argumenten spricht, ist meiner Auffassung nach jedoch nicht berechtigt. Das Ziel jeder wissenschaftlichen Forschung – sei sie theoretisch oder experimentell – ist, die Realität zutreffend zu erfassen (siehe dazu auch Abschnitt 1.2). Dabei erweisen sich die Erkennt-
2 nisse der theoretischen und experimentellen Disziplinen als füreinander unmittelbar relevant. Die in der Psycho- und Neurolinguistik entwickelten Untersuchungsparadigmen ermöglichen es, Vorhersagen theoretischer Modelle experimentell zu überprüfen. Die mit diesen Methoden gewonnenen Erkenntnisse erlauben es, theoretische Modelle zu widerlegen, zu bestätigen oder in kritischen Punkten zu modifizieren. Das Ziel, zu zutreffenden Vorstellungen über die Repräsentation der Flexion zu kommen, kann nur erreicht werden, wenn alle vorliegenden Erkenntnisse – seien sie durch theoretische Überlegungen oder Experimente gewonnen – berücksichtigt und zu einem Gesamtbild integriert werden. Mit den Worten Chomskys: „Approaching the topic as in the sciences, we will look for all sorts of evidence. [...] evidence can be found from studies of language acquisition and perception, aphasia, sign language, electrical activity of the brain, and who knows what else.“ (Chomsky 1994: 205)
Dementsprechend soll in diesem Buch eine Brücke zwischen Modellen der theoretischen Linguistik einerseits und Ergebnissen der experimentellen linguistischen Disziplinen andererseits geschlagen werden. Die mittlerweile in den verschiedenen linguistischen Disziplinen erzielten Erkenntnisse über Speicherungsmodalitäten und Verarbeitungsmechanismen, über lexikalische Organisationsstrukturen, ihren Erwerb, ihre Schädigung bei neurologischen Störungen sowie über mögliche Lokalisationsorte im Gehirn sollen dabei zu einem Gesamtbild der mentalen und neuronalen Repräsentation der Flexion integriert werden und so zu unserem Verständnis von Flexion als einer grammatischen Leistung, die im Gehirn beheimatet ist, beitragen. Die folgenden Abschnitte der Einleitung geben einen ersten Überblick über die wissenschaftlichen Kontroversen, die sich am Gegenstandsbereich der Flexion entzündet haben und die im Laufe dieses Buchs thematisiert werden sollen. Phänomene der englischen Flexion stehen und standen bei diesen Diskussionen im Mittelpunkt. Allerdings ist die Flexionsmorphologie im Englischen nicht nur sehr stark reduziert, sie weist auch Besonderheiten, z.B. bei der Frequenzverteilung regulär und irregulär flektierter Formen, auf, die sich bei der Klärung der oben angesprochenen Kontroversen als problematisch erwiesen haben (siehe 1.3). Da deutsche Flexionssysteme sich bei aller Ähnlichkeit zur englischen Flexion in relevanten Punkten vom Englischen unterscheiden, sind insbesondere die deutsche Partizip- und nominale Pluralflexion, die in Abschnitt 1.3 kurz erläutert werden, in den Fokus der Forschung geraten. Experimentelle Untersuchungen zur deutschen Flexion haben es nicht nur ermöglicht, strittige Fragen zur mentalen und neuronalen Repräsentation der Flexion zu klären. Studien zur Flexionsmorphologie des Deutschen – beispielsweise zu ihrer neuronalen Lokalisation (siehe Kap. 6) – haben auch dazu geführt, dass Forschungsergebnisse, die insbesondere am System der englischen past tense Flexion gewonnen wurden, in entscheidender Weise modifiziert werden müssen. Bevor in den nachfolgenden Kapiteln des Buchs die angesprochenen Kontroversen und relevanten Forschungsergebnisse erläutert werden, möchte ich in Kapitel 2 zunächst einen Überblick über die wichtigsten methodischen Verfahren geben, die in psycho- und neurolinguistischen Untersuchungen zur Flexionsmorphologie eingesetzt wurden und werden. Die nachfolgenden Kapitel 3 bis 6 stellen anschließend dar, welche Erkenntnisse mit diesen Verfahren über die mentale und neuronale Repräsentation der Flexionsmorphologie gewonnen werden konnten.
3 Kapitel 3 erläutert anhand von Ergebnissen zum Erwerb, zur Verarbeitung und zur Beeinträchtigung irregulärer past tense Formen des Englischen und irregulärer Partizipien des Deutschen, welchen Organisationsprinzipien die Speicherung flektierter Wörter folgt, und stellt ein Modell zur neuronalen Repräsentation flektierter Wörter vor. Die Frage, ob nicht nur regulär, sondern auch irregulär flektierte Formen gespeichert sind, war in den letzten 20 Jahren ein zentraler Gegenstand sowohl psycho- und neurolinguistischer Untersuchungen als auch konnektionistischer Computersimulationen. Eine Vielzahl von Untersuchungsergebnissen, die mit verschiedenen psycho- und neurolinguistischen Verfahren gewonnenen wurden, legen nahe, dass regulär flektierte Wörter, anders als irregulär flektierte Formen, generell nicht als Vollformen im mentalen Lexikon gespeichert sind, sondern durch eine Affigierungsoperation gebildet werden. Symbolmanipulierende Operationen der Art ‚V + -ed → past tense’, die die Affigierung eines Flexivs an eine Instanz einer bestimmten Wortkategorie vorsehen, werden in der antisymbolistischen Richtung des Konnektionismus abgelehnt. Stattdessen werden in solchen antisymbolistischen konnektionistischen Modellen sowohl regulär als auch irregulär flektierte Formen in einer assoziativen Netzwerkstruktur gespeichert. Kapitel 4 gibt einen Überblick über die psycho- und neurolinguistischen Befunde, die für eine qualitative Distinktion zwischen regulär und irregulär flektierten Formen sprechen, und skizziert die zwischen Konnektionisten und Psycho- bzw. Neurolinguisten wogende Diskussion, ob die Befunde zu Erwerb, Verarbeitung und insbesondere zu Sprachstörungen im Bereich der Flexionsmorphologie in antisymbolistischen konnektionistischen Modellen adäquat simuliert werden können. Tatsächlich gibt es konnektionistische Modelle, die die vorliegenden Daten durchaus simulieren können. Ein besonderes Verdienst des Konnektionismus liegt gerade darin, gezeigt zu haben, wie erfolgreich einfache assoziative Lernprozeduren sein können. Ob antisymbolistische konnektionistische Netzwerke die vorhandenen psycho- und neurolinguistischen Daten simulieren können, ist eine empirische Frage, die entgegen der Auffassungen von Pinker (1999) oder Clahsen (1999) noch nicht entschieden ist. Der Konnektionismus lässt sich daher wohl nicht auf der Basis einzelner Simulationen zurückweisen, die durch neuere und erfolgreichere ersetzt werden können. Es ist vielmehr die antisymbolistische Position des Konnektionismus, die sich meiner Ansicht nach in entscheidender Hinsicht als inadäquat erweist. Wenn reguläre Formen nicht gespeichert sind, sondern durch Affigierung gebildet werden, stellt sich die Frage, wie Flexionsaffixe in der Grammatik repräsentiert sind. Diese Frage wird in der theoretischen Linguistik sehr kontrovers diskutiert. Die Diskussion dreht sich dabei beispielsweise um die Frage, ob auch Affixe lexikalische Einträge haben oder ob regulär flektierte Formen durch die Anwendung von Flexionsregeln gebildet werden, die phonologisches Material ohne eigenständigen lexikalischen Status hinzufügen. Auf der Basis psycho- und neurolinguistischer Befunde werde ich in Kapitel 5 dafür argumentieren, dass Affixe lexikalische Einträge haben. Wie diese Affixeinträge aussehen und in welchen Ordnungsstrukturen Affixe im mentalen Lexikon organisiert sind, ist der weitere Gegenstand dieses Kapitels. Eine ökonomische Repräsentation der Lexikoninformation erweist sich dabei als zentral. In der jüngsten Zeit ist ein Vorschlag von Michael Ullman (vgl. Ullman 2001, 2004) zur neuroanatomischen Lokalisation regulär und irregulär flektierter Formen auf großes Interesse gestoßen. Diesem Vorschlag zufolge spielt bei der Produktion und Verarbeitung regulär flektierter Formen das links-hemisphärische Broca-Areal eine entscheidende Rolle, wäh-
4 rend irregulär flektierte Wörter in temporo-parietalen Kortexarealen gespeichert sind. Kapitel 6 überprüft diese Hypothese Ullmans auf der Basis der Erkenntnisse, die in bildgebenden Verfahren und Patientenstudien gewonnen wurden. Insbesondere der Vergleich der an englischsprachigen Broca-Aphasikern gewonnenen Daten Ullmans mit den Daten deutschsprachiger Broca-Aphasiker zeigt jedoch, dass die von Ullman vorgeschlagene Lokalisation der regulären Flexion nicht haltbar ist. Die selektive Beeinträchtigung regulär flektierter Wörter, die bei englischsprachigen Broca-Aphasikern auftritt, scheint vielmehr eine sprachspezifische Ausprägung der aphasischen Sprachstörung zu sein. Auf der Basis der in den Kapiteln 3 bis 6 diskutierten Ergebnisse und Überlegungen skizziert Kapitel 7 einen Vorschlag, wie Flexion im mentalen Lexikon repräsentiert ist und wie diese Repräsentationen erworben werden können.
1.1
Kontroversen zur Repräsentation der Flexion
1.1.1 Berechnung oder Speicherung? Eine erste zentrale Kontroverse, die sowohl die theoretische Linguistik als auch die Psycholinguistik sowie die Kognitionswissenschaften allgemein berührt, dreht sich um die Frage, ob flektierte Formen durch eine Berechnungskomponente, gebildet werden oder ob sie als flektierte Formen im mentalen Lexikon gespeichert sind. Die Erfassung der Flexionsmorphologie erweist sich in dieser Hinsicht als anspruchsvolle Aufgabe. So weisen Flexionssysteme einerseits in hohem Maße Regularitäten auf, die durch symbolmanipulierende Operationen, wie beispielsweise Affigierungsregeln, erfasst werden können und folglich eine Speicherung flektierter Formen unnötig erscheinen lassen. Andererseits – und im Gegensatz zu den völlig regulären Operationen der Syntax – weisen Flexionssysteme auch eine Reihe von Irregularitäten wie Suppletion, willkürliche Lücken in Flexionsparadigmen oder irregulär flektierte Formen auf, die sich durch Flexionsregeln nicht leicht erfassen lassen. Morpheme oder Wortformen? In theoretisch linguistischen Ansätzen entspricht der Frage nach Berechnung oder Speicherung flektierter Formen die Diskussion zwischen morphem- und wortbasierten morphologischen Theorien. In morphembasierten Theorien der Flexionsmorphologie wird das Morphem als Basis morphologischer Operationen gesehen. Im mentalen Lexikon sind sowohl Stamm- und Wurzelmorpheme als auch Flexionsaffixe als eigenständige lexikalische Einträge gespeichert. Flektierte Wortformen werden durch eine Konkatenation von Stamm- und Affixmorphemen gebildet (vgl. z.B. Chomsky & Halle 1968, Lieber 1980, Sproat 1985, Jensen 1990, Wunderlich 1996a, b). In einigen Arbeiten wird dabei sowohl die reguläre als auch die irreguläre Flexion durch ein Regelsystem erfasst (Chomsky & Halle 1968, Halle & Mohanan 1985, Halle & Marantz 1993, Embick & Marantz 2005). Die phonologische Ausbuchstabierung der flektierten Formen wird dabei durch ein System von spell-out und readjustment rules geleistet, die auch für irreguläre Formen die korrekte
5 Realisierung sicherstellen. Gängiger ist jedoch die Annahme, dass nur regulär flektierte Formen durch eine Verknüpfung von Stamm und Affix gebildet werden, während irregulär flektierte Formen im mentalen Lexikon gespeichert sind (z.B. Jensen 1990, Wunderlich & Fabri 1995, Aronoff & Anshen 1998). Morphembasierte Ansätze beruhen auf der Annahme, dass Form und Funktion eines Morphems in einer eins-zu-eins-Beziehung stehen. Diese Annahme wird in wortbasierten Ansätzen der Morphologie jedoch bestritten. Gerade die Flexionsmorphologie ist reich an Phänomenen, die einer eins-zu-eins-Beziehung von Form und Funktion zuwider zu laufen scheinen (vgl. z.B. Spencer 1991, Anderson 1992, Coates 2000, Stump 2001). So realisiert bei einem Synkretismus von Formen ein phonologischer Marker verschiedene morphosyntaktische Spezifikationen. Formen der 2. Person Plural sowie der 3. Person Singular Präsens Indikativ deutscher Verben werden beispielsweise durch den homophonen Marker -t realisiert. Kumulative Exponenten, wie sie z.B. im System der Kongruenzflexion deutscher Verben vorkommen, grammatikalisieren zwei oder mehr morphosyntaktische Kategorien (im Beispielsfall PERSON und NUMERUS) durch jeweils nur einen Marker. Im Deutschen lassen sich zudem Fälle von so genannter extended exponence finden, in denen eine morphosyntaktische Spezifikation nicht nur durch eine Endung, sondern zusätzlich durch eine Stammänderung realisiert wird (Bsp. Fuß - Füße[Pl.]). Schließlich ist hier auch die lexikalisch bedingte Allomorphie von Flexionsmarkern zu nennen, die beispielsweise im Bereich der nominalen Pluralflexion des Deutschen zu beobachten ist, die fünf verschiedene Marker zur Bildung von Nominalpluralen (-s, -e, -er, -n und keine Markierung) bereithält. Morphembasierten Theorien, in denen flektierte Formen durch Affigierung von einer Basisform abgeleitet werden, wird ferner vorgehalten, dass sie die paradigmatischen Beziehungen, die zwischen den flektierten Wortformen eines Lexems bestehen, vernachlässigen (vgl. z.B. Bybee 1991, Plungian 2000, van Marle 2000). In wortbasierten Ansätzen wird dagegen der paradigmatischen Organisation flektierter Wortformen eine besondere Bedeutung beigemessen (vgl. z.B. Matthews 1972, Anderson 1982, 1992, Bybee 1991). In diesen Ansätzen wird angenommen, dass flektierte Wortformen als Vollformen im mentalen Lexikon gespeichert sind. Die Gesamtheit der Wortformen eines Lexems bilden ein Paradigma. Der Aufbau und die Organisation solcher Paradigmen zeigt dabei Gesetzmäßigkeiten und Strukturprinzipien, deren Erforschung ein Kernpunkt dieser Ansätze ist (vgl. z.B. Wurzel 1984, Bybee 1991, Carstairs-McCarthy 1987, 1998). Berechnung oder Speicherung in Modellen der Psycholinguistik? Der theoretischen Kontroverse zwischen morphem- und wortbasierten Ansätzen der Flexionsmorphologie entspricht die psycholinguistische Kontroverse zwischen full-listingund affix-stripping-Modellen der Sprachverarbeitung. In affix-stripping-Modellen wird angenommen, dass komplexe Wörter bei der Sprachverarbeitung grundsätzlich in Stamm und Affix dekomponiert werden. Entsprechend wird auch eine dekomponierte Repräsentation von komplexen Wörtern im mentalen Lexikon angenommen (vgl. z.B. Taft & Forster 1975, Taft 1979). Demgegenüber propagiert der full-listing-Ansatz (z.B. Butterworth 1983), komplexe Wörter seien als Vollformen im Lexikon gespeichert und würden daher bei der Verarbeitung nicht in Stamm und Affix dekomponiert. Die Vorstellung, dass alle flektierten Formen als Vollformen im mentalen Lexikon abgespeichert sind, wurde Mitte
6 der 80er Jahre in konnektionistischen Arbeiten wieder aufgegriffen (Rumelhart & McClelland 1986). Symbolische Regeln oder assoziative Netzwerke? Der Konnektionismus ist eine Richtung der Kognitionsforschung, in der versucht wird, kognitive Leistungen in künstlichen neuronalen Netzwerkmodellen zu simulieren. Solche Netze bestehen aus mehreren Schichten einfacher Verarbeitungseinheiten, so genannter Knoten, die über gewichtete Verbindungen miteinander verknüpft sind. Jeder Knoten ist eine Verrechnungseinheit, die eingehende Aktivierungen gewichtet, summiert und an die mit ihm verbundenen Knoten der nächsten Schicht weiterreicht. Konnektionistische Netze sind in der Lage, im Verlauf eines entsprechenden Trainings ihre Verbindungsgewichtungen so zu verändern, dass sie für vorgegebene Eingabeaktivierungen eine korrekte Ausgabeaktivierung generieren können. Wissensrepräsentation, Lernen und Verarbeitung beruhen in konnektionistischen Netzen auf den Prinzipien der assoziativen Verknüpfung, die maßgeblich durch Faktoren wie die Vorkommenshäufigkeit von Aktivierungsmustern und die Ähnlichkeit von Aktivierungsmustern untereinander bestimmt sind. Das Ziel einer einflussreichen Richtung des Konnektionismus ist es zu zeigen, dass diese assoziativen Mechanismen zur Repräsentation und Verarbeitung kognitiver Fähigkeiten ausreichend sind, auf Operationen, die abstrakte, symbolische Repräsentationen manipulieren, also verzichtet werden kann. Mehr noch ist es Ziel dieser antisymbolistischen Richtung des Konnektionismus zu belegen, dass symbolische Repräsentationen und symbolmanipulierende Operationen nur ein Artefakt der Beschreibung kognitiver Fähigkeiten sind und keinerlei Realität haben (für einen ausführlichen Überblick vgl. Marcus 2001).1 Die Debatte zwischen symbolistischen und antisymbolistischen Positionen prägt die Kognitionswissenschaft seit langem. Im Kern reicht sie auf den – bis zu Platon und Aristoteles zurückführbaren – Widerstreit zwischen den Denkgebäuden des Rationalismus und des Empirismus zurück (vgl. z.B. Gardner 1992, Pinker 1999). In den 20er, 30er und 40er Jahren des 20. Jahrhunderts prägten vor allem antimentalistische und antisymbolistische Positionen wie die des Behaviorismus die Wissenschaft. Die Erforschung mentaler Operationen und die Annahme mentaler, abstrakte Symbole enthaltender Repräsentationen wurde als unwissenschaftlich angesehen. In der Mitte der 50er Jahre kam es zunächst zu einer kognitiven Wende, die unter anderem durch die Arbeiten von Chomsky in der Linguistik (1957), von von Neumann (1958) sowie von Newell & Simon (1972) in der Computerwissenschaft und von Bruner, Goodnow & Austin (1956) in der Psychologie ausgelöst wurde (für einen wissenschaftshistorischen Überblick siehe Gardner 1992). Die Erforschung mentaler Repräsentationen rückte mit diesen Forschern wieder in den Mittel–––––––—–– 1
Der Begriff des Symbols ist äußerst vielschichtig und eine Diskussion dieses Begriffs kann in dieser Arbeit nicht geleistet werden. In der hier interessierenden Diskussion um die adäquate Repräsentation der Flexion im engeren und der menschlichen Sprachfähigkeit im weiteren Sinne sind Symbole als abstrakte Kategorien wie Verb, Nomen oder Affix zu verstehen. Solche Kategorien schreiben den Elementen eines Grundbereichs bestimmte grammatische Eigenschaften zu. Teil der menschlichen Sprachfähigkeit sind zudem kombinatorische Operationen, die es erlauben, Berechnungen über diesen Kategorien durchzuführen und hierarchisch strukturierte Relationen zwischen sprachlichen Kategorien herzustellen.
7 punkt des wissenschaftlichen Interesses. Mit dem Aufkommen des Konnektionismus Mitte der 80er Jahre ist die Kontroverse zwischen mentalistischen/symbolistischen und antimentalistischen/antisymbolistischen Positionen erneut aufgeflammt. Ein Kernbereich, in dem die Debatte zwischen symbolistischen und antisymbolistischen Ansätzen zur menschlichen Kognition ausgetragen wird, ist die Erfassung der regulären und irregulären Flexion – insbesondere der past tense Flexion des Englischen. Rumelhart & McClelland stellten 1986 ein konnektionistisches Modell zur Simulation des Erwerbs der englischen past tense Flexion vor, in dem sie sowohl für regulär als auch für irregulär flektierte Formen eine einheitliche Vollformrepräsentation in einer assoziativen Speicherstruktur postulierten. Die Annahme, dass Flexionsoperationen als symbolmanipulierende Konkatenation von Stamm- und Affixmorphemen zu erfassen sind, wobei für jede Instanz der Kategorie [V] durch Verknüpfung mit dem Affix -ed eine past tense Form produziert werden kann, lehnten sie dagegen ab. In Reaktion auf diese Arbeit wurde von Steven Pinker und Kollegen ein dualistisches Modell zur Erfassung der Flexion vorgeschlagen (z.B. Pinker & Prince 1988, Pinker 1998, 1999). Dem Dual-Mechanism Modell zufolge sind zwar irregulär flektierte Formen als flektierte Vollformen in einer assoziativen Speicherstruktur erfasst, regulär flektierte Formen werden jedoch durch eine symbolmanipulierende Operation, die ein Affix mit einem Stamm einer bestimmten Wortkategorie kombiniert, produktiv gebildet. Dieser Vorschlag von Pinker initiierte einen bis heute anhaltenden Wettstreit zwischen Vertretern dualistischer und konnektionistischer Ansätze zur Flexion. In dessen Folge wurde eine Fülle psycho- und neurolinguistischer Studien mit dem Ziel durchgeführt, Evidenz für eine qualitative Distinktion regulär und irregulär flektierter Formen zu finden. Diese wurden durch immer neue konnektionistische Simulationen gekontert, die versuchten, die jeweils aufgedeckten Aspekte von Erwerb, Verarbeitung und Störung regulär und irregulär flektierter Formen in einer antisymbolistischen, rein assoziativen Netzstruktur zu modellieren (vgl. z.B. MacWhinney & Leinbach 1991, Plunkett & Marchman 1993, Daugherty et al. 1993, Joanisse & Seidenberg 1999, sowie den Überblick in Marcus 2001). Beleg für die anhaltende Relevanz dieser Kontroverse und für das Engagement, mit der sie geführt wird, sind die zahlreichen Buchpublikationen (z.B. Rumelhart & McClelland 1986, Pinker & Mehler 1989, Macdonald & Macdonald 1995, Elman et al. 1996, Pinker 1999, Marcus 2001) und die kritischen Diskussionen, die regelmäßig in Fachzeitschriften entbrennen (vgl. z.B. The Behavioral and Brain Sciences 1999: Nr. 22, Trends in Cognitive Sciences 2002: Nr. 6, Brain and Language, 2003: Nr. 85, Brain and Language 2005: Nr. 93). Die Kontroverse zwischen symbolistischen und antisymbolistischen Positionen wird nicht nur auf dem Gebiet der Repräsentation flektierter Wörter geführt. Ähnliche Kontroversen finden sich auch in anderen Bereichen der Kognitionsforschung, so z.B. im Bereich der Kategorisierung oder des Schlussfolgerns (vgl. z.B. Pothos 2005).2 Die Debatte um die –––––––—–– 2
Im Bereich der Kategorisierung wird beispielsweise diskutiert, ob Kategorien durch Regeln beschrieben werden, die definierende oder kritische Bedingungen aufführen (z.B. Bruner, Goodnow & Austin 1956, Levine 1966), oder ob sie der Tradition von Wittgenstein (1953) folgend über die Ähnlichkeit der Kategoriemitglieder untereinander (Familienähnlichkeit) bzw. über die Ähnlichkeit zu einem Prototyp bestimmt sind (z.B. Rosch 1975, 1978, Taylor 1989, Kruschke 1992). Die Kategorisierung eines Elements basiert dabei auf der Ähnlichkeit dieses Elements zu (prototypischen) Mitgliedern der Kategorie (exemplar-based models). Dualistische Modelle, die
8 Erfassung regulär und irregulär flektierter Formen spielt jedoch in dieser Kontroverse eine zentrale Rolle. Dies liegt darin begründet, dass es sich bei der regulären und irregulären Flexion um einen überschaubaren, begrenzten Bereich der menschlichen Kognition handelt, in dem sich dennoch grundlegende Fragen zur menschlichen Kognition stellen und untersuchen lassen. Zum einen bietet das Vorliegen distinkter Formen für regulär bzw. irregulär flektierte Wörter die Möglichkeit zu untersuchen, ob diese Unterschiede auf qualitativ distinkte mentale Repräsentationen (wie assoziative Speicherung bzw. symbolmanipulierende Verknüpfungsoperation) zurückzuführen sind oder nicht. Zum anderen kann die Wirkung interferierender Faktoren in diesem Bereich sehr gut begrenzt werden, da regulär und irregulär flektierte Formen in vieler Hinsicht vergleichbar sind: Es handelt sich jeweils nur um ein Wort, beide Formen haben denselben kategorialen Status und realisieren jeweils identische morphosyntaktische Merkmale. Laut Pinker bietet die Untersuchung regulär und irregulär flektierter Wörter einen einzigartigen Fall, „[…] an dem sich zwei bedeutende Systeme abendländischen Denkens überprüfen und anhand einer einzigen reichhaltigen Datenmenge vergleichen lassen, als seien sie zwei ganz gewöhnliche wissenschaftliche Hypothesen.“ (Pinker 1999, in der dt. Übersetzung von 2000: 117)
Pinker hat die Bedeutung der Untersuchung (insbesondere regulär) flektierter Formen für die Kognitionswissenschaften daher schon mit der Bedeutung der Fruchtfliege für die Genetik verglichen: „Perhaps regular verbs can become the fruitflies of the neuroscience of language – their recombining units are easy to extract and visualize, and they are well studied, small, and easy to breed.“ (Pinker 1997: 548)
1.1.2 Flexion zwischen Lexikon und Syntax Neben der Frage, ob alle flektierten Wörter als Vollformen im mentalen Lexikon vorliegen oder ob zumindest reguläre Flexion als Konkatenation von Stamm- und Affixmorphemen zu erfassen ist, betrifft eine andere Kontroverse die Frage, wo die Flexion im Bereich der Grammatik anzusiedeln ist. Basierend auf den traditionellen Vorstellungen eines Lexikons, das die Morpheme einer Sprache enthält, und einer Grammatik, die die Regeln zur Verknüpfung dieser Morpheme bereitstellt (z.B. Bloomfield 1933, Chomsky 1965), wurden zunächst sowohl die Flexion als auch die Derivation durch die Anwendung syntaktischer Regeln geleistet (Chomsky –––––––—–– beide Aspekte verbinden, werden ebenfalls diskutiert (vgl. z.B. Nosofsky, Palmeri & McKinley 1994, Erickson & Kruschke 1998). Auch der Bereich des Schlussfolgerns (reasoning) ist durch eine Kontroverse zwischen regelbasierten Ansätzen, die davon ausgehen, dass Schlüsse durch abstrakte Regeln geleitet sind (vgl. Smith, Langston & Nisbett 1992), und instance-Modellen, die annehmen, dass Probleme durch Analogie zu im Gedächtnis gespeicherten Fällen gelöst werden (vgl. z.B. den Überblick in Medin & Ross 1989), bestimmt. Auch hier wurden mittlerweile dualistische Positionen vorgeschlagen (z.B. Sloman 1996). Für einen Überblick über vergleichbare Symbolismus-Antiymbolismus-Kontroversen in den Kognitionswissenschaften siehe Pothos (2005) und die daran anschließenden Diskussionen.
9 1965). In der Folge von Chomskys Remarks on Nominalization (1970) wurde zunächst die Derivation dem Lexikon zugesprochen. Chomsky wies darauf hin, dass sich die Bedeutung von Derivaten häufig nicht kompositional aus der Bedeutung ihrer Teile ergibt. Da ihre Bedeutung in diesen Fällen idiosynkratisch ist, müssten diese Formen im Lexikon gelistet sein. Während die Derivation heute in den meisten Ansätzen im Lexikon erfasst wird (vgl. z.B. Spencer 1991, Aronoff 2000),3 ist die Zuordnung der Flexion weiterhin umstritten. Die Funktion der Flexionsmorphologie ist die Grammatikalisierung morphosyntaktischer Kategorien wie PERSON, NUMERUS, TEMPUS etc. am Wort.4 Diese Merkmale realisieren nicht nur inhärente Eigenschaften einer lexikalischen Kategorie (wie z.B. GENUS oder NUMERUS), sondern dienen auch dem Ausdruck syntaktischer Beziehungen (wie Kongruenz oder Rektion), die zwischen verschiedenen Elementen bestehen (z.B. Stump 1998). Insbesondere diese letzte Funktion der Flexion erfordert es, dass grammatische Merkmale in syntaktischen Repräsentationen vorhanden sind. Während über diese Punkte Einigkeit besteht, ist strittig, ob dies in Konsequenz bedeutet, dass die Flexion dem Bereich der Syntax zuzurechnen ist. Der schwach lexikalistische Ansatz: In der Standardtheorie (Chomsky 1965) wurde zunächst zwischen syntaktischer Funktion und phonologischer Realisierung der Flexion unterschieden. Um die entsprechenden syntaktischen Funktionen zu gewährleisten, enthielten Phrasenstrukturrepräsentationen grammatische Merkmale. Die Realisierung dieser Merkmale erfolgte dann in der phonologischen Komponente. Diese Auffassung zur Flexionsmorphologie wurde beispielsweise in den Arbeiten von Matthews (1972), Aronoff (1976) oder Anderson (1982, 1992) beibehalten (vgl. auch die Diskussion in Spencer 1991, Borer 1998, Aronoff 2000). Als Argument für diese Erfassung der Flexion wird angeführt, dass grammatische Merkmale auf jeden Fall in syntaktischen Repräsentationen vorhanden sein müssen. Jedes weitere Vorkommen dieser Merkmale, etwa im Lexikon, sei folglich redundant und im Sinne einer nicht-redundanten Repräsentation grammatischer Merkmale abzulehnen. Solche Ansätze, in denen lediglich die Derivation im Lexikon angesiedelt ist, die Flexion jedoch zwischen Syntax und Phonologie angesetzt wird, werden als schwach lexikalistisch (weak lexicalist) bezeichnet. Da als Konsequenz dieser Auffassung Derivation und Flexion auf unterschiedliche Komponenten verteilt und durch völlig distinkte Operationen geleistet werden, wird sie auch als Split-Morphology-Hypothese bezeichnet. Die Split-MorphologyHypothese setzt voraus, dass eine klare – auch zeitlich-prozedurale – Trennung von Flexion und Derivation möglich ist. Daher sollte die Flexion als syntaktische Operation der Derivation, die im Lexikon angesetzt wird, nicht vorausgehen können. Im Niederländischen
–––––––—–– 3 4
In Baker (1988) sowie ihm nachfolgenden Arbeiten (z.B. Siebert 1999) wird Derivation allerdings syntaktisch erfasst. Die Begriffe Grammatikalisierung und Lexikalisierung bezeichnen innerhalb der funktionalen Linguistik spezifische Ansätze zum Sprachwandel (vgl. z.B. Hopper & Traugott 1993, Fischer & Rosenbach 2000). In dieser Arbeit verwende ich beide Begriffe jedoch in ihrer allgemeineren Bedeutung im Sinne von grammatischer bzw. lexikalischer Realisierung.
10 oder Deutschen beispielsweise finden sich jedoch auch reguläre Nominalplurale in Derivaten (z.B. damenhaft).5 Der stark lexikalistische Ansatz: Im Unterschied zu schwach lexikalistischen Ansätzen erfolgt in stark lexikalistischen (strong lexicalist) Ansätzen auch die Flexion – wie die Prozesse der Wortbildung – in einer eigenständigen morphologischen Komponente im Lexikon (z.B. Halle 1973, Lieber 1980, Selkirk 1982, Kiparsky 1982a, Jensen 1990, auch Chomsky 1995). Diese Ansätze ziehen eine Distinktion nicht zwischen Derivation und Flexion, sondern zwischen Operationen auf der Wortebene, die in den Bereich der Morphologie fallen, und Operationen auf der Phrasenebene, die zur Syntax zählen. Als Argument für eine einheitliche morphologische Komponente wird darauf verwiesen, dass Flexion und Derivation auf vergleichbare Operationen wie die Affigierung zurückgreifen. Zudem entfällt unter dieser Annahme die Notwendigkeit für eine strikt serielle Anordnung von Derivation und Flexion. Dass reguläre Flexion der Derivation auch vorangehen kann, ist damit prinzipiell nicht mehr ausgeschlossen. Eine weitere Konsequenz der starken lexikalistischen Position ist zudem, dass auch Affixe wie lexikalische Hauptkategorien im Lexikon repräsentiert sind. Derivation und Flexion lassen sich so einheitlich durch eine Konkatenation von aus dem Lexikon ausgewählten Stämmen und Affixen erfassen. 1.1.3 Berechnungs- und Speicherökonomie Beide Kontroversen – wie sind flektierte Wörter zu repräsentieren und wo in der Grammatik erfolgt Flexion – tangieren das Verhältnis von Speicherung und Berechnung. Berechnungs- und Speicherökonomie bilden die beiden Facetten der als Occam’s razor bekannten Maxime, nach der postulierte Repräsentationen so sparsam wie möglich sein sollen (vgl. Bierwisch 1996, Stiebels 2002). Berechnungs- und Speicherökonomie wirken jedoch in entgegengesetzte Richtungen. Unter Gesichtspunkten der Speicherökonomie ist es optimal, sowenige Informationen wie möglich zu speichern. Unter diesem Gesichtspunkt ist ein möglichst kleines Lexikon, in dem ferner lediglich idiosynkratische Information aufgelistet ist, die nicht auf Regularitäten der Grammatik zurückgeführt werden kann, wünschenswert. Bezogen auf die Frage der Repräsentation flektierter Wörter wäre unter dieser Maxime ein regelbasierter Ansatz zu bevorzugen, der flektierte Formen durch eine Affigierungsoperation in der Berechnungskomponente produziert. Unter dem Aspekt der Berechnungsökonomie ist es dagegen optimal, Informationen zu speichern und nicht durch Berechnungsprozeduren abzuleiten. Flektierte Formen sollten demzufolge im Lexikon gespeichert sein und nicht durch eine Affigierungsoperation gebildet werden. Die Minimierung der Berechnungskomponente kann also nur durch eine Maximierung der im Lexikon gespeicherten Informationen erzielt werden, die Minimierung der Speicherkomponente resultiert dagegen zwangsläufig in einer Vergrößerung der Berechnungskomponente. –––––––—–– 5
Ausführliche Diskussionen der Unterschiede und Gemeinsamkeiten von Flexion und Derivation finden sich beispielsweise in Bybee (1985), Scalise (1988), Dressler (1989), Spencer (1991), Stump (1998) sowie Booij (2000b).
11 Berechnungs- und Speicherökonomie in der Entwicklung der Grammatiktheorie: Auch die Kontroverse zwischen stark und schwach lexikalistischen Ansätzen zur Erfassung der Flexion lässt sich unter die Dichotomie von Berechnungs- und Speicherökonomie subsumieren. In traditionellen Ansätzen zur Repräsentation der Sprachfähigkeit (vgl. Chomsky 1965, auch Bloomfield 1933) wurde das Lexikon lediglich als ein Speicher idiosynkratischer Informationen angesehen. Ziel war es, das Lexikon so minimal wie möglich zu halten. Alle Eigenschaften von Wörtern, die auf phonologische oder syntaktische Regularitäten zurückgeführt werden konnten, waren aus dem Lexikon auszuschließen. Die Berechnungskomponente der Grammatik war im Kontrast dazu sehr mächtig. So enthielt die Syntax nicht nur alle Regeln für die Verknüpfung der im Lexikon gespeicherten Morpheme zu komplexen Wörtern und Phrasen; diese Regeln waren auch sprachspezifisch. In der Entwicklung der generativen Grammatiktheorie über die Prinzipien-undParameter-Theorie (Chomsky 1981) hin zum Minimalistischen Programm (Chomsky 1992, 1995) wurde die Berechnungskomponente auf immer weniger und immer globalere Operationen beschränkt, die Teil unserer genetisch determinierten Sprachfähigkeit sind und den Aufbau syntaktischer Phrasen in den Sprachen der Welt universell leisten. So umfasst das Minimalistische Programm nur noch drei Operationen: Select wählt lexikalische Elemente aus dem Lexikon aus, merge fügt jeweils zwei dieser Elemente zu Phrasen zusammen und move bewegt einzelne Konstituenten in strukturelle Positionen, in denen ihre Merkmale überprüft werden können. Im Gegenzug wurde das Lexikon in der Entwicklung zum starken Lexikalismus von einem bloßen ‚Appendix’ der Grammatik (Bloomfield 1933) zu einer – vielleicht sogar der – zentralen Komponente der Grammatik. Zum einen wird das Lexikon als die Komponente der Grammatik gesehen, in der die Unterschiede zwischen den Sprachen der Welt ihren Ursprung haben. Diese ergeben sich durch einzelsprachliche Unterschiede in der Lexikalisierung grammatischer Merkmale, die durch die Universalgrammatik vorgegeben sind (Chomsky 1989, 1995). Der Grammatikerwerb lässt sich demzufolge als Lexikonerwerb charakterisieren. Dazu gehört nicht nur der Erwerb der inhaltsbezogenen Lexeme einer Sprache, sondern auch der Erwerb derjenigen Elemente, die grammatische Merkmale lexikalisieren (vgl. Clahsen 1988, Clahsen & Penke 1992, Clahsen, Eisenbeiss & Penke 1996, Eisenbeiss 2002). Die Identifikation der grammatischen Merkmale, die eine Sprache grammatikalisiert, und der Erwerb derjenigen lexikalischen Elemente, die diese Merkmale realisieren, steuern dabei den Erwerb syntaktischer Strukturen.6 –––––––—–– 6
So führt beispielsweise der Erwerb der Flexive der Subjekt-Verb-Kongruenz des Deutschen dazu, dass der funktionale Kopf AGRS0 lexikalisiert und eine AGRS-Phrase in der Syntax projiziert werden kann. Damit stehen auch neue Landepositionen für bewegte Konstituenten zur Verfügung. So kann das Subjekt erst nach dem Erwerb des Systems der Subjekt-Verb-Kongruenzflexion eine Position zwischen dem finiten Verb (in COMP) und der Negation einnehmen (vgl. (i)). Vor dem Erwerb der Kongruenzflexion und damit vor dem Aufbau der AGRS-Phrase finden sich in den deutschen Kindersprachdaten dagegen ungrammatische Äußerungen, in denen das Subjekt VPintern verbleiben muss, da zwischen dem finiten Verb (in F0) und der Negation noch kein weiterer Landeplatz zur Verfügung steht (vgl. (ii)) (Clahsen, Penke & Parodi 1994, Clahsen, Kursawe & Penke 1996, Penke 2001): (i) [CP jetz is [AGRSP der [VP nich mehr traurig]]] (Leonie 2;8 J.) (ii) *[FP da is [VP nich papa pauf]] (= drauf) (Annelie 2;6 J.)
12 Zum anderen hat insbesondere Bierwisch (1992, 1996) darauf hingewiesen, dass Lexikoneinträge selbst eine starke inhärente Strukturierung aufweisen, die ebenfalls durch die Universalgrammatik vorgegeben sein muss. Laut Bierwisch sind lexikalische Einträge komplexe, mental repräsentierte Datenstrukturen, in denen die phonetische Form, die grammatischen Merkmale, die Argumentstruktur und die semantische Form einer lexikalischen Einheit systematisch miteinander verbunden sind. Bierwisch argumentiert, dass die Universalgrammatik nicht nur das generelle Merkmalsinventar festlegt, das einzelsprachspezifisch grammatikalisiert werden kann, sondern dass sie auch festlegt, welche Merkmalskonfigurationen überhaupt mögliche lexikalische Einträge sind. Die UG stellt also den Bauplan für den komplexen Datentyp der Lexikoneinheit bereit. Ein weiteres Charakteristikum dieser Datenstrukturen ist, dass sie durch die Operation merge miteinander kombiniert werden können. Neben der inhärenten Strukturierung und der Anlage zur Kombinierbarkeit zeigen sich auch systematische Organisationsstrukturen zwischen den verschiedenen Lexikoneinheiten. Insbesondere Untersuchungen an sprachgestörten Sprechern haben eine Fülle von Hinweisen auf solche Organisationsstrukturen erbracht. So gibt es Sprachstörungen wie den Agrammatismus, die in erster Linie funktionale Elemente zu beeinträchtigen scheinen. Andere Störungen wie die amnestische Aphasie betreffen dagegen in erster Linie Elemente der lexikalischen Hauptklassen. Innerhalb der Klasse der lexikalischen Hauptkategorien zeigen sich kategoriespezifische Defizite. So treten bei Patienten mit Wortfindungsstörungen Beeinträchtigungen in erster Linie bei Nomina auf. Der Agrammatismus geht dagegen mit reduzierten Leistungen beim Benennen von Verben einher. Schließlich finden sich auch Sprachstörungen, die nur die lexikalischen Elemente eines bestimmten semantischen Feldes innerhalb der Klasse der Nomina, wie beispielsweise Obstsorten, Werkzeuge oder Tiere, beeinträchtigen (für Überblicke der Literatur zu kategoriespezifischen Defiziten vgl. z.B. Warrington & Shallice 1984, Zingeser & Berndt 1990, Garrett 1992, Goodglass 1994, Caramazza 1998, Saffran & Sholl 1999, Damasio et al. 2004). Die Ausführungen von Bierwisch und die Beispiele sehr selektiv nur bestimmte Klassen oder Gruppen von Lexikoneinheiten betreffender Schädigungen verdeutlichen, dass das mentale Lexikon keine unstrukturierte Liste beliebiger lexikalischer Einträge, sondern ein vielschichtig organisierter Speicher komplexer und inhärent strukturierter Datentypen ist. Ist Speicherökonomie erforderlich? In der Entwicklung der Grammatiktheorie wurde die Berechnungskomponente minimiert, die Speicherkomponente dagegen deutlich ausgebaut. In stark lexikalistischen Ansätzen enthält das Lexikon außer den Einträgen der lexikalischen Hauptkategorien auch Einträge für Affixe. Die Berechnungskomponente ist auf eine Verkettungsoperation reduziert, die Stamm und Affix verknüpft. Die Speicherung vollflektierter Wortformen, die in wortbasierten Flexionstheorien angenommen wird, wäre in dieser Entwicklungslinie ein weiterer Schritt hin zu einer Maximierung der Speicherkomponente. Der Konnektionismus kann in dieser Entwicklung als logischer Endpunkt betrachtet werden. Alle Informationen sind in den Verbindungsgewichten des neuronalen Netzes gespeichert, die Berechnungskomponente führt dagegen keine symbolmanipulierenden Operationen mehr aus. Als Rechtfertigung einer das Lexikon maximierenden Vollformspeicherung flektierter Formen, wie sie in wortformbasierten und konnektionistischen Ansätzen angenommen
13 wird, wird gerne darauf verwiesen, dass keine Notwendigkeit für eine ökonomische Informationsspeicherung bestehe, da keine externe Begrenzung der Speicherkapazitäten des Gehirns bekannt sei. Bybee beispielsweise schreibt: „First, there is no reason to believe that neural organizations result in non-redundant storage of information, nor that the brain’s capacity would be strained by storage of all the words of a language or even several languages.“ (Bybee 1991: 69-70)
Und ähnlich notieren Wilder & Gärtner (1996): „Given that the ‚storage capacity’ of the human brain is vastly underoccupied, there is no a priori reason to expect that the minimization of storage space is an externally dictated necessity.“ (ebd.: 32)
Stiebels (2002) weist allerdings zu Recht darauf hin, dass die ökonomische Nutzung der Speicherressourcen des mentalen Lexikons erst die Bedingung dafür sein könnte, dass beispielsweise Gedächtniskapazitäten für den Lexikonerwerb weiterer Sprachen überhaupt vorhanden sind. Als Hinweis auf die Relevanz ökonomischer Speicherung im Lexikon führt sie das Verbot vollständiger Synonymie lexikalischer Elemente an, das ein universelles Charakteristikum menschlicher Sprachen ist. Wäre eine ökonomische Speicherung nicht erforderlich, dann gäbe es auch keine Begründung für das Synonymieverbot, das die Speicherung neuer Wörter dann verbietet, wenn sie vollständige Synonyme zu bereits gelisteten Wörtern sind. Auch die Schnelligkeit und Effizienz des lexikalischen Zugriffs, der sich im Bereich weniger hundert Millisekunden bewegt (z.B. Marslen-Wilson & Tyler 1980, Marslen-Wilson 1989, Cutler 1989), bedingen ihrer Ansicht nach eine ökonomische Speicherung lexikalischer Informationen. Tatsächlich ist die Speicherkapazität des Gehirns zwar beeindruckend, aber durchaus nicht unbegrenzt. Schmidt (1987) errechnet in dem Standardwerk Physiologie des Menschen auf der Basis einer Schätzung der Speicherkapazität des menschlichen Gedächtnisses, dass lediglich 1% der durch unser Bewusstsein fließenden Informationen im Langzeitgedächtnis gespeichert werden können. Vaas (2000) nennt als Schätzung für die Speicherkapazität des Langzeitgedächtnisses eine Zahl zwischen 10 Milliarden und 100 Billionen Bit. Das ist zwar viel, jedoch ist diese Kapazität erstens nicht unbegrenzt und zweitens darf nicht übersehen werden, dass sprachliche Informationen nur einen Teil der zu speichernden Informationsmenge ausmachen. Daher wird in den Neurowissenschaften durchaus die Notwendigkeit zu ökonomischen Repräsentationen gesehen. So werden beispielsweise für die neuronale Repräsentation von Objekten oder Konzepten so genannte ‚Großmutterzellen’, in denen ein Neuron ein bestimmtes Konzept oder Objekt (z.B. die eigene Großmutter) enkodiert und bei seiner Wahrnehmung feuert, gerade auch deshalb abgelehnt, weil eine solche Vollformspeicherung, in der jedes Konzept bzw. Objekt von genau einem Neuron repräsentiert wird, als unökonomisch angesehen wird (vgl. z.B. Engel, König & Singer 1993, Vaas 2000, Connor 2005). Repräsentationen, die nicht Vollformen enkodieren, sondern in denen die Merkmale eines Objekts in miteinander verknüpften oder zeitlich synchron feuernden Neuronenverbänden erfasst sind (vgl. Hebb 1949, Palm 1988, Braitenberg & Schütz 1989, Engel, König & Singer 1993, Shastri & Ajjanagadde 1993, Pulvermüller 1999a), werden in den Neurowissenschaften bevorzugt, weil sie eine ökonomischere Repräsentation ermöglichen.
14 Tatsächlich liegen auch Forschungsergebnisse – beispielsweise im Bereich der Bewegungsplanung in motorischen Rindenregionen – vor, die auf ökonomische Repräsentationen im Nervensystem hinweisen. So sind laut Fischbach (1992) in die Planung einer Armbewegung weniger als 100 Nervenzellen involviert. Für ihn ein Zeichen dafür, dass sparsame Kodierung in motorischen Rindenregionen die Regel ist. Untersuchungen zum visuellen System haben außerdem ergeben, dass bei der visuellen Wahrnehmung verschiedene Areale der Großhirnrinde mit der Verarbeitung verschiedener Merkmale des wahrzunehmenden Objekts beschäftigt sind. So werden Aspekte der Form, Farbe, Bewegung oder Perspektive eines Objekts parallel in distinkten Kortexarealen verarbeitet, bevor sie zu einem Gesamteindruck zusammengefügt, ‚gebunden’, werden (vgl. z.B. Zeki 1992, Herzog, Ernst & Eurich 2002).7 In einem faszinierenden Experiment konnten Herzog, Ernst & Eurich (2002) Fehlleistungen des menschlichen visuellen Systems herbeiführen, in denen Merkmale wie die Diskontinuität einer präsentierten Linie an ein falsches Objekt gebunden wurden. Diese Fehlleistung verdeutlicht – ähnlich wie Versprecher in der Versprecherforschung –, dass das falsch gebundene Merkmal in einer Phase der Verarbeitung ein ‚Eigenleben’ geführt hat, also eine Verarbeitungsstufe existiert, auf der dieses Merkmal separat verarbeitet wurde. Dieser kurze Exkurs verdeutlicht, dass Aspekte der Speicherökonomie in den Neurowissenschaften durchaus als relevant gesehen werden. Repräsentationen, in denen Merkmale verteilt und distinkt enkodiert sind und parallel verarbeitet werden können, gelten auch aus ökonomischen Gründen plausibler als Vollformrepräsentationen. Das Argument vollformbasierter und konnektionistischer Ansätze zur Flexion, die beeindruckenden Speicherkapazitäten des Gehirns rechtfertigten es, die Berechnungsökonomie auf Kosten der Speicherökonomie einseitig zu maximieren, überzeugt daher nicht. Zudem lässt sich eine interessante Parallele zwischen der (psycho)linguistischen Kontroverse, wie flektierte Wortformen im mentalen Lexikon zu repräsentieren sind, und der Repräsentation von Objekten im visuellen System ziehen. In beiden Bereichen konkurrieren vollformbasierte Ansätze, in denen für jedes Objekt/Wort mit einer unterschiedlichen Merkmalsspezifikation eine eigenständige, distinkte Repräsentation angenommen wird, mit merkmalsbasierten Ansätzen, in denen flektierte Wörter/Objekte in kleinere Einheiten mit distinkten Merkmalsspezifikationen separiert werden. Eine ökonomischere Repräsentation resultiert in merkmalsbasierten Ansätzen daraus, dass für Einheiten mit identischen Merkmalen (z.B. für Morpheme mit identischer Merkmalsspezifikation) lediglich eine Repräsentation angenommen werden muss. Unabhängig davon, ob man die merkmalsbasierte Verarbeitung im visuellen System als externe Evidenz für eine merkmalsbasierte Verarbeitung in der Linguistik werten will, verdeutlicht der Blick in die Neurowissenschaften doch die Notwendigkeit, auch bei der Erfassung flektierter Formen zu Repräsentationen zu gelangen, die nicht nur hinsichtlich des Berechnungsaufwands, sondern auch hinsichtlich des Speicheraufwands ökonomisch sind. –––––––—–– 7
Die Frage, wie diese verschiedenen und distinkt verarbeiteten Merkmale dann zu dem wahrzunehmenden Objekt zusammengefügt werden, wird in den Neurowissenschaften als Bindungsproblem bezeichnet. Das Bindungsproblem ist bislang ungelöst. Für eine Diskussion verschiedener Lösungsmöglichkeiten siehe z.B. Engel, König & Singer (1993), van der Velde & de Kamps (in Druck).
15
1.2 Zum Verhältnis von theoretischer Linguistik und Psycho-/Neurolinguistik Wie flektierte Wörter erworben, produziert und verarbeitet werden und wo sie neuronal zu lokalisieren sind, war in den letzten 20 Jahren ein zentraler Gegenstand psycho- und neurolinguistischer Untersuchungen. Diese Untersuchungen haben eine Fülle an Erkenntnissen geliefert, die es nun erlauben, aus psycho- und neurolinguistischer Perspektive einen Beitrag zur Frage der Erfassung der Flexionsmorphologie und zur Klärung der in Abschnitt 1.1 angerissenen Kontroversen zu leisten. Ziel der Arbeit ist es, auf der Basis dieser Ergebnisse eine Skizze der Repräsentation flektierter Wörter im mentalen Lexikon vorzuschlagen und dabei eine Brücke zwischen Modellen der theoretischen Morphologie und den experimentell gewonnenen Befunden der Psycho- bzw. Neurolinguistik zu schlagen. Psycho- und Neurolinguistik haben Untersuchungsparadigmen entwickelt, mit denen die mentale und neuronale Repräsentation flektierter Wörter untersucht werden können. Flexion ist eine Komponente der menschlichen Sprachfähigkeit, die nach Chomsky ein autonomer Teil der menschlichen Kognition und des menschlichen Gehirns ist und zur biologischen Ausstattung des Menschen gehört (z.B. Chomsky 1980a, b, 2002, 2005). Die Aussagen morphologischer Theorien, die sich mit der Flexion als einer Komponente unseres mental/neuronal repräsentierten Sprachvermögens beschäftigen, fallen damit in den Gegenstandsbereich psycho- und neurolinguistischer Untersuchungen, und die solcherart gewonnenen Erkenntnisse sind für die theoretische Morphologie unmittelbar relevant. Dennoch ist das Verhältnis zwischen theoretischer Linguistik auf der einen und Psycho- bzw. Neurolinguistik auf der anderen Seite nicht störungsfrei und oft durch eine gewisse Geringschätzung der Arbeit des jeweils anderen gekennzeichnet. Die folgenden Klarstellungen erscheinen mir daher bei dieser Zielsetzung des Buchs angebracht. Theoretische Linguisten haben keinen privilegierten Zugang zur sprachlichen Kompetenz: In der theoretischen Linguistik stößt man zuweilen auf die Auffassung, die theoretische Linguistik befasse sich mit unserer Sprachkompetenz, während Psycho- und Neurolinguisten nicht die Kompetenz, sondern lediglich die Performanz, also die konkrete Nutzung dieser Fähigkeit, untersuchen könnten. Diese Auffassung ist meiner Ansicht nach unzutreffend (vgl. auch Schütze 1996). Chomsky hat immer darauf hingewiesen, dass es sich bei unserer Sprachfähigkeit um ein mental repräsentiertes, abstraktes Wissenssystem handelt (I-language). Dieses Wissenssystem, unsere Sprachkompetenz, ist eine ‚black box’, der direkten Beobachtung nicht zugänglich. Unsere Sprachkompetenz ist unabhängig von der Fähigkeit, dieses mental repräsentierte Wissen bei der Sprachproduktion oder beim Sprachverstehen auch zu nutzen. Erkenntnisse über dieses Wissenssystem können wir immer nur indirekt über die Analyse von Performanzdaten erlangen, also konkreten Anwendungen dieses Wissenssystems bei der Sprachproduktion oder dem Sprachverstehen. Ob Sprecher einer Sprache um ein Urteil über die Grammatikalität einer spezifischen Struktur gebeten werden, das zur Aufstellung einer Grammatik führt, die dann wiederum zur Formulierung einer linguistischen Theorie herangezogen wird, ob psycho- oder neurolinguistische Experimente durchgeführt, der Spracherwerb von Kindern oder Sprachstörungen untersucht werden, wir analysieren in jedem Fall Performanzdaten. Nur die Analyse von Performanzdaten erlaubt uns Rückschlüsse auf unsere sprachliche Kompetenz und damit auf die men-
16 tale Repräsentation sprachlicher Fähigkeiten. Die theoretische Linguistik hat also keinen privilegierten Zugang zur Erforschung sprachlicher Repräsentationen. Psycho- und Neurolinguisten haben keinen privilegierten Zugang zur sprachlichen Kompetenz: Dies gilt umgekehrt allerdings auch für die experimentell arbeitenden Teilgebiete der Linguistik. Auch hier trifft man gelegentlich auf die Auffassung, Arbeiten der theoretischen Linguistik wären nichts als gedankliche Konstrukte ohne Bezug zu realen Daten. Demgegenüber wird postuliert, dass nur durch experimentelle Untersuchungen der Realitätsgehalt einer linguistischen Theorie getestet werden könne. Dieser Anspruch wird häufig durch den Begriff der ‚psychologischen Realität’ ausgedrückt, die einer Theorie zu- oder abgesprochen wird (vgl. die Diskussion in Chomsky 1980b, Jenkins 2000). So bemerkt beispielsweise McCawley (1980), linguistische Theorien würden häufig nur Auskunft geben „[…] about what transformational grammarians are willing to let each other get away with […]“ (ebd.: 27). Daher wäre psycholinguistische Evidenz erforderlich „[…] if one is to know how to interpret putative linguistic facts and whether to take them seriously […]“ (ebd.: 27). Und Sandra (1998) spricht Linguisten rundheraus die Möglichkeit ab, begründete Aussagen über die mentale Repräsentation der Sprachfähigkeit zu machen: „But to what extent can linguists say anything about the human mind, one might ask. They have not been trained as psychologists, nor do they use the experimental techniques that psycholinguists have for addressing their research problems. Given this profile, are they able to say anything interesting at all (that is, beyond speculation) about the language user’s mind [...]? (ebd.: 362)
Dieser Anspruch, mit dem Kriterium der psychologischen Realität über den ultimativen Bewertungsmaßstab linguistischer Theorien zu verfügen, ist jedoch ebenfalls überzogen. Jede wissenschaftliche Arbeit hat den Anspruch, die Realität adäquat zu erfassen. Jede wissenschaftliche Analyse von sprachlichen Performanzdaten hat dementsprechend das Ziel, sprachliche Fähigkeiten adäquat zu repräsentieren. Die Analyse experimentell gewonnener Performanzdaten bietet dabei prinzipiell keine privilegiertere Einsicht in unsere sprachliche Kompetenz als Introspektion, die Befragung von Sprechern oder die Analyse von Grammatiken, die auf solchen Sprecherurteilen basieren (vgl. z.B. Chomsky 1980b, Jenkins 2000). Der folgende Gesprächsausschnitt mit Chomsky verdeutlicht, dass auch die Arbeit theoretischer Linguisten als empirisch zu werten ist, da sie auf systematischer Beobachtung von Performanzdaten beruht: „Kim-Renaud: What kind of evidence is used? You don’t do actual experiments? Chomsky: You actually do. For example, if I ask you as a speaker of English whether ‘Who do you believe John’s claim that Bill saw?’ is a sentence, that’s an experiment.“ (Chomsky 1988a: 268)
Da der Begriff der psychologischen (oder auch neuronalen oder mentalen) Realität zu der missverständlichen Interpretation einlädt, psycho- bzw. neurolinguistische Untersuchungen ermöglichten einen privilegierten Zugang zu mentalen Repräsentationen, sollte nach Ansicht Chomskys (z.B. 1980b, vgl. auch Jenkins 2000) auf diesen Begriff verzichtet werden.8 –––––––—–– 8
Eine ausführliche Diskussion zum Realitätsbegriff in der Linguistik und den Naturwissenschaften bietet die stellenweise polemische und daher vergnügliche Darstellung in Jenkins (2000).
17 Der Anspruch linguistischer Theorien muss sein, ein Erklärungsmodell zu liefern, das auf eine adäquate Repräsentation unserer sprachlichen Kompetenz zielt und mit den vorliegenden Daten übereinstimmt. Wissenschaftstheoretischen Maximen folgend (vgl. Popper 1935) sollte das Ziel jeder wissenschaftlichen Arbeit die Überprüfung vorhandener Theorien mit dem Ziel ihrer Falsifikation sein. Diese Überprüfung kann nur auf systematisch erhobenen Performanzdaten basieren. Untersuchungen, die psycho- oder neurolinguistische Methoden einsetzen, bieten dabei keinen privilegierten Zugang zu unserer mental repräsentierten Sprachfähigkeit. Sie liefern jedoch andere Typen von Daten, ermöglichen damit andere Vorhersagen und eröffnen dadurch andere Möglichkeiten des Zugangs zu unserem mental repräsentierten, sprachlichen Wissenssystem. Als Gütekriterium für eine linguistische Theorie darf sicher gesehen werden, wenn eine Theorie weder durch typologische Daten noch durch mit psycho- oder neurolinguistischen Verfahren gewonnene Daten falsifiziert werden kann. In dieser Hinsicht können psycho- und neurolinguistische Untersuchungen zwar keinen privilegierten, aber einen wichtigen Beitrag zur Klärung der Frage leisten, wie flektierte Wörter mental zu repräsentieren sind und wo die Flexionskomponente in der Grammatik anzusetzen ist.
1.3 Einführung in die relevanten Bereiche der deutschen Flexion Die psycho- und neurolinguistischen Ergebnisse, die in dieser Arbeit präsentiert werden, stammen ganz überwiegend aus Untersuchungen zur Flexionsmorphologie des Englischen und Deutschen. Einen zentralen Teil dieses Buchs nehmen dabei die Daten zur deutschen Flexionsmorphologie ein, die meine Mitarbeiter und ich in meinem Projekt „C8: Neurolinguistische Untersuchungen zur Flexionsmorphologie“ im Rahmen des Sonderforschungsbereichs 282 „Theorie des Lexikons“ erhoben haben ((http://www.phil-fak.uniduesseldorf.de/sfb282/C8/). Die Konzentration psycho- und neurolinguistischer Untersuchungen auf Flexionssysteme des Englischen und Deutschen ist in der Entwicklung der in Abschnitt 1.1 dargestellten Kontroverse zwischen Symbolisten und Konnektionisten begründet. Als Folge der Simulation des englischen past tense Erwerbs von Rumelhart & McClelland (1986) konzentrierte sich die Forschung zunächst auf detaillierte Untersuchungen zum Erwerb, zur Produktion und Verarbeitung sowie zur Beeinträchtigung englischer past tense Formen, da es sich hier um ein einfaches Flexionssystem handelt, an dem dennoch grundlegende Fragen zur Repräsentation der Flexion und der menschlichen Sprachfähigkeit untersucht werden konnten. Im Gefolge der Diskussion, welche kognitiven Mechanismen der past tense Flexion zugrunde liegen, rückten insbesondere die Partizipflexion und die nominale Pluralflexion des Deutschen in den Fokus des Interesses. Reguläre und irreguläre Partizipflexion: Das Partizip Perfekt des Standarddeutschen setzt sich aus drei Elementen zusammen: aus einem Präfix (ge-), einem Stamm und einem Suffix. Das Präfix ge- ist nicht obligatorisch. Seine Affigierung ist prosodisch motiviert und unterbleibt, wenn die initiale Silbe des
18 Verbstamms unbetont ist (z.B. studiert, verbeamtet) (siehe Wiese 1996). Stamm und Suffix sind dagegen notwendige Bestandteile des Partizips. Die Partizipstämme unterscheiden sich darin, ob sie einen Ablaut in der Partizipform haben oder ob Partizip- und Präsensstamm identisch sind. Als Suffixe stehen die beiden Flexive -t und -n zur Verfügung. Verben der schwachen Flexion bilden das Partizip mit einem nicht durch Ablaut veränderten Präsensstamm und dem Suffix -t (z.B. lachen - gelacht). Stark flektierende Verben haben dagegen einen durch Ablaut veränderten Präteritum- und eventuell auch Partizipstamm. Bei ihnen besteht die Partizipform aus der Endung -n und einem häufig durch Ablaut veränderten Partizipstamm (z.B. werfen - warf - geworfen, fallen - fiel - gefallen).9 Die Verteilung der Verben auf die Klasse der starken bzw. schwachen Verben ist idiosynkratisch. Zwar folgen starke Verben häufig bestimmten Ablautmustern, wie z.B. dem Ablautmuster i-a-u für Verben, die auf /inC/ (C = beliebiger Konsonant) enden (z.B. singen - sang - gesungen), jedoch sind diese Ablautmuster nicht ohne Ausnahmen. So handelt es sich beispielsweise bei dem Verb winken um ein schwaches Verb mit den Formen winkte und gewinkt. Insgesamt lassen sich mit solchen Mustern nur ca. 2/3 der Simplexverben der starken Flexion vorhersagen (vgl. Wunderlich 1992, aber auch Köpcke 1999). Daher müssen für starke Verben Informationen über den ablautenden Partizipstamm gespeichert sein. Genau diese notwendige Speicherung eines als Partizip markierten Verbstamms lässt es jedoch unplausibel erscheinen, dass Partizipformen starker Verben über einen regulären Affigierungsprozess gebildet werden. Da die morphosyntaktische Information [+ PARTIZIP] bereits mit dem Partizipstamm gespeichert werden muss, wäre eine Affigierungsoperation, die ein Affix -n mit eben derselben morphosyntaktischen Spezifikation [+ PARTIZIP] hinzufügte, redundant (Wunderlich & Fabri 1995). Eine Vollformspeicherung der Partizipformen der starken Verben ist folglich sparsamer als ihre Bildung über einen Affigierungsprozess. Die Partizipflexion starker Verben ist daher irregulär (Wunderlich & Fabri 1995). Die Partizipbildung bei schwachen Verben ist dagegen völlig vorhersagbar und äußerst produktiv. Sie wird beispielsweise zur Partizipbildung bei abgeleiteten Verben (z.B. gefaxt), onomatopoetischen Verben (z.B. gebrummt) oder Entlehnungen (z.B. gemailt) verwendet (vgl. Marcus et al. 1995). Allgemein wird daher angenommen, dass Partizipien schwacher Verben durch Affigierung des Suffixes -t an den Präsensverbstamm gebildet werden, also regulär flektiert sind (vgl. z.B. Eichler & Bünting 1978, Heidolph, Fläming & Motsch 1981, Eisenberg 1989, Wunderlich & Fabri 1995). Nominale Pluralflexion: Im Deutschen kann der Plural an Nomina durch die Endungen -e, -er, -(e)n, und -s, markiert werden sowie morphologisch unmarkiert bleiben. Unmarkierte Formen und Formen –––––––—–– 9
Neben der starken und schwachen Verbklasse gibt es im Deutschen noch 16 Simplexverben der gemischten Flexion. Sie zeigen ebenfalls einen Ablaut in Präteritum- und Partizipform. Präteritum- und Partizipformen werden jedoch mit der regulären Präteritumendung -te und dem Partizipsuffix -t gebildet, sodass bei diesen Verben eine Mischung zwischen starkem (Ablaut im Stamm) und schwachem Verb (Partizipbildung mit -t) entsteht (z.B. denken - dachte - gedacht). Aufgrund ihres oberflächlich hybriden Status werden Verben der gemischten Flexion in experimentellen Studien meist nicht untersucht. Ich werde in dieser Arbeit daher nicht weiter auf sie eingehen.
19 auf -e können dabei einen Umlaut durch die Frontierung des Stammvokals zeigen. Formen auf -er, deren Stamm einen hinteren oder zentralen Stammvokal enthält, müssen umlauten (Wiese 1996). Es wird diskutiert, ob die Umlautvarianten von -e, -er und den unmarkierten Formen als eigenständige Pluralallomorphe angesehen werden sollten oder nicht (für einen Überblick siehe Mugdan 1977, Bartke 1998). Da das Vorkommen eines Umlauts jedoch durch eine unabhängige phonologische Regel gesteuert ist, die nicht nur bei der Pluralbildung zu beobachten ist (vgl. z.B. die Diminutivform Männlein von Mann, siehe Wiese 1987b, 1996), erscheint diese Annahme nicht gerechtfertigt. Die Wahl eines Pluralflexivs zur Numerusmarkierung eines bestimmten Nomens ist im Deutschen in unterschiedlich hohem Maße arbiträr (siehe z.B. Clahsen et al. 1992, Marcus et al. 1995, Bartke 1998). Zwar lassen sich je nach Genus oder den phonologischen Charakteristika eines Nomens bevorzugte Suffixe identifizieren – so z.B. die unmarkierte Form für die Pluralbildung von Maskulina oder Neutra, die auf eine unbetonte, ein Schwa enthaltende Silbe enden (z.B. der Henkel - die Henkel). Uneingeschränkt vorhersagbar ist die Wahl des Pluralallomorphs mittels dieser Kriterien jedoch lediglich bei Feminina, die auf Schwa enden. In diesen Fällen wird der Plural mit -n gebildet (z.B. die Blume - die Blumen). Unter den genannten Pluralallomorphen fällt -s durch seinen weiten Anwendungsbereich besonders auf. Zwar ist -s das Pluralflexiv mit der geringsten Auftretenshäufigkeit (Marcus et al. 1995, Clahsen 1999), jedoch wird es in bestimmten Umgebungen sehr produktiv verwendet. So tritt es unter anderem an Entlehnungen (z.B. die Cafés), Onomatopoetika (z.B. die Kuckucks) und an Nominalisierungen anderer Kategorien, wie z.B. Konjunktionen (die Abers), auf. Zudem ist -s im Gegensatz zu den anderen Pluralallomorphen des Deutschen nicht an eine spezifische morphophonologische Umgebung gebunden: Es findet sich bei Nomina jedes Genus, bei Nomina mit unterschiedlichen Akzentmustern (Hotéls vs. Ópas) und – mit Ausnahme von Sibilanten – in verschiedenen phonologischen Umgebungen (z.B. nach Vokalen und Konsonanten) (siehe Marcus et al. 1995, Golston & Wiese 1996, Bartke 1998). Insbesondere scheint -s auch nicht an die Generalisierung gebunden zu sein, nach der Standardplurale des Deutschen auf eine reduzierte Silbe, d.h. eine Silbe mit Schwa oder einem silbischen Sonoranten als Kern, enden müssen (Neef 1998, vgl auch Golston & Wiese 1996, Wiese 1996). Damit ist -s das einzige Pluralallomorph, das einsilbige Pluralformen wie Schals oder Dutts ermöglicht. Aufgrund dieser Besonderheiten des -s-Plurals ist vorgeschlagen worden, -s als das reguläre default-Pluralaffix des Deutschen anzusehen (vgl. Janda 1990, Marcus et al. 1995, Wiese 1996, Bartke 1998, Clahsen 1999, Wunderlich 1999), das immer dann affigiert wird, wenn keine andere Pluralform gespeichert ist oder gebildet werden kann. Weitgehende Einigkeit besteht auch darüber, dass Pluralformen auf -er und der -n-Plural bei Maskulina und Neutra, die in der Singularform nicht auf Schwa enden (z.B. Muskel - Muskeln), nicht vorhersagbar und daher irreguläre Formen sind, die als Vollformen im mentalen Lexikon gespeichert sind (z.B. Wiese 1996, Bartke 1998, Wunderlich 1999). Der theoretische Status der anderen Pluralformen ist dagegen umstritten (vgl. Kap. 5.2.1). Subjekt-Verb-Kongruenzflexion: Kongruenz zwischen Subjekt und Verb wird im Deutschen hinsichtlich der morphosyntaktischen Kategorien PERSON und NUMERUS hergestellt. Diese Kategorien werden durch die Kongruenzflexive -t, -st, -n oder -e bzw. durch gespeicherte Verbstämme kodiert. Mit
20 Ausnahme der hochfrequenten Suppletivformen des Verbs sein, die idiosynkratisch und daher im Lexikon gespeichert sind (vgl. Wunderlich & Fabri 1995), ist die Kongruenzflexion völlig regulär. Scheinbare Unregelmäßigkeiten der Verbflexion, wie z.B. die Veränderung des Verbstamms durch einen Ablaut bei starken Verben, sind dabei nicht durch Irregularitäten der Flexion, sondern durch die Affigierung der Flexive an speziell markierte Verbstämme bedingt. Tabelle 1.1 zeigt das traditionelle Paradigma der Subjekt-Verb-Kongruenzflexion, in dem die Kategorie PERSON durch die Werte 1., 2. und 3. und die Kategorie NUMERUS durch die Werte Singular (Sg.) und Plural (Pl.) realisiert sind.
Tab. 1.1: Traditionelles Paradigma der Subjekt-Verb-Kongruenzflexion
Unterschiede zwischen Flexionssystemen des Englischen und des Deutschen: Flexionssysteme des Deutschen, wie die Partizipflexion oder die nominale Pluralflexion, gerieten bei der Debatte um konnektionistische Repräsentationen der englischen past tense Flexion in den Fokus des Interesses, da sie bei aller Ähnlichkeit zu den entsprechenden Flexionssystemen des Englischen entscheidende Unterschiede zum Englischen aufweisen, die es erlauben, konfundierende Faktoren zu untersuchen und zu neutralisieren. Beispielsweise werden im Englischen irreguläre Formen durch eine Veränderung des Stamms gebildet (z.B. mouse - mice, go - went). Das Deutsche verfügt dagegen bei der Plural- und Partizipflexion sowohl für regulär als auch für irregulär flektierte Formen über separierbare Endungen (z.B. gelach-t, gefall-en). Zudem zeigen nicht alle irregulär flektierten Partizipien oder Pluralformen auch Änderungen im Stamm (z.B. fall - gefallen). Dies erlaubt es, Experimente zu konstruieren, in denen allein der Faktor Regularität, nicht jedoch das Vorliegen oder Fehlen einer separierbaren Endung oder eines Stammablauts für Unterschiede in der Verarbeitung regulär und irregulär flektierter Formen verantwortlich gemacht werden kann. Ein weiterer konfundierender Faktor, dessen Einfluss bei der Untersuchung der Pluralund Partizipflexion des Deutschen minimiert werden kann, ist der Faktor der Frequenz.
21 Reguläre past tense und Pluralformen sind im Englischen wesentlich häufiger als irreguläre Formen. So gehören 95% aller englischen, aber nur 78% aller deutschen Verben zur schwachen Flexion (Marcus et al. 1995). Und während 98% aller englischen Nomina den regulären -s-Plural nehmen, tritt der reguläre -s-Plural nur bei 7% der deutschen Nomina auf (vgl. Marcus et al. 1995, Clahsen 1999). Die Frequenzverteilung der regulären und irregulären Formen im Englischen hat die Möglichkeit aufgeworfen, dass die Regularität einer Flexionsoperation lediglich ein Artefakt der Häufigkeit ist, mit der sie appliziert. Insbesondere im Bereich der deutschen Pluralflexion ist der Faktor Regularität jedoch nicht mit dem Faktor Frequenz konfundiert. Beide Faktoren – Frequenz und Regularität – können daher getrennt untersucht werden. Schließlich erlaubt es das Deutsche auch, Phänomene zu untersuchen, die sich in den sehr reduzierten Flexionssystemen des Englischen nicht finden. So gibt es im Bereich der deutschen Pluralflexion, anders als im Englischen, nicht nur ein reguläres Pluralflexiv, sondern das System umfasst verschiedene Pluralallomorphe, deren Regularität getestet werden kann. Des Weiteren verfügt das Deutsche im Vergleich zum Englischen über ein relativ ausgeprägtes System zur Markierung von Personen- und Numeruskongruenz am Verb, an dem beispielsweise untersucht werden kann, in welchen Ordnungsstrukturen Kongruenzaffixe im mentalen Lexikon gespeichert sind. Ein berechtigter Einwand hinsichtlich der Zielsetzung dieses Buchs ist, dass sich die vorgestellten psycho- und neurolinguistischen Erkenntnisse ganz überwiegend auf Flexionssysteme des Englischen und des Deutschen beziehen, Flexionssysteme von Sprachen mit typologisch viel reicherer und interessanterer Flexion dagegen nicht thematisiert werden. Dies liegt in den Anforderungen an experimentelle Untersuchungen begründet. Eine theoretisch relevante experimentelle Untersuchung erfordert nicht nur, dass für die untersuchten Sprachphänomene linguistisch fundierte Beschreibungen und Analysen vorliegen und auch der Experimentator eine fundierte Kenntnis der strukturellen Eigenschaften des untersuchten Sprachsystems hat. Notwendig ist beispielsweise auch, dass eine genügend große Menge von Versuchspersonen am Untersuchungsort verfügbar ist oder – wie im Verlauf des Buchs deutlich werden wird – verlässliche Angaben über die Vorkommenshäufigkeit bestimmter Wörter und Wortformen vorliegen. An all diesen – und anderen – Punkten mangelt es jedoch häufig (vgl. Rice, Libben & Derwing 2002 für eine Darstellung der Probleme, die bei psycholinguistischen Untersuchungen mit Sprechern einer polysynthetischen Sprache auftreten). Gelingt es, diese Probleme zu überwinden, dann wird die psycho- und neurolinguistische Erforschung typologisch reicherer und komplexerer Flexionssysteme sicher zu Modifikationen der hier präsentierten Skizze zur mentalen und neuronalen Repräsentation der Flexion führen. Dennoch können – wie ich in diesem Buch darstellen will – bereits aus der Untersuchung der relativ einfachen und theoretisch gut untersuchten Flexionssysteme des Deutschen und Englischen zentrale Erkenntnisse über die Repräsentation der Flexionsmorphologie gewonnen werden.
2 Methoden zur Erforschung des mentalen Lexikons
Untersuchungen zur Repräsentation und Organisation der Flexionsmorphologie im mentalen Lexikon nutzen das gesamte Spektrum psycho- und neurolinguistischer Untersuchungsmethoden. Im folgenden Kapitel werden einige der wichtigsten Verfahren kurz vorgestellt. Jede der vorgestellten Methoden ermöglicht eine andere Herangehensweise an die Fragestellung und testet spezifische Effekte wie etwa Frequenzeffekte, den Anstieg der Hirndurchblutung oder die selektive Störbarkeit von spezifischen Repräsentationen oder Operationen. Allerdings sind auch alle Methoden in ihrer Aussagekraft begrenzt bzw. leiden unter methodisch bedingten Problemen, wie z.B. einer schlechten zeitlichen Auflösung oder Unklarheiten darüber, welche Operationen oder Repräsentationen mit der jeweiligen Methode genau gemessen werden. Die Kombination der unterschiedlichen Verfahren bietet jedoch die Möglichkeit, solche methodenspezifischen Probleme auszugleichen. Zudem erlaubt sie, verschiedene Facetten der Repräsentation, Organisation und Verarbeitung der Flexionsmorphologie im mentalen Lexikon auszuleuchten und sie – so die Hoffnung – zu einem schlüssigen Gesamtbild zusammenzufügen.
2.1 Psycholinguistische Verfahren Jeder empirischen Untersuchung liegt das Ziel zugrunde, mit Hilfe einer systematischen Sammlung von Daten eine Hypothese zu testen. Aufgabe empirischer Forscher ist es dabei, die Versuchsperson zu einem Verhalten zu bringen, das man messen kann. Dabei lassen sich prinzipiell zwei verschiedene Verfahrensweisen unterscheiden: on-line und off-line Verfahren. Bei off-line Verfahren – wie der klassischen Grammatikalitätsbeurteilung oder der Elizitation – sind Gegenstand der Auswertung die produzierten Sprachstrukturen oder Bewertungen, also die Endergebnisse der in unserem Verstand ablaufenden Sprachverarbeitungsprozesse. Mit Hilfe von on-line Verfahren versucht man dagegen, diese Sprachverarbeitungsprozesse zu untersuchen, während sie ablaufen. Dabei testet man, ob bestimmte Verarbeitungseffekte auftreten oder fehlen. 2.1.1 Off-line Verfahren – Elizitation Bei der Elizitation versucht man, bestimmte grammatische Strukturen aus einer Versuchsperson ‚herauszulocken’. Dafür wird ein sprachlicher Kontext hergestellt, der in der Regel zur Produktion der gewünschten grammatischen Struktur führt. So gelingt beispielsweise die Elizitation von nominalen Pluralformen recht einfach durch Vorgaben der Art ‚Ein X, zwei __?’ (X = beliebiges Nomen). Die Elizitation bietet sich vor allem zur Datengewinnung bei Kindern (siehe Eisenbeiss 2002) oder sprachgestörten Sprechern an, die von einem experimentellen on-line Verfahren
24 unter Umständen überfordert wären. Die Elizitation von Daten erlaubt es, die Sprachproduktion der Versuchsperson stärker zu kontrollieren, als das bei einer normalen, unbeschränkten Kommunikationssituation der Fall wäre. Die stärkere Kontrolle der Sprachproduktion ermöglicht es, gezielt die für eine Untersuchung relevanten Daten zu sammeln. Dabei ergibt sich in erster Linie ein quantitativer Vorteil gegenüber der Spontansprachproduktion, da elizitierte Daten wesentlich mehr der relevanten Daten enthalten als unbeschränkte Produktionsdaten. Zudem ermöglicht es die Elizitation auch, Versuchspersonen zur Produktion von Strukturen zu bringen, die sie in der Spontansprachproduktion vermieden hätten. Die Vermeidung von Strukturen, deren Produktion Probleme bereitet, ist insbesondere für den Spracherwerb und für die Sprachproduktion bei Sprachstörungen typisch. Für die Sprachstörung des Agrammatismus (vgl. Abschnitt 2.3) beispielsweise stellte bereits de Villiers (1978) fest, dass die Beeinträchtigung grammatischer Morpheme mit einer erheblichen Reduzierung der Kontexte zum Gebrauch dieser Morpheme einhergeht. „It is mysterious that nonfluent aphasics not only fail to supply some morphemes but also apparently have less occasion to try.“ (ebd.: 135)
Ähnlich konstatiert auch Heeschen (1985): „It is as if the agrammatics have an enormously specific and precise instinct about what they should have better omitted if they could have spoken freely and spontaneously.“ (ebd.: 245)
Bestimmte grammatische Defizite können oft erst durch die Elizitation entsprechender Strukturen aufgedeckt werden. So fand sich beispielsweise in insgesamt fast 900 Äußerungen von vier deutschen Sprechern mit Broca-Aphasie kein einziger Kontext für einen -s-Plural (Penke 1998). Präsentiert man dagegen im Rahmen einer Elizitation Nomina, die den -s-Plural nehmen, zeigen sich regelmäßig erhebliche Probleme der Agrammatiker mit der Produktion von -s-Pluralen (Penke 1998, Penke & Krause 1999). Die Technik der Elizitation erlaubt es, gezielt solche für die Versuchspersonen problematischen Strukturen zu testen. Ein Nachteil der Elizitation ist, dass die Versuchsperson die Möglichkeit hat, andere als die gewünschten Strukturen zu produzieren. Die Antwortstrategie einer sprachgestörten Versuchsperson könnte beispielsweise sein, auf die Vorgabe ‚Ein X, zwei __?’ nicht mit der Pluralform, sondern mit ‚noch ein X’ zu reagieren. Dennoch ist es gerade die Tatsache, dass die Elizitation die Reaktion der Versuchsperson weniger kontrolliert, d.h. einschränkt, als kontrollierte, experimentelle Designs, die dieses Verfahren für die Gewinnung von Sprachdaten äußerst wertvoll macht. Denn anders als bei experimentellen Techniken, in denen die Reaktion der Versuchsperson häufig auf das Drücken einer Reaktionszeittaste beschränkt ist, erhält die Versuchsperson bei der Elizitation die Möglichkeit, produktiv auf die Aufgabe zu reagieren und Fehler zu machen. Gerade bei diesen produktiven Fehlleistungen zeigt sich auch ein qualitativer Vorteil elizitierter Daten im Vergleich zu Spontansprachdaten, da fehlerhafte Reaktionen interessante Einblicke in die sprachliche Kompetenz der Versuchspersonen ermöglichen. Die Erkenntnis, dass Fehler Einblicke in unser Sprachvermögen ermöglichen, stammt aus der Versprecherforschung (Fromkin 1971, 1973). Linguistische Analysen von Versprechern belegen, dass diese durch das Sprachsystem beschränkt sind. So besagt das Unit
25 Similarity Constraint (Shattuck-Hufnagel 1979), dass die Elemente, die in einen Versprecher involviert sind, von derselben Kategorie sind und auf derselben Verarbeitungsstufe bearbeitet werden. Bei einem Versprecher wie glear plue sky für das intendierte clear blue sky (Fromkin 1971: 36) beispielsweise wurden das [+ stimmhaft] Merkmal des Plosivs [b] und das [− stimmhaft] Merkmal des Plosivs [k] vertauscht. Die beiden vertauschten Elemente gehören derselben Kategorie an (phonetisches Merkmal [± stimmhaft]) und ihre Vertauschung spricht dafür, dass es eine Sprachverarbeitungsstufe gibt, auf der beide Merkmale präsent und relevant waren. In vergleichbarer Weise können auch die Fehler, die Kinder oder sprachgestörte Sprecher produzieren, als Quelle für Erkenntnisse über ein Sprachsystem genutzt werden, das diese Fehler produziert. Die in der Kindersprache häufig vorkommenden Übergeneralisierungen beispielsweise, bei denen regularisierte Partizipformen wie gesingt für starke Verben produziert werden, werden als Hinweis darauf gesehen, dass das Kind eine mentale Operation erworben hat, die ein Affix -t an einen Stamm suffigiert, um ein Partizip zu bilden. Einmal erworben kann diese Operation immer dann angewendet werden, wenn keine Partizipform im mentalen Lexikon gespeichert ist (siehe Marcus et al. 1992, Clahsen & Rothweiler 1993, Weyerts & Clahsen 1994, Weyerts 1997). Der Unterschied zwischen den Versprechern normaler Sprecher und den Fehlern von Kindern und sprachgestörten Sprechern ist unter dieser Betrachtung in erster Linie quantitativer Natur: Kinder und sprachgestörte Sprecher produzieren mehr Fehler und geben uns damit mehr Gelegenheiten, durch die Analyse von Fehlern Einblicke in unser Sprachsystem zu erlangen. 2.1.2 On-line Verfahren – Reaktionszeitexperimente Unter on-line Verfahren fallen insbesondere solche experimentellen Untersuchungen, in denen die Reaktionszeiten (in Millisekunden (ms)) gemessen werden, die die Versuchsperson zur Durchführung einer gestellten Aufgabe benötigt. Da Reaktionszeiten an sich keine Auskünfte über die bei der Verarbeitung ablaufenden kognitiven Prozesse und die involvierten grammatischen Repräsentationen geben, macht man sich bei on-line Verfahren Verarbeitungseffekte zu Nutze, die bei bestimmten Aufgabenstellungen regelmäßig zu beobachten sind. Diese Verarbeitungseffekte werden als Ausdruck bestimmter kognitiver Operationen interpretiert, und in Versuchsanordnungen wird das Stimulusmaterial dahingehend variiert, ob das Auftreten eines solchen Effekts erwartet wird oder nicht. Das Vorhandensein, Fehlen oder die Stärke des getesteten Verarbeitungseffekts liefern dann Evidenz für oder gegen die postulierten kognitiven Verarbeitungsschritte und die ihnen zugrunde liegenden grammatischen Repräsentationen. Insbesondere drei dieser Effekte werden in den folgenden Kapiteln Erwähnung finden: der Frequenzeffekt (2.1.2.1), der priming-Effekt (2.1.2.2) und der Ungrammatikalitätseffekt (2.1.2.3). Um eine gezielte Einflussnahme der Probanden auf die Untersuchung zu verhindern, ist bei einem on-line Experiment der Stimulus, auf den die Versuchsperson reagieren soll, im Idealfall nicht identisch mit dem Element, das den Untersucher eigentlich interessiert (vgl. Tyler 1992, 1994). In Wortidentifizierungsaufgaben beispielsweise ist die Aufgabe der Versuchsperson, die Reaktionszeittaste zu drücken, sobald sie ein vorgegebenes Zielwort im Experimentmaterial identifiziert hat. Die Reaktionszeit der Versuchsperson ist jedoch nur insofern interessant, als sie widerspiegelt, ob das eigentlich relevante Testmaterial, das
26 unmittelbar vor dem Zielwort präsentiert wird, grammatisch ist oder nicht. Geht dem Zielwort nämlich eine ungrammatische Struktur voraus, dann verlängert sich die Reaktionszeit auf das Zielwort im Vergleich zu einer Bedingung, in der dem Zielwort eine grammatische Struktur vorausgeht. Eine solche Trennung von Reaktionsstimulus und untersuchter Konstruktion wird nicht immer erreicht. Zumindest jedoch sollte die Aufgabenstellung, die die Versuchsperson beschäftigt, nicht identisch mit der eigentlichen Untersuchungsfrage sein. Gegenüber der Elizitation haben experimentelle on-line Techniken den Vorteil, dass mit ihnen spezifische Bereiche ganz gezielt getestet werden können, ohne dass möglicherweise beeinflussende Faktoren, wie z.B. Wortfindungsprobleme, die Leistung der Versuchsperson beeinträchtigen. Im Idealfall kann so allein der Einfluss der interessierenden unabhängigen Variable auf die abhängige Variable, die Reaktionszeit, getestet werden, während alle anderen Faktoren, die die Reaktionszeit ebenfalls beeinflussen könnten, kontrolliert sind. Ein Nachteil im Vergleich zur Elizitation ist jedoch, dass in experimentellen on-line Verfahren die Reaktionsmöglichkeiten der Versuchsperson auf das Drücken eines Knopfes der Reaktionszeitbox reduziert sind. Damit stehen für die Datenanalyse lediglich Reaktionszeiten und Fehlerraten zur Verfügung. Produktive Reaktionen der Versuchsperson, wie z.B. Übergeneralisierungen, sind jedoch durch das kontrollierte Design ausgeschlossen. 2.1.2.1 Frequenzeffekt Frequenzeffekte treten insbesondere bei lexikalischen Entscheidungsaufgaben auf, bei denen eine Versuchsperson die Aufgabe hat, so schnell wie möglich zu entscheiden, ob ein präsentierter Stimulus ein Wort der geprüften Sprache ist oder nicht. Gemessen wird dabei die Reaktionszeit, die die Versuchsperson vom Beginn der Darbietung des Stimulus bis zur Entscheidung durch Druck auf eine vorgegebene Taste einer Reaktionszeitbox benötigt. Die Stimuli können dabei sowohl auditiv als auch visuell dargeboten werden. Abbildung 2.1 präsentiert das Untersuchungsdesign für einen auditiven lexikalischen Entscheidungstest. Frühere Untersuchungen haben ergeben, dass lexikalische Entscheidungszeiten durch die Wortfrequenz beeinflusst werden (für einen Überblick siehe Balota 1994, Lively, Pisoni & Goldinger 1994). So führen Wörter mit niedriger Wortfrequenz zu längeren Reaktionszeiten als Wörter mit höherer Wortfrequenz.1 Dieser Frequenzeffekt wird als Folge der Suche nach dem Lexikoneintrag des geprüften Elements im mentalen Lexikon interpretiert. In Aktivierungsmodellen zur Worterkennung (z.B. Morton 1969, McClelland & Rumelhart 1981) wird der Frequenzeffekt als Resultat der Höhe der Aktivierungsschwelle eines Lexikoneintrags gesehen, die frequenzabhängig ist. Zur Erkennung von häufiger vorkommenden Wörtern ist dabei weniger Information notwendig als zur Erkennung selten vorkommender Wörter; sie kann also schneller erfolgen. In Suchmodellen (z.B. Savin 1963, Forster 1976) ergibt sich der Frequenzeffekt dagegen aus einer Suchstrategie, nach der zunächst häufig vorkommende Wörter überprüft werden. –––––––—–– 1
Die Wortfrequenz oder auch Lemmafrequenz ist die aufsummierte Frequenz aller flektierten Formen eines Wortes.
27
Abb. 2.1: Experimentelles Design bei einer auditiven lexikalischen Entscheidungsaufgabe
Wortformfrequenzeffekt: Interessant für die Untersuchung der Flexionsmorphologie ist diese Technik, weil sich neben dem Wortfrequenzeffekt auch ein Effekt der Wortformfrequenz für bestimmte flektierte Formen gezeigt hat. So fanden z.B. Clahsen, Eisenbeiss & Sonnenstuhl (1997) bei starken Verben des Deutschen einen Einfluss der Frequenz der Partizipform auf die lexikalische Entscheidungszeit: Für Verben mit häufig vorkommender Partizipform, aber relativ niedriger Wortfrequenz (wie z.B. gegriffen) zeigten sich signifikant schnellere Reaktionszeiten im Vergleich zu Verben mit relativ hoher Wortfrequenz, deren Partizipform jedoch selten verwendet wird (wie z.B. geschienen). In einem auditiven lexikalischen Entscheidungsexperiment, in dem wir Reaktionszeiten für Paare von deutschen Nominalpluralen mit gleicher Wortfrequenz, aber unterschiedlicher Frequenz der Pluralform verglichen, zeigte sich z.B. ein Effekt der Wortformfrequenz für Pluralformen auf -er (Penke & Krause 2002): Bei gleicher Wortfrequenz wurden -er-Plurale mit höherer Pluralfrequenz (z.B. Rinder: Wortfrequenz 98, Pluralfrequenz 67) signifikant schneller erkannt als -er-Plurale mit niedrigerer Pluralfrequenz (z.B. Fässer: Wortfrequenz 80, Pluralfrequenz 9) (vgl. Abb. 2.2). Effekte der Wortformfrequenz werden als Beleg dafür gesehen, dass die getesteten flektierten Wortformen im mentalen Lexikon gespeichert sind und der Frequenzeffekt Folge des Zugriffs auf diese Wortformen ist. Folglich lässt sich dieser Effekt nutzen, um zu testen, ob bzw. für welche flektierten Wortformen eine Wortformspeicherung im mentalen Lexikon anzunehmen ist. Fehlende Wortformfrequenzeffekte werden dementsprechend als Evidenz gegen eine Vollformspeicherung flektierter Wortformen gewertet.
28
Abb. 2.2: Frequenzeffekt bei deutschen -er-Pluralen (nach Penke & Krause 2002)
2.1.2.2 Priming-Effekt Auch priming-Effekte – auf deutsch vielleicht am besten mit ‚Voraktivierungseffekt’ zu bezeichnen – zeigen sich bei lexikalischen Entscheidungsaufgaben. Der Versuchsaufbau bei diesem Experimenttyp ist jedoch etwas anders als bei den oben beschriebenen lexikalischen Entscheidungsexperimenten. Bei einem priming-Experiment wird der Einfluss eines vorgegebenen Wortes, des primes, auf die lexikalische Entscheidungszeit des Zielworts oder target untersucht. Der klassische priming-Effekt ist das semantische priming (z.B. Meyer & Schvanefeldt 1971). Präsentiert man einer Versuchsperson als prime z.B. das Wort dog, gefolgt von dem Zielwort cat, dann ist die lexikalische Entscheidungszeit für dieses Zielwort deutlich verkürzt im Vergleich zu einer Konstellation, in der das Zielwort cat auf einen nicht mit dem Zielwort in semantischer Beziehung stehenden prime, wie z.B. pen, folgt. Der primingEffekt ergibt sich aus dem Vergleich der lexikalischen Entscheidungszeiten, die für ein bestimmtes Zielwort in einem neutralen Kontext gemessen werden, mit denen, die gemessen werden, wenn dieses Zielwort zu dem prime in einer Beziehung steht. Der semantische priming-Effekt wird so interpretiert, dass die Vorgabe eines semantisch verwandten primes außer dem Wort selbst auch die Einträge aktiviert, die mit dem prime über assoziative Bahnen verbunden sind, da sie z.B. semantische Merkmale teilen (vgl. Balota 1994, aber auch Neely 1991, Forster 1999). Gehört das nachfolgend präsentierte Zielwort auch zu diesen voraktivierten Einträgen, dann können Zugriff und Verarbeitung dieses Wortes schneller erfolgen, als dies bei fehlender Voraktivierung der Fall wäre. Der klarste Fall eines priming-Effekts liegt demnach beim Identitäts-priming vor, in dem prime und Zielwort identisch sind. Der semantische priming-Effekt wird als Evidenz dafür gesehen, dass Lexikoneinträge im mentalen Lexikon nach semantischen Kriterien miteinander verknüpft sind. Dementsprechend wird dieser Effekt zur Untersuchung der semantischen Strukturierung des mentalen Lexikons eingesetzt.
29 Morphologischer priming-Effekt: Neben diesem semantischen priming-Effekt haben Untersuchungen seit Mitte der 70er Jahre auch Evidenz für einen morphologischen priming-Effekt gefunden. Stanners et al. (1979) konnten zeigen, dass ein priming-Effekt auch dann zu beobachten ist, wenn prime und Zielwort in einer morphologischen Beziehung zueinander stehen. Präsentiert man als prime eine flektierte Form, wie z.B. pours ‚gießen-3.Sg.‘, und als Zielwort den Verbstamm pour, so zeigen sich deutlich verkürzte lexikalische Entscheidungszeiten für das Zielwort im Vergleich zu einer Bedingung, in der prime und Zielwort nicht in einer morphologischen Beziehung zueinander stehen. Dieser morphologische priming-Effekt wird als Evidenz dafür gewertet, dass das flektierte prime-Wort pours bei der Verarbeitung den Verbstamm pour aktiviert, was die Reaktionszeiten bei der anschließenden Präsentation dieses Verbstamms verkürzt. Die Voraktivierung des Verbstamms ist jedoch nur dann möglich, wenn das flektierte prime-Wort bei der Verarbeitung in Stamm und Affix dekomponiert wird. Wären Verbstamm und flektierte Verbformen eigenständige Einträge im mentalen Lexikon, die nicht miteinander in Beziehung stehen, dann wäre eine Voraktivierung des Verbstamms nach Präsentation einer flektierten Verbform dagegen nicht zu erwarten. Dass orthographische bzw. phonologische Ähnlichkeit zwischen prime und Zielwort für diesen Effekt verantwortlich sind, kann ausgeschlossen werden. So konnten z.B. Drews & Zwitserlood (1995) zeigen, dass zwar für morphologisch verwandte prime-Zielwort-Paare wie kersen - kers ‚KirschenKirsche‘ ein priming-Effekt auftritt, nicht jedoch für orthographisch ähnliche Paare wie kerst - kers ‚Weihnachten-Kirsche‘ (vgl. auch Kempley & Morton 1982, Napps & Fowler 1987, Napps 1989, Allen & Badecker 2002). Ein Einfluss der semantischen Ähnlichkeit zwischen prime und Zielwort kann in Studien zum morphologischen priming dadurch ausgeschlossen werden, dass die semantische Ähnlichkeit zwischen prime und Zielwort in den verschiedenen morphologischen Testbedingungen konstant gehalten wird. Eine Reihe von Studien hat mittlerweile den morphologischen priming-Effekt genutzt, um zu untersuchen, inwieweit bzw. für welche flektierten Formen von einer Dekomposition in Stamm und Affix ausgegangen werden kann (z.B. Marslen-Wilson, Hare & Older 1993 zum Englischen, Laudanna, Badecker & Caramazza 1992 und Orsolini & Marslen-Wilson 1997 zum Italienischen, Feldman & Fowler 1987 zum Serbokroatischen, Schriefers, Friederici & Graetz 1992, Sonnenstuhl, Eisenbeiss & Clahsen 1999 zum Deutschen, Meunier & Marslen-Wilson 2004 zum Französischen). Um das Vorliegen und die Signifikanz eines priming-Effekts zu evaluieren, werden in Experimenten zum morphologischen priming idealerweise drei verschiedene Bedingungen getestet: (i) eine Identitätsbedingung, in der prime und Zielwort identisch sind (z.B. prime: Brikett, Zielwort: Brikett); (ii) eine Kontrollbedingung, in der prime und Zielwort weder semantisch noch morphologisch verwandt sind (prime: Giebel, Zielwort: Brikett); und (iii) eine Testbedingung, in der zwischen prime und Zielwort eine morphologische (und auch semantische) Beziehung besteht (prime: Briketts, Zielwort: Brikett). Ein priming-Effekt liegt dann vor, wenn die lexikalischen Entscheidungszeiten für das Zielwort in Identitäts- und Testbedingung signifikant unter den Entscheidungszeiten in der Kontrollbedingung liegen (vgl. Abb. 2.3). Je nach Art der Stimuluspräsentation werden verschiedene Varianten von primingExperimenten unterschieden. Prime und Zielwort können unimodal entweder auditiv oder visuell dargeboten werden oder crossmodal, wobei einem auditiv dargebotenen prime ein
30 visuell dargebotenes Zielwort folgt. Das crossmodale priming bietet den Vorteil, dass ein Effekt der rein phonologischen bzw. rein orthographischen Ähnlichkeit von prime und Zielwort ausgeschlossen werden kann. Weitere Varianten ergeben sich daraus, ob prime und Zielwort direkt aufeinander folgen (immediate repetition priming), bzw. aus der Anzahl der zwischen prime und target liegenden Stimuli (short bzw. long lag priming). Dementsprechend ergeben sich auch Unterschiede in der Aufgabe der Versuchspersonen, die die Entscheidungsaufgabe entweder für jeden Stimulus durchführen (short bzw. long lag priming) oder nur auf das Zielwort reagieren sollen (crossmodales priming). Abbildung 2.4 zeigt das Untersuchungsdesign für ein crossmodales priming-Experiment.
Abb. 2.3: Priming-Effekt bei -s-Pluralen (nach Sonnenstuhl, Eisenbeiss & Clahsen 1999)
Abb. 2.4: Experimentelles Design bei einem crossmodalen priming-Experiment (Sonnenstuhl, Eisenbeiss & Clahsen 1999)
31 2.1.2.3 Ungrammatikalitätseffekt Ein weiterer Effekt, für den es eine Reihe unterschiedlicher Untersuchungsdesigns gibt, ist der Ungrammatikalitätseffekt. In Verarbeitungsexperimenten zeigt sich regelmäßig, dass die Verarbeitung einer ungrammatischen Struktur im Vergleich zu einer grammatischen Struktur mit signifikant längeren Reaktionszeiten einhergeht. Man nimmt an, dass diese längeren Reaktionszeiten durch die Verarbeitung der Ungrammatikalität verursacht sind. Diesen Effekt kann man nutzen, um zu untersuchen, welche Arten von Grammatikalitätsverletzungen zu einem Ungrammatikalitätseffekt führen und ob unterschiedliche Grammatikalitätsverletzungen mit unterschiedlich starken Ungrammatikalitätseffekten einhergehen. Die Satzpaar-Vergleichsaufgabe: Ein Untersuchungsverfahren, das bei bestimmten Grammatikalitätsverletzungen regelmä ßig zu Ungrammatikalitätseffekten führt, ist die Satzpaar-Vergleichsaufgabe (sentence matching) (vgl. z.B. Murray 1982, Freedman & Forster 1985). Bei diesem Verfahren soll die Versuchsperson so schnell wie möglich entscheiden, ob zwei auf dem Bildschirm präsentierte Sätze (oder andere linguistische Strukturen) identisch sind oder nicht. Dabei wird die Reaktionszeit ab Beginn der Präsentation der zweiten Struktur bis zur Entscheidung der Versuchsperson durch Druck auf eine Taste der Reaktionszeitbox gemessen (vgl. Abb. 2.5 für das Vorgehen bei diesem Experimenttyp).2
Abb. 2.5: Experimentelles Design bei einer Satzpaar-Vergleichsaufgabe
–––––––—–– 2
Die versetzte Präsentation des zweiten Satzes soll einen rein perzeptuellen Vergleich der beiden Sätze, wie er bei paralleler Anordnung möglich wäre, verhindern.
32 Um diese Aufgabe für die Versuchsperson sinnvoll zu machen, werden neben identischen Satzpaaren auch Satzpaare präsentiert, die nicht identisch sind. Da die Reaktionszeit bei diesen Paaren jedoch vom Ort der Differenz im Satz abhängig ist – je weiter vorne im Satz, desto schneller die Reaktionszeit –, kann man lediglich die Reaktionszeiten identischer Paare auswerten. Ein Ungrammatikalitätseffekt ergibt sich dann, wenn man die Reaktionszeiten für identische grammatische Paare mit den Reaktionszeiten auf identische ungrammatische Paare vergleicht. Abbildung 2.6 illustriert den Ungrammatikalitätseffekt am Beispiel einer Untersuchung, in der wir dieses Verfahren einsetzten, um Verletzungen der nominalphraseninternen Kongruenz zu untersuchen (vgl. Kap. 5.2.2 und 5.3.2 sowie Penke, Janssen & Eisenbeiss 2004).
Abb. 2.6: Ungrammatikalitätseffekt bei Verletzung der nominalphraseninternen Kongruenz (nach Penke, Janssen & Eisenbeiss 2004)
2.1.3 Zusammenfassung Die besprochenen Methoden haben uns in den letzten Jahren über die mit ihnen verbundenen Verarbeitungseffekte Einblicke in die Repräsentation der Flexionsmorphologie im mentalen Lexikon ermöglicht. Leider sind jedoch mit jedem der drei diskutierten Untersuchungsdesigns spezifische Probleme verbunden. So zeigen sich bei der lexikalischen Entscheidungsaufgabe nicht nur Frequenzeffekte. Die Entscheidungszeiten werden auch von Faktoren beeinflusst wie der Vertrautheit der Versuchsperson mit einem präsentierten Wort, dem Alter, in welchem ein Wort erworben wurde (age of acquisition Effekt, Morrison & Ellis 1995), der Anzahl und der Frequenz orthographisch oder phonologisch ähnlicher Wörter (Nachbarschaftseffekt) sowie von semantischen Faktoren, wie z.B. der Konkretheit eines Stimulus (siehe Balota 1994 für einen Überblick). Das Stimulusmaterial hinsichtlich all dieser Faktoren zu kontrollieren, ist jedoch kaum möglich. Ein Einfluss dieser Faktoren auf die Reaktionszeitergebnisse kann daher häufig nicht gänzlich ausgeschlossen werden.
33 Die eben genannten konfundierenden Faktoren können natürlich auch die Ergebnisse von priming-Untersuchungen beeinträchtigen. Bei priming-Experimenten interessieren zwar nicht absolute Entscheidungszeiten, sondern es werden die Entscheidungszeiten für das Zielwort in Identitäts-, Kontroll- und Testbedingung miteinander verglichen. Faktoren wie Nachbarschaftsgröße, Vertrautheit oder Konkretheit können jedoch ungünstigenfalls mit den verschiedenen Experimentbedingungen interagieren. Zudem gibt es Hinweise darauf, dass die in priming-Experimenten beobachteten Effekte nicht unabhängig von der Art der Stimuluspräsentation (auditiv oder visuell) sind (vgl. z.B. Feldman & Soltano 1999, Rueckl & Galantucci 2005). Während z.B. Marslen-Wilson, Hare & Older (1993) in einem crossmodalen immediate repetition priming-Experiment mit visueller Präsentation des Zielworts einen priming-Effekt nur für regulär flektierte past tense Formen des Englischen fanden, berichten Marslen-Wilson & Tyler (1997) von einem vollen priming-Effekt auch für irregulär flektierte past tense Formen in einem unimodalen priming-Experiment mit auditiver Stimuluspräsentation. Spiegelt der priming-Effekt lediglich die Dekomposition eines flektierten Wortes in Stamm und Affix wider, dann sind solche Effekte der Stimuluspräsentation eigentlich nicht zu erwarten, da die Frage, ob dekomponiert werden kann, unabhängig von der Präsentationsmodalität sein sollte (vgl. auch Forster 1999 für weitere offene Fragen zum priming). Kontrovers diskutiert wird auch die Frage, welche ungrammatischen Strukturen bei der Satzpaar-Vergleichsaufgabe zu Ungrammatikalitätseffekten führen und wodurch dieser Effekt verursacht ist. Während z.B. Verletzungen der Subjekt-Verb-Kongruenz regelmäßig zu einem Ungrammatikalitätseffekt führen, fand sich in einer Reihe von Studien kein Ungrammatikalitätseffekt für ungrammatische wh-Fragen der Art Who did you see Leonardo’s painting of? (vgl. z.B. Freedman & Forster 1985, Crain & Fodor 1987, aber Eubank 1993). Zur Erklärung dieses Unterschieds wird diskutiert, ob Ungrammatikalitätseffekte nur bei lokalen Verletzungen (z.B. Forster & Stevenson 1987), nur bei Verletzungen unterhalb der CP-Ebene (z.B. Eubank 1993), nur bei leicht zu korrigierenden Fehlern (Crain & Fodor 1987) oder nur bei Fehlern, die keine Operator-Variablen-Bindung betreffen (z.B. Clahsen, Hong & Sonnenstuhl 1995), auftreten. Trotz der bestehenden Unklarheiten, welche spezifischen kognitiven Verarbeitungsschritte jeweils für einen bestimmten experimentellen Effekt verantwortlich sind, bedürfen signifikant unterschiedliche Reaktionen in den verschiedenen Experimentbedingungen eines gut kontrollierten Experiments immer der Erklärung. Die Untersuchung einer Fragestellung mit verschiedenen Verfahren ermöglicht es dabei, methodenspezifische Effekte und Probleme zu minimieren.
2.2 Bildgebende Verfahren der Neurolinguistik Die Entwicklung moderner bildgebender Verfahren wie der ereigniskorrelierten Potentiale, der funktionellen Magnetresonanztomographie oder der Positronenemissionstomographie hat uns in den letzten Jahren einen neuen Weg geebnet, um Erkenntnisse über die neuronalen Grundlagen der Sprachverarbeitung und -repräsentation zu gewinnen. Die Ableitung
34 von Nervensignalen mittels ereigniskorrelierter Potentiale erreicht im Vergleich zu herkömmlichen Reaktionszeitexperimenten eine noch bessere zeitliche Auflösung. Im Prinzip ist es mit dieser und verwandten Techniken möglich, die im Gehirn ablaufenden kognitiven Verarbeitungsvorgänge fast in Realzeit zu registrieren. Verfahren wie die funktionelle Magnetresonanztomographie oder die Positronenemissionstomographie ermöglichen uns ferner, Aufschlüsse über die Lokalisation sprachlicher Komponenten im Gehirn zu gewinnen. Vor der Entwicklung der modernen bildgebenden Verfahren beruhten Erkenntnisse über die neuronale Organisation sprachlicher Komponenten in erster Linie auf der Untersuchung von Menschen, die als Folge einer Hirnschädigung eine Sprachstörung erlitten hatten. Bei dieser Methode ist jedoch strittig, inwieweit tatsächlich Erkenntnisse über die Lokalisation und Arbeitsweise des unbeeinträchtigten Sprachsystems gewonnen werden können (vgl. Abschnitt 2.3). Im Gegensatz dazu können bildgebende Verfahren auch bei unbeeinträchtigten Versuchspersonen angewendet werden. Damit können nicht nur die Ergebnisse der Untersuchung von Sprachstörungen evaluiert werden, sondern diese Verfahren erlauben auch einen direkten Blick auf die neuronale Organisation des unbeeinträchtigten Sprachsystems ohne den Umweg der Analyse von Sprachstörungen. Relevanter als die hohe zeitliche Auflösung oder die häufig sehr präzise Lokalisation sprachlicher Komponenten, die diese bildgebenden Verfahren ermöglichen, ist für die vorliegende Arbeit jedoch, dass diese Verfahren eine neue Möglichkeit bieten, um zu untersuchen, ob auf theoretischer Basis postulierte distinkte kognitive Komponenten auch neuronal distinkt repräsentiert sind. Diese Möglichkeit ergibt sich aufgrund der Annahme, dass eine bestimmte kognitive Operation oder Repräsentation stets an das gleiche neuronale Substrat gekoppelt ist, im Gehirn also nur in einer Art und Weise implementiert ist (Invarianz-Hypothese) (Rugg 1999). Zeigen sich in bildgebenden Untersuchungen daher qualitativ oder neuroanatomisch distinkte Aktivierungsmuster, kann daraus geschlossen werden, dass die mit ihnen korrelierten kognitiven Operationen bzw. Repräsentationen ebenfalls qualitativ distinkt sind (vgl. z.B. Rugg 1999, Hagoort, Brown & Osterhout 1999). Die folgenden beiden Abschnitte sollen als kurze Einführung in die Methodik der modernen bildgebenden Verfahren dienen. Das bildgebende Verfahren, das zunächst vorgestellt werden soll, ist die Darstellung der neuronalen Mechanismen kognitiver Prozesse mit Hilfe der Technik der ereigniskorrelierten Potentiale (abgekürzt ERP für event related potential, deutsch auch EKP). 2.2.1 Ereigniskorrelierte Potentiale Nervenzellen leiten Signale in Form kurzer elektrischer Impulse weiter. Sind große Neuronenverbände synchron aktiv, können die elektrischen Impulse, die bei der synaptischen Übertragung von Nervensignalen an den Dendriten insbesondere der Pyramidenzellen des Neocortex entstehen, mit Elektroden an der Kopfoberfläche registriert werden (Kutas & Van Petten 1994, Segalowitz & Chevalier 1998, Kutas, Federmeier & Sereno 1999). Diese Ableitung der elektrischen Aktivierungen im Gehirn nennt man ein Elektroenzephalogramm (EEG). An jeder Elektrode wird dabei registriert, wie sehr sich die von ihr gemessene elektrische Ladung von der Ladung unterscheidet, die an einer Referenzelektrode
35 gemessen wird, an der sich keine Hirnaktivität bemerkbar macht, z.B. am Ohrläppchen.3 Gemessen werden also die Spannungsdifferenzen zwischen zwei Elektroden, die sich in Form von Kurven mit positivem oder negativem Verlauf im EEG niederschlagen. Diese Kurven geben jedoch keinen Hinweis darauf, ob sie durch hemmende oder erregende Aktivierung verursacht sind. Die Spannungsdifferenzen, die als Reaktion auf einen spezifischen Reiz auftreten, bewegen sich im Bereich von wenigen Mikrovolt (ca. 5-10 µV). Diese Schwankungen fallen vor dem Hintergrund der normalen Spannungsvariationen im Gehirn, die sich im Rahmen von 50-100 µV bewegen, nicht auf (Kutas & Van Petten 1994). Um diese Spannungsdifferenzen dennoch sichtbar zu machen, bedient man sich des Tatbestands, dass sich zufällig generierte, übereinander gelegte Kurven gegenseitig nivellieren. Präsentiert man denselben Reiz viele Male, dann nivellieren sich im EEG die übereinander gelegten Aktivierungskurven, die nicht durch die Verarbeitung dieses Reizes verursacht sind, zu einer Nulllinie. Die EEG-Aktivität, die durch die Reizverarbeitung verursacht ist, addiert sich dagegen auf. Durch dieses averaging genannte Verfahren erhält man eine Basislinie, vor der die Spannungsdifferenzen registriert werden können, die durch die Reizverarbeitung ausgelöst werden. Aus diesem Verfahren ergibt sich auch die Bedeutung des Begriffs EKP. EKPs sind Spannungsdifferenzen im EEG, die zeitlich synchronisiert zu sensorischen, motorischen oder kognitiven Prozessen auftreten. Das Verfahren erlaubt damit, die Hirnaktivität zu messen, die mit einem sensorischen, motorischen oder kognitiven Prozess korreliert ist (ausführlichere Beschreibungen der Methode finden sich z.B. in Garnsey 1993, Kutas & Van Petten 1994). EKP-Komponenten: Die an den Elektroden registrierten Spannungsdifferenzen werden in Hinblick auf vier Parameter ausgewertet: (i) Polarität: Führen die Spannungsdifferenzen zu einer Positivierung oder einer Negativierung im Vergleich zur Basislinie bzw. zu einer Referenzlinie, die sich aus einer Vergleichsbedingung innerhalb des Experiments ergibt? (ii) Amplitude Wo zeigen sich Maxima bzw. Minima der Spannungsschwankung? (iii) Latenz: Wie ist der zeitliche Verlauf dieser Maxima und Minima von der Stimuluspräsentation an? (iv) Topographie: Wie ist die Verteilung der EKPs auf der Kopfoberfläche? Aus der Gesamtheit dieser Informationen leiten sich Bezeichnungen für charakteristische Wellenformen ab, die bei bestimmten experimentellen Manipulationen regelmäßig auftreten. Diese charakteristischen Wellenformen werden als Anzeichen für einen bestimmten Verarbeitungsprozess gesehen und als Komponente bezeichnet. Eine solche Komponente ist z.B. die N400. Die N400 bezeichnet eine Welle, die im Vergleich zur Basis- bzw. Referenzlinie zu einer Negativierung führt, die nach ca. 400 ms ihr Maximum an centro-parietalen Elektroden (auf der Mitte des Schädels) erreicht. Ferner unterscheidet man exogene von endogenen Komponenten. Während exogene Komponenten die Erregung sensorischer –––––––—–– 3
Möglich ist auch der Vergleich mit dem algebraischen Mittel der Aktivierungen an allen anderen Elektroden.
36 Bahnen reflektieren und bis zu 100 ms nach dem Reiz auftreten, reflektieren die danach auftretenden endogenen Komponenten nicht die physikalischen Eigenschaften des Stimulus, sondern werden als Korrelat eines bestimmten kognitiven Verarbeitungsschrittes aufgefasst (Heinze & Münte 1992, Garnsey 1993, Kutas & Van Petten 1994). EKP-Komponenten, die mit der Verarbeitung morphologischer Verletzungen korreliert sind (N400 und LAN): Bei der Untersuchung endogener Komponenten, die mit der Verarbeitung sprachlicher Reize korreliert sind, wird als experimentelles Design oft das so genannte Verletzungsparadigma gewählt. Dabei werden der Versuchsperson neben korrekten zielsprachlichen Reizen auch Reize angeboten, die die Zielsprache verletzen. Verglichen werden dann die Kurven, die als Reaktion auf einen zielsprachlichen bzw. nicht-zielsprachlichen Reiz auftreten. In Untersuchungen zur Verarbeitung flektierter Formen wurden so insbesondere zwei relevante Komponenten gefunden: die N400 und die LAN (für links anteriore Negativierung). Die N400 ist die zur Zeit wahrscheinlich am besten untersuchte endogene Komponente. Sie war die erste neurolinguistische Komponente, die 1980 in einer Untersuchung von Kutas & Hillyard (1980) identifiziert werden konnte. Kutas & Hillyard präsentierten ihren Versuchspersonen Wort für Wort Sätze, bei denen das letzte präsentierte Wort entweder semantisch zum Satzkontext passte (vgl. (1a)) oder eine semantisch unpassende Vervollständigung war (vgl. (1b)). (1) a. The pizza was too hot to eat. b. The pizza was too hot to cry. Dabei zeigte sich im Vergleich der zwei Bedingungen als Reaktion auf die semantisch unplausible Satzvervollständigung eine negative Welle, mit einem Beginn um 250 ms, die über den centro-parietalen Elektroden (auf der Mitte des Schädels) nach ca. 400 ms einen (negativen) Gipfel erreichte (siehe Abb. 2.7).
Abb. 2.7: Schematische Darstellung einer N400 auf semantisch passende bzw. unpassende Satzvervollständigungen (nach Kutas & Van Petten 1994)
37 Die weitere Untersuchung der Frage, wodurch eine N400 auslösbar ist, hat inzwischen ergeben, dass die N400 wahrscheinlich als Reflex lexikalischer Verarbeitungsvorgänge zu sehen ist. Ihre Amplitude ist dabei umso größer, je höher der Verarbeitungsaufwand ist, der benötigt wird, um ein Wort semantisch in die bisher erstellte Bedeutungsrepräsentation zu integrieren (für eine ausführliche Diskussion der N400 vgl. z.B. Kutas & Van Petten 1988, 1994). Auch in unseren Arbeiten zur Flexionsmorphologie konnten wir eine N400 beobachten, nämlich dann, wenn ein eigentlich regulär flektiertes Wort mit einer irregulären Endung präsentiert wurde (z.B. *Karussellen statt Karussells). Wahrscheinlich deutet das Auftreten der N400 in dieser Bedingung darauf hin, dass diese irregularisierten Wörter als nicht-existente Kunstwörter erfasst werden, da die Präsentation von Kunstwörtern ebenfalls regelmäßig zu einer N400 führt (vgl. Weyerts et al. 1997). Ein anderer Effekt, der sich unter anderem bei Untersuchungen zur Flexionsmorphologie gezeigt hat, ist die LAN. Die LAN tritt mit einer ähnlichen Latenz wie die N400 zwischen 300 und 500 ms nach Stimuluspräsentation auf, zeigt aber eine andere topographische Verteilung als die N400 mit einem Maximum über den Elektroden, die links vorne (d.h. links anterior) auf dem Schädel platziert sind. In verschiedenen Untersuchungen hat sich eine LAN als Reaktion auf Verletzungen morphosyntaktischer Merkmale, z.B. bei Verletzungen der Subjekt-Verb-Kongruenz oder bei Kasus- und Numerusfehlern, gezeigt (Münte, Heinze & Mangun 1993, Hagoort, Brown & Osterhout 1999). In unseren eigenen Arbeiten haben wir eine LAN gefunden, wenn reguläre Flexionsendungen an eigentlich irregulär flektierte Wörter affigiert werden wie *gelauft oder *Muskels (siehe Abb. 2.8) (vgl. Penke et al. 1997, Weyerts et al. 1997). Eine ausführlichere Darstellung dieser Ergebnisse folgt in Kapitel 4.1.5.
Abb. 2.8: LAN bei starken Verben mit regulärem Partizip suffix (nach Penke et al. 1997)
Vorteile und Probleme der Methode: Der große Vorteil der EKP-Technik liegt in ihrer hervorragenden zeitlichen Auflösung. Im Prinzip ist es möglich, zu jedem Zeitpunkt eines Verarbeitungsprozesses ein Bild über die im Gehirn stattfindenden Aktivierungsprozesse zu gewinnen. Wie Kutas & Van Petten (1994) feststellen: „The measure is as close to immediate and on-line as is now technically possible.“ (ebd.: 93).
38 Zudem bieten EKPs unter der Annahme, dass zwei identische kognitive Verarbeitungsprozesse nicht zu verschiedenen EKP-Effekten führen können, die Möglichkeit zu testen, ob die Annahme hypothetisch distinkter, kognitiver Prozesse gerechtfertigt ist oder nicht. Findet man unterschiedliche EKP-Komponenten, die mit hypothetisch distinkten Verarbeitungsprozessen korrelieren, so bietet das Evidenz dafür, dass es sich um zwei distinkte kognitive Prozesse handelt (Kutas & Van Petten 1994, Rugg 1999, Hagoort, Brown & Osterhout 1999). Umgekehrt sollte ein und dieselbe kognitive Operation nicht mit distinkten EKP-Komponenten einhergehen. Probleme der Methode liegen darin, dass zur Zeit noch unklar ist, welche kognitiven Prozesse genau sich in den EKP-Komponenten – wie einer N400 oder LAN – widerspiegeln. Weitere Unklarheiten betreffen die Fragen, ob eine Komponente als Anzeichen einer zeitgleich ablaufenden kognitiven Operation zu sehen oder nur Folge einer solchen Operation ist und in welchem Teil der Komponente die Aussage steckt: im Maximum oder zum Zeitpunkt der ersten signifikanten Divergenz zweier Wellen (vgl. auch Garnsey 1993, Kutas & Van Petten 1994). Auch Rückschlüsse auf die Frage, welche Hirnstrukturen die EKPs erzeugen, sind problematisch. Die Beobachtung, dass eine links vorn platzierte Elektrode eine besonders hohe Spannungsdifferenz zur Referenzelektrode zeigt, bedeutet nicht, dass diese Differenz durch die Aktivität des darunter liegenden Kortex ausgelöst wurde. Vielmehr ist jede räumliche Verteilung von Spannungsdifferenzen an der Kopfhaut mit mehr als einer Menge möglicher so genannter Generatoren kompatibel (Garnsey 1993, Kutas & Van Petten 1994, Kutas, Federmeier & Sereno 1999). Ursächlich für dieses als Inversionsproblem bekannte Problem sind z.B. die unterschiedliche Durchlässigkeit des Schädelknochens für die elektrischen Impulse oder die Organisation der Neuronen im Kortex und ihre Lage zur messenden Elektrode (vgl. Kutas, Federmeier & Sereno 1999 für eine ausführliche Diskussion des Inversionsproblems und verschiedener Lösungsansätze). Zudem kann man davon ausgehen, dass kognitive Komponenten nicht durch jeweils einen einzigen so genannten Generator, sondern durch eine ganze Reihe neuronaler Generatoren erzeugt werden, die unterschiedlich lokalisiert sind. Anzunehmen ist nämlich, dass eine EKP-Komponente einen Verarbeitungsprozess widerspiegelt, der über eine gewisse Zeit läuft und unterschiedliche Verarbeitungsschritte umfasst, die in unterschiedlichen Arealen des Gehirns lokalisiert sein können. Wichtig ist auch zu bedenken, dass EKPs nicht alle neuronalen Aktivitäten des Gehirns anzeigen, sondern nur dann registriert werden, wenn große Neuronenverbände synchron aktiviert werden (Garnsey 1993, Segalowitz & Chevalier 1998, Rugg 1999). 2.2.2 Positronenemissionstomographie und funktionelle Magnetresonanztomographie Die Positronenemissionstomographie (PET) und die funktionelle Magnetresonanztomographie (fMRI für functional magnetic resonance imaging, deutsch fMRT) gehören zu den modernen bildgebenden Verfahren, die Schnittbilder (Tomogramme) des Gehirns produzieren, auf denen während eines kognitiven Verarbeitunsvorgangs aktive Hirnregionen räumlich sehr genau lokalisiert werden können. Beide Verfahren sind mittlerweile auch in Untersuchungen zur Flexionsmorphologie eingesetzt worden (z.B. Jaeger et al. 1996, Indefrey et al. 1997, Ullman, Bergida & O‘Craven 1997, Beretta et al. 2003, Sach, Seitz & Indefrey 2004). Dabei ging es insbesondere darum herauszufinden, ob regulär und irregulär
39 flektierte Wörter in unterschiedlich lokalisierten Hirnregionen verarbeitet werden. Wäre dies der Fall, dann wäre das Evidenz gegen unitaristische Ansätze der Flexion, die für beide Typen von flektierten Wortformen keine Unterschiede in der kognitiven Verarbeitung und damit auch in der Lokalisation der Verarbeitungsprozesse annehmen. Im Folgenden werde ich zunächst die beiden Verfahren kurz erläutern. Auf konkrete Ergebnisse der Untersuchungen zur Flexionsmorphologie werde ich in den Kapiteln 4.1.5, 6.2 und 6.3.1 eingehen. PET und fMRT sind hämodynamische Methoden, die sich den Umstand zu Nutze machen, dass es im Gehirn eine enge Kopplung zwischen dem Aktivitätszustand von Neuronenverbänden und der Blutversorgung gibt: Aktivitätssteigerungen gehen mit einer Zunahme des Blutflusses einher. Der Blutfluss in regional umschriebenen Hirnarealen (der regional cerebral blood flow, rCBF) kann daher als Indikator für die Aktivität der Neuronenpopulation in diesem Areal gesehen werden (Raichle 1998, Rugg 1999). Die beiden Verfahren unterscheiden sich jedoch darin, wie sie den rCBF bestimmen. Die Methode der PET: Bei der PET wird den Versuchspersonen eine radioaktiv markierte Substanz – der tracer (z.B. in Wasser (H2O) gebundener, radioaktiv markierter Sauerstoff (15O)) – in die Blutbahn injiziert. Diese radioaktiv markierte Substanz wird mit dem Blutstrom ins Gehirn transportiert und reichert sich insbesondere in den Hirnregionen an, deren Neuronenpopulation aktiviert und daher stärker durchblutet sind. Wie stark sich der tracer in welcher Hirnregion ansammelt, d.h. welche Hirnregion wie stark aktiv ist, kann man messen, da der radioaktiv markierte tracer bei seinem Verfall Positronen emittiert. Diese frei werdenden Positronen kollidieren mit negativ geladenen Elektronen. Beide Teilchen zerstrahlen dabei zu zwei Gammaquanten, die in entgegengesetzter Richtung davonfliegen. Diese Gammastrahlung wird mit einem Detektorring, der den Kopf der Versuchsperson umgibt, registriert, wobei ein Signal gewertet wird, wenn zwei entgegengesetzt liegende Detektoren ansprechen. Aus diesem Signal lässt sich dann der Entstehungsort der Gammastrahlung sehr genau ermitteln. Aktivitätsunterschiede im Gehirn lassen sich mit diesem Verfahren auf wenige Millimeter genau ermitteln. Da die PET aufgrund der erforderlichen Ausstattung und Logistik bei der Herstellung der notwendigen radioaktiven tracer, der kurzen Halbwertzeit des tracers und der Strahlenbelastung der Probanden nicht unproblematisch in der Anwendung ist, wird zur Lokalisation kognitiver Prozesse im Gehirn zunehmend die funktionelle Magnetresonanztomographie (fMRT) eingesetzt. Die Methode der fMRT: Bei der fMRT macht man sich eine Besonderheit des Hirnstoffwechsels zu Nutze: Neuronale Aktivierungen führen zu Veränderungen der lokalen Durchblutung. Der Sauerstoffverbrauch der aktivierten Hirnregionen steigt jedoch nicht proportional mit der Steigerung des Blutflusses. Es kommt zu einem Missverhältnis zwischen dem gesteigerten Blutfluss und der geringeren Steigerung des Sauerstoffverbrauchs. Als Konsequenz enthält daher das aktive Hirnregionen durchfließende Blut mehr Sauerstoff als das inaktive Hirnregionen durchfließende Blut (Raichle 1994, Rugg 1999). Durch die Sauerstoffbeladung ändern sich die magnetischen Eigenschaften des Hämoglobins, das den Sauerstoff transportiert. Diese veränderten magnetischen Eigenschaften kann man mit der Magnetresonanztomographie
40 aufdecken, die den Effekt der Kernspinresonanz nutzt. Dabei richtet ein starkes Magnetfeld die Protonen von Wasserstoffatomen im Körpergewebe in eine Richtung hin aus. Die ausgerichteten Protonen führen dabei eine nicht-synchrone Präzessionsdrehung aus, d.h. ihre ausgerichteten Achsen beschreiben einen Kegelmantel. Durch einen Radioimpuls kann man die Protonen in Phase bringen. Sie führen dann eine synchronisierte Bewegung aus. Das durch die Bewegung der Protonen entstehende Magnetfeld induziert einen Strom, der in einer Messspule registriert wird. Dieser Strom wird durch die synchrone Schwingung der Protonen verstärkt. Gemessen wird ebenfalls die Abnahme dieses Stroms, die dadurch bedingt ist, dass die Protonen aufhören, in Phase zu schwingen (Dephasierung). In der Nähe sauerstoffreichen Bluts erfolgt diese Dephasierung schneller, da sie von lokalen Magnetfeldinhomogenitäten beeinflusst wird, die durch die magnetischen Eigenschaften sauerstoffreichen Bluts verstärkt werden. Bei der funktionellen Magnetresonanztomographie wird dieser Unterschied in der Dephasierung, der so genannte BOLD-Kontrast (für blood oxygenation level dependent), gemessen. (Für eine Darstellung und Diskussion der beiden Methoden vgl. z.B. Raichle 1994, 1998, Chertkow & Bub 1994, Stowe et al. 1994, Démonet 1998, Rugg 1999, Horwitz, Friston & Taylor 2000, Logothetis et al. 2001). Vorteile und Probleme der beiden Methoden: Beide Verfahren ermöglichen eine bis auf wenige Millimeter präzise Lokalisation der Hirnregionen, die bei spezifischen kognitiven Verarbeitungsprozessen aktiv sind (Raichle 1994). Zeigen sich dabei in der experimentellen Manipulation für zwei als distinkt postulierte Sprachkomponenten unterschiedlich lokalisierte Aktivierungszentren, dann wird das als Evidenz dafür gesehen, dass diese kognitiven Komponenten hinsichtlich ihrer Funktion und Lokalisation distinkt sind (z.B. Rugg 1999). Im lebenden Gehirn ist jedoch neben den Hirnregionen, die durch einen spezifischen kognitiven Prozess aktiviert werden, stets eine Vielzahl von Hirnregionen aktiv, die mit anderen Funktionen beschäftigt sind, wie z.B. der Aufmerksamkeitssteuerung oder der Aufrechterhaltung der primären Körperfunktionen. Um aus der Vielzahl der zu jedem Zeitpunkt aktiven Hirnregionen diejenigen zu extrahieren, die spezifisch für einen bestimmten kognitiven Prozess sind, wird die so genannte Subtraktionsmethode angewendet (Raichle 1994, 1998). Bei der Subtraktionsmethode vergleicht man die Hirndurchblutung, die während der Beschäftigung mit der Testbedingung registriert wurde, mit der Hirndurchblutung in einer Kontrollbedingung. Diese Kontrollbedingung kann eine Ruhebedingung sein, die das Gehirn in seiner üblichen, nicht-aufgabenspezifischen Aktivität zeigt. Sie kann jedoch auch in der Fixation eines Bildschirmpunkts oder in einer weiteren Experimentbedingung bestehen, die sich von der Testbedingung möglichst nur in einer kognitiven Operation unterscheidet. Die Durchblutungswerte, die man in dieser Kontrollbedingung ermittelt, werden dann von den Durchblutungswerten subtrahiert, die während der Testbedingung registriert wurden. Durch diese Subtraktion können nicht-aufgabenspezifische Aktivierungen eliminiert werden. Übrig bleiben in dem resultierenden Differenzbild die Hirnareale, die während der spezifischen Aufgabe aktiv und damit wahrscheinlich mit der Bearbeitung dieser Aufgabe beschäftigt waren. Subtrahiert man von den Aktivierungswerten der Testbedingung die Aktivierungswerte einer weiteren Experimentbedingung, die sich möglichst nur in einer kognitiven Operation von der Testbedingung unterscheidet, dann können so die Hirnaktivierungen isoliert werden, die mit dieser unterscheidenden kognitiven
41 Operation korreliert sind (vgl. z.B. Indefrey & Levelt 2000, 2004). Um das Verhältnis zwischen relevantem Signal und störendem Rauschen, das z.B. durch zufällige Aktivierungen während der Aufgabenbedingungen verursacht ist, zu verbessern und die Aussagekraft statistischer Verfahren zu erhöhen, werden Messungen mehrerer Probanden zu einem gemittelten Differenzbild zusammengefasst (siehe Abb. 2.9).
Abb. 2.9: Vorgehen bei der Erstellung gemittelter Differenzbilder (Raichle 1994: 59) Abdruck mit freundlicher Genehmigung von M. Raichle
In der Subtraktionsmethode liegt jedoch auch eines der größten Probleme für PET und fMRT, denn sie macht Aufgaben notwendig, die eine Hierarchie von additiven Prozessen beinhalten und sich wenn möglich nur in jeweils einem kognitiven Prozess voneinander unterscheiden. Nur dann kann bei der Subtraktion das Hirnareal ermittelt werden, das für die Durchführung eines spezifischen mentalen Prozesses zuständig ist. Zur Zeit bewegen wir uns mit Annahmen über die bei bestimmten sprachlichen Prozessen ablaufenden kognitiven Operationen jedoch noch weitgehend im Spekulativen. Dies beeinträchtigt nicht nur die Überlegungen, welche Aufgaben zu einer sinnvollen Subtraktion herangezogen werden können, sondern auch die Interpretation der resultierenden Differenzbilder, die ja in Abhängigkeit von der gewählten Kontrollbedingung variieren. Die so gewonnenen Aussagen zur Lokalisation distinkter kognitiver Komponenten sind folglich immer nur so gut wie die kognitiven Verarbeitungsmodelle, auf denen sie hinsichtlich Aufgabenstellung und Interpretation beruhen (für eine ausführliche Diskussion der Probleme der Subtraktionsmethode und alternativer Methoden vgl. Bub 2000). Auch die Beobachtung, dass Hirnakti
42 vierungen in Abhängigkeit von der Vertrautheit mit der Aufgabe variieren können (vgl. z.B. Raichle 1994, 1998), mahnt zur Vorsicht bei der Interpretation von Ergebnissen aus PETund fMRT-Studien. Zudem erlauben es PET und fMRT zwar, sprachliche Verarbeitungsprozesse mit einer hohen räumlichen Auflösung im Gehirn zu lokalisieren, der zeitliche Verlauf kognitiver Prozesse kann mit dieser Technik jedoch kaum erhellt werden. Kognitive Verarbeitungsprozesse verursachen nur geringe Änderungen im rCBF (ca. 5%, vgl. Stowe et al. 1994, Chertkow & Bub 1994), die sich nicht ad hoc vollziehen, sondern erst mit einer gewissen zeitlichen Verzögerung von ca. 3 Sekunden einsetzen (vgl. Raichle 1994, Démonet 1998, Rugg 1999). Aus Reaktionszeitexperimenten wissen wir jedoch, dass die bei der Sprachverarbeitung ablaufenden kognitiven Prozesse zeitlich deutlich schneller ablaufen, als sie durch PET oder fMRT gemessen werden könnten. In den Differenzbildern zeigen sich folglich Aktivierungen, die nicht nur durch den interessierenden sprachlichen Verarbeitungsprozess ausgelöst sind, sondern z.B. auch durch Erwartung des nächsten Stimulus, durch innere Kommentare oder assoziative Gedankenketten. Diese erschweren es jedoch, die eigentlich interessierende kognitive Operation zu lokalisieren (vgl. Bub 2000). Das Erstellen der Schnittbilder erfordert bei der PET einen gewissen Zeitraum (ca. 40 Sekunden) (Rugg 1999), in dem der interessierende kognitive Prozess kontinuierlich durchgeführt werden muss. Das hat zur Folge, dass mit einem geblockten Experimentdesign gearbeitet werden muss, in dem die Stimuli verschiedener Aufgabenbedingungen nicht randomisiert, sondern in aufeinander folgenden Blöcken mit items jeweils eines Stimulustyps präsentiert werden. Dies kann jedoch neben Effekten, die durch die Gewöhnung an einen bestimmten Stimulustyp ausgelöst werden, auch zur Ausbildung von Lösungsstrategien führen, die nicht die normalerweise ablaufenden kognitiven Operationen widerspiegeln (Rugg 1999). Zwar können Schnittbilder bei der funktionellen Magnetresonanztomographie innerhalb weniger hundert Millisekunden erstellt werden, durch die Verzögerung der Blutflussreaktion beträgt die zeitliche Auflösung bei diesem Verfahren jedoch auch noch ca. 3 Sekunden. Daher wird bei diesem Verfahren ebenfalls häufig ein geblocktes Experimentdesign eingesetzt. Alternativ bietet die funktionelle Magnetresonanztomographie die Möglichkeit ereigniskorrelierter Messungen. Dabei werden über einen Zeitraum von ca. 30 Sekunden die Änderungen des Blutflusses registriert (Anstieg und erneuter Abfall), die mit der Verarbeitung eines Stimulus korreliert sind. Wie bei der Methode der ereigniskorrelierten Potentiale werden anschließend die registrierten Aktivierungswerte aller Stimuli einer Experimentbedingung gemittelt, um zufällige, nicht-aufgabenspezifische Aktivierungen zu nivellieren. Die lange Messspanne geht aber auch hier mit der Gefahr einher, dass wiederkehrende Reaktionen der Versuchsperson, die jedoch nicht durch die Verarbeitung der Teststimuli selbst verursacht sind (z.B. Suche nach verwandten Wörtern, stilles Summen einer Melodie etc.), die Messergebnisse beeinflussen können. Berücksichtigt werden muss außerdem, dass auch bei PET und fMRT – so wie bei der Messung von EKPs – nicht jede Aktivierung im Gehirn registriert wird, da Änderungen der Hirndurchblutung nur durch die Aktivität eines großen, umschrieben lokalisierten Neuronenverbandes ausgelöst werden (Stowe et al. 1994, Démonet 1998). Über größere Kortexareale ausgedehnte Netze einzelner Neuronen, wie sie z.B. in konnektionistischen neuronalen Netzwerken angenommen werden, können eine solche Änderung nicht auslösen. Ihre Aktivierung bliebe folglich unsichtbar.
43
2.3 Die Untersuchung selektiver Defizite bei Sprachstörungen Die Untersuchung von Sprachstörungen ist nicht in gleicher Weise eine ‚Methode’ wie die vorgestellten Reaktionszeit- und bildgebenden Verfahren. Sprachstörungen bieten vielmehr ein Beobachtungsfeld, auf dem die oben dargestellten Methoden eingesetzt werden können, um zu Erkenntnissen, z.B. über die Repräsentation von Flexionsmorphologie, zu gelangen. Die Untersuchung von Sprachstörungen ist jedoch mit den anderen Methoden insofern vergleichbar, als auch hier ein bestimmter Effekt genutzt werden kann, um zu theoretisch relevanten Erkenntnissen zu gelangen – nämlich das Vorliegen selektiver Störungen. Wie bei den bisher vorgestellten Methoden liegen auch der Untersuchung selektiver Defizite bestimmte Annahmen zugrunde, zeigen sich spezifische Probleme und Vorteile. Diese sollen im Folgenden besprochen werden. Unter Sprachstörungen fasst man Beeinträchtigungen der menschlichen Sprachfähigkeit, die nach Abschluss des Spracherwerbs durch Schädigungen des Gehirns verursacht sind. Solche Schädigungen können durch die unterschiedlichsten Prozesse verursacht sein – beispielsweise durch Störungen der Blutversorgung, durch einen degenerativen Abbau der Hirnsubstanz oder durch Störungen des Neurotransmitterhaushalts (d.h. durch Störungen, die die Botenstoffe betreffen, die im Gehirn zur Signalübermittlung verwendet werden). Sprachstörungen sind daher Folge einer ganzen Reihe neurologischer Erkrankungen. Dennoch hat sich die Erforschung von Sprachstörungen bis in die 90er Jahre des 20. Jahrhunderts fast ausschließlich auf Aphasien konzentriert. Aphasien sind zentrale Störungen der menschlichen Sprachfähigkeit, die meist durch einen Schlaganfall in der linken Kortexhemisphäre verursacht sind (Poeck 1992). Insbesondere der Broca-Aphasie mit ihrem Kernsymptom des Agrammatismus galt dabei das Interesse der Linguisten (siehe de Bleser 1987, Penke 1998 für einen Überblick über die Agrammatismusforschung), da der Agrammatismus durch eine generelle Verarmung der syntaktischen Struktur und die Auslassung oder Ersetzung funktionaler Elemente, wie Determinierer, Auxiliare oder Flexive, gekennzeichnet ist (z.B. Huber, Poeck & Weniger 1982, Friederici 1984, Menn & Obler 1990a, Tesak 1991) und daher eine Schädigung zentraler sprachlicher Fähigkeiten erwarten ließ. Ziele der linguistischen Beschäftigung mit Sprachstörungen: Die linguistische Beschäftigung mit Sprachstörungen dient zwei Zielen. Zum einen will man die gestörten sprachlichen Fähigkeiten auf den verschiedenen linguistischen Beschreibungsebenen (Phonetik, Phonologie, Morphologie, Syntax, Semantik, Pragmatik) möglichst detailliert erfassen. Ziel ist dabei, verschiedene sprachliche Störungssymptome, die ein spezifisches Störungssyndrom charakterisieren, zu identifizieren und sie auf die Schädigung grammatischer Komponenten zurückzuführen. Daneben ist es ein weiteres Ziel, über die Analyse gestörten sprachlichen Verhaltens etwas über das ungestörte, unserer Sprachfähigkeit zugrunde liegende Wissenssystem zu erfahren. Entdeckt man Störungsmuster, die sich an grammatiktheoretisch postulierten Klassifikationen orientieren, so wird dies als Evidenz für die Realität dieser Klassifikationen gewertet. Des Weiteren ist die Hoffnung, durch die Analyse der Korrelation von Ort der Hirnschädigung und Art der resultierenden sprachlichen Ausfälle auch etwas über die Lokalisation bestimmter sprachlicher Fähigkeiten im Gehirn zu erfahren.
44 Der Rückschluss von gestörtem Verhalten auf das ungestörte System hat in der kognitiven Neuropsychologie eine lange Tradition. Caramazza (1992) führt diese Zielsetzung bis auf Auguste Comte (1798-1857) zurück, der darauf hinwies, dass pathologische Zustände Experimente der Natur seien, deren Analyse die empirische Grundlage für Theorien unbeeinträchtigter biologischer Funktionen bilden könne. Die Relevanz dieses Vorgehens für die Theoriebildung wurde auch in der Linguistik – zunächst von Baudouin de Courtenay und Ferdinand de Saussure (vgl. Fromkin 1997) – gesehen. Roman Jakobson war der erste Linguist, der diese Methode anwandte, indem er zur Stützung seiner phonologischen Markiertheitstheorie auch auf Daten aphasischer Sprecher zurückgriff (Jakobson 1941/1972, vgl. Fromkin 1997). Selektive Defizite und ihre Prämissen: Der Rückschluss von gestörtem Sprachverhalten auf das unbeeinträchtigte sprachliche Wissenssystem setzt vier Prämissen voraus: (i) In der Generativen Grammatik wird die sprachliche Kompetenz als ein von anderen Bereichen der menschlichen Kognition unabhängiges Modul betrachtet. Die Annahme eines sprachspezifischen, mental repräsentierten Sprachmoduls wird als Modularitätshypothese bezeichnet (Fodor 1983). Die Modularitätshypothese postuliert nicht nur einen modularen Aufbau der menschlichen Kognition, sondern geht auch von der Annahme aus, dass das sprachliche Wissen seinerseits wiederum aus eigenständigen, aufgabenspezifischen Submodulen besteht. (ii) Die Autonomiehypothese besagt, dass diese sprachspezifischen Module unabhängig voneinander und unabhängig von anderen Bereichen oder Modulen der menschlichen Kognition arbeiten (Fodor 1983). (iii) Dem Interesse, das von neurolinguistischer Seite erworbenen Sprachstörungen entgegengebracht wird, liegt nun die Annahme zugrunde, die Störung könne selektiv nur eine oder mehrere der sprachspezifischen Teilkomponenten betreffen. Diese Fraktionierungshypothese bezeichnet nach Caramazza „[…] the belief that brain damage can result in the selective impairment of components of cognitive processing“ (Caramazza, 1984: 10). (iv) Bedeutsamkeit für die linguistische Forschung erlangen Sprachstörungen jedoch erst durch eine weitere Annahme – die Transparenzhypothese (Caramazza 1984). Sie besagt, dass die verbleibenden, von der Störung nicht betroffenen Komponenten unverändert wie im ungestörten System arbeiten. Nur wenn diese Annahme gemacht wird, erlaubt die Beobachtung des gestörten Sprachsystems Rückschlüsse auf das normale System. Unter Annahme der Transparenzhypothese lässt sich das durch die Störung ausgelöste Verhalten als Arbeit des intakten Systems ohne die gestörte Komponente auffassen.4 Aus diesen Prämissen ergibt sich, dass in der Neurolinguistik ein besonderes Augenmerk der Aufdeckung von Defiziten gilt, die selektiv eine Funktion X, nicht aber andere Funktio–––––––—–– 4
Diese Hypothesen betreffen in erster Linie Sprachstörungen, die nach Abschluss des Spracherwerbs eintreten. Bei Sprachstörungen, die während der Sprachentwicklung auftreten, ist zu beachten, dass sie ein noch nicht voll entwickeltes Sprachsystem beeinträchtigen. Möglich ist daher, dass sprachliche Module unter Umständen noch nicht erworben sind, noch nicht autonom von der allgemeinen Kognition arbeiten oder störungsbedingt eine völlig andere Entwicklung durchlaufen (vgl. z.B. Karmiloff-Smith 1998). Diese besondere Problematik erschwert Rückschlüsse aus Sprachentwicklungsstörungen auf das unbeeinträchtigte System zusätzlich (für einen Überblick siehe Levi & Kavé 1999).
45 nen betreffen, so genannte Dissoziationen. Besondere Bedeutung wird dabei allgemein doppelten Dissoziationen zugesprochen. Diese liegen vor, wenn bei einem sprachgestörten Sprecher eine Funktion Y beeinträchtigt ist, während eine Funktion X unbeeinträchtigt oder signifikant besser erhalten ist, und es einen zweiten Patienten gibt, bei dem eine umgekehrte Beeinträchtigung vorliegt, also Funktion Y unbeeinträchtigt oder besser erhalten ist als Funktion X (Teuber 1955, Shallice 1988). In der Neurolinguistik wird argumentiert, dass insbesondere doppelte Dissoziationen einen direkten Blick in die mentale Repräsentation der menschlichen Sprachfähigkeit erlauben. Die dissoziierte Beeinträchtigung wird als Beleg dafür gesehen, dass es sich bei X und Y um zwei mental unterschiedlich zu repräsentierende kognitive Funktionen oder Module handelt (s. die Diskussion in Shallice 1988). Prinzipiell bedarf es für diesen Schluss jedoch keiner doppelten Dissoziation (vgl. auch Shallice 1988). Teuber (1955) hatte auf die Bedeutung doppelter Dissoziationen hingewiesen, da er erkannt hatte, dass einfache Dissoziationen auch durch Aufgaben verursacht sein können, die unterschiedlich komplex sind und sich hinsichtlich des Verarbeitungsaufwands unterscheiden. Zeigt sich z.B. in einer Benennungsaufgabe eine stärkere Beeinträchtigung seltener Wörter im Vergleich zu häufig vorkommenden Wörtern, so spricht das nicht notwendig dafür, dass frequente und seltene Wörter in zwei kognitiv distinkten Modulen zu repräsentieren sind. Die stärkere Beeinträchtigung seltener Wörter ist auch durch den größeren Aufwand bei der Suche im mentalen Lexikon erklärbar. Kann man solche alternativen Erklärungsmöglichkeiten jedoch ausschließen, lassen sich auch aus einer einfachen Dissoziation Erkenntnisse über das Sprachsystem gewinnen. Die Beobachtung, dass bestimmte linguistische Entitäten selektiv von einer Sprachstörung betroffen sind, wird dabei als Beleg für eine distinkte mentale Repräsentation dieser Entitäten gewertet und für eine Verarbeitungsstufe im Sprachsystem, auf der diese Entitäten relevant sind. Dieses Vorgehen ist im Prinzip vergleichbar mit dem Vorgehen in der Versprecherforschung, in der ebenfalls aus den in Versprechern involvierten Einheiten auf die Realität dieser Einheiten und ihre Relevanz bei der Sprachverarbeitung geschlossen wird (vgl. Fromkin 1971, 1973, Wiese 1987a, vgl. Abschnitt 2.1.1). Vorteile und Probleme der Untersuchung von Sprachstörungen: Das Vorliegen einer (doppelten) Dissoziation bietet entgegen der in der Neurolinguistik gängigen Auffassung allerdings nicht zwangsläufig Evidenz für das Vorliegen distinkter mentaler Repräsentationen oder Module. Shallice (1988) diskutiert eine Reihe nichtmodularer Systeme, bei denen eine Schädigung ebenfalls zu dissoziierten Beeinträchtigungen führen kann, z.B. bei kontinuierlich repräsentierten Systemen, bei denen verschiedene Teilstücke des Kontinuums geschädigt sind (vgl. auch Munakata 2001). Auch in konnektionistischen neuronalen Netzen, in denen Wissen nicht modular, sondern einheitlich in assoziativen Verbindungen zwischen Knoten repräsentiert ist, können (doppelte) Dissoziationen durch Schädigungen des Netzes simuliert werden (vgl. z.B. Marchman 1993, Bullinaria & Chater 1995, Joannisse & Seidenberg 1999, Westermann 2000, Juola & Plunkett 2000, Penke & Westermann 2006).5 Entsprechend werden im Konnektionismus domänenspezifische kognitive Module, wie sie durch Modularitäts- und Autonomiehypothese postuliert werden, abgelehnt. –––––––—–– 5
Für eine Diskussion des Konnektionismus und dieser Simulationen verweise ich auf Kapitel 4.2.3.
46 Obwohl der Schluss von einer Dissoziation auf das Vorliegen distinkter Repräsentationen oder Module nicht zwangsläufig ist, gilt jedoch der umgekehrte Schluss: Werden unterschiedliche mentale Repräsentationen für theoretische Klassifikationen postuliert, dann müssen diese unterschiedlichen mentalen Repräsentationen von Hirnschädigungen selektiv betroffen werden können. Es sollten also dissoziierte Schädigungen auftreten, die nur bestimmte der theoretisch postulierten Kategorien oder Strukturen betreffen. Auch Fraktionierungs- und Transparenzhypothese sind Gegenstand kritischer Diskussionen (vgl. z.B. Shallice 1988, Kosslyn & Van Kleek 1990, Caramazza 1992, Farah 1994). So orientieren sich Schädigungen des Gehirns meist nicht an der Funktion bestimmter Hirnareale. Sie sind vielmehr ‚accidents of nature’ (Marin, Saffran & Schwartz 1976). Welche Hirnareale von einer Schädigung betroffen werden, ergibt sich aus anatomischen und physiologischen Faktoren, wie z.B. den individuellen Gegebenheiten der arteriellen Blutversorgung und der individuellen Lokalisation ihrer Behinderung (Poeck 1981). Eng umgrenzte, nur eine kognitive Funktion betreffende Schädigungen, wie sie in der Fraktionierungshypothese postuliert werden, sind daher kaum zu erwarten (Marin, Saffran & Schwartz 1976, Müller 1992). Auch ist zur Zeit noch ungeklärt, ob kognitive Funktionen überhaupt in eng umgrenzten Hirnarealen lokalisiert sind, die von lokalen Hirnschädigungen betroffen werden könnten (z.B. Kosslyn & Van Kleek 1990). Gegen die Transparenzhypothese wird eingewendet, dass ein direkter Rückschluss aus dem Erscheinungsbild einer Störung auf die Funktion einer Teilkomponente nicht immer unproblematisch ist. Die Radio-Metapher von Richard L. Gregory macht diesen Gedankengang klar: „Wenn man aus einem Radiogerät irgendeinen von mehreren Widerständen ausbaut, kann dies dazu führen, daß es merkwürdige Geräusche von sich gibt, aber daraus kann man nicht schließen, die Aufgabe der Widerstände sei es, das Pfeifen zu unterdrücken.“ (Zitiert nach Gardner 1992: 285)
Zudem wies bereits Hughlings-Jackson (1878) darauf hin, dass man nach einer Hirnschädigung nicht davon ausgehen könne, das Gehirn arbeite mit Ausnahme der gestörten Funktionskomponente normal weiter. Problematisch sind in dieser Hinsicht vor allem zwei Faktoren: die Plastizität des Gehirns und die Anwendung von Strategien. Im sprachgestörten Patienten begegnen wir einem „[…] adaptive organism which will strive to accomplish its functions as best as it can“ (Marin, Saffran & Schwartz 1976: 869). Dabei hilft ihm zum einen die Plastizität des Gehirns, die es in gewissem Umfang erlaubt, Defekte, beispielsweise durch Rekrutierung nicht geschädigter Hirnareale, auszugleichen. Können jedoch kognitive Ausfälle durch Reorganisation intakter Funktionen oder die Schaffung neuer Funktionen gemildert oder kompensiert werden, sind direkte Rückschlüsse auf das intakte System erschwert (Kosslyn & Van Kleek 1990). Auch Strategien, die sprachbeeinträchtigte Menschen entwickeln, um mit der Sprachstörung umzugehen (vgl. z.B. Heeschen 1985, Heeschen & Kolk 1988), erschweren den Rückschluss vom gestörten auf das ungestörte System, da die Auswirkungen der Sprachstörung durch die Anwendung von Strategien verschleiert werden. Die angesprochenen Probleme bei der Interpretation von Sprachstörungsdaten mögen zu der Frage verleiten, warum Sprachstörungsdaten überhaupt zur Untersuchung unseres sprachlichen Wissenssystems herangezogen werden und warum die neuronale Repräsentation unseres Sprachsystems nicht allein mittels der neuen bildgebenden Verfahren, die ja einen direkten Blick in das unbeeinträchtigte Gehirn ermöglichen, untersucht wird. Die
47 Diskussion der bildgebenden Verfahren in Kapitel 2.2 hat jedoch verdeutlicht, dass auch diese mit spezifischen Problemen konfrontiert sind. Ein Vorteil der Untersuchung von Sprachstörungen gegenüber bildgebenden Verfahren liegt zudem darin, dass Fehler untersucht werden. Die Analyse solcher Fehler bietet – wie aus der Untersuchung von Versprechern bekannt ist (vgl. Fromkin 1971, 1973, Wiese 1987a) – besonders interessante Einblicke in das sprachliche Wissenssystem, da sie es erlaubt, Erkenntnisse über die kognitiven Operationen oder Faktoren zu erlangen, die diese Fehler systematisch beschränken (vgl. Abschnitt 2.1.1). Ferner zeigen PET und fMRT zwar Korrelationen zwischen einer kognitiven Operation und den Hirnarealen, die während dieser kognitiven Operation aktiv sind; diese Korrelationen ermöglichen jedoch keine Kausalitätsaussage und damit keine Aussage, welche der aktiven Hirnregionen tatsächlich notwendig für die Durchführung einer spezifischen kognitiven Operation sind. Die Untersuchung von Hirnschädigungen ist hier von entscheidendem Vorteil, denn die Schädigung einer spezifischen Hirnregion sollte zu einer Störung genau derjenigen kognitiven Operation(en) führen, die an die Intaktheit dieser Region gebunden sind. Läsionsstudien wird daher eine wichtige Funktion bei der Evaluierung der Ergebnisse zugesprochen, die mit bildgebenden Verfahren gewonnen wurden (Brown & Hagoort 1999b, Rugg 1999): „[…] evidence from lesion studies will continue to play a key role in understanding how cognitive functions are instantiated in the brain,“ (Rugg 1999: 32)
Zudem haben sich die vier genannten Prämissen trotz der angesprochenen Kritikpunkte in der kognitiven Neuropsychologie und der Neurolinguistik bewährt (vgl. Marin, Saffran & Schwartz 1976, Caramazza 1992). Nach Caramazza (1992) sprechen empirisch-pragmatische Gründe dafür, dass diese Prämissen und die darauf basierenden Rückschlüsse vom gestörten auf das intakte System berechtigt sind: „[...] the justification is based on the fact that the use of particular observations seems to lead to theoretically useful insights in the domain of investigation.“ (Caramazza 1992: 81)
Caramazza führt aus, dass sich in der klinischen Praxis immer wieder Fälle zeigen, bei denen es nach Hirnschädigungen zu sehr spezifischen Defiziten kommt, was die Fraktionierungshypothese stütze. Ein Beispiel für ein solches spezifisches Defizit bietet die beeinträchtigte Produktion irregulärer Partizipien bei erhaltener regulärer Partizipflexion, die bei deutschsprachigen Broca-Aphasikern beobachtet werden kann (Penke, Janssen & Krause 1999). Dem Einwand, dass durch die Anwendung von Strategien sprachgestörter Sprecher der Rückschluss vom gestörten auf das intakte System erschwert wird, kann durch geeignete experimentelle Verfahren begegnet werden, die Möglichkeiten für die Anwendung von Strategien minimieren. Und schließlich scheint es als Folge der Sprachstörung auch nicht zu einer funktionalen Reorganisation oder zur Schaffung neuer funktionaler Module zu kommen. Vielmehr scheint es so zu sein, dass Optionen zur Komplexitätsreduktion, die das intakte System enthält, verstärkt genutzt und auf neue Kontexte ausgeweitet werden (Caramazza 1992). Ein Beispiel dafür sind die so genannten root infinitives, die in der Sprachproduktion deutscher agrammatischer Aphasiker vermehrt auftauchen (Heeschen 1985, Kolk & Heeschen 1992, Penke 1998). Dabei handelt es sich um uneingeleitete Hauptsätze, die zielsprachlich ein finites Verb in Verbzweit-Position enthalten müssten. Tatsächlich werden
48 jedoch Verben produziert, die nach morphologischen und syntaktischen Kriterien infinit sind: Die jeweiligen Kongruenzflexive sind durch das Infinitivflexiv -n ersetzt, und das Verb steht satzfinal hinter der Negation oder anderen Elementen der Verbalphrase (z.B. ich morgen aufstehen). Die Produktion infiniter Äußerungen ist eine Option, die das zielsprachliche System bietet. Sie werden z.B. in Antworten auf wh-Fragen (Was machst Du? Ein Buch lesen.) oder in Jussiven (Alle mal herhören!) verwendet (Lasser 2002). Die Ausweitung dieser Option auf zielsprachlich nicht zulässige Kontexte bietet agrammatischen Aphasikern den Vorteil, dass statt einer komplexen Satzstruktur (CP) nur eine reduzierte Phrasenstruktur (VP) aufgebaut werden muss. Dies reduziert einerseits den Berechnungsaufwand und entlastet damit das geschädigte System. Andererseits bieten root infinitives auch die Möglichkeit, spezifische Probleme beim Phrasenstrukturaufbau – wie das Problem, unter den hohen Verarbeitungsanforderungen der Spontansprachproduktion stets die korrekte finite Verbform zu finden – zu umgehen. Die Annahme der vier Prämissen ist nach Caramazza (1992) auch dadurch empirisch gerechtfertigt, dass man in der kognitiven Neuropsychologie zu Ergebnissen kommt, die mit denen übereinstimmen, die durch andere Methoden, etwa psycholinguistische Reaktionszeitexperimente, erzielt wurden. Die Ergebnisse aus der Untersuchung von Sprachstörungen dürfen nicht in Isolation gesehen werden. Bei einer wissenschaftlichen Vorgehensweise werden Ergebnisse, die durch die Untersuchung von Sprachstörungen gewonnen werden, immer durch den Vergleich mit anders erzielten Ergebnissen und theoretischen Überlegungen evaluiert. Bei solchem Vorgehen bietet die Aufdeckung selektiver Defizite – neben theoretischen Argumentationen und Ergebnissen aus der Anwendung psycholinguistischer oder bildgebender Methoden – eine weitere wichtige Informationsquelle bei der Erforschung der Frage, wie die menschliche Sprachfähigkeit mental repräsentiert ist. Die Untersuchungen zur Flexionsmorphologie sprachgestörter Sprecher, die in den folgenden Kapiteln vorgestellt werden sollen, werden auch empirisch bestätigen, dass die Ergebnisse der Untersuchung sprachgestörter Sprecher, die Ergebnisse psycholinguistischer Reaktionszeitverfahren sowie bildgebender Verfahren und theoretisch-linguistische Überlegungen ein kohärentes Bild ergeben. Die Befürchtung, bei der Untersuchung von Patienten würde es zu einer Vielzahl von Dissoziationen kommen, was zu einer inflationären Vielfalt postulierter Module führe (Müller 1992), ist bei einem solchen Vorgehen nicht stichhaltig. Ein klarer Vorteil der Untersuchung von Sprachstörungen im Vergleich zu psycholinguistischen Experimenten ist bei diesem Vorgehen zudem, dass Erkenntnisse über die mentale Repräsentation sprachlicher Fähigkeiten prinzipiell schon durch die Untersuchung eines einzigen Patienten mit einer selektiven Störung gewonnen werden können.6 Die Durchführung einer Gruppenstudie,7 die bei Patienten mit Sprachstörungen immer an dem –––––––—–– 6
7
Erkenntnisse über die mentale Repräsentation der Sprachfähigkeit auf eine Einzelfallstudie zu stützen, setzt allerdings eine fünfte Prämisse voraus – die Universalitätshypothese. Diese besagt, dass die funktionale Organisation in jedem menschlichen Gehirn dieselbe ist (Caramazza 1986, Müller 1992, Caplan 1994). Ob diese Annahme zutrifft, ist eine empirische Frage. Unterstützung erfährt diese Annahme, wenn es bei Patienten mit vergleichbarer Schädigung zu vergleichbaren selektiven Defiziten kommt. Unter Gruppenstudie ist hier eine Studie verstanden, bei der die Leistungen einer Versuchspersonengruppe zu einem Mittelwert zusammengefasst werden, also nicht die individuellen Leistungen der Versuchspersonen untersucht werden.
49 Problem krankt, eine Gruppe vergleichbarer Patienten zu finden, ist nicht notwendig (vgl. Caramazza 1984, 1986, Ellis 1987). Insgesamt ist daher die Schlussfolgerung berechtigt: „[…] the study of language breakdown is fulfilling its promise in serving as a natural laboratory in which linguistic theories may be tested.“ (Levi & Kavé 1999: 138).
Warum Broca-Aphasie? Für den Bereich der Flexionsmorphologie haben sich vor allem Untersuchungen agrammatischer Broca-Aphasiker als interessant erwiesen. Die Broca-Aphasie ist eines der vier großen aphasischen Syndrome, die im Versorgungsgebiet der Arteria cerebri media durch eine Gefäßschädigung entstehen.8 Eine Broca-Aphasie wird dabei meist durch einen Infarkt im Versorgungsgebiet der Arteria praecentralis, eines Teilastes der Arteria cerebri media, verursacht, der zu einer präzentral, im Frontalhirn, gelegenen Läsion führt (Kerschensteiner et al. 1978, Huber 1981, Huber, Poeck & Weniger 1982). Das Syndrom der Broca-Aphasie umfasst neben einem erheblich verlangsamten, durch viele Pausen unterbrochenen und verringerten Sprachfluss, einer mühevollen Artikulation und Lautvertauschungen (sog. phonematische Paraphasien) noch spezifische Störungen der Satz- und Wortbildung, die unter den Begriff Agrammatismus gefasst werden (Kerschensteiner et al. 1978, Huber 1981, Huber, Poeck & Weniger 1982, Friederici 1984, Poeck 1992). Der Agrammatismus ist gekennzeichnet durch eine generelle Verarmung der syntaktischen Struktur, die sich in einer Reduktion der Äußerungslänge auf wenige Konstituenten, der Bevorzugung kanonischer Stellungsmuster und der Auslassung von Funktionswörtern äußert. Neben der Beeinträchtigung der syntaktischen Fähigkeiten werden insbesondere Beeinträchtigungen der Flexionsmorphologie, die sich in Auslassungen (vgl. (2a-b)) bzw. Ersetzungen (vgl. (3a-b)) von Affixen zeigen, als eines der Kardinalsymptome des Agrammatismus genannt (z.B. Tissot, Mounin & Lhermitte 1973, Kerschensteiner et al. 1978, Friederici 1984, Menn & Obler 1990a, Tesak 1991). (2) a. the woman wipe a plate (Goodglass, Christiansen & Gallagher 1993) b. du muss ins Krankenhaus (3) a. grustnaja malcik (Tsvjetkova & Glozman, 1978) traurig-FEM Junge-MASK b. Rotkäppchen, warum hast du so ein roter Mund? Sprachvergleichende Studien zu aphasischen Beeinträchtigungen haben gezeigt, dass die konkreten Ausprägungen des Agrammatismus von den spezifischen morphologischen Charakteristika einer Sprache beeinflusst werden (Menn & Obler 1990b, Bates & Wulfeck 1989, Bates, Wulfeck & MacWhinney 1991). Ob ein Affix ausgelassen oder ersetzt wird, hängt unter anderem davon ab, ob der Stamm des zu flektierenden Wortes in der jeweiligen –––––––—–– 8
Neben der Broca-Aphasie sind dies die Wernicke-Aphasie, die globale und die amnestische Aphasie, die jeweils mit charakteristischen sprachlichen Beeinträchtigungen einhergehen. Einen Überblick über die aphasischen Sprachstörungen geben z.B. Huber (1981), Huber, Poeck & Weniger (1982), Poeck (1992), Dronkers, Pinker & Damasio (1999), Obler & Gjerlow (1999).
50 Sprache ein lexikalisch wohlgeformtes Wort ist (Grodzinsky 1984, 1990). Ist dies der Fall, dann kommt es im Agrammatismus zu Auslassungen von Affixen (Bsp. (2a-b)). Ist der Stamm dagegen kein lexikalisch wohlgeformtes Wort, wie der russische Stamm grustn- in Beispiel (3a), dann werden Affixe nicht ausgelassen, sondern ersetzt. Auch die Größe der Flexionsparadigmen der jeweiligen Sprache scheint die Häufigkeit fehlerhafter Realisierungen flektierter Wortformen zu beeinflussen: Je größer ein Flexionsparadigma ist, d.h. je mehr Formen es enthält, desto eher kommt es zu Ersetzungen richtiger durch falsche Formen (Bates, Friederici & Wulfeck 1987, Bates & Wulfeck 1989, Menn & Obler 1990b). Während über lange Zeit die syntaktischen Auswirkungen des Agrammatismus im Zentrum des linguistischen Interesses standen (s. Penke 1998 für einen Überblick), hat sich in den letzten Jahren das Forschungsinteresse auch den Beeinträchtigungen der Flexionsmorphologie zugewandt. Dabei hat sich gezeigt, dass im Agrammatismus ein idealer Testfall vorliegt, an dem Störungen der Flexion untersucht werden können, die Rückschlüsse auf die Repräsentation der Flexionsmorphologie ermöglichen. Welche spezifischen Erkenntnisse mit der Untersuchung agrammatischer Broca-Aphasiker sowie mit den weiteren in diesem Kapitel vorgestellten psycholinguistischen und bildgebenden Verfahren über die Repräsentation von Flexionsmorphologie im mentalen Lexikon bislang gewonnen werden konnten, soll in den folgenden Kapiteln ausgeführt werden.
3 Assoziative Netze – Speicherstrukturen für flektierte Formen
Eine der in Kapitel 1.1 angesprochenen Kontroversen zur Flexionsmorphologie dreht sich um die Frage, ob flektierte Formen im mentalen Lexikon abgespeichert werden oder ob sie durch die Anwendung von Berechnungsoperationen bei Bedarf aus den im Lexikon gespeicherten Wortstämmen produziert werden. Während diese Frage insbesondere für regulär flektierte Formen hitzig diskutiert wird (siehe Kap. 4), besteht in Bezug auf irregulär flektierte Formen sowohl in morphologischen Theorien (z.B. Jensen 1990, Wunderlich & Fabri 1995, Aronoff & Anshen 1998) als auch in psycholinguistischen Ansätzen zur Repräsentation und Verarbeitung von Flexion (z.B. Butterworth 1983, Pinker & Prince 1988) weitgehend Einigkeit darüber, dass irregulär flektierte Wörter als Vollformen im mentalen Lexikon gespeichert sind (s. auch Fußnote 10). Wie die Bezeichnung ‚irregulär’ verdeutlicht, ist die phonologische Form eines irregulär flektierten Wortes aus der Basisform seines lexikalischen Eintrags nicht vorhersagbar (z.B. Wunderlich 1992). Sie muss folglich im Erwerb gelernt und abgespeichert werden. Dieses Kapitel beschäftigt sich mit der Frage, wie der Gedächtnisspeicher, in dem irregulär flektierte Formen abgelegt werden, beschaffen ist und nach welchen Gesichtspunkten er organisiert ist. Bei der Untersuchung dieser Fragen haben sich insbesondere Spracherwerbs- und Sprachstörungsdaten als wichtige Informationsquellen erwiesen. Die Untersuchung des Spracherwerbs zeigt auf, wie irreguläre Wörter erworben werden und welche Faktoren ihren Erwerb bestimmen. Aus den Fehlern, die sprachgestörten Sprechern beim Abruf gespeicherter irregulärer Formen unterlaufen, lassen sich Rückschlüsse auf die Organisation und Strukturierung dieses Gedächtnisspeichers ziehen.
3.1 Die U-Kurve im Flexionserwerb Eine gängige Beobachtung beim Flexionserwerb ist, dass dieser eine U-förmige Verlaufskurve beschreibt: Auf eine Phase korrekter Verwendungen flektierter Formen folgt dabei eine Phase, in der falsch flektierte Formen auftauchen, bevor diese Fehler dann langsam wieder zurückgehen und durch korrekt flektierte Formen ersetzt werden (vgl. Abb. 3.1). Die U-förmige Verlaufskurve, die der Flexionserwerb beschreibt, ist auf der Basis einer beeindruckenden Datenmenge, bestehend aus Längsschnitt- und Querschnittskorpora sowie experimentellen Untersuchungen zum Englischen past tense Erwerb (z.B. Cazden 1968, Kuczaj 1977, Marcus et al. 1992, Maslen et al. 2004) und zum Erwerb der deutschen Partizipflexion (z.B. Clahsen & Rothweiler 1993, Weyerts & Clahsen 1994, Weyerts 1995, 1997), detailliert untersucht worden. Phase I – korrekt flektierte Formen: Die ersten regulären bzw. irregulären past tense bzw. Partizipformen, die Kinder im Spracherwerb verwenden, sind zunächst korrekt flektiert. Diese Phase kann sich über meh-
52 rere Monate erstrecken, in deren Verlauf Kinder eine Anzahl verschiedener regulärer und irregulärer past tense bzw. Partizipformen korrekt verwenden. Die Länge dieser Phase und die Anzahl der korrekt verwendeten regulären bzw. irregulären Formen in den verschiedenen untersuchten Längsschnittkorpora variieren, was neben interindividuellen Unterschieden auch durch Unterschiede in der Länge der Spontansprachaufnahmen oder in den zeitlichen Abständen, in denen Daten erhoben wurden, bedingt ist. Die umfangreiche Datenmenge, die dieser Beobachtung zugrunde liegt, stellt jedoch sicher, dass es sich bei dieser Phase nicht nur um ein Artefakt der Datenerhebung handelt. Die Daten zeigen vielmehr, dass Kinder in den ersten Phasen des Lexikonerwerbs eine größere Anzahl von Verben über einen längeren Zeitraum korrekt flektiert verwenden. So stellte z.B. Weyerts (1997) bei Auswertung der Längsschnittdaten des Kindes Simone (Miller-Korpus, s. Miller 1976) fest, dass Simone zwischen einem Alter von 1;10 (1 Jahr, 10 Monate) bis 2;1 fünf reguläre und sieben irreguläre Partizipien (types) erwarb und korrekt flektiert verwendete. Marcus et al. (1992) geben für die beiden Kinder Adam und Sarah einen Zeitraum im Alter von 2;3 bis 2;10 (Sarah) bzw. 2;11 (Adam) an, in dem die beiden jeweils weit über 200 irreguläre past tense Formen (tokens) korrekt produzierten. Und eine Auswertung der Partizipien, die meine Tochter Eva zwischen einem Alter von 1;6 und 2;0 produzierte, ergab, dass für einen Zeitraum von acht Wochen nach der Produktion des ersten Partizips mit 1;6 die von ihr gebrauchten 11 irregulären und 8 regulären Partizipien (types) zunächst in Hinblick auf Stammablaut und Partizipendung korrekt waren (z.B. wehtan, runtermissen, nitten). Phasen II und III – Auftreten und Rückgang von Übergeneralisierungen: Nach dieser Phase der korrekt flektierten Formen produzieren Kinder plötzlich past tense und Partizipformen starker Verben, die regulär flektiert sind, wie z.B. *gebratet, *breaked oder *goed. Solche Fehler werden als Übergeneralisierungen bezeichnet. Aus den in Marcus et al. (1992) aufgeführten Daten aus der Literatur zum past tense Erwerb lässt sich grob folgender Verlauf der Übergeneralisierungsrate für das englische past tense skizzieren: Auf der Basis der in Valian (1991) angegebenen Daten ermittelten Marcus et al. (1992) bei einer Gruppe von Kindern mit einem mittleren Alter von 2;5 Jahren eine mittlere Übergeneralisierungsrate von 8,4%. Diese stieg für die Kinder der nächsten Altersgruppe mit einem mittleren Alter von 2;7 auf 13,2% an. Danach sinkt die Übergeneralisierungsrate langsam und kontinuierlich wieder ab. Für die in Marcus et al. aufgeführten Daten der Querschnittskorpora von 15 Kindern im Alter zwischen 4;6 und 5;0 ergab sich bei 38 Übergeneralisierungen auf 1572 korrekt verwendete Formen eine Übergeneralisierungsrate von 2,4%. Diese stimmt ungefähr mit der Übergeneralisierungsrate von 2,8% überein, die Marcus et al. auf der Basis einer Untersuchung von Moe, Hokins & Rush (1982) für amerikanische Erstklässler im Alter von ca. 6 Jahren errechneten. Für Viertklässler beträgt diese Rate dann nur noch 0,8%. Gänzlich verschwinden Übergeneralisierungen jedoch nie. Selbst bei erwachsenen Sprechern sind sie ab und an zu beobachten. Anhand von Versprecherdaten (Stemberger 1989) ermittelten Marcus et al. für erwachsene Sprecher eine Übergeneralisierungsrate von 0,004%, was einer Übergeneralisierung alle 25.000 Äußerungen entspricht. Aus diesen Übergeneralisierungsraten ergibt sich, wie in Abbildung 3.1 ersichtlich, eine angedeutete U-förmige Verlaufskurve für die Korrektheitswerte der irregulären past tense Flexion: Auf eine Phase korrekt verwendeter Formen
53 (Phase I) folgt dabei eine Phase, in der starke Verben übergeneralisiert werden, bevor sich die Korrektheitswerte dann wieder 100% annähern.
Abb. 3.1: U-förmige Verlaufskurve der Korrektheitswerte für irreguläre past tense Formen nach den Angaben in Marcus et al. (1992)
Dieser Verlauf wurde in Untersuchungen zum Erwerb der irregulären Partizipflexion des Deutschen bestätigt. Clahsen & Rothweiler (1993) berechneten für die Längsschnittdaten dreier Kinder im Alter von 1;6 bis 3;9 Jahren nach einer frühen Phase korrekter Verwendungen (Phase I) folgende Übergeneralisierungsraten: In Phase II, bei einer mittleren Äußerungslänge (MLU) zwischen 1,75 und 2,75 Wörtern, wurden 5% der starken Verben übergeneralisiert. Dieser Prozentsatz stieg in Phase III (MLU >2,75 und ≤ 3,5) auf zunächst 10% an, um dann in Phase IV (MLU > 3,5), bei einem Alter von ca. drei Jahren, wieder auf 7-8% abzusinken. Daten des Partiziperwerbs meiner Tochter Eva veranschaulichen, dass auch der Erwerbsverlauf eines einzelnen Individuums eine U-Kurve beschreibt (siehe Abb. 3.2). Während Evas irreguläre Partizipien zunächst korrekt waren, sank der Prozentsatz korrekt produzierter irregulärer Partizipformen (types) im Verlauf der nächsten 3 Monate bis auf einen Tiefstwert von 54%. Jede zweite Partizipform starker Verben wurde von Eva zu diesem Zeitpunkt übergeneralisiert (z.B. *getut, *geesst, *gestoßt). Im Verlauf der nächsten zwei Monate bis zum Ende meiner Aufzeichnungen, als Eva 2;0 war, stiegen die Korrektheitswerte dann wieder auf 72% an.1 –––––––—–– 1
Im Gegensatz zu Übergeneralisierungen, die in den Kinderdaten ganz regelmäßig zu beobachten sind, sind Irregularisierungen, bei denen für schwache Verben irregularisierte past tense oder Partizipformen gebildet werden (wie beat - *bate, trick - *truck, *gelachen oder *gekriegen), extrem selten. Xu & Pinker (1995) fanden in einem mehr als 20.000 past tense Formen enthaltenden Spontansprachkorpus von neun Kindern lediglich 39 Irregularisierungen. Weyerts (1997) ermittelte in den Längsschnittdaten von neun deutschsprachigen Kindern zwischen 1;4 und 3;9 Jahren unter 655 schwachen und gemischten Verben lediglich acht Irregularisierungen (= 1,2%). In den von ihr experimentell elizitierten Querschnittdaten von 78 Kindern zwischen 3;1 und 8;11
54
Abb. 3.2: U-förmige Verlaufskurve korrekt flektierter Partizipformen starker Verben für Eva im Beobachtungszeitraum zwischen 1;6 und 2;02
Was ist von Übergeneralisierungen betroffen? Übergeneralisierungsfehler ermöglichen uns Aufschlüsse über Entwicklung und Organisationsprinzipien des mentalen Lexikons. So lässt sich beobachten, dass die plötzlich auftretenden Übergeneralisierungen auch solche Formen betreffen, die von den Kindern zuvor bereits einmal korrekt verwendet wurden. Marcus et al. geben für drei der von ihnen untersuchten Kinder (Adam, Sarah und Eve) an, dass zwischen 33% und 65% der vorher bereits korrekt verwendeten irregulären past tense Formen (types) in der anschließenden Übergeneralisierungsphase manchmal regularisiert wurden (siehe auch Kuczaj 1977). Zudem legen –––––––—––
2
Jahren finden sich unter 977 schwachen bzw. gemischten Verben lediglich 21 Irregularisierungen (= 2,1%). Und in den Daten meiner Tochter Eva finden sich in dem sechs Monate umfassenden Beobachtungszeitraum zwischen 1;6 und 2;0 lediglich 12 Irregularisierungen (types) in 287 produzierten Partizip-types schwacher Verben (= 4,2%). Die Übergeneralisierungsrate beträgt im selben Zeitraum mit 37,1% fast das zehnfache. Für jeden Erhebungstag innerhalb des sechsmonatigen Beobachtungszeitraums wurden die korrekt und inkorrekt produzierten Partizip-types ermittelt. Die Anzahl korrekter bzw. inkorrekter types wurde anschließend der besseren Übersichtlichkeit halber über einen Monatszeitraum hin aufsummiert. Auf der Basis dieser Zahlen wurde dann die Rate korrekt flektierter Partizipformen starker Verben ermittelt. Durch dieses Erhebungs- und Berechnungsverfahren erklären sich auch die im Vergleich zu Abbildung 3.1 deutlich höheren Übergeneralisierungsraten. Gegenüber einem Berechnungsverfahren, das die token-Zahlen korrekt bzw. inkorrekt produzierter Partizipformen zueinander in Beziehung setzt, führt ein Verfahren, in dem jede korrekt bzw. inkorrekt produzierte Form am Erhebungstag nur als jeweils ein type gezählt wird, zu einer stärkeren Gewichtung der auftretenden Fehler.
55 die vorliegenden Daten nahe, dass die Kinder zum Zeitpunkt der ersten Übergeneralisierungen die bis dahin korrekt verwendeten past tense und Partizipformen bereits als past tense bzw. Partizipformen kategorisiert hatten. So ergibt ein Vergleich der in Weyerts (1997) aufgeführten Verb- und Partizipinventare des Kindes Simone, dass Simone vor der Übergeneralisierungsphase bereits für sechs der von ihr verwendeten sieben Partizipien auch über Präsensformen verfügte. Diese Beobachtungen zeigen, dass Übergeneralisierungen nicht nur zur Bildung von solchen past tense bzw. Partizipformen führen, die die Kinder bislang noch nicht erworben haben, sondern dass sie auch solche Formen betreffen, die bereits korrekt verwendet wurden (Kuczaj 1977, Marcus et al. 1992, Lindner 1998, Pinker 1999). Dennoch führen Übergeneralisierungen nicht zu einem Rückschritt in der Sprachentwicklung, indem sie einstmals korrekte Formen ersetzen. Vielmehr steigt der Prozentsatz der in past tense Kontexten korrekt flektierten Formen in der Phase der Übergeneralisierungen weiter an. Mit steigender Anzahl der Übergeneralisierungen sinkt dagegen der Anteil der Verben, die vorher in einem obligatorischen Kontext keine past tense Markierung erhielten (Kuczaj 1977, Marcus et al. 1992, Pinker 1999). Übergeneralisierungen scheinen also vor allem solche Formen zu ersetzen, die vorher in einem obligatorischen past tense Kontext unmarkiert geblieben waren. Eine Analyse der von Kindern verwendeten Übergeneralisierungen zeigt auch, dass diese frequenzabhängig sind. Übergeneralisiert werden vor allem die starken Verben, die von den Eltern eher selten im past tense oder in der Partizipform verwendet werden, die die Kinder also seltener gehört haben (z.B. Bybee & Slobin 1982, Marcus et al. 1992, Weyerts 1997, Maslen et al. 2004)). Marcus et al. verglichen die Rate, mit der 91 starke Verben im past tense übergeneralisiert wurden, mit der Häufigkeit, mit der die past tense Formen dieser Verben von den Eltern der untersuchten 19 Kinder verwendet wurden. Dabei zeigte sich für jedes der Kinder eine signifikante negative Korrelation: Je seltener eine bestimmte irreguläre past tense Form im input der Kinder auftauchte, desto höher war die Übergeneralisierungsrate für dieses Verb. Abhängig von der Frequenz, mit der bestimmte irreguläre Formen im input der Kinder auftauchen, ist auch die Verwendung dieser Formen durch die Kinder selbst. Formen mit niedriger Frequenz tauchen im input der Kinder selten auf, werden von ihnen ebenfalls selten verwendet und sind für Übergeneralisierungen anfälliger als Formen, die von Kindern häufig gehört und auch verwendet werden. Abbildung 3.3, die auf den von Weyerts (1997) ermittelten Übergeneralisierungen in den Längsschnittdaten neun monolingual deutschsprachiger Kinder im Alter von 1;4 bis 3;9 basiert, verdeutlicht diesen Zusammenhang. Die Spontansprachdaten der neun Kinder enthielten insgesamt 61 verschiedene irreguläre Partizipien (types). Für jedes dieser Partizipien ermittelte Weyerts (i) die Häufigkeit des Gesamtauftretens dieses Partizips in den Spontansprachdaten der Kinder, (ii) die Häufigkeit, mit der dieses Partizip inkorrekt mit -t flektiert wurde, und (iii) die in der CELEX-Datenbank (Baayen, Piepenbrock & van Rijn 1993) aufgeführte Partizipfrequenz. Um die Zusammenhänge zwischen Vorkommenshäufigkeit im input der Kinder, Verwendungshäufigkeit der Form durch die Kinder selbst und Übergeneralisierungsrate zu verdeutlichen, bietet es sich an, diese 61 irregulären Partizipien nach der CELEX-Frequenz ihrer Partizipform zu sechs Gruppen à zehn Partizipien zusammenzufassen:3 Gruppe I enthält dabei zehn selten vorkommende irreguläre Partizipien, die eine –––––––—–– 3
Das Partizip mit der größten Vorkommenshäufigkeit wurde dabei nicht berücksichtigt.
56 CELEX-Frequenz zwischen 0 und 16 haben. Für die zehn häufig vorkommenden irregulären Partizipien der Gruppe VI listet die CELEX-Datenbank dagegen Frequenzwerte zwischen 1179 und 2857 auf. Abbildung 3.3 verdeutlicht, dass es eine positive Korrelation gibt zwischen der Häufigkeit, mit der irreguläre Partizipformen im input der Kinder vorkommen (repräsentiert durch die auf der X-Achse angegebenen CELEX-Frequenzen der Partizipien in den Gruppen I bis VI), und der Häufigkeit, mit der diese Formen von den Kindern selbst verwendet werden (r(4) = .897, p = .015) (siehe Säulen und die zugehörige Skalierung auf der linken vertikalen Achse in Abb. 3.3): Während die zehn irregulären Partizipien mit der niedrigsten Vorkommenshäufigkeit (Gruppe I) von den Kindern insgesamt nur 39 mal verwendet wurden, sind die zehn frequentesten Partizipien (Gruppe VI) in den Kinderdaten insgesamt 253 mal vertreten. Zudem zeigt die Graphik eine negative Korrelation (r(4) = -.811, p = .05) zwischen der Vorkommenshäufigkeit einer Partizipform (siehe die auf der X-Achse angegebenen CELEX-Frequenzen der Partizipien in den Gruppen I bis VI) und der prozentualen Häufigkeit von Übergeneralisierungen (siehe die schwarze Linie in der Graphik sowie die zugehörige Skalierung auf der rechten vertikalen Achse). So wurden z.B. elf der 39 Vorkommen der zehn seltensten Partizipien (Gruppe I) inkorrekt mit -t flektiert, was einer Übergeneralisierungsrate von 28,2% entspricht. Die Übergeneralisierungsrate für die zehn frequentesten irregulären Partizipien (Gruppe VI) liegt dagegen nur noch bei 7,5% (19 Übergeneralisierungen auf 253 Vorkommen). Die Graphik verdeutlicht damit folgende Zusammenhänge: Je häufiger eine irreguläre Partizipform im input von Kindern ist, desto häufiger verwenden Kinder die gehörte Form selber. Dadurch sinkt natürlich auch die Anzahl der Übergeneralisierungsfehler, in denen eine regularisierte Partizipform für ein starkes Verb gebildet wird.
Abb. 3.3: Übergeneralisierungsrate und Verwendungshäufigkeit irregulärer Partizipien in Abhängigkeit von ihrer Frequenz (nach den Angaben in Weyerts 1997)
57 Eine Erklärung des U-förmigen Erwerbsverlaufs: Steven Pinker und Kollegen (siehe z.B. Marcus et al. 1992, Pinker 1999) haben für diese Beobachtungen folgende Analyse vorgeschlagen: Die Frequenzabhängigkeit der Übergeneralisierungen legt nahe, dass es sich bei ihnen um die Folge eines Gedächtniseffekts handelt. Dass Frequenz – also die Häufigkeit, mit der wir einer Wortform begegnen – einen Einfluss auf die Sprachverarbeitung hat, ist hinlänglich bekannt (für einen Überblick siehe Balota 1994). Gespeicherte Wörter bzw. Wortformen profitieren offensichtlich von Wiederholungen: Je öfter wir einem Wort begegnen, desto stärker wird die Gedächtnisspur dieses Eintrags im mentalen Lexikon und desto besser können wir auf ihn zugreifen. Dass sich Frequenzeffekte auch für irreguläre past tense bzw. Partizipformen zeigen, legt demnach nahe, dass auch diese flektierten Wortformen im mentalen Lexikon gespeichert sind. Kinder haben aufgrund ihres geringen Lebensalters noch relativ wenig Erfahrungen mit irregulären Formen gemacht. Einige haben sie noch nie gehört, sodass für diese Formen noch kein Eintrag im mentalen Lexikon angelegt wurde. Andere haben sie erst wenige Male gehört, und die Gedächtnisspuren dieser irregulären Formen sind folglich noch schwach. Dementsprechend gelingt auch der Abruf dieser Formen in der Sprachproduktion nicht immer verlässlich. Übergeneralisierungen bieten in dieser Situation eine Möglichkeit, in einem obligatorischen Kontext für z.B. eine past tense Form eine Form mit der erforderlichen morphosyntaktischen Markierung zu produzieren. Mit zunehmendem Alter steigt auch die Vertrautheit mit irregulären Formen. Die Gedächtnisspuren dieser lexikalischen Einträge verstärken sich. Der Abruf dieser Formen gelingt verlässlicher, und die Übergeneralisierungsrate geht dementsprechend zurück. Diese Theorie erklärt auf einleuchtende Weise das schleichende Auslaufen der Übergeneralisierungen im Laufe der Kindheit, die zunehmenden Korrektheitswerte der irregulären Flexion bei Rückgang der unmarkierten Formen und die beobachteten Korrelationen zwischen der input-Frequenz, der Verwendungshäufigkeit und der Übergeneralisierungsrate irregulärer Formen.4
3.2 Frequenzeffekte Frequenzeffekte, die nahe legen, dass irregulär flektierte Formen im mentalen Lexikon gespeichert sind, zeigen sich jedoch nicht nur im Erwerb irregulärer Formen. Auch bei erwachsenen Sprechern beeinflusst die Frequenz einer gespeicherten Wortform Sprachproduktion und Sprachverstehen. So ergab z.B. die Auswertung eines mehr als 7000 Versprecher umfassenden Korpus englischsprachiger Sprecher (Stemberger 1984), dass seltene starke Verben in past tense Kontexten signifikant häufiger unmarkiert blieben als frequente starke Verben (Stemberger & MacWhinney 1986, 1988). –––––––—–– 4
Lindner (1998) weist allerdings auf Probleme hin, die sich aus den noch bestehenden Unklarheiten über die genauen Mechanismen der Speicherung und des Zugriffs auf die abgespeicherten lexikalischen Einträge ergeben. So stellt sich z.B. das Problem, warum Kinder selbst nach mehrfacher Vorgabe korrekter irregulärer Formen diese Verben dennoch übergeneralisieren (vgl. auch Maslen et al. 2004).
58 Frequenzeffekte in lexikalischen Entscheidungsexperimenten: Wie in Kapitel 2.1.2.1 ausgeführt, wird für die Untersuchung von Frequenzeffekten insbesondere die Technik der lexikalischen Entscheidungsaufgabe genutzt, da lexikalische Entscheidungszeiten von der Vorkommenshäufigkeit von Wörtern bzw. Wortformen beeinflusst sind. Mit abnehmender Frequenz verlängern sich dabei die Reaktionszeiten. Dieser Frequenzeffekt reflektiert nach gängiger Meinung die Suche nach dem Lexikoneintrag des präsentierten Worts im mentalen Lexikon. Diese Suche ist dabei umso schneller erfolgreich, je häufiger das jeweilige Wort oder die Wortform verwendet wird. Clahsen, Eisenbeiss & Sonnenstuhl (1997) verglichen die lexikalischen Entscheidungszeiten, die unbeeinträchtigte Muttersprachler des Deutschen bei der Wortidentifikation frequenter und seltener irregulärer Partizipien in einem lexikalischen Entscheidungstest benötigten. Um den Einfluss unterschiedlicher Ablautmuster auszuschalten, untersuchten sie Verben des Ablauttyps ABA, bei denen der Stammvokal in Basis- und Partizipstamm identisch ist (z.B. laufen - lief - gelaufen). Die Versuchspersonen benötigten dabei zur Identifikation von neun seltenen irregulären Partizipien signifikant mehr Zeit als zur Identifikation von neun frequenten Partizipien (vgl. Tab. 3.1). Dass ein Frequenzeffekt bei der Verarbeitung flektierter Wortformen auftritt, spricht dafür, dass die getesteten irregulären Partizipformen im mentalen Lexikon gespeichert sind.5
Tab. 3.1: Frequenzverteilung und Reaktionszeiten für irreguläre Partizipien (nach Clahsen, Eisenbeiss & Sonnenstuhl 1997)
Eine hohe Partizipfrequenz geht jedoch häufig mit einer hohen Lemmafrequenz einher, eine niedrige Partizipfrequenz mit einer niedrigeren Lemmafrequenz, da bei der Ermittlung der Lemmafrequenz die Frequenzen aller flektierten Formen eines Wortes summiert werden. In einem weiteren Experiment testeten Clahsen, Eisenbeiss & Sonnenstuhl daher, ob für den beobachteten Frequenzeffekt tatsächlich die Partizipfrequenz und nicht etwa die Lemmafrequenz ausschlaggebend war. Dafür verglichen sie die lexikalischen Entscheidungszeiten für neun starke Verben mit seltener Partizipform, aber relativ hoher Lemmafrequenz –––––––—–– 5
Vergleichbare Frequenzeffekte zeigten sich in lexikalischen Entscheidungstests unter anderem auch bei deutschen Nominalpluralen auf -er (Clahsen, Eisenbeiss & Sonnenstuhl 1997, Penke & Krause 2002) und bei Maskulina und Neutra mit einem -n-Plural (Penke & Krause 2002) sowie im Niederländischen bei -en-Pluralen (Baayen, Dijkstra & Schreuder 1997) und dem Komparativflexiv -er (Bertram, Schreuder & Baayen 2000) (vgl. dazu Kap. 4.1.1).
59 (Gruppe I) mit den Reaktionszeiten für neun starke Verben mit relativ häufiger Partizipform, aber relativ niedriger Lemmafrequenz (Gruppe II) (vgl. Tab. 3.2).
Tab. 3.2: Frequenzverteilung (Partizip- und Lemmafrequenz) und Reaktionszeiten für irreguläre Partizipien (nach Clahsen, Eisenbeiss & Sonnenstuhl 1997)
Wäre die Lemmafrequenz für den Frequenzeffekt ausschlaggebend, dann hätten die Entscheidungszeiten für die starken Verben der Gruppe I kürzer als die der Gruppe II sein sollen. Tatsächlich waren jedoch die Reaktionszeiten für die Verben der Gruppe II trotz der relativ niedrigen Lemmafrequenz signifikant schneller als die Reaktionszeiten für die starken Verben mit hoher Lemmafrequenz, aber niedriger Partizipfrequenz (Gruppe I). Abbildung 3.4 visualisiert diesen Effekt: Mit steigender Partizipfrequenz (dunkelgraue Balken und zugehörige Skalierung auf der linken vertikalen Achse) verkürzen sich die lexikalischen Entscheidungszeiten (schwarze Linie und Skalierung auf der rechten vertikalen Achse).
Abb. 3.4: Frequenzverteilung und Reaktionszeiten für irreguläre Partizipien (nach Clahsen, Eisenbeiss & Sonnenstuhl 1997)
Der beobachtete Frequenzeffekt ist also durch die Unterschiede in der Partizipfrequenz bedingt, während ein Einfluss der Lemmafrequenz (helle Balken in Abb. 3.4) auf die lexi-
60 kalischen Entscheidungszeiten für irreguläre Partizipien nicht beobachtet werden konnte (für einen vergleichbaren Befund zum niederländischen -en-Plural vgl. Baayen, Dijkstra & Schreuder 1997). Auch dieses Ergebnis spricht für eine Speicherung der flektierten irregulären Partizipformen im mentalen Lexikon. Frequenzeffekte in den Fehlerraten agrammatischer Broca-Aphasiker: Weitere Evidenz für die Annahme, dass irregulär flektierte Formen im mentalen Lexikon gespeichert sind und Übergeneralisierungen resultieren, wenn der Zugriff auf diese gespeicherten Formen misslingt, liefert eine experimentelle Untersuchung, in der wir bei elf Broca-Aphasikern neben anderen flektierten Formen auch jeweils 39 irreguläre Partizipien elizitierten (vgl. Penke, Janssen & Krause 1999). Zur Elizitation wurde mit den Versuchspersonen eine Satzvervollständigungsaufgabe durchgeführt. Den Versuchsteilnehmern wurde dabei eine Karte mit zwei Sätzen vorgelegt. Im ersten Satz wurde eine Verbform in einem Präsenskontext eingeführt. Der zweite Satz lieferte dann einen Vergangenheitskontext. Nachdem die zwei Sätze mit den Versuchspersonen laut gelesen worden waren, wurden sie aufgefordert, den zweiten Satz zu ergänzen. Die Vorgabe eines Auxiliars sollte dabei sicherstellen, dass der Satz mit einer Partizipform vervollständigt wurde (vgl. (1)). (1)
Um den Einfluss der Frequenz auf die Fehlerraten bei der Produktion von Partizipien zu untersuchen, elizitierten wir sowohl frequente Partizipformen frequenter Verben als auch seltene Partizipformen relativ seltener Verben (vgl. Tab. 3.3).
Tab. 3.3: Frequenzverteilung der Verben im Testmaterial von Penke, Janssen & Krause (1999) Die aufgeführten Frequenzangaben stammen aus der CELEX-Datenbank (Baayen, Piepenbrock & van Rijn 1993).
Ein Vergleich der Fehlerzahlen bei der Produktion der 13 häufigen und 16 seltenen irregulären Partizipformen ergab einen signifikanten Frequenzeffekt (Wilcoxon, p = .014). Die Anzahl der Fehler, die die Aphasiker bei der Produktion irregulärer Formen machten, war
61 von der Frequenz der irregulären Partizipformen abhängig. Während nur 15,3% der frequenten irregulären Partizipformen eine falsche Partizipendung trugen, lag die Fehlerrate für die seltenen irregulären Partizipien bei 42,3% (siehe schwarze Linie sowie rechte vertikale Achse in Abb. 3.5).6
Abb. 3.5: Frequenzverteilung der Suffixfehler bei irregulären Partizi pien (nach Penke, Janssen & Krause 1999)
Die Frequenzabhängigkeit der Fehlerrate bestätigt sich auch, wenn man die CELEX-Partizipfrequenzen der getesteten 39 starken Verben mit der Anzahl der Fehler korreliert, die bei der Flexion jedes einzelnen dieser Verben insgesamt von den Versuchspersonen gemacht wurden. Dafür wurden die 39 starken Verben nach ihrer CELEX-Partizipfrequenz auf sechs Frequenzbereiche aufgeteilt (Gruppen I bis VI).7 Die Säulen (und die zugehörige linke vertikale Skala) in Abbildung 3.6 zeigen den Wert der durchschnittlichen Partizipfrequenz der Verben in diesen sechs Gruppen. Anschließend wurden die Fehlerraten bei der Partizipproduktion für die Verben in diesen sechs Frequenzbereichen ermittelt (siehe schwarze Linie und zugehörige rechte vertikale Skala in Abb. 3.6). Die Abbildung illustriert, dass die so ermittelte Fehlerrate für die sechs starken Verben mit der niedrigsten Partizipfrequenz (Gruppe I) bei 50% lag (32 Fehler auf 64 auswertbare Formen). Dagegen betrug sie für die –––––––—–– 6
7
Im Unterschied zu den Spracherwerbsdaten wurden in den nachfolgenden Analysen der Daten der aphasischen Sprecher nicht nur Übergeneralisierungsfehler ausgewertet, sondern alle Fehler, bei denen die Partizipendung fehlerhaft war. Dennoch handelt es sich bei den aufgetretenen Suffixfehlern an irregulären Partizipien zum ganz überwiegenden Teil (98 von 124 = 79%) um Übergeneralisierungen der regulären Partizipendung -t. Bei den verbleibenden Fehlern wurde die Partizipendung entweder ausgelassen (z.B. bersten - geberst) oder durch -e ersetzt (z.B. trügen - getrüge). Die Frequenzbereiche I und II enthielten je sechs Verben, die Frequenzbereiche IV und V je sieben Verben, Frequenzbereich III enthielt acht Verben und Frequenzbereich VI fünf Verben.
62 fünf starken Verben mit der höchsten Partizipfrequenz (Gruppe VI) nur noch 11,3% (6 Fehler auf 53 auswertbare Formen). Insgesamt ergibt sich eine signifikante negative Korrelation zwischen der Partizipfrequenz und der Fehlerrate (r(4) = -.850, p = .032): Je niedriger die Partizipfrequenz eines starken Verbs ist, desto höher ist die Fehlerrate in den Daten der agrammatischen Versuchspersonen.
Abb. 3.6: Korrelation zwischen Partizipfrequenz und Fehlerrate für starke Verben in den Daten agrammatischer Broca-Aphasiker
Die Auswertung der Fehler bestätigt ferner, dass nicht die Lemmafrequenz, sondern die Partizipfrequenz für diesen Frequenzeffekt verantwortlich ist. Zehn der starken Verben im Testmaterial waren so ausgewählt worden, dass sie zwar hinsichtlich ihrer Lemmafrequenzen vergleichbar waren, fünf der Verben hatten jedoch selten vorkommende Partizipformen (Gruppe I) und fünf hatten frequente Partizipformen (Gruppe II) (vgl. Tab. 3.4).
Tab. 3.4: Frequenzverteilung für zehn irreguläre Partizipien im Testma terial von Penke, Janssen & Krause (1999) Die aufgeführten Frequenzen stammen aus der CELEX-Daten bank (Baayen, Piepenbrock & van Rijn 1993).
63 Ein Vergleich der Fehlerraten der elf Aphasiker für diese zwei Verbgruppen ergab einen signifikanten Unterschied. Trotz der vergleichbaren Lemmafrequenz wurden 41,5% der starken Verben mit niedriger Partizipfrequenz (Gruppe I) fehlerhaft gebildet, jedoch nur 22% der starken Verben mit frequenten Partizipformen (Gruppe II) (Wilcoxon, p = .037) (vgl. Abb. 3.7). Dies belegt, dass für die größere Fehleranfälligkeit seltener irregulärer Partizipien ihre niedrige Partizipformfrequenz verantwortlich ist.8
Abb. 3.7: Frequenzverteilung und Fehlerraten für zehn starke Verben
Hält man umgekehrt die Partizipfrequenz konstant, variiert jedoch die Lemmafrequenz, bestätigt sich, dass die Lemmafrequenz keinen Einfluss auf die Fehlerraten hat. Die 25 im Testmaterial enthaltenen und mit einer Partizipfrequenz von weniger als 50 relativ seltenen irregulären Partizipien wurden nach ihrer Lemmafrequenz in fünf Gruppen mit aufsteigender Frequenz geordnet. Anschließend wurden die Fehlerraten für diese Partizipien ermittelt. Bei einem Einfluss der Lemmafrequenz auf die Fehlerraten hätte sich eine Korrelation zwischen steigender Lemmafrequenz und fallenden Fehlerraten zeigen sollen. Tatsächlich ergab die statistische Auswertung jedoch keine Korrelation von Lemmafrequenz und Fehlerrate (r(3) = -.07, p = .911). Die beobachteten Frequenzeffekte legen für die aphasischen Sprecher ein Gedächtnisproblem nahe, das den Zugriff auf die gespeicherten, irregulären Partizipformen beeinträchtigt. Die Daten zeigen, dass der Zugriff auf gespeicherte Formen umso eher misslingt, je seltener irreguläre Partizipformen sind.9 Folge des gescheiterten Zugriffs auf gespeicherte Wortformen sind Übergeneralisierungen, die es ermöglichen, trotz gescheiterten Zugriffs –––––––—–– 8
9
Andere möglicherweise beeinflussende Faktoren wie der Ablauttyp oder der Stammvokal von Präsens- und Partizipform wurden kontrolliert und unterschieden sich in den beiden Bedingungen nicht. Eine vergleichbare Frequenzabhängigkeit agrammatischer Fehler konnten wir auch in elizitierten Daten zum deutschen irregulären -n-Plural bei Maskulina und Neutra beobachten (vgl. Penke & Krause 1999, 2002 sowie Kap. 5.2.1).
64 dennoch eine Form mit den erforderlichen morphosyntaktischen Merkmalsspezifikationen zu erzeugen. Stützung erfährt die Annahme, dass die Broca-Aphasie mit Zugriffsstörungen auf lexikalische Einträge verbunden ist, durch die Beobachtung, dass Wortfindungsstörungen, die insbesondere Verben betreffen, ein häufig beobachtetes Symptom der BrocaAphasie sind (z.B. Zingeser & Berndt 1990, Damasio & Damasio 1992, Berndt et al. 1997). Für eine Zugriffsstörung sprechen ferner die Daten einer nach 13 bzw. 16 Monaten mit vier der elf Aphasiker durchgeführten Wiederholung des Elizitationsexperiments. Dabei erwiesen sich zwar im Prinzip dieselben Partizipformen wie in der Erstuntersuchung als störungsanfällig und wieder zeigte sich, dass Partizipien umso fehleranfälliger waren, je niedriger ihre Partizipfrequenz war (r(4) = -.864, p = .027). Ein Vergleich der irregulären Partizipien, die von den einzelnen Aphasikern in der Erstuntersuchung bzw. in der Wiederholungsuntersuchung falsch suffigiert worden waren, ergab jedoch, dass insgesamt nur zwölf der 32 fehlerhaften Formen der Erstelizitation auch in der zweiten Untersuchung fehlerhaft waren. Ein durch die Aphasie bedingter Verlust von Lexikoneinträgen kann also ausgeschlossen werden. Zusammenfassung: Die vorgestellten Daten belegen, dass irregulär flektierte Formen im mentalen Lexikon gespeichert sind. Der Zugriff auf diese gespeicherten Formen ist abhängig von ihrer Frequenz: Er ist für selten vorkommende Formen langsamer als für häufig vorkommende Formen und kann bei seltenen Formen auch ganz scheitern. Dies lässt sich insbesondere bei Kindern beobachten, die aufgrund ihrer kürzeren Lebensdauer noch wenig Erfahrungen mit irregulären Formen gesammelt haben, sowie bei Aphasikern, bei denen es als Folge der Hirnschädigung zu Zugriffsproblemen auf das mentale Lexikon kommt.
3.3 Phonologische Ähnlichkeitseffekte Analysen der im Spracherwerb und bei Aphasikern beobachtbaren Fehler bei der Produktion irregulärer Formen sowie die Ergebnisse aus Elizitationsexperimenten mit Kunstverben haben zudem ergeben, dass die bereits erworbenen Verbeinträge nicht einfach in Form einer unstrukturierten Liste im mentalen Lexikon vorliegen. Vielmehr lässt sich neben dem bereits diskutierten Einfluss der Frequenz auch ein Einfluss der phonologischen Ähnlichkeit zwischen verschiedenen Verbeinträgen beobachten. Die irregulären englischen past tense bzw. deutschen Partizipformen bilden Gruppen bzw. Familien ähnlich klingender und ablautender Formen. So gibt es z.B. im Deutschen eine relativ große Gruppe 18 starker Verben, die im Basisstamm auf /InCObstruent/ enden (sinken, singen, klingen etc.) und den Stammvokal im Partizip zu u ablauten (gesunken, gesungen, geklungen etc.). Ganz entsprechend gibt es im Englischen ca. zwölf Verben, bei denen ein [I] des Präsensstamms zu [√] im past tense ablautet (string, cling etc.) (Pinker 1999).
65 Phonologische Ähnlichkeitseffekte im Spracherwerb und bei Kunstwortexperimenten: Bybee & Slobin (1982) haben darauf hingewiesen, dass past tense Formen, die zu einer solchen Familie ähnlich lautender und ablautender Verben gehören, im Erstspracherwerb schneller erworben werden. Zudem sind irreguläre Formen, die zu einer solchen Familie gehören, im Spracherwerb auch vor Übergeneralisierungen eher gefeit. Um diesen Effekt zu testen, ermittelten Marcus et al. (1992) für jedes der in ihren Spracherwerbsdaten enthaltenen 91 verschiedenen irregulären Partizipien (types) die Stärke der Familie, der diese irregulären Verben angehören. Dafür summierten sie die past tense Frequenzen all derjenigen starken Verben, bei denen sich sowohl der Basisverbstamm als auch die past tense Form reimten. Zur Ermittlung der Familienstärke einer irregulären past tense Form wie stung (Basisverbstamm sting) wurden demnach die past tense Frequenzen von clung, flung, swung usw. aufsummiert, die sich auf stung und deren Basisverbstämme cling, fling, swing sich auf sting reimten. Marcus et al. fanden eine negative Korrelation zwischen der so ermittelten Familienstärke und der Übergeneralisierungsrate: Je höher die aufsummierten Frequenzen der phonologisch ähnlichen irregulären Verben waren, je stärker also die Familie eines irregulären Verbs war, desto seltener wurde es übergeneralisiert. Dieses Ergebnis konnte Weyerts (1997) in ihrer Untersuchung zum Partiziperwerb des Deutschen replizieren. Sowohl in den von ihr untersuchten Spontansprachdaten als auch in ihren elizitierten Daten fand sich eine signifikante negative Rangkorrelation zwischen der in gleicher Weise ermittelten Stärke einer Familie phonologisch ähnlicher starker Verben und der Höhe der Übergeneralisierungsraten im Spracherwerb. Elizitationsexperimente mit Kunstverben haben ferner ergeben, dass Familien starker Verben Vorbilder für analoge past tense Bildungen von Kunstverben sein können (Bybee & Moder 1983, Prasada & Pinker 1993, Plag 2000, Berent, Pinker & Shimron 2002, Ramscar 2002) – ein Effekt, der auch gang-Effekt genannt wird (vgl. Stemberger & MacWhinney 1988). Auf der Basis ihrer Kunstverbelizitation zur string-strung-Klasse schlagen Bybee & Moder (1983) vor, dass irreguläre past tense Muster Kategorien der Familienähnlichkeit im Wittgensteinschen Sinne (Wittgenstein 1953) bzw. Prototypen im Sinne der Prototypentheorie (Rosch 1975, 1978) bilden (vgl. auch Pinker 1998, 1999). Demnach gibt es keine eindeutige Definition, mit der sich die Mitglieder einer Familie bestimmen lassen, sondern die Mitglieder einer Familie teilen in unterschiedlichem Maße bestimmte phonologische Merkmale wie die initialen und finalen Konsonantencluster oder den Stammvokal miteinander.10 So beginnt z.B. das prototypische Mitglied der Verbfamilie, die im past tense den Vokal [√] aufweist, mit einem Konsonantencluster, das mit einem stimmlosen dentalen Frikativ anlautet. Es endet mit einem velaren Nasal, wie z.B. strung. Das Elizitationsexperiment von Bybee & Moder ergab: Je größer die Übereinstimmung der phonologischen –––––––—–– 10
Nach Ansicht von Pinker (1998, 1999) ist der Familienähnlichkeitscharakter der irregulären Cluster auch die Ursache für die Probleme des Ansatzes von Halle & Mohanan (1985), die versuchen, die past tense Flexion starker Verben durch morphophonologische Regeln zu erfassen, deren Anwendung auf bestimmte Verben beschränkt ist (sog. minor rules) (vgl. auch Halle & Marantz 1993, Embick & Marantz 2005). So sei es einerseits nicht möglich, phonologische Bedingungen anzugeben, die genau diejenigen und nur diejenigen Verben erfassen, auf die eine bestimmte Regel appliziert. Eine Auflistung derjenigen Verben, die unter den Anwendungsbereich einer bestimmten minor rule fallen, würde andererseits die phonologischen Ähnlichkeiten, die zwischen diesen Verben bestehen, unerklärt lassen.
66 Merkmale zwischen Kunstverb und diesem Prototyp war, desto häufiger resultierte eine analog zum irregulären Muster gebildete Kunstverbform. Für ein Kunstverb, das genau diesem Prototyp entsprach (spling), produzierten 44% der Versuchspersonen von Bybee & Moder die past tense Form splung. Stimmte der onset des Kunstverbs nicht mit dem Prototyp überein, wie z.B. bei shink, dann bildeten 24% der Probanden die past tense Form shunk. Bezog sich die Übereinstimmung lediglich auf den Stammvokal, wie bei sid, produzierten schließlich nur noch 7% der Versuchspersonen die past tense Form sud. Laut Bybee & Moder zeigt dieses letzte Ergebnis auch, dass nicht die Präsensform – und hier insbesondere der Stammvokal – für die irreguläre Familie entscheidend ist. Ihrer Ansicht nach folgen die Mitglieder einer Familie nicht einer Generalisierung in der Art einer Ablautregel wie ‚[I] → [√]’, sondern die Familienmitglieder ergeben sich aus den Übereinstimmungen der past tense Formen untereinander. Die Familie ist, in Bybees Terminologie, produktorientiert (vgl. Bybee 1988, 1995 und für eine ähnliche Auffassung Stemberger & MacWhinney 1988). Als weitere Evidenz für diese Auffassung führt Bybee (1995) diachrone Daten an, die zeigen, dass der Stammvokal neuerer Mitglieder der strungFamilie durchaus nicht immer [I] lautet (z.B. strike [aI] - struck, sneak [i:] - snuck oder drag [Q] - drug) (vgl. auch Pinker 1999). Bybees Netzwerkmodell des Lexikons: Auf der Basis dieser Daten formuliert Bybee ein Netzwerkmodell des Lexikons, in dem flektierte Formen wie Basisformen in einem assoziativen Netzwerk gespeichert sind (1985, 1988, 1991, 1995). Wörter mit ähnlichen oder identischen semantischen und phonologischen Merkmalen sind dabei durch assoziative Verknüpfungen miteinander verbunden. Abbildung 3.8 skizziert die Repräsentation eines Ausschnitts der strung-Klasse und die Ausbildung eines Schemas, das dann für analoge past tense Bildungen genutzt werden kann. Ähnliche phonologische Merkmale – sowie in der Abbildung nicht dargestellte semantische Merkmale – verbinden die Basisformen mit ihren jeweiligen past tense Formen. Ähnliche phonologische Merkmale und die jeweils identische Merkmalsspezifikation [+ PAST] verbinden jedoch auch die verschiedenen past tense Formen untereinander.11 Die lexikalischen Verbindungen, die zwischen solcherart ähnlichen past tense Formen bestehen, bilden Schemata, die zur Analogiebildung genutzt werden können. Je größer dabei die Gruppe der ähnlich verbundenen Einträge – hier der past tense Formen – ist, desto stärker ist das jeweilige Schema (in der Abbildung durch die unterschiedliche Dicke der Linien angedeutet). Je stärker das so entstandene Schema ist und je weniger Restriktionen es für seine Mitglieder gibt, umso produktiver kann es für Analogiebildungen genutzt werden. Die Verben der strung-Klasse beispielsweise (vgl. Abb. 3.8) bilden ein past tense Schema, das man nach Bybee wie folgt beschreiben kann (1988: 135): (2)
–––––––—–– 11
Die Verbindungen der Basisformen untereinander wurden in Abbildung 3.8 der Übersichtlichkeit halber weggelassen.
67 Das Schema erfasst, dass die prototypische past tense Form eines Verbs dieser Klasse den Stammvokal [√] aufweist. Diesem geht ein Konsonant oder Konsonantencluster voran. Auf [√] folgt ein velarer und/oder nasaler Konsonant.
Abb. 3.8: Lexikalische Verbindungen der past tense Formen eines Teils der strung-Klasse (nach Bybee 1988: 135)
Evidenz gegen produktorientierte Schemata – Analogiebildungen beruhen auf Reimähnlichkeiten, nicht auf Schemata: Die Herausbildung solcher produktorientierter Schemata, die unabhängig vom Stammvokal der Basisform operieren, mag zwar für englische irreguläre past tense Formen eine zutreffende Generalisierung bieten,12 für deutsche irreguläre Partizipien erscheint sie jedoch problematisch. Unter den irregulären Partizipien des Deutschen gibt es deutlich weniger Reimähnlichkeiten als unter den past tense Formen des Englischen. Die Klasse der /InCObstruent/-Verben (wie singen - gesungen, klingen - geklungen etc.) des Deutschen, die eine große Reimähnlichkeit der Mitglieder untereinander aufweist, ist hier eher die –––––––—–– 12
Als weiteres Beispiel für die Notwendigkeit produktorientierter Schemata nennt Bybee (1995) die Pluralbildung im Hausa. Sie verweist auf eine Analyse von Haspelmath (1989) und experimentelle Befunde von Lobben (1991), die zeigen, dass Pluralformen im Hausa einem Schema folgen, das sich nicht als Anwendung einer einheitlichen Regel auf die Singularformen erfassen lässt. So folgen z.B. Nomina mit ganz unterschiedlichem Tonmuster und ohne phonologische Ähnlichkeit einem Pluralschema, demzufolge die Pluralform das Tonmuster hoch-hoch-tief zeigt und auf -úCàa endet (z.B. kàntíi - kántúnàa ‚Laden‘, tákòobii - tákúbàa ‚Schwert‘).
68 Ausnahme als die Regel. Die deutlich geringere Reimähnlichkeit erlaubt es, die Einflüsse von Reimähnlichkeiten und produktorientierten Schemata auf Analogiebildungen zu trennen. Einen Testfall bieten irreguläre Partizipien mit dem Stammvokal o. Sieht man von der Gespanntheit und Länge des Stammvokals ab, bilden ca. 75 der ca. 172 irregulären Simplexverben des Deutschen das Partizip mit dem Stammvokal o (z.B. lügen - gelogen, saufen - gesoffen, bergen - geborgen, bieten - geboten, schwören - geschworen, gären gegoren) (vgl. Wiese in Druck). Da sich außer diesem Stammvokal und der -en-Endung keine weiteren augenfälligen Gemeinsamkeiten der Formen feststellen lassen, sollte sich nach Bybees Theorie das folgende Schema für diese Partizipformen herausbilden: (3) Eine Partizipform, die diesem Schema folgt, beginnt mit einem Konsonanten oder Konsonantencluster. Diesem folgt ein Stammvokal o, auf den wiederum ein Konsonant oder Konsonantencluster und die Endung [´n] folgen. Aufgrund der großen Anzahl von Partizipien, die diesem Schema folgen, und aufgrund der Tatsache, dass für diese Partizipien keine weiteren phonologischen Restriktionen gelten, handelt es sich Bybees Argumentation folgend um ein relativ produktives Partizipschema, das häufig für Analogiebildungen genutzt werden sollte. Die Ergebnisse einer von uns durchgeführten Kunstverbelizitation zeigen jedoch, dass dieses Schema allein nicht zur analogen Produktion von Partizipien mit Stammvokal o führt. In unserem oben bereits erwähnten Partizipexperiment mit aphasischen Versuchspersonen (siehe Abschnitt 3.2) elizitierten wir auch Partizipien für insgesamt 15 Kunstverben mit dem Stammvokal e. Fünf dieser Kunstverben reimten sich dabei weder mit existierenden schwachen noch mit existierenden starken Verben (z.B. brewen), fünf Kunstverben reimten sich mit seltenen starken Verben (z.B. melzen) und fünf Kunstverben reimten sich mit hochfrequenten starken Verben (z.B. spechen). Dabei zeigte sich, dass dem obigen Schema entsprechende Partizipien (wie gebrowen, gemolzen, gespochen) nur bei denjenigen Kunstverben gebildet wurden, die sich mit existierenden starken Verben reimten (siehe Tab. 3.5). Während für 19% der Kunstverben vom Typ spechen und für 10,7% der Kunstverben vom Typ melzen eine dem Schema in (3) folgende Partizipform gebildet wurde, wurde dieses Schema auf keines der nicht-reimenden Kunstverben angewandt. Zu Analogiebildungen kommt es also offensichtlich nur, wenn sich Kunstverben und existierende starke Verben auch reimen. Ein Schema im Bybeeschen Sinne scheint dagegen für Analogiebildungen nicht hinreichend zu sein.
69
Tab. 3.5: Rate der nach Schema produzierten bzw. regulär flektierten Partizipformen für reimen de und nicht-reimende Kunstverben Absolute Werte bezogen auf die Gesamtmenge der jeweils auswertbaren Reaktionen sind in Klammern angegeben.
Auch in den Kindersprachdaten von Weyerts (1997) zeigte sich kein Einfluss produktorientierter Familien. Wie oben erwähnt, fand Weyerts, dass irregulär flektierende Verben vor Übergeneralisierungen geschützt sind, wenn es ein starkes Cluster von Verben gibt, mit denen sie sich sowohl in der Basisform als auch in der Partizipform reimen. Je frequenter die Partizipformen der Reimwörter sind, je stärker also die Familie ist, desto seltener waren Übergeneralisierungen. Ein solcher Schutzeffekt zeigte sich jedoch nicht, als sie zur Ermittlung der Familienstärke die Partizipfrequenzen all derjenigen irregulären Partizipien aufaddierte, die sich lediglich in ihrer Partizipform, nicht aber auch in ihrer unmarkierten Basisform reimten, also z.B. gekommen, genommen, geschwommen mit den Basisformen nehm-, schwimm-, komm-. Die Stärke dieser produktorientierten Familien hatte – anders als von Bybee postuliert – keinen Einfluss auf die Übergeneralisierungsrate starker Verben. Diese Daten legen nahe, dass für die Bildung von Familien phonologisch ähnlicher starker Verben sowohl eine Reimähnlichkeit im Basisstamm als auch im Partizipstamm gegeben sein muss. Starke Verben, die sich nur in ihrer Partizipform reimen, scheinen dagegen entgegen Bybees Theorie – zumindest im Deutschen – keine Familie zu bilden. Evidenz gegen produktorientierte Schemata – Effekte des Stammvokals der Basisform: Weitere Evidenz gegen die Wirksamkeit produktorientierter Schemata im Deutschen liefert die Beobachtung, dass der Stammvokal der Basisform einen Einfluss auf die Rate der Suffigierungsfehler aphasischer Sprecher bei der Partizipproduktion hat. Laut Bybees Netzwerkmodell spielt der Stammvokal der Basisform bei der Ausbildung eines produktorientierten past tense Schemas keine Rolle. Untersucht man jedoch in den aphasischen Daten, welche irregulären Partizipformen häufiger bzw. seltener als andere fehlerhaft realisiert wurden, zeigt sich ein klarer Effekt des Stammvokals der Basisverbform.
70 Die ungefähr 172 starken Simplexverben des Deutschen zeigen verschiedene Ablautmuster im Vokal ihrer Verbstämme. Die Anzahl der starken Verben, die einem bestimmten Ablautmuster folgen, ist dabei nicht gleich verteilt. Ca. 30 der 172 starken Simplexverben (= 17,4%) ändern den Stammvokal e im Basisstamm auf o im Partizipstamm (z.B. fechten gefochten). Relativ selten sind dagegen die Ablautmuster au zu o (saufen - gesoffen), ä zu o (gären - gegoren), ö zu o (schwören - geschworen) und ü zu o (lügen - gelogen), zu denen jeweils zwischen ein und drei und insgesamt lediglich zwölf Simplexverben gehören (= 7%) (vgl. Wiese in Druck). Wir konnten bei der Analyse der Fehlerdaten unserer elf aphasischen Sprecher feststellen, dass die Größe eines solchen Ablautclusters die Fehleranfälligkeit beeinflusst (vgl. Penke, Janssen & Krause 1999). Wir verglichen dafür die Fehlerraten von zwei Gruppen à fünf irregulärer Partizipien, die sowohl hinsichtlich ihrer Partizip- und Lemmafrequenz sowie auch in der Anzahl ihrer regulär und irregulär flektierten Reimwörter übereinstimmten. Die fünf Verben der einen Gruppe hatten jedoch alle das Ablautmuster e zu o, die fünf Verben der anderen Gruppe fielen unter die Ablautmuster au, ä, ö und ü zu o. Die Auswertung der Fehlerraten für diese zwei Gruppen ergab für die Verben, die einem der seltenen Ablautmuster folgten, signifikant höhere Fehlerraten (= 49,1%) im Vergleich zu starken Verben mit dem relativ häufigen Ablautmuster e zu o (= 33,3%) (Wilcoxon, p = .044). Diese Unterschiede sind mit Bybees Modell, das produktorientierte Schemata annimmt, die unabhängig vom Stammvokal der Basisform sind, nicht zu erklären, da nach ihrem Modell alle getesteten Partizipien demselben Partizipschema angehört hätten. Die Ergebnisse bestätigen jedoch eine andere von Bybees Annahmen, nämlich die Auffassung, die lexikalische Stärke einer Familie sei von der Anzahl ihrer Mitglieder abhängig (Bybee 1988, 1995). Die Fehlerraten zeigen, dass sich die Anzahl der Verben, die zu einem spezifischen Ablautmuster gehört, begünstigend auf den lexikalischen Zugriff auswirkt. Je stärker eine Familie ähnlicher starker Verben ist, wie hier die Verben mit dem Basisstammvokal e, desto besser sind ihre Mitglieder vor Problemen beim lexikalischen Zugriff geschützt. Die Anzahl der Reimwörter und deren Frequenz bestimmt die Familienstärke: Untersucht man, welche irregulären Partizipformen häufiger bzw. seltener als andere von unseren agrammatischen Versuchspersonen fehlerhaft realisiert wurden, zeigt sich, dass die Familienstärke und damit der Schutzeffekt der reimenden irregulären Familienangehörigen sowohl von der Anzahl als auch der Partizipfrequenz der Reimwörter abhängt. Für die in unserem Experimentmaterial enthaltenen 25 relativ seltenen irregulären Partizipien wurden die Anzahl und die Partizipfrequenzen derjenigen starken Simplexverben ermittelt, die sich in Basis- und Partizipstamm mit diesen 25 Verben des Testmaterials reimten.13 Um zu ermitteln, welchen Einfluss die Anzahl der Reimwörter hat, wurden die 25 Testverben zunächst nach der Anzahl ihrer Reimwörter (keines, 1, 2, ≥ 3) in vier –––––––—–– 13
Aufgrund des großen Einflusses der Partizipfrequenz auf die Fehlerraten muss die Partizipfrequenz bei der Ermittlung von Reimeffekten konstant gehalten werden. Daher wurden die folgenden Analysen nur mit denjenigen 25 irregulären Partizipien durchgeführt, die mit einer Partizipfrequenz von ≤50 relativ selten sind und sich hinsichtlich ihrer Fehlerzahl nicht signifikant unterschieden.
71 Gruppen eingeteilt.14 So beträgt die Anzahl der irregulären Reimwörter für das Testverb fechten 1, da es sich lediglich auf flechten - geflochten reimt. Das Testverb pfeifen reimt sich dagegen mit greifen - gegriffen, kneifen - gekniffen und schleifen - geschliffen. Die Anzahl seiner irregulären Reimwörter ist demnach 3. Anschließend wurden für diese vier Gruppen von Testverben die Raten der Suffigierungsfehler bei der Partizipproduktion ermittelt. Die Auswertung ergab, dass die Anzahl der Reimwörter negativ mit der Fehlerrate korrelierte (r(2) = -.973, p = .027): Je geringer also die Anzahl der starken Verben war, die sich mit einem der Testverben reimten, desto fehleranfälliger war das Testverb (vgl. Abb. 3.9). Während 37 der 73 auswertbaren Partizipien in der Testverbgruppe ohne irreguläre Reimwörter fehlerhaft produziert wurden (= 50,6%), sank die Fehlerrate für die 50 auswertbaren Partizipien in der Gruppe mit drei oder mehr Reimwörtern auf 20% (siehe schwarze Linie und zugehörige rechte vertikale Skala in Abb. 3.9).
Abb. 3.9: Verlauf der Fehlerrate in Abhängigkeit von der Anzahl irregulärer Reimwörter
Neben der Anzahl der irregulären Reimwörter beeinflusste aber auch die Frequenz ihrer Partizipformen die Häufigkeit fehlerhaft produzierter Partizipien in den Daten unserer agrammatischen Sprecher. Für diese Analyse wurden dieselben 25 starken Testverben nach der summierten Partizipfrequenz ihrer irregulären Reimwörter in vier Gruppen eingeteilt.15 –––––––—–– 14
15
Die Größe der vier Testverbgruppen war wie folgt: Die Gruppe der Testverben, die sich nicht auf andere starke Verben reimten, umfasste sieben Verben. Die Gruppe der Testverben mit einem irregulären Reimwort bestand aus neun Verben. Vier der Testverben reimten sich auf genau zwei starke Verben. Fünf Testverben hatten drei oder mehr irreguläre Reimverben. Die Einteilung der 25 Testverben war im Einzelnen wie folgt: Gruppe I enthielt die sieben Testverben ohne Reimwörter; Gruppe II enthielt diejenigen sechs Testverben, bei denen die aufsummierte Partizipfrequenz der jeweiligen irregulären Reimwörter unter zehn lag. Der Mittelwert der aufsummierten Partizipfrequenzen dieser Reimwörter betrug 4,2. Die entsprechenden Werte der Gruppen III und IV waren: Gruppe III, sieben Verben, aufsummierte Partizipfrequenz der Reimwörter jeweils zwischen elf und 100, Mittelwert 46,4;
72 Beispielsweise beträgt die aufsummierte Partizipfrequenz der irregulären Reimwörter des Testverbs pfeifen, das sich mit greifen - gegriffen (Partizipfrequenz 36), kneifen - gekniffen (Partizipfrequenz 1) und schleifen - geschliffen (Partizipfrequenz 9) reimt, 46. Es gehört damit zur Gruppe III (aufsummierte CELEX-Frequenz der reimenden irregulären Partizipformen zwischen 11 und 100). Für die Testverben dieser vier Gruppen wurden dann die Fehlerraten ermittelt. Die Analyse ergab auch für die aufsummierte Partizipfrequenz der Reimwörter eine negative Korrelation mit der Fehlerzahl (r(2) = -.977, p = .023): Je höher die summierte Partizipfrequenz der irregulären Reimwörter war, desto weniger anfällig war der Zugriff auf die gespeicherte Partizipform der Testverben (siehe Abb. 3.10). Während die Fehlerrate der Testverben ohne irreguläre Reimwörter (Gruppe I) bei 50,6% lag, betrug sie für die Testverben, deren Partizipformen sich mit hochfrequenten irregulären Partizipien reimten (Gruppe IV), nur noch 23,1% (siehe schwarze Linie und zugehörige rechte vertikale Skala in Abb. 3.10).
Abb. 3.10: Verlauf der Fehlerrate in Abhängigkeit von der aufsummier ten Partizipfrequenz der irregulären Reimwörter
Zwar gibt es natürlich einen Zusammenhang zwischen der Anzahl der Reimwörter und der Höhe der aufsummierten Partizipfrequenz für diese Reimwörter, da mit steigender Anzahl der Reimwörter im Normalfall auch die Frequenzsumme steigt. Anzahl und Partizipfrequenz der irregulären Reimwörter wirken jedoch in gewissem Maße auch unabhängig voneinander. So beträgt die Fehlerrate für irreguläre Partizipien, die sich auf drei oder mehr –––––––—–– -
Gruppe IV, fünf Verben, aufsummierte Partizipfrequenz der Reimwörter jeweils größer als 250, Mittelwert 517,4.
73 starke Verben reimen, lediglich 20% (siehe Abb. 3.9), obwohl die durchschnittliche aufsummierte Partizipfrequenz für die Reimwörter dieser Gruppe mit 203,4 niedriger ist als für die Verbgruppe mit zwei irregulären Reimwörtern, die eine durchschnittliche aufsummierte Partizipfrequenz von 393 bei einer Fehlerrate von 36,6% haben. Diese Daten deuten darauf hin, dass die Anzahl der Reimwörter wichtiger als deren aufsummierte Partizipfrequenz sein könnte. Dafür spricht auch die oben beschriebene Beobachtung, dass die Fehlerraten für seltene Verben, die einem häufigen Ablautmuster (e → o) angehören, niedriger sind als die Fehlerraten für seltene Verben, die einem seltenen Ablautmuster angehören ({au, ö, ä, ü} → o). Allerdings ist die vorliegende Datenbasis zu gering, um die Frage, ob Anzahl oder Frequenz der Reimwörter für die Familienstärke von größerer Bedeutung sind, abschließend zu klären. Zusammenfassung: Zusammengefasst zeigen sich in den Spracherwerbsdaten, den Daten aphasischer Sprecher und den Daten aus Kunstverbexperimenten folgende Effekte der phonologischen Ähnlichkeit: - Starke Verben bilden Gruppen miteinander reimender Verben. Zumindest im Deutschen scheint dabei von Bedeutung zu sein, dass sich sowohl die Basisformen als auch die Partizipformen reimen. Ein Einfluss der von Bybee (1988, 1995) postulierten rein produktorientierten Schemata, die unabhängig von den jeweiligen Basisformen sind, zeigt sich im Deutschen nicht. - Der Zugriff auf eine irreguläre Partizipform erfolgt umso fehlerfreier, je mehr Verben dieser Reimgruppe angehören bzw. je frequenter die Mitglieder dieser Reimgruppe sind. - Unabhängig von diesem Reimeffekt zeigt sich ein Einfluss des Stammvokals der Basisform, der nahe legt, dass Verben mit gleichem Ablautmuster – unabhängig davon, ob sie sich untereinander reimen oder nicht – eine Familie bilden. - Auch für diese Familien gilt, dass der Zugriff auf eine gespeicherte Form umso besser gelingt, je mehr Verben einer Ablautfamilie angehören.
3.4 Ein alternatives Modell zur Erfassung der Familienähnlichkeit Die Daten zeichnen ein Bild ineinander geschachtelter Familiengruppen: Relativ kleine Reimgruppen (im Deutschen) sind dabei Teil einer größeren Familie gleich ablautender Verben. Die Beobachtung, dass die Zugehörigkeit zu einer Familie in entscheidendem Maße durch die Basisform bestimmt ist, legt nahe, dass irreguläre Partizipformen zusammen mit dem Basisverbstamm in strukturierten lexikalischen Einträgen gespeichert sind, aus denen sich sowohl das Ablautmuster als auch die phonologische Ähnlichkeit zwischen verschiedenen Paaren von Basisverbstamm und Partizipstamm direkt ermitteln lässt. Solche strukturierten Lexikoneinträge sind in der von Wunderlich konzipierten Minimalistischen Morphologie vorgeschlagen worden (Wunderlich & Fabri 1995, Wunderlich 1996a).
74 In Wunderlichs Ansatz wird irreguläre Flexion durch Vererbungsbäume erfasst. Irreguläre Formen bilden Äste der Baumrepräsentation, die von einem unmarkierten Basisknoten ausgehen und dessen Informationen erben, soweit sie diese nicht mit spezifischeren Informationen überschreiben. Die Abbildung in (4) verdeutlicht diese Repräsentation für das starke Verb fahren. Vom Basisknoten des unmarkierten Verbstamms fahr- zweigen Äste für den Stamm der 2. und 3. Person Singular Präsens Formen fähr- (1. Ast), für die Präteritumund Konjunktivstämme (fuhr-, führ-) (2. Ast) und den Partizipstamm (fahren) (3. Ast) ab. (4)
Laut Wunderlich & Fabri (1995) lassen sich die Ablautregularitäten innerhalb der starken Verben des Deutschen mit dem in (5) aufgeführten generellen Strukturschema erfassen.16 Die Formen, die nicht in der Vererbungsbaumstruktur aufgeführt sind, werden durch reguläre Affigierung gebildet. Gruppen starker Verben unterscheiden sich darin, welche der Äste dieses Schemas sie realisieren. So fehlt beispielsweise bei allen Verben mit vorderem Basisstammvokal der linke Ast der Vererbungsbaumstruktur. Verben wie stecken (stak gesteckt) haben den Partizipast, Verben wie hauen (haute - gehauen) haben den Präteritum/Konjunktivast verloren. (5)
Diese Vererbungsbaumstruktur begrenzt zum einen die Menge der möglichen Irregularitäten, da neue Knoten und Äste nicht beliebig hinzugefügt oder abgebaut werden können. So kann nicht der Präteritumstamm verloren gehen, der Konjunktivstamm aber erhalten bleiben. Zum anderen ermöglicht es die Vererbungsbaumstruktur, in Abhängigkeit von den jeweils realisierten Abschnitten der generellen Vererbungsbaumstruktur in (5) spezifische Schemata zu bilden, mit denen sich die Subregularitäten in Clustern starker Verben erfassen lassen. So zeigen die insgesamt 18 starken Verben, die auf /InCObstruent/ enden (sinken, singen, klingen etc.), eine bis auf die Konsonanten des Basiseintrags identische Vererbungsbaumstruktur (6). –––––––—–– 16
Die Abkürzungen [+f], [+h] und [+r] stehen für die Merkmalsspezifikationen [+front], [+high] und [+round] des jeweiligen Stammvokals (Merkmalsspezifikation nach Wiese 1996).
75 (6)
Diese Vererbungsbaumstruktur kann auch für produktive Neubildungen genutzt werden, da sie ein Schema für analoge Bildungen bereitstellt. So existiert beispielsweise zu dem schwachen Verb winken, das eine große phonologische Ähnlichkeit zu den starken Verben auf /InCObstruent/ hat, mittlerweile die Partizipform gewunken. Wunderlich & Fabri machen zwar keine Aussagen zum Erwerb solcher Vererbungsbaumstrukturen wie in (4), (5) oder (6). Sie sollten jedoch – ähnlich wie auch in Bybees Netzwerkmodell angenommen – durch die Verknüpfung von Verbstämmen mit identischen bzw. ähnlichen semantischen und phonologischen Merkmalen aufgebaut werden können. Ein Schema wie das in (6) gezeigte ergibt sich dabei aus den Verknüpfungsmustern, die eine Gruppe von Verben – wie die Verben auf /InCObstruent/ – gemeinsam haben. Tatsächlich fanden wir in den Daten der von uns untersuchten Broca-Aphasiker einen Hinweis darauf, dass Verben, die ein bestimmtes Verknüpfungsmuster teilen, im mentalen Lexikon in einer schematischen Struktur wie in (6) verbunden sind: So gelang der Broca-Aphasikerin A.H. für kein einziges der insgesamt acht getesteten starken Verben auf ei die Produktion einer korrekten Partizipform. Stattdessen produzierte sie für diese Verben übergeneralisierte Partizipien wie gepfeift oder gestreicht. Diese Beobachtung legt nahe, dass A.H. das Vererbungsbaumschema der starken Verben auf ei – oder zumindest den Partizipast dieses Schemas (vgl. (7)) – verloren hat und daher zur Produktion von Partizipien auf die reguläre Partizipflexion zurückgreifen muss. (7)
Auch psycholinguistische Untersuchungen haben mittlerweile Belege für die von Wunderlich & Fabri (1995) vorgeschlagene Vererbungsbaumstruktur starker Verben erbracht. Ein Charakteristikum der Vererbungsbaumstruktur ist, dass zwischen den verschiedenen Knoten eines Astes der Vererbungsbaumstruktur eine asymmetrische Beziehung besteht. Innerhalb eines Astes vererben höher in der Struktur gelegene Knoten ihre Informationen an tiefer eingebettete Knoten eines Astes. Umgekehrt können die Informationen tiefer eingebetteter Knoten jedoch nicht an weiter oben liegende Knoten vererbt werden. In einem priming-Experiment fanden Clahsen et al. (2001, 2002) dass Präteritumformen wie warft eine Präsensform wie werft besser primen, als im umgekehrten Fall die Vorgabe einer Präsensform wie werft die Reaktionszeiten auf eine Präteritumform wie warft verkürzt. Die
76 signifikanten Unterschiede, die beim priming von werft - warft im Vergleich zu warft werft auftreten, belegen nach Clahsen et al. die Asymmetrie der Vererbungsrelation, die zwischen höher und tiefer eingebetteten Knoten in einer Vererbungsbaumstruktur wie (5) besteht. Da tiefer eingebettete Knoten der Baumstruktur Informationen von den höher gelegenen Knoten erben, enthalten sie eine Übermenge der Informationen höher gelegener Knoten. Höher gelegene Knoten enthalten dagegen nur eine Teilmenge der Informationen tiefer eingebetteter Knoten. Im Fall des Stimuluspaars werft - warft enthält die Präteritumform warft eine Merkmalsspezifikation [+ PRÄTERITUM], die die Präsensform werft nicht trägt und die daher durch die Präsentation der Präsensform auch nicht voraktiviert, geprimt, werden konnte. Im umgekehrten Fall warft - werft enthält das Zielwort werft dagegen keine Merkmale, die durch das prime-Wort warft nicht bereits voraktiviert sind, da in der Baumstruktur (5) tiefer gelegene Knoten wie der Präteritumknoten die Informationen des weiter oben gelegenen Basisknotens erben. Bybees Überlegungen zur lexikalischen Stärke eines Schemas lassen sich in Wunderlichs Ansatz gut integrieren: Je mehr Verben eine vergleichbare Vererbungsbaumstruktur aufweisen, umso stärker ist das betreffende Schema. Je stärker das Schema ist, umso leichter ist der lexikalische Zugriff und umso eher steht es für analoge Bildungen – sowohl für Neuschöpfungen als auch im Spracherwerb – zur Verfügung. Ausschlaggebend für solche analogen Bildungen scheint dabei jedoch zu sein, dass sich die Basisform des neuen Verbs auf die Basisform eines bereits vorhandenen Eintrags reimt. Anders als in Bybees Ansatz ist der Basisstamm dementsprechend eine wichtige Komponente des Schemas. Inwiefern bei der Englischen past tense Flexion (oder der Pluralflexion im Hausa, vgl. Fußnote 12) tatsächlich kein Einfluss der Basisform festzustellen ist, bedarf der Klärung in weiteren Untersuchungen. Sowohl in der Untersuchung von Bybee & Moder (1983) als auch in der Studie von Prasada & Pinker (1993) zeigten sich jedoch die höchsten Raten für analoge Neubildungen dann, wenn das vorgegebene Kunstwort sich mit der Basisform eines starken Verbs reimte. Ziel von Bybees Betonung der Produktorientiertheit von Schemata scheint in erster Linie die Abgrenzung von regelbasierten Ansätzen zu sein. Dementsprechend hebt sie hervor, dass z.B. die Pluralflexion im Hausa leicht durch ein Pluralschema zu erfassen ist, während ein regelbasierter Ansatz aufgrund der Vielzahl der Operationen, die zur Ableitung des immer gleichen Pluralschemas aus den phonologisch so differierenden Basisformen erforderlich wären, zu unplausiblen Annahmen führt (Bybee 1995). In den von Wunderlich vorgeschlagenen Vererbungsbäumen ließen sich allerdings auch die von Bybee genannten Beispiele für produktorientierte Schemata leicht erfassen.
3.5 Zur neuronalen Repräsentation assoziativ gespeicherter Wörter Die Beobachtung, dass in der ersten Phase des Erwerbs flektierter Formen die verwendeten Formen immer korrekt flektiert sind, wird allgemein als Evidenz für die Speicherung vollflektierter Formen im mentalen Lexikon interpretiert (z.B. Kiparsky & Menn 1977, MacWhinney 1978, MacWhinney et al. 1989, Marcus et al. 1992, Marchman & Bates
77 1994). Weitgehende Übereinstimmung herrscht mittlerweile zudem über die Auffassung, dass auch nach der ersten Phase des Erwerbs für irregulär flektierte Formen von einer Vollformspeicherung in einem assoziativen Gedächtnisspeicher für Wörter – dem mentalen Lexikon – auszugehen ist (z.B. Rumelhart & McClelland 1986, Jensen 1990, Bybee 1995, Wunderlich 1996a, Aronoff & Anshen 1998, Pinker 1999 und die Diskussion zu Clahsen 1999). Ansätze wie die von Kiparsky (1982a, b), Halle & Mohanan (1985), Halle & Marantz (1993) und Embick & Marantz (2005), die im Rahmen der Lexikalischen bzw. Generativen Phonologie sowie der Distributed Morphology versuchen, irreguläre Formen durch die Anwendung morphophonologisch eingeschränkter Regeln zu erklären, fanden keine empirische Bestätigung (vgl. z.B. Pinker 1999, Clahsen 1999 sowie Fußnote 10). Reaktionszeitexperimenten zur Verarbeitung irregulärer englischer past tense Formen und deutscher Partizipien, Elizitationsexperimenten zur Flexion von Kunstverben sowie Untersuchungen zur Fehleranfälligkeit flektierter Formen im Spracherwerb und bei Sprachstörungen verdanken wir nähere Aufschlüsse über die Organisationsprinzipien dieses assoziativen Speichers. Hier sind insbesondere der Einfluss der Frequenz flektierter Formen sowie Effekte der phonologischen Ähnlichkeit zwischen Basis- und flektierten Formen zu nennen. Diese führen zur Herausbildung von Schemata, die umso einflussreicher sind, je mehr Wörter (types) ihnen folgen. Beide Effekte, Frequenzeffekt und Effekt der phonologischen Ähnlichkeit, resultieren aus den Mechanismen assoziativer Gedächtnisspeicher, in denen Verbindungen (= Assoziationen) zwischen Elementen mit ähnlichen Form- und Inhaltsmerkmalen hergestellt werden. Die Gedächtnisspur, das so genannte Engramm eines Eintrags, verstärkt sich dabei mit jeder Aktivierung bzw. mit jedem Zugriff (siehe bereits Ebbinghaus 1885), was zu einem weniger störbaren Gedächtnisinhalt und einem schnelleren Zugriff auf diesen führt. Ein gängiges Modell der neuronalen Mechanismen bei der Bildung eines assoziativen Gedächtnisses wurde von Donald Hebb bereits 1949 vorgeschlagen und durch nachfolgende Forschungen weitgehend gestützt. Demnach ist die Aktivierung von Zell-Ensembles (cell assemblies) des Kortex, in denen Nervenzellen über Verbindungen mit speziellen Eigenschaften (Hebb-Synapsen) verschaltet sind, das physiologische Korrelat kognitiver Elemente, wie z.B. Wörter. Die Nervenzellen (Neuronen) des Gehirns sind hochgradig miteinander vernetzt. Wird eine Nervenzelle erregt, sendet sie über ihr Axon Signale in Form kurzer elektrischer Impulse zu anderen Neuronen. Die Zelle feuert. Wie ein Baum verzweigt sich das Axon, um mit 1.000 bis 10.000 anderen Neuronen in Kontakt zu treten. Die Verbindungsstellen zwischen zwei Nervenzellen werden als Synapsen bezeichnet. Dort wird der elektrische Impuls auf chemischem Weg – über die Freisetzung von Botenstoffen, so genannten Neurotransmittern – an die nachgeschaltete Nervenzelle weitergeleitet. Die Neurotransmitter öffnen an der nachgeschalteten Nervenzelle Ionenkanäle, die positiv oder negativ geladene Ionen in diese Zelle einströmen lassen. Durch den Ioneneinstrom kommt es zu Spannungsdifferenzen zwischen Außen- und Innenseite der Zellmembran. Ein hemmender oder erregender elektrischer Impuls entsteht, der an den Zellkörper der nachgeschalteten Zelle weitergeleitet wird. Die Verästelungen, über die eine Nervenzelle ankommende Signale aufnimmt und zum Zellkörper weiterleitet, werden als Dendriten bezeichnet. Wird die nachgeschaltete Zelle durch die eingehenden Impulse ausreichend erregt, feuert auch sie.
78 Nach Hebbs Modell entsteht ein Zell-Ensemble, wenn die synaptischen Verbindungen zwischen gleichzeitig aktiven Nervenzellen verstärkt werden. Die Aktivierung der einzelnen Nervenzellen erfolgt dabei durch senso-motorische Eingangsreize. Korrelationen in der Außenwelt werden so zu Verbindungen zwischen gleichzeitig aktiven Neuronen (z.B. Palm 1988).17 Sobald sich ein Zell-Ensemble konstituiert hat, erlangt es einen autonomen Status. Aktivierung von Teilen des Ensembles führt dann dazu, dass das gesamte Ensemble ‚zündet’ (siehe z.B. Palm 1988, Braitenberg & Schütz 1989, Pulvermüller 1999a).18 Pulvermüller (1999a, b) hat auf der Basis dieser Theorie ein Modell der neuronalen Repräsentation von Wörtern vorgeschlagen (vgl. auch Müller 1996, Saffran & Sholl 1999, Damasio et al. 2004). Die kortikale Lokalisation eines Zell-Ensembles, das ein kognitives Element repräsentiert, ergibt sich demnach aus der Lokalisation der Nervenzellen, die zum Zeitpunkt des Erwerbs dieses Elements gleichzeitig aktiviert waren. Die Verarbeitung akustischer Signale, die mit dem Sprachverstehen einhergeht, führt dabei zu einer Aktivierung des primären und sekundär/tertiären auditorischen Kortex. Die mit der Lautproduktion einhergehende Bewegungssteuerung aktiviert den motorischen und somato-sensorischen Kortex. In diesen Kortexarealen, die um die Sylvische Furche herum angeordnet sind, bilden sich durch senso-motorische bzw. auditorische Aktivierungen bei der Produktion oder Verarbeitung von Wortformen Zell-Ensembles, die die akustischen Eigenschaften bzw. motorischen Artikulationsprogramme für spezifische Wortformen enthalten. Die so entstehenden Zell-Ensembles repräsentieren im Prinzip jeweils unterschiedliche Wortformen. Zell-Ensembles für Wortformen mit identischen senso-motorischen und akustischen Merkmalen überlappen jedoch. In diesem Fall sind einzelne Nervenzellen Teil verschiedener Ensembles.19 Neben den Neuronen des perisylvischen Kortex (d.h. der Kortexareale, die um die Sylvische Furche herum gelegen sind), die die akustischen und motorischen Merkmale von Wortformen repräsentieren, bestehen Zell-Ensembles für Wörter auch aus Nervenzellen, die die Wortbedeutung enkodieren. Auch hier ergibt sich nach Pulvermüllers Vorschlag die Lokalisation der beteiligten Nervenzellen aus der Art der sensorischen Eingangserregung, die zur Aktivierung der beteiligten Neuronen führt (vgl. auch Saffran & Sholl 1999 und Damasio et al. 2004 sowie die dort angegebene Literatur zur neuronalen Repräsentation von Wortbedeutungen). So führt z.B. der Anblick konkreter Objekte zu einer Aktivierung von Nervenzellen des visuellen Kortex. Diese Nervenzellen, die die visuellen Eigenschaften eines Objekts repräsentieren, werden ebenfalls Teil des Zell-Ensembles. Im Gegensatz zum perisylvisch lokalisierten, ‚phonologischen’ Teil von Zell-Ensembles sind die Teile der Ensembles, die die Bedeutung eines Wortes repräsentieren, über weite Kortexareale beider Hemisphären verstreut. Auch für sie gilt, dass die –––––––—–– 17
18
19
Da assoziative Mechanismen Ereignisse miteinander verbinden, die regelmäßig aufeinander folgen, wirft Macphail (1996) den interessanten Gedanken auf, dass es sich bei der Entwicklung assoziativer Lernvorgänge um eine evolutionäre Adaptation handeln könnte, die sich entwickelt hat, da sie es Lebewesen ermöglicht, die kausale Struktur ihrer Umwelt zu erkennen. Für Einführungen und Diskussionen zur Neurophysiologie, –anatomie und –psychologie des assoziativen Gedächtnisses vergleiche z.B. Kandel & Hawkins (1992), Engel, König & Singer (1993), Vaas (2000), Markowitsch (2001). Dass diese Wortform-Ensembles überwiegend in der linken Hemisphäre angesiedelt sind, obwohl die Verarbeitung akustischer Signale und die Initiierung motorischer Programme bihemisphärisch organisiert sind, führt Pulvermüller auf genetische Faktoren zurück.
79 Überlappung von Bedeutungsaspekten (z.B. in der visuellen Form oder der Funktion) zur Überlappung von Zell-Ensembles führt. Irregulär flektierte Formen und ihre Basisformen werden in diesem Modell durch ZellEnsembles erfasst, die hinsichtlich der ähnlichen semantischen und phonologischen Merkmale von Basis und flektiertem Stamm überlappen, sich hinsichtlich der Nervenzellen, die differierende morphosyntaktische (z.B. das Merkmal [± PAST]) und phonologische Merkmale (z.B. Ablaut) repräsentieren, jedoch unterscheiden. Effekte der phonologischen Ähnlichkeit, wie sie in diesem Kapitel beschrieben wurden, können in Pulvermüllers Modell durch überlappende Zell-Ensembles erfasst werden. Auch der Einfluss der lexikalischen Stärke eines Schemas, die abhängig von der Anzahl der Wörter ist, die diesem Schema folgen, sowie der Einfluss der Wortformfrequenz lassen sich in Pulvermüllers Vorschlag integrieren, da die wiederholte gleichzeitige Aktivierung der Teile eines Zell-Ensembles in einer zunehmenden Verstärkung der Verbindungen der aktivierten Zellen resultiert. Diese führt wiederum dazu, dass das Zell-Ensemble bzw. Teile des Ensembles leichter aktivierbar sind. Auch wenn Pulvermüllers Vorschlag viele Probleme unbeantwortet lässt (vgl. dazu die Diskussion zu Pulvermüller 1999a oder van der Velde & de Kamps in Druck), bietet er eine interessante erste Skizze, wie Wörter in einem assoziativen mentalen Lexikon repräsentiert sein könnten.
4 Unterschiede zwischen regulär und irregulär flektierten Formen
Wie im vorangegangenen Kapitel dargelegt, besteht weitgehend Einigkeit darüber, dass irregulär flektierte Formen als vollflektierte Formen in einer assoziativen Netzstruktur gespeichert sind. Kontrovers ist dagegen, ob auch regulär flektierte Formen so zu repräsentieren sind oder ob sie Resultat einer symbolmanipulierenden Operation sind, genauer der Konkatenation eines Affixes mit einer Instanz einer abstrakten Kategorie wie [+ V] oder [+ N], die bei Bedarf vorgenommen wird. Obwohl diese Kontroverse auch in der theoretischen Morphologie virulent ist, in der morphembasierte Ansätze wortbasierten Theorien gegenüberstehen (vgl. Kap. 1.1.1), hat sie insbesondere die Auseinandersetzung zwischen symbolistischen und antisymbolistischen konnektionistischen Ansätzen zur menschlichen Kognition beherrscht. Seit der von Chomsky ausgelösten kognitiven Wende in der Linguistik wird Sprache in der generativen Linguistik als ein mentales Wissenssystem verstanden, das abstrakte sprachliche Kategorien (Symbole) wie [+ V] oder [+ N] und kombinatorische Operationen wie merge oder move α umfasst, mit denen sprachliche Kategorien zu hierarchisch strukturierten Repräsentationen verknüpft werden können. Auch regulär flektierte Formen lassen sich als Produkt einer solchen symbolmanipulierenden Operation erfassen, die ein Flexiv an einen Stamm einer bestimmten Wortkategorie affigiert. Als Beleg für diese Auffassung galt und gilt insbesondere die Erwerbsabfolge, die sich beim Erstspracherwerb des Englischen past tense und ähnlicher Flexionssysteme beobachten lässt. Wie in Kapitel 3.1 skizziert, folgt dabei auf eine Phase korrekter Verwendung regulärer und irregulärer Formen eine Phase, in der die reguläre Flexion produktiv auf irreguläre Verben übergeneralisiert wird, während Irregularisierungen regulärer Verben nicht bzw. nur äußerst selten auftreten. Die in dieser Phase verstärkt auftretenden Übergeneralisierungen werden als Evidenz für den Erwerb einer mentalen Regel gewertet, die produktiv zur Bildung von past tense Formen herangezogen werden kann. Die im Unterschied dazu äußerst begrenzte Produktivität von Irregularisierungen, die nur bei einer weitgehenden phonologischen Übereinstimmung mit existierenden starken Verben auftreten, gilt entsprechend als Beleg dafür, dass die irreguläre Flexion nicht auf einer symbolmanipulierenden Operation beruht und Irregularisierungen auf Analogiebildungen zu gespeicherten, irregulär flektierten Formen basieren (vgl. z.B. Marcus et al. 1992, Clahsen 1999). Diese Argumentation wurde jedoch 1986 durch Rumelhart & McClelland erschüttert, die in einem einfachen konnektionistischen Netzwerk den Erwerb der englischen past tense Flexion simulierten. Auf der Basis dieser Simulation argumentierten sie nicht nur gegen die Auffassung, regulär flektierte Formen setzten sich aus Stamm- und Affixmorphemen zusammen, sondern sie stellten generell die Realität von Symbolen und symbolmanipulierenden Operationen oder Regeln der Art ‚V + -ed → past tense’ in Frage. Kernstück des Modells von Rumelhart & McClelland ist ein Musterassoziierer, der darauf trainiert wurde, die phonologische Repräsentation der Stammform eines Verbs auf der Eingabeebene des Netzes, dem input-layer, mit der phonologischen Repräsentation der zugehörigen past tense Form auf der Ausgabeebene, dem output-layer, zu verbinden. Nach der Lernphase war ihr Modell nicht nur in der Lage, korrekte past tense Formen auch für solche Stammformen zu
82 bilden, die dem Netz noch nicht präsentiert worden waren. Es konnte auch die für den Spracherwerb charakteristischen Übergeneralisierungen der past tense Endung -ed auf starke Verben simulieren. Auf der Basis dieser Simulation schlossen Rumelhart & McClelland: „We have, we believe, provided a distinct alternative to the view that children learn the rules of English past-tense formation in any explicit sense. We have shown that a reasonable account of the acquisition of past tense can be provided without recourse to the notion of a ‘rule’ as anything more than a description of the language.“ (ebd.: 267) (Hervorhebung im Original)
Im Gefolge der Arbeit von Rumelhart & McClelland wurde von Verfechtern symbolorientierter Ansätze ein Forschungsprogramm aufgelegt mit dem Ziel, die unterschiedlichen Charakteristika regulär und irregulär flektierter Formen herauszuarbeiten. Dabei wurde in den letzten 20 Jahren eine beeindruckende Datenbasis aus psycho- und neurolinguistischen Untersuchungen zusammengetragen, die Evidenz gegen eine Vollformspeicherung regulär flektierter Formen in einer assoziativen Netzwerkstruktur liefern soll. Als Evidenz gegen eine Vollformspeicherung wird dabei zum einen aufgeführt, dass sich für regulär flektierte Formen im Unterschied zu irregulär flektierten Formen keine Frequenzeffekte oder phonologischen Ähnlichkeitseffekte zeigen, so wie sie sich aus der Organisationsstruktur assoziativer Netze ergeben sollten (vgl. Kap. 3.2 und 3.3). Zum anderen haben primingExperimente sowie Morphemgrenzeffekte Evidenz dafür erbracht, dass regulär flektierte Formen bei Sprachverarbeitung und Sprachproduktion in Stamm und Affix dekomponiert bzw. aus Stamm und Affix zusammengesetzt werden. Die Ergebnisse neurolinguistischer Studien sprechen zudem für eine neurophysiologisch und neuroanatomisch distinkte Repräsentation regulär und irregulär flektierter Formen. Im folgenden Kapitel 4.1 werde ich zunächst die wichtigsten Belege, die in psycho- und neurolinguistischen Studien für eine qualitative Unterscheidung regulär und irregulär flektierter Formen zusammengetragen wurden, vorstellen und diskutieren. Die Bemühungen, diese Befunde in unitären konnektionistischen Netzen zu simulieren, sind Gegenstand des anschließenden Kapitels 4.2.
4.1
Experimentelle Befunde zur Distinktion von regulärer und irregulärer Flexion
4.1.1 Für regulär flektierte Formen zeigen sich keine Frequenzeffekte Wie in Kapitel 3.2 ausgeführt, beeinflusst die Frequenz irregulär flektierter Wortformen sowohl die Verarbeitungsgeschwindigkeit in lexikalischen Entscheidungsaufgaben als auch die Wahrscheinlichkeit, mit der sprachgestörte Sprecher fehlerhafte Formen produzieren. Als ursächlich für diese Frequenzeffekte wird gehalten, dass der Zugriff auf gespeicherte Lexikoneinträge frequenzabhängig ist und umso schneller bzw. besser gelingt, je häufiger eine Form ist. Dass solche Effekte in Abhängigkeit von der Frequenz flektierter Wortformen auftreten, bietet Evidenz für die Annahme, dass irregulär flektierte Formen als flektierte Vollformen im mentalen Lexikon gespeichert sind. Wären auch regulär flektierte Formen als vollflektierte Formen im mentalen Lexikon gespeichert, dann sollten sich dieser Argumentation folgend auch für sie vergleichbare Frequenzeffekte zeigen.
83 Frequenzeffekte in lexikalischen Entscheidungsexperimenten: Um diese Vorhersage zu testen, führten Clahsen, Eisenbeiss & Sonnenstuhl (1997) mit unbeeinträchtigten Sprechern einen visuellen lexikalischen Entscheidungstest zur deutschen Partizipflexion durch. Während die Entscheidungszeiten für frequente irreguläre Partizipien des Ablauttyps ABA (schlafen - schlief - geschlafen) mit 593 ms signifikant schneller waren als die Entscheidungszeiten für seltene irreguläre Partizipien (652 ms) (s. auch Tab. 3.1), zeigte sich für regulär flektierte Partizipien kein Einfluss der Partizipfrequenz. Die lexikalischen Entscheidungszeiten für seltene regulär flektierte Partizipien unterschieden sich mit 613 ms nicht signifikant von den 617 ms, die die Versuchspersonen im Mittel für die lexikalische Entscheidung bei häufigen regulären Partizipien benötigten. Weitere Untersuchungen mit diesem Verfahren ergaben, dass das Fehlen eines Frequenzeffekts für regulär flektierte Formen weder auf die Partizipflexion beschränkt noch modalitätsspezifisch ist. In einem auditiven lexikalischen Entscheidungsexperiment zur deutschen Pluralflexion (vgl. Penke & Krause 2002), das wir mit 16 unbeeinträchtigten deutschsprachigen Versuchspersonen durchführten, verglichen wir die Reaktionszeiten häufiger und seltener Pluralformen verschiedener Pluraltypen. Pro Flexionstyp testeten wir 20 Paare von Nominalpluralen. Jedes Paar bestand aus zwei Pluralformen, die bei einer vergleichbaren Lemmafrequenz unterschiedliche Pluralfrequenzen aufwiesen: So haben die Nomina des Stimulus-Paars Rinder - Fässer zwar eine vergleichbare Lemmafrequenz (Rinder: 98, Fässer 80). Während die Pluralfrequenz für Rinder mit 67 jedoch relativ hoch ist, beträgt sie für Fässer lediglich 9.1 Der paarweise Vergleich der Reaktionszeiten für häufige und seltene Pluralformen mit vergleichbarer Lemmafrequenz ermöglicht es, allein den Einfluss der Pluralfrequenz auf die Reaktionszeiten zu testen, während der Einfluss der Lemmafrequenz kontrolliert ist.
Tab. 4.1: Wort- und Pluralfrequenzen für die getesteten Pluraltypen (nach Penke & Krause 2002)
–––––––—–– 1
Alle Frequenzinformationen stammen aus der CELEX-Datenbank (Baayen, Piepenbrock & van Rijn 1993). Das Experimentmaterial wurde selbstverständlich nicht paarweise angeboten, sondern randomisiert.
84 Tabelle 4.1 gibt einen Überblick über die mittleren Plural- und Lemmafrequenzen für drei der getesteten Pluraltypen: -er-Plurale, -n-Plurale bei Maskulina und Neutra, deren Singularform nicht auf Schwa endet (hier abgekürzt als -nnonfem, z.B. Muskel - Muskeln), und -s-Plurale. Das Stimulusmaterial für die getesteten Pluraltypen war so gewählt, dass sich die Frequenzen der häufigen und seltenen Pluralformen für jeden getesteten Flexionstyp im Mittel jeweils um den Faktor vier unterschieden. Die Auswertung der Reaktionszeiten ergab für Pluralformen auf -er, die nach gängiger Auffassung als irregulär flektiert anzusehen sind (vgl. Kap. 1.3), einen klaren Einfluss der Pluralfrequenz auf die lexikalischen Entscheidungszeiten (vgl. Abb. 4.1). Bei gleicher Lemmafrequenz wurden -er-Plurale mit höherer Pluralfrequenz signifikant schneller erkannt (774 ms) als -er-Plurale mit niedrigerer Pluralfrequenz (827 ms) (t(15) = 3.866, p = .002). Ein vergleichbarer Frequenzeffekt zeigte sich auch für -nnonfem-Plurale, für die ebenfalls eine Vollformspeicherung als irreguläre Formen angenommen wird (vgl. Kap. 1.3). Wie für irreguläre Formen zu erwarten, waren die Reaktionszeiten für häufige Pluralformen auf -nnonfem (863 ms) signifikant schneller als die Reaktionszeiten für seltene Pluralformen auf -nnonfem (909 ms) (t(15) = 6.188, p = .000). Im Gegensatz zu den irregulären Pluralformen auf -er und -nnonfem ergaben sich für reguläre, mit dem default-Plural -s flektierte Formen jedoch keine signifikanten Reaktionszeitunterschiede zwischen häufigen (929 ms) und seltenen (926 ms) Pluralformen (vgl. Abb. 4.1) (t(15) = -.228, p = .823). Das Fehlen eines Einflusses der Pluralfrequenz für -s-Plurale legt nahe, dass Pluralformen auf -s im Gegensatz zu irregulären Pluralen auf -er und -nnonfem nicht im mentalen Lexikon gespeichert sind. Diese Ergebnisse stimmen mit den Resultaten von Clahsen, Eisenbeiss & Sonnenstuhl (1997) sowie Sonnenstuhl & Huth (2002) überein, die in visuellen lexikalischen Entscheidungstests zwar für -er-Plurale, nicht jedoch für -sPlurale einen Frequenzeffekt fanden.
Abb. 4.1: Reaktionszeiten für reguläre (-s) und irreguläre (-er, -nnonfem) deut sche Pluralformen (nach Penke & Krause 2002) * signifikanter Unterschied, n.s. kein signifikanter Unterschied zwi schen den Reaktionszeiten für seltene und häufige Pluralformen.
85 Frequenzeffekte in den Fehlerraten agrammatischer Broca-Aphasiker: Dass sich für regulär flektierte Formen kein Frequenzeffekt zeigt, wird auch durch die Resultate des Partizip-Elizitationsexperiments bestätigt, das wir mit elf Broca-Aphasikern durchführten (vgl. Kap. 3.2 sowie Penke, Janssen & Krause 1999). Wie in Kapitel 3.2 dargelegt, ergab der Vergleich der Fehlerraten für häufige und seltene irreguläre Partizipien einen signifikanten Frequenzeffekt: Die Anzahl fehlerhaft suffigierter Partizipien stieg dabei mit abnehmender Frequenz der Partizipformen an. Offensichtlich gelingt mit abnehmender Partizipfrequenz der Zugriff auf die gespeicherten, irregulären Partizipformen nicht immer, was zu fehlerhaften Realisierungen des intendierten Partizips – in den meisten Fällen durch Übergeneralisierungen – führt. Die Fehlerraten für reguläre Partizipien waren dagegen nicht von der Partizipfrequenz beeinflusst. Wir verglichen die Fehlerraten für 13 häufige und 22 seltene reguläre Partizipien aus dem getesteten Stimulusmaterial (vgl. Tab. 4.2).
Tab. 4.2: Frequenzverteilung der regulären Verben im Testmaterial von Penke, Janssen & Krause (1999) Die aufgeführten Frequenzangaben stammen aus der CELEXDatenbank (Baayen, Piepenbrock & van Rijn 1993).
Der Vergleich der Fehlerzahlen für diese beiden Gruppen regulärer Verben ergab, dass sie nicht von der Frequenz der Partizipform abhängig waren. Die Fehlerrate für seltene reguläre Partizipien unterschied sich mit 5,4% nicht signifikant von der Fehlerrate von 9,5% für häufige reguläre Partizipien (Wilcoxon, p = 0.125) (siehe die schwarze Linie und die zugehörige rechte vertikale Achse in der rechten Graphik in Abb. 4.2). Die linke Seite der Abbildung zeigt im Vergleich noch einmal die Daten für die entsprechend ausgewählten irregulären Partizipien (vgl. Tab. 3.3 und Abb. 3.5), für die sich ein signifikanter Frequenzeffekt zeigte. Weder die Reaktionszeiten in lexikalischen Entscheidungstests noch die Fehlerraten sprachgestörter Aphasiker zeigen für regulär flektierte Formen einen Einfluss der Wortformfrequenz. Der Unterschied zu irregulär flektierten Formen, bei denen dieser Einfluss dagegen sehr wohl zu beobachten ist, legt nahe, dass regulär flektierte Formen nicht als Vollformen im mentalen Lexikon gespeichert sind.2 –––––––—–– 2
Auch bei bestimmten EKP-Komponenten lassen sich Frequenzeffekte für irregulär flektierte Formen, nicht aber für regulär flektierte Formen feststellen. Allen, Badecker & Osterhout (2003) präsentierten frequente bzw. seltene regulär und irregulär flektierte englische past tense Formen in
86
Abb. 4.2: Frequenzverteilung der Suffixfehler aphasischer Sprecher bei irregulären und regulären Partizipien (nach Penke, Janssen & Krause 1999)
Für bestimmte reguläre Formen kann auch eine flektierte Vollform gespeichert sein: Allerdings ist eine Vollformspeicherung regulär flektierter Formen auch nicht unmöglich, da es der assoziative Lernmechanismus erlaubt, auch regulär flektierte Formen als Vollformen abzuspeichern. Tatsächlich fanden Stemberger & MacWhinney (1988) sowie Alegre & Gordon (1999) für sehr frequente reguläre Formen ebenfalls Hinweise auf eine Vollformspeicherung. In einem Elizitationsexperiment zum englischen past tense, das Stemberger & MacWhinney mit 75 Probanden durchführten, erwiesen sich die zehn getesteten sehr hochfrequenten regulären Verben mit nur 13 Fehlern als signifikant fehlerresistenter als die zehn getesteten sehr seltenen regulären Verben (28 Fehler). Aus diesem Frequenzeffekt –––––––—–– Kontexten, in denen die past tense Markierung ungrammatisch war (z.B. The man will worked on the platform). Bei einem Vergleich der EKP-Wellen stellten sie fest, dass die P600-Komponente, die mit der Verarbeitung ungrammatischer Strukturen korreliert ist (vgl. Hagoort, Brown & Osterhout 1999), bei frequenten irregulär flektierten past tense Formen (z.B. will stood) fast 200 ms früher einsetzte als bei seltenen irregulär flektierten Formen (z.B. will knelt). Für die regulär flektierten past tense Formen zeigte sich dagegen kein vergleichbarer Frequenzeffekt. Das Einsetzen der P600-Komponente wurde von der Wortformfrequenz nicht beeinflusst. Nach Allen, Badecker & Osterhout sprechen die beobachteten Unterschiede im Einsetzen der P600-Komponente bei regulär und irregulär flektierten past tense Formen für eine unterschiedliche Repräsentation regulär und irregulär flektierter Formen, denn wären regulär wie irregulär flektierte Formen als Vollformen im mentalen Lexikon gespeichert, dann hätte sich der Invarianz-Hypothese zufolge (s. Kap. 2.2) ein vergleichbares Verhalten der P600-Komponente bei regulär und irregulär flektierten past tense Formen zeigen sollen.
87 schließen Stemberger & MacWhinney: „[…] high-frequency regularly inflected forms are stored in the lexicon in some fashion“ (ebd.: 106). Auch Alegre & Gordon (1999) fanden in einem lexikalischen Entscheidungstest bei hochfrequenten regulär flektierten englischen Nomina und Verben einen Frequenzeffekt. Stemberger & MacWhinney heben jedoch hervor, dass für hochfrequente regulär flektierte Formen neben der gespeicherten, vollflektierten Form in jedem Fall auch eine dekomponierte Form vorliegen müsse. Dafür spricht ihrer Ansicht nach der Versprechertyp des affix shifts, bei dem ein Affix an eine andere Position im Satz rückt (z.B. point outed statt pointed out (Garrett 1980)). Dieser Versprechertyp ist bei hochfrequenten flektierten Formen häufiger zu beobachten als bei seltenen Formen. Zudem konnten sie in ihrer Untersuchung für reguläre Verben keine Evidenz für Effekte der phonologischen Ähnlichkeit feststellen, wie sie bei einer Vollformspeicherung aller regulär flektierten Formen zu erwarten wären (s. Kap. 3.3 und 4.1.2 ). Sie schließen daher, dass lediglich für sehr hochfrequente regulär flektierte Formen neben einer dekomponierten Repräsentation auch eine Vollformspeicherung vorliegen könne. Auch Baayen, Dijkstra & Schreuder (1997), Bertram, Schreuder & Baayen (2000), Bertram et al. (2000) sowie Baayen et al. (2002) berichten, dass für bestimmte regulär flektierte Formen Frequenzeffekte in lexikalischen Entscheidungsaufgaben auftreten können. Ihrer Ansicht nach ist eine Speicherung regulär flektierter Formen beispielsweise dann zu erwarten, wenn eine Homonymie zwischen zwei produktiven Affixen vorliegt. Baayen, Dijkstra & Schreuder verdeutlichen dies am Beispiel des niederländischen Affixes -en, das sowohl an Verben als auch an Nomina Plural markiert. Die Verteilung dieses Affixes auf diese zwei Kategorien ist jedoch nicht gleichmäßig: 64% der Vorkommen von -en (tokens) entfallen auf Verben, nur in 36% der Fälle tritt es an Nomina auf. Aufgrund dieser Verteilung geht man laut Baayen, Dijkstra & Schreuder bei der Verarbeitung mit -en affigierter Wortformen zunächst davon aus, dass es sich um Verben handelt. Ist dies nicht der Fall, kommt es zu einem Konflikt, dessen Lösung Zeit benötigt. In einem solchen Fall ist es ihrer Ansicht nach für die lexikalische Verarbeitung vorteilhafter, reguläre mit -en suffigierte Pluralnomina als Vollformen zu speichern. Da für -en-markierte Verben ein solcher Konflikt nicht auftritt, ist eine Vollformspeicherung für sie nicht notwendig. Baayen, Dijkstra & Schreuder belegen diesen Vorschlag mit den Ergebnissen eines lexikalischen Entscheidungstests, in dem sich zwar für regulär mit -en flektierte Nomina, nicht jedoch für regulär mit -en flektierte Verben ein Effekt der Wortformfrequenz zeigte.3 Im Gegensatz zum konnektionistischen Modell von Rumelhart & McClelland gehen Baayen und Kollegen jedoch nicht davon aus, dass alle regulär flektierten Formen nur als vollflektierte Formen im mentalen Lexikon vorliegen. Ihr Modell postuliert lediglich, dass es für bestimmte flektierte Formen im Hinblick auf den Verarbeitungsaufwand und die Verarbeitungsgeschwindigkeit sinnvoller sein kann, auch in einer gespeicherten Form vorzuliegen. –––––––—–– 3
Ob der Vorschlag von Baayen, Dijkstra, Schreuder und Bertram, Affixhomonymie führe zur Speicherung regulär flektierter Formen, zutreffend ist, bedarf meiner Ansicht nach noch weiterer Überprüfung. Bei den vorgestellten lexikalischen Entscheidungsexperimenten zum Deutschen ließen sich jedenfalls trotz Homonymie des regulären Partizipaffixes -t, das auch als Kongruenzaffix der 3. Person Singular und der 2. Person Plural fungiert, keine Wortformfrequenzeffekte feststellen (vgl. auch die Diskussion in Bertram et al. 2000).
88 4.1.2 Für regulär flektierte Formen zeigen sich keine phonologischen Ähnlichkeitseffekte Die in Kapitel 3.3 vorgestellten Untersuchungen haben gezeigt, dass starke Verben in Familien phonologisch ähnlicher starker Verben organisiert sind. Die Zugehörigkeit zu einer Familie phonologisch ähnlicher, reimender Verben beeinflusst z.B. die Anfälligkeit starker Verben für Übergeneralisierungen. Irreguläre englische past tense bzw. deutsche Partizipformen, die zu einer großen Familie reimender starker Verben gehören, sind z.B. im Spracherwerb gegen Übergeneralisierungen besser gefeit als starke Verben ohne eine solche Familie (vgl. Bybee & Slobin 1982, Marcus et al. 1992, Weyerts 1997). Dieser Effekt der phonologischen Ähnlichkeit oder gang-Effekt wird als Evidenz für eine Speicherung irregulärer Formen in einem assoziativen Gedächtnisspeicher gesehen, in dem Verbindungen (= Assoziationen) zwischen Elementen mit ähnlichen Formmerkmalen hergestellt werden, die sich gegenseitig verstärken und so den Lexikonzugriff erleichtern. Wären auch regulär flektierte Formen als Vollformen in einem solchen assoziativen System gespeichert, dann sollten sich analoge Familienähnlichkeitseffekte für reguläre Formen zeigen. Je mehr reguläre Verben einer Familie phonologisch ähnlicher regulärer Verben angehören und je häufiger diese Verben sind, desto besser sollten die Verben dieser Familie im Spracherwerb vor Irregularisierungen geschützt sein. Weyerts (1997) testete diese Vorhersage für die elf irregularisierten Formen, die die von ihr untersuchten deutschsprachigen Kinder bei der Elizitation von 546 regulär und gemischt flektierten Partizipien produzierten. Eine Korrelationsanalyse zwischen der Irregularisierungsrate regulärer Partizipien und der Reimstärke der getesteten regulären Partizipien, die durch Aufsummierung der Partizipfrequenzen der regulären Reimwörter ermittelt wurde, ergab dabei keine signifikante Korrelation. Allerdings ist die Aussagekraft dieser Analyse aufgrund der geringen Zahl an Irregularisierungsfehlern, wie Weyerts selbst einräumt, begrenzt. Da Irregularisierungen sowohl im Spracherwerb als auch bei sprachgestörten4 und unbeeinträchtigten erwachsenen Sprechern sehr selten zu beobachten und statistisch valide Aussagen aufgrund dieser geringen Datenbasis kaum möglich sind, versucht man, den möglichen Einfluss phonologischer Ähnlichkeitseffekte auf regulär flektierte Formen mit anderen experimentellen Techniken zu klären. Prasada & Pinker (1993) baten ihre Versuchspersonen, past tense Formen für Kunstverben zu produzieren, die sich jeweils mit einer Gruppe irregulärer bzw. regulärer englischer Verben reimten bzw. nicht reimten. Dabei zeigte sich, dass irreguläre past tense Formen für Kunstverben umso eher gebildet wurden, je größer die phonologische Ähnlichkeit zu einer Familie irregulärer Verben war. Ein vergleichbarer Effekt für regulär flektierte Kunstverben ergab sich jedoch nicht. Die Häufigkeit, mit der Kunstverben regulär flektiert wurden, war unabhängig davon, ob diese eine große phonologische Ähnlichkeit zu einer Familie regulärer Verben hatten oder keinerlei Ähnlichkeit zu existierenden englischen Verben aufwiesen (z.B. ploamph). Dieser Befund bestätigte sich in einer Untersuchung zur regulären und irregulären nominalen Pluralflexion des Hebräischen (Berent, Pinker & Shimron 2002) sowie auch in einem Kunstverbexperiment zur deutschen Partizipbildung, das Weyerts (1997) mit 48 Kindern im Alter zwischen –––––––—–– 4
In den Daten des von uns mit Broca-Aphasikern durchgeführten Elizitationsexperiments zur Partizipflexion fanden sich unter den 399 produzierten Partizipformen für reguläre Verben lediglich 22 Irregularisierungen (= 5,5%).
89 3;10 und 8;10 durchführte. Sowohl für die drei Kunstverben, die sich mit existierenden regulären Verben reimten (z.B. pachen), als auch für die sieben Kunstverben, die sich nicht mit existierenden Verben reimten (z.B. tolmen), lag die Rate regulär gebildeter Partizipformen bei 83%.5 Ullman (1999a) testete den Einfluss phonologischer Familieneffekte mit einem Experiment, in dem korrekte reguläre und irreguläre englische past tense Formen beurteilt werden sollten. Die Auswertung ergab dabei einen klaren Einfluss der phonologischen Ähnlichkeit auf irreguläre past tense Formen. Je größer die phonologische Ähnlichkeit von Basis- und past tense Form eines starken Verbs (z.B. blow - blew) zu anderen Basis-/past tense Paaren starker Verben (z.B. grow - grew) war, desto besser waren die Beurteilungswerte für irreguläre past tense Formen. Für reguläre past tense Formen fand sich dagegen keine signifikante Korrelation zwischen den Beurteilungsraten der Versuchspersonen und der phonologischen Ähnlichkeit der beurteilten Verben zu anderen regulären Verben. Evidenz gegen einen gang-Effekt regulär flektierter Verben liefern auch Stemberger & MacWhinney (1988). Sie präsentierten ihren Versuchspersonen im Kontext ‚is Xing’ zwei verschiedene Typen regulärer Verben. Die Stammformen des einen Typs reimten sich auf 3. Person Singular Formen mehrerer regulärer Verben. So reimt sich die Stammform gaze der präsentierten regulären Form is gazing unter anderem auf die 3. Person Singular Form plays. Die Stammformen des zweiten Typs der präsentierten regulären Verben (z.B. is crossing) reimten sich dagegen nicht auf 3. Person Singular Formen existierender regulärer Verben. Aufgabe der Versuchspersonen war es, für das vorgegebene Verb die 3. Person Singular Form zu produzieren. Sind regulär flektierte Formen wie zum Beispiel 3. Person Singular Formen (plays) gespeichert, dann sollten sie laut Stemberger & MacWhinney einen Einfluss auf phonologisch ähnlich klingende Formen (z.B. gaze) haben. So wie Familien irregulärer past tense Formen phonologisch ähnliche Kunstverben anziehen, die dann irregulär flektiert werden, so sollten auch Familien regulär flektierter 3. Person Singular Formen phonologisch ähnliche Verben anziehen. Dies sollte laut Stemberger & MacWhinney dazu führen, dass Verben wie gaze in 3. Person Singular Kontexten häufiger unmarkiert bleiben als Verben, deren Stammform sich nicht mit existierenden 3. Person Singular Formen reimt (z.B. cross). Auch hier ergab die Datenauswertung jedoch keine Evidenz für Effekte der Familienähnlichkeit bei regulären Verben. Die Anzahl unmarkierter –––––––—–– 5
Auch im Bereich der deutschen Nominalplurale wurden zwei Kunstverbexperimente zur Untersuchung von Familienähnlichkeitseffekten durchgeführt. Während Marcus et al. (1995) ein Beurteilungsexperiment mit erwachsenen Sprechern durchführten, untersuchten Bartke, Marcus & Clahsen (1996, Bartke 1998) die Beurteilungen von Kindern. In beiden Experimenten wurden lediglich mit -s-markierte Formen als regulär flektiert gewertet. Alle anderen Formen wurden dagegen als irregulär flektiert angesehen. In unseren Untersuchungen zur deutschen Pluralflexion konnten wir jedoch zeigen, dass auch -n-Plurale bei Feminina, deren Singularform auf Schwa endet, regulär sind (vgl. Penke & Krause 1999, 2002 sowie Kapitel 5.2.1). Das Vorliegen eines regulären Flexionsprozesses wird auch für Nullplurale sowie Plurale auf -e diskutiert (vgl. z.B. Golston & Wiese 1996, Wiese 1999, Wunderlich 1999). Zwar wurden in den beiden Untersuchungen von Marcus et al. und Bartke et al. keine Reimeffekte für mit -s-markierte Kunstwortplurale gefunden, die Art der Datenauswertung erlaubt jedoch keine weiteren Aussagen über das Vorliegen bzw. Fehlen von Reimeffekten bei weiteren regulär bzw. irregulär flektierten Kunstwortpluralen. Aus diesem Grund werde ich auf beide Untersuchungen nicht näher eingehen.
90 3. Person Singular Formen war für reimende und nicht-reimende Verben nicht signifikant verschieden. Stemberger & MacWhinney schließen aus diesem Ergebnis, dass regulär flektierte Formen im Allgemeinen nicht im Lexikon gespeichert sind. Zusammenfassend kann folgendes festgehalten werden: Zwar sind Irregularisierungen existierender regulärer Verben sehr selten, und auch die vorgestellten experimentellen Untersuchungen sind hinsichtlich Design, Größe der Datenbasis oder Vorgehen bei der Datenauswertung nicht immer optimal, dennoch stimmen alle Untersuchungen darin überein, dass regulär flektierte Verben nicht wie irregulär flektierte Verben phonologischen Familienähnlichkeitseffekten unterliegen. Bei einer Vollformspeicherung regulär flektierter Formen sollten diese wie irregulär flektierte Formen in Familien phonologisch ähnlicher Verben gespeichert sein. Wie bei irregulären Verben zu beobachten, sollten diese regulären Familien die Verarbeitung und Produktion ihrer Familienmitglieder ebenfalls beeinflussen. Dass solche Einflüsse konsistent nicht zu finden sind, spricht daher gegen eine Vollformspeicherung regulär flektierter Formen. 4.1.3 Für regulär flektierte Formen zeigt sich ein Dekompositionseffekt Weitere Evidenz gegen eine Vollformspeicherung regulär flektierter Formen liefern priming-Experimente (vgl. Kap. 2.1.2.2). Dass die Präsentation eines regulär flektierten Wortes, des primes (z.B. pours), die lexikalische Entscheidungszeit für den nachfolgend präsentierten Wortstamm, das Zielwort (z.B. pour), verkürzt, wird als Evidenz dafür gewertet, dass das flektierte prime-Wort bei der Worterkennung in Stamm und Affix dekomponiert wird. Durch diese Dekomposition wird der Eintrag des Stamms aktiviert, was wiederum dazu führt, dass sich die lexikalische Entscheidungszeit bei der nachfolgenden Präsentation des Wortstamms deutlich verkürzt. Bei irregulär flektierten Formen, die als vollflektierte Formen im mentalen Lexikon gespeichert sind, sollte dagegen keine Dekomposition in Stamm und Affix erfolgen. Die Präsentation einer irregulär flektierten Form sollte dementsprechend nicht zu einer vergleichbaren Verkürzung der lexikalischen Entscheidungszeiten für den nachfolgend präsentierten Verbstamm führen. Stanners et al. testeten diese Vorhersage bereits 1979 in einem visuellen primingExperiment mit regulär und irregulär flektierten Verbformen des Englischen. Dabei zeigte sich für drei Gruppen regulär flektierter Verben – reguläre past tense Formen (burned), Kongruenzformen der 3. Person Singular (pours) und Progressivformen (lifting) – der Vorhersage entsprechend, dass die Vorgabe einer regulär flektierten Form die lexikalischen Entscheidungszeiten für den anschließend präsentierten Verbstamm (z.B. burn, pour, lift) genauso verkürzte wie die Präsentation des Verbstamms selbst (Identitäts-priming: prime: burn, Zielwort: burn, vgl. Kap. 2.1.2.2). Die Vorgabe irregulär flektierter Formen wie hung oder shook führte dagegen zwar ebenfalls zu einer Verkürzung der Entscheidungszeiten für die nachfolgend präsentierten Verbstämme (hang, shake), diese fiel jedoch im Vergleich zur Identitätsbedingung signifikant geringer aus. Stanners et al. schlossen aus diesem Ergebnis, dass für irregulär, nicht aber für regulär flektierte Formen eigene Lexikoneinträge angenommen werden müssten. In Übereinstimmung mit diesen Ergebnissen stehen auch die crossmodalen primingStudien von Sonnenstuhl, Eisenbeiss & Clahsen (1999) zur Plural- und Partizipflexion des Deutschen. Sie fanden sowohl für regulär flektierte Partizipien (mit dem Suffix -t) als auch
91 für Pluralformen auf -s einen vollen priming-Effekt: Die Präsentation einer regulär flektierten Form verkürzte die Reaktionszeit für die nachfolgend präsentierte Stammform genauso effektiv wie die Präsentation der Stammform selbst. Ähnlich wie in der Studie von Stanners et al. zeigte sich für irregulär flektierte Partizipien und Pluralformen auf -er dagegen nur ein reduzierter priming-Effekt. Zwar verkürzte die Präsentation einer irregulär flektierten Form (z.B. prime: Kinder) die lexikalischen Entscheidungszeiten des nachfolgend präsentierten Stamms (z.B. Kind) im Vergleich zu einer neutralen Kontrollbedingung (z.B. prime: Technik, Zielwort: Kind) signifikant. Dieser priming-Effekt war jedoch signifikant weniger effektiv als das Identitäts-priming (prime: Kind, Zielwort: Kind). Sonnenstuhl, Eisenbeiss & Clahsen werten diese Ergebnisse als Evidenz für eine unterschiedliche Verarbeitung regulär und irregulär flektierter Formen: Demnach wird nur für regulär flektierte Formen eine Dekomposition in Stamm und Affix vorgenommen, während eine Dekomposition der als Vollform gespeicherten, irregulär flektierten Formen nicht stattfindet. Leider hat sich die Technik des primings als anfällig für experimentelle Variationen gezeigt. Insbesondere die Präsentationsmodalität – auditiv oder visuell – scheint Einfluss auf die beobachteten Effekte zu haben (vgl. auch Holcomb & Neville 1990). So fanden z.B. Marslen-Wilson, Hare & Older (1993) in einem crossmodalen priming-Experiment mit visueller Präsentation des Zielworts nur für regulär flektierte englische past tense Formen einen priming-Effekt. Für irregulär flektierte past tense Formen des Typs sleep - slept ergaben sich dagegen keine signifikanten Unterschiede zur Kontrollbedingung. Für irregulär flektierte past tense Formen des Typs give - gave fanden sie sogar einen Inhibitionseffekt, d.h. die Entscheidungszeiten für das Zielwort (give) waren nach Präsentation des primes (gave) sogar langsamer als in der Kontrollbedingung. Dagegen beobachteten Marslen-Wilson & Tyler (1997) in einem unimodalen priming-Experiment mit auditiver Stimuluspräsentation auch für irregulär flektierte past tense Formen einen vollen primingEffekt. Der beobachtete Einfluss der Präsentationsmodalität auf die Verarbeitung irregulär flektierter Formen ist jedoch für die Annahme problematisch, dass die priming-Technik die Dekomposition einer flektierten Wortform in Stamm und Affix erfasst, da diese modalitätsunabhängig erfolgen sollte (vgl. auch Rueckl & Galantucci 2005). Für eine Erklärung der variierenden priming-Befunde für irregulär flektierte Formen sind weitere Studien über die Einflüsse externer Faktoren wie der Präsentationsmodalität notwendig. Festgehalten werden kann jedoch, dass sich in den meisten Untersuchungen klare Unterschiede in den priming-Effekten für regulär und irregulär flektierte Formen zeigten. In allen genannten Studien fanden sich ferner für regulär flektierte Formen übereinstimmend volle priming-Effekte, die für eine Dekomposition in Stamm und Affix sprechen. Volle priming-Effekte traten für irregulär flektierte Formen – wenn überhaupt – nur in unimodalen (Fowler, Napps & Feldman 1985, Marslen-Wilson & Tyler 1997), nicht aber in crossmodalen priming-Experimenten (Marslen-Wilson, Hare & Older 1993, Sonnenstuhl, Eisenbeiss & Clahsen 1999) auf.6 Während bei unimodaler Präsentation ein rein perzeptuel–––––––—–– 6
Meunier & Marslen-Wilson (2004) berichten in ihrer crossmodalen priming Studie zu regulären und irregulären Verben des Französischen, dass ‚irreguläre’ Verbformen wie irons ‚geh1.PL.FUTUR’ einen vollen priming-Effekt auslösten. Allerdings vermengen Meunier & MarslenWilson in ihrer Studie Veränderungen des Stamms und Irregularität hinsichtlich der Flexion. Eine Form wie irons weist zwar einen im Vergleich zum Basisstamm veränderten Futurstamm auf, die Person- und Numerusflexion (-ons) ist jedoch völlig regulär und die Form ist in Stamm und Affix
92 ler Vergleich von prime und Zielwort möglich ist, erscheint es bei einer crossmodalen Präsentation unumgänglich, dass tatsächlich auf lexikalische Einträge zugegriffen wird. Insofern könnten die Befunde aus crossmodalen priming-Experimenten gewichtiger sein als Ergebnisse unimodaler priming-Experimente. Zum jetzigen Zeitpunkt deuten die primingBefunde für regulär und irregulär flektierte Formen daher eher auf eine distinkte Repräsentation von regulärer und irregulärer Flexion hin. 4.1.4 Für regulär flektierte Formen zeigen sich Morphemgrenzeffekte Einen weiteren Beleg dafür, dass regulär flektierte Formen nicht als Vollformen gespeichert sind, sondern durch die Verknüpfung eines Stamms mit einem Affix produziert werden, fanden wir in Daten zum Erwerb der regulären deutschen Partizipflexion. Symbolistische, dualistische Ansätze zur Flexion gehen davon aus, dass regulär flektierte Formen, wie beispielsweise reguläre deutsche Partizipien, durch die Verknüpfung eines Stamms mit einem Affix produziert werden (Pinker & Prince 1988, Pinker 1999, Clahsen 1999, Wunderlich & Fabri 1995). Ist diese Hypothese korrekt, dann sollte es an der Grenze zwischen Stammmorphem und Affixmorphem zu einem phonologischen Problem kommen, wenn durch die Verknüpfung zwei identische Segmente in Stamm und Affix aufeinander treffen. Ein solches Morphemgrenzproblem sollte sich beispielsweise ergeben, wenn für das Verb husten eine reguläre Partizipform produziert werden soll. Eine Verknüpfung des Stamms hust- mit dem Partizipaffix -t würde zu einer Form gehustt führen. Abfolgen von zwei identischen Konsonanten werden in den Sprachen der Welt jedoch generell vermieden (Leben 1973, Goldsmith 1979, McCarthy 1986, Yip 1998). Im konkreten Fall gibt es dazu folgende zwei Möglichkeiten: Im ersten Fall wird nur eines der Segmente realisiert (Degemination). Es resultiert die Form gehust. Alternativ kann ein epenthetischer Vokal – im Deutschen ist dies der Vokal Schwa – zwischen die beiden identischen Segmente eingefügt werden. Es resultiert die standardsprachliche Form gehustet. Sprachen unterscheiden sich darin, welche der beiden Lösungen sie für dieses Morphemgrenzproblem wählen. Während im Standarddeutschen die Schwa-Epenthese gewählt wird (gehustet), finden wir im Niederländischen die Degemination als Lösung dieses Problems. Reguläre Partizipien werden im Niederländischen durch die Affigierung von -d an den Basisverbstamm gebildet. Endet dieser bereits auf einen koronalen Plosiv [t] oder [d] wie der Stamm hoest- ‚husten’, dann wird nur einer der Plosive realisiert. Die reguläre Partizipform ist entsprechend gehoest. Da Verben mit stammfinalem [t] im Deutschen nicht selten und auch Kindern geläufig sind, stoßen deutsche Kinder schon bald, nachdem sie die ersten mit –t flektierten Partizipien produzieren, auf dieses [t]-t-Problem. Im Laufe des Erwerbs müssen sie dann identifizieren, wie die von ihnen gelernte Sprache mit diesem Problem umgeht. Dass für Kinder diese Fälle tatsächlich ein Erwerbsproblem darstellen, belegen Daten wie die von Naomi (s. auch Grijzenhout & Penke 2005). Naomi ist ein monolingual deutsch erwerbendes Kind deutschsprachiger Eltern, für das ein großes Korpus an wöchentlich durchgeführten Spontansprachaufnahmen aus frühen Erwerbsphasen vorhanden ist. Naomi produziert die ersten –––––––—–– dekomponierbar. Der hier beboachtete priming-Effekt ist daher kein Beleg dafür, dass irregulär flektierte Formen wie regulär flektierte Formen in Stamm und Affix dekomponiert werden.
93 mit -t flektierten regulären Partizipformen im Alter von 1;8.28. Knappe drei Wochen später (mit 1;9.18) stößt sie auf das [t]-t-Problem. Von diesem Zeitpunkt an bis zum Alter von 2;1.20, dem Zeitpunkt der letzten Aufnahme, die uns von Naomi vorliegt, finden wir in Naomis Daten alle drei Realisierungsformen des [t]-t-Problems bei regulären Partizipien belegt: In 59,3% der Kontexte (16 von 27) realisiert sie bei stammfinalem [t] und Affix -t nur eines der beiden [t]-Segmente (vgl. (1a)). In 29,6% der Kontexte (8 v. 27) produziert sie Formen, in denen beide [t]-Segmente aufeinander folgen (1b). Zielsprachliche Formen mit Schwa-Epenthese finden sich dagegen nur in 11,1% der Kontexte (3 v. 27) (1c). (1) Zielsprachliche Form (an)geguckt, Naomis Realisierungen:7 a. [tUt] (Naomi 1;11;24 – 2;0;26) b. [an´tUtt] (Naomi 2;1;03) c. [tUt´t] (Naomi 1;9;18) Verben, deren Stamm nicht auf [t] enden, bereiten Naomi dagegen bei der Produktion regulär mit -t flektierter Partizipien keine Schwierigkeiten. 84 der 92 in diesem Zeitraum produzierten regulären Partizipien für Verben ohne stammfinales [t] sind korrekt mit -t flektiert. Nur in 5,4% der Fälle wurde die Endung -t ausgelassen. Diese Daten verdeutlichen, dass Naomi während einer Phase ihres Spracherwerbs mit dem [t]-t-Problem und der Lösung, die das Deutsche für dieses Problem wählt, ringt. Während dieser Phase produziert sie Formen, die sie im input nicht gehört hat. Bedeutsam ist diese Beobachtung deshalb, weil sich ein Morphemgrenzproblem wie das [t]-t-Problem überhaupt nur dann stellt, wenn regulär flektierte Formen durch eine Verknüpfung von Stammmorphem und Affixmorphem gebildet werden. Würden die im input gehörten regulären Partizipformen dagegen als vollflektierte Formen im mentalen Lexikon abgespeichert, dann gäbe es gar keine Morphemgrenze zwischen einem stammfinalen [t] und einer Endung -t und damit auch kein Problem, dessen Lösung im Spracherwerb erworben werden müsste. In diesem Fall sollten Deutsch erwerbende Kinder keine Probleme mit der Produktion von Formen wie gehustet haben. Die Unsicherheiten, die Naomi in diesem Bereich zeigt, und insbesondere die sehr markierten [tt]-Formen (1b), die Naomi nie gehört hat, belegen jedoch eindrucksvoll, dass Naomi hier mit einem Problem ringt, das durch die produktive Verknüpfung und das daraus resultierende Aufeinandertreffen eines Stammmorphems und eines Affixes verursacht ist. 4.1.5 Regulär und irregulär flektierte Formen sind neuronal distinkt repräsentiert Mit Hilfe der neuen bildgebenden Verfahren ist es in den letzten Jahren gelungen, neurophysiologische und neuroanatomische Evidenz für eine qualitative Distinktion von regulärer und irregulärer Flexion zu erbringen. Die Argumentation basiert hier auf der InvarianzHypothese, der zufolge: –––––––—–– 7
Naomi realisiert die velaren Plosive [g] und [k] als [t]. Der Verbstamm guck- wird von ihr daher als [tUt] realisiert.
94 „[…] the mapping between a cognitive operation and its neural substrate, however complex, is invariant – in other words, it is assumed that a given cognitive operation is instantiated in a brain in only one way.“ (Rugg 1999: 17)
Korrelieren unterschiedliche neuronale Aktivierungen also mit der Verarbeitung oder Produktion regulär und irregulär flektierter Formen, dann kann gemäß der Invarianz-Hypothese geschlossen werden, dass diese unterschiedlichen neuronalen Aktivierungen auch distinkte kognitive Operationen reflektieren. Liegen regulär und irregulär flektierten Formen dagegen die gleichen Repräsentationen und kognitiven Operationen zugrunde, dann können laut Invarianz-Hypothese die mit ihnen korrelierten neuronalen Aktivierungen nicht qualitativ distinkt sein (Rugg 1999, Hagoort, Brown & Osterhout 1999). In den letzten Jahren sind eine Reihe von Studien, die die Techniken der EKPs, der PET und der fMRT anwendeten, der Frage der neuronalen Repräsentation der regulären und irregulären Flexion nachgegangen (s. Kap. 2.2 für eine Beschreibung dieser Verfahren). EKP-Studien zur deutschen Partizip- und Pluralflexion: Die Technik der EKPs erlaubt es, die elektrischen Aktivierungen des Gehirns zu registrieren, die mit bestimmten kognitiven Operationen korreliert sind. Wir führten mit dieser Technik zwei Experimente zur deutschen Partizip- und Pluralflexion durch (Penke et al. 1997, Weyerts et al. 1997), um zu untersuchen, ob die Verarbeitung regulär und irregulär flektierter Wörter mit distinkten EKP-Komponenten assoziiert ist. In der Partizipstudie präsentierten wir den 20 Versuchspersonen auf einem Bildschirm Wort für Wort Sätze, die ein korrekt bzw. inkorrekt gebildetes Partizip enthielten. Wir präsentierten starke Verben mit der korrekten Partizipendung -n (2a), starke Verben mit dem regulären Suffix -t (2b), reguläre Verben mit dem korrekten Partizipsuffix -t (3a) und reguläre Verben mit der irregulären Endung -n (3b).8 Für jede dieser vier Bedingungen erstellten und testeten wir 50 Sätze. (2) a. Starke Verben, b.
korrekt: inkorrekt:
(3) a. Reguläre Verben, korrekt: b. inkorrekt:
Sie haben die Möbel schon aufgeladen. Sie haben die Möbel schon aufgeladet. Sie haben die ganze Nacht durchgetanzt. Sie haben die ganze Nacht durchgetanzen.
Um dem Problem zu entgehen, dass hochfrequente reguläre Partizipien ebenfalls gespeichert sein könnten (s. Stemberger & MacWhinney 1986, 1988), wählten wir nur relativ seltene reguläre Verben aus. Anschließend suchten wir hinsichtlich der Frequenzen vergleichbare starke Verben vom Ablauttyp ABA, bei denen der Stammvokal in Präsens- und –––––––—–– 8
Insgesamt wurden (mit unterschiedlichen Versuchspersonen) drei Experimente zur Partizipflexion durchgeführt. Die Stimuli wurden dabei außer in Satzform – wie hier beschrieben – auch in einer Wortliste sowie in eine Geschichte eingebettet präsentiert, um eventuell durch die Satzpräsentation ausgelöste Artefakte zu identifizieren. Da die Ergebnisse in allen drei Experimenten jedoch vergleichbar waren, beschränke ich mich auf die Darstellung des ‚Satz‘-Experiments. Eine Darstellung aller drei Untersuchungen findet sich in Penke et al. (1997).
95 Partizipstamm identisch ist. Die Beschränkung auf diesen Ablauttyp erlaubte es, den in der Partizipform häufig auftretenden Stammvokalwechsel als konfundierenden Faktor zu neutralisieren. Die Aufgabe der Versuchspersonen war zu entscheiden, ob ein nach jeweils zehn Sätzen vorgegebener ‚Testsatz‘ bereits präsentiert worden war oder nicht. Abbildung 4.3 zeigt die über alle Probanden gemittelten EKPs, die an der hier besonders relevanten, links frontal gelegenen Elektrode F7 registriert wurden. Die rechte Abbildung zeigt die Aktivierungen, die mit dem Lesen korrekt flektierter (durchgezogene Linie) bzw. irregularisierter (gepunktete Linie) regulärer Partizipien korreliert waren. Zwar zeigt der Vergleich der Messungen für korrekte und inkorrekte reguläre Partizipien eine geringfügig größere Positivierung, die bei der Verarbeitung inkorrekter regulärer Partizipien auftritt. Dieser Effekt erwies sich jedoch in zwei Folgeuntersuchungen, in denen das Stimulusmaterial nicht in Sätzen, sondern in Wortlisten bzw. Geschichten präsentiert wurde, als nicht konsistent.
Abb. 4.3: EKPs bei korrekt und inkorrekt flektierten irregulären und regulären Partizipien an der Elektrodenposition F7 (nach Penke et al. 1997)
Ein konsistenter Effekt zeigte sich jedoch für irreguläre Partizipien. Der linke Graph in Abbildung 4.3 präsentiert die EKPs, die beim Lesen korrekter (durchgezogene Linie) bzw. übergeneralisierter (gepunktete Linie) irregulärer Partizipien auftraten. Die Verarbeitung übergeneralisierter, mit -t flektierter irregulärer Partizipien (*geladet) ist im Vergleich zur Verarbeitung korrekter irregulärer Partizipien mit einer größeren Negativierung assoziiert, die ca. 200 ms nach Stimuluspräsentation beginnt und zwischen 250 bis 500 ms nach Stimuluspräsentation ihr Maximum über links-frontalen Kortexarealen erreicht. Sowohl der zeitliche Verlauf als auch die topographische Verteilung mit einem links frontalen Maximum sprechen dafür, dass es sich bei der registrierten Negativierung um eine so genannte LAN handelt. Die LAN ist eine EKP-Komponente, die in verschiedenen Untersuchungen mit der Verarbeitung morphosyntaktischer Merkmalsverletzungen assoziiert war. Sie hat sich z.B. bei Verletzungen der Subjekt-Verb-Kongruenz oder bei Kasus- und Numerusfehlern gezeigt (Münte, Heinze & Mangun 1993, Osterhout & Mobley 1995, Hagoort, Brown & Osterhout 1999). Als gemeinsamen Nenner dieser Arbeiten und unserer Studie könnte man
96 formulieren, dass eine LAN mit einem inkorrekten Affigierungsprozess korreliert ist, der dann vorliegt, wenn morphosyntaktische Merkmale nicht übereinstimmen oder wenn affigiert wurde, obwohl die Affigierung durch das Vorliegen einer gespeicherten, irregulären Form hätte geblockt sein sollen. Diese Erklärung sagt voraus, dass der LAN-Effekt nicht nur bei Übergeneralisierungen der regulären Partizipflexion zu beobachten, sondern generell mit Übergeneralisierungen korreliert sein sollte. Um diese Vorhersage zu testen, untersuchten wir in einem Folgeexperiment, ob sich der LAN-Effekt auch bei Übergeneralisierungen des regulären Pluralaffixes -s auf irregulär flektierte Formen zeigte (siehe Weyerts et al. 1997). Wie in der Partizipstudie verwendeten wir auch in der Pluralstudie das Design des Verletzungsparadigmas und präsentierten den 18 Probanden korrekte und inkorrekte Pluralformen. Entsprechend der Partizipstudie waren die getesteten Pluralformen als jeweils letztes Element in einen Satz eingebettet, der Wort für Wort visuell präsentiert wurde. Insgesamt untersuchten wir in dieser Studie vier verschiedene Pluralbedingungen. Neben Nomina, die mit dem regulären default-Pluralaffix -s gebildet werden (z.B. Karussells), testeten wir irregulär flektierte -nnonfem-Plurale (z.B. Muskeln). Inkorrekte Pluralformen wurden dabei jeweils durch Austausch der Endungen -s und -n gebildet (vgl. (4a, b) und (5a, b)). (4) regulär flektierende Nomina: a. korrekt: Nicht ganz ungefährlich sind die modernen Karussells. b. inkorrekt: Nicht ganz ungefährlich sind die modernen Karussellen. (5) irregulär flektierende Nomina: a. korrekt: Im Sporthemd zeigen sich seine stählernen Muskeln. b. inkorrekt: Im Sporthemd zeigen sich seine stählernen Muskels. Insgesamt wurden 72 Stimuli pro Bedingung präsentiert. Vergleichbar zum Partizipexperiment hatten die Versuchspersonen auch hier über eine Erinnerungsaufgabe zu entscheiden. Abbildung 4.4 zeigt die Resultate dieser Untersuchung. Erneut zeigte sich für übergeneralisierte irreguläre Formen (*Muskels, gepunktete Linie im linken oberen Graph) im Vergleich zu korrekten irregulären Pluralformen (durchgezogene Linie im linken oberen Graph) beginnend nach ca. 200 ms eine Negativierung mit einem links-anterioren Maximum, die aufgrund Latenz und Topographie als LAN identifiziert werden kann. Auch in dieser Untersuchung trat bei irregularisierten Pluralformen (*Karussellen) ein qualitativ unterschiedlicher EKP-Effekt auf (vgl. rechter oberer Graph in Abb. 4.4). Irregularisierte Pluralformen korrelierten zwar ebenfalls mit einer Negativierung, diese zeigte jedoch eine völlig andere topographische Verteilung mit einem Maximum an der zentralen Elektrode Cz (vgl. rechter unterer Graph in Abb. 4.4). Abbildung 4.4 verdeutlicht dies durch einen direkten Vergleich der EKPs für die mit -s bzw. -n flektierten Pluralformen an den beiden Elektroden, an denen jeweils die maximalen Effekte registriert werden konnten: F7 für übergeneralisierte (*Muskels) und Cz für irregularisierte (*Karussellen) Pluralformen.
97
Abb. 4.4: EKPs für mit -n bzw. mit -s flektierte korrekte und inkorrekte Pluralformen an den Elektrodenpositionen F7 und Cz (nach Weyerts et al. 1997)
Der an Elektrode Cz registrierte Effekt für irregularisierte Pluralformen (*Karussellen) ähnelt der N400-Komponente, einer Komponente, die z.B. bei der Präsentation phonologisch wohlgeformter Kunstwörter beobachtet worden ist (vgl. z.B. Rugg 1987, Bentin 1989). Die Ähnlichkeit der beiden Effekte könnte darauf hindeuten, dass die irregularisierten Pluralformen von den Probanden als nicht-existente Kunstwörter erfasst wurden. Unter der Annahme, dass irreguläre Pluralformen als Vollformen gespeichert sind, die Endung -n also kein eigenständiges, separierbares Affix ist, würde die Suche nach einer Form wie Karussellen im mentalen Lexikon ins Leere laufen: Weder ist ein Eintrag für Karussellen vorhanden, noch gibt es einen Eintrag für ein passendes Pluralaffix -n, das eine Dekomposition in Stamm und Affix ermöglichen würde. Formen wie Karussellen hätten damit eine Art Kunstwortstatus.9 –––––––—–– 9
Als mögliche Erklärung dafür, dass ein Kunstworteffekt bei irregularisierten Partizipien (*getanzen) fehlt, nennt Weyerts (1997) die Homonymie zwischen der irregulären Partizipendung
98 Insgesamt kann festgehalten werden, dass beide Studien – obwohl zwei unterschiedliche Phänomene getestet wurden – vergleichbare EKP-Ergebnisse geliefert haben. Bei den beobachteten EKPs scheint es sich folglich um Komponenten zu handeln, die mit der Verarbeitung regulärer und irregulärer Flexion assoziiert sind. Zwar ist insbesondere bei der mit Übergeneralisierungen assoziierten LAN noch nicht abschließend geklärt, welche kognitiven Operationen mit dem Auftreten dieser Komponente korrelieren: So wird für die LAN z.B. diskutiert, ob sie als Reflex einer morphosyntaktischen Verletzung (vgl. z.B. Münte, Heinze & Mangun 1993, Hagoort, Brown & Osterhout 1999) zu interpretieren ist oder aber mit der Belastung des Arbeitsgedächtnisses korreliert (vgl. z.B. Kutas & Kluender 1994, King & Kutas 1995, Coulson, King & Kutas 1998, Hagoort, Brown & Osterhout 1999). Wichtig für die vorliegende Fragestellung ist jedoch allein, dass Prozesse, die mit der Verarbeitung regulärer und irregulärer Flexion korreliert sind, konsistent mit qualitativ verschiedenen EKP-Komponenten assoziiert sind. Durch einen unitären Mechanismus wie den von Rumelhart & McClelland (1986), der eine einheitliche Vollformspeicherung regulär und irregulär flektierter Formen annimmt, ist das Auftreten solcher qualitativ verschiedenen Effekte unter der Annahme der Invarianz-Hypothese nicht erklärbar.10 Weitere EKP-Studien: Mittlerweile ist eine Reihe weiterer EKP-Studien mit dem Ziel durchgeführt worden, die für das Deutsche beobachteten Effekte in anderen Sprachen zu replizieren. Newman et al. (1999, siehe auch Ullman 1999b) präsentierten in einem past tense Kontext korrekte reguläre und irreguläre englische past tense Formen sowie inkorrekte unmarkierte Verben (*Yesterday, I slip on ice / *Yesterday, I sleep in bed.). Dabei zeigte sich im Vergleich korrekter und unmarkierter inkorrekter regulärer Verben (slipped / *slip) eine LAN, im Vergleich korrekter und unmarkierter irregulärer Verben (slept / *sleep) dagegen eine Negativierung mit eher zentraler Verteilung. Dieser Befund ist mit unseren Studien zum Deutschen allerdings nicht vergleichbar, da im Unterschied zu unseren Experimenten keine morphologisch inkorrekten Formen präsentiert wurden. Die präsentierten unmarkierten Formen waren morphologisch korrekt. Die Ungrammatikalität ergab sich erst durch eine syntaktische Inkompatibilität zwischen past tense Kontext und fehlender Realisierung der [+ PAST] Merkmalsspezifikation im Satzkontext. EKP-Untersuchungen wurden auch in zwei romanischen Sprachen – Italienisch (Gross et al. 1998) und Katalanisch (Rodriguez-Fornells et al. 2001) – durchgeführt. In der Untersuchung zum Italienischen zeigte sich, vergleichbar zu den Ergebnissen im Deutschen, eine LAN für Übergeneralisierungen des Partizipaffixes -t auf Verben mit irregulärer Partizipform (z.B. *prendato statt preso). In der Untersuchung zum ähnlichen katalanischen Parti–––––––—––
10
-n und z.B. dem Infinitivsuffix -n. Formen wie getanzen könnten demnach von den Probanden als inkorrekte Präfix-Infinitivkombinationen (ge+tanzen) analysiert worden sein. Da diese Kombination in zwei Elemente separierbar ist, die beide Einträge im mentalen Lexikon haben, tritt ein Kunstworteffekt nicht auf. Natürlich ist die Frage, ob die Invarianz-Hypothese zutrifft, eine Frage, die der empirischen Überprüfung unterzogen werden muss. Für den jetzigen Stand der Forschung kann laut Rugg (1999) jedoch gelten: „In fact, there is little reason at present to believe that cognitive functions are instantiated in the brain in multiple ways, and thus no reason at the moment to question the invariance assumption.“ (ebd.: 29-30).
99 zipsystem konnte dieser Effekt jedoch nicht repliziert werden. Übergeneralisierungen des Partizipaffixes -t auf Verben mit irregulären Partizipformen (z.B. *admetat statt admès) korrelierten anders als im Italienischen nicht mit einer LAN. Bei der Bewertung der in diesen drei Studien erzielten uneinheitlichen und teilweise zu unseren Studien abweichenden Resultate ist zu berücksichtigen, dass das Stimulusmaterial nicht so kontrolliert werden konnte wie in unseren Studien zum Deutschen. In den Experimenten zur deutschen Partizip- und Pluralflexion testeten wir Formen, die keine Stammänderungen in Partizip- oder Pluralform aufwiesen und bei denen auch irreguläre Formen eine separierbare Endung hatten. So konnten wir minimal kontrastierende Formen (z.B. Muskeln - Muskels, getanzt - getanzen) miteinander vergleichen. Da es jedoch weder im Englischen noch im Katalanischen oder Italienischen separierbare Endungen für irregulär flektierte Formen gibt, sondern diese durch Stammänderungen markiert werden, unterscheiden sich in diesen Sprachen die verglichenen korrekten und inkorrekten übergeneralisierten Formen – schon allein in der Wortlänge – erheblich (vgl. *prendato statt preso, *admetat statt admès). EKP-Effekte, die mit Irregularisierungen assoziiert sind, konnten wegen fehlender irregulärer Endungen zudem gar nicht untersucht werden. Aus diesen Gründen können die Resultate der genannten Studien nicht als Evidenz gegen die im Deutschen beobachteten EKP-Ergebnisse gewertet werden, die sich in unterschiedlichen Experimentdesigns (Satzkontext, Wortliste, Einbettung in Geschichte) und bei unterschiedlichen Phänomenen (Partizip- und Pluralflexion) bewährt haben. PET- und fMRT-Studien: Auch Untersuchungen mit den bildgebenden Verfahren der PET und der fMRT haben ergeben, dass regulär und irregulär flektierte Formen mit qualitativ distinkten neuronalen Aktivierungen korreliert sind, und lassen daher den Schluss zu, dass reguläre und irreguläre Flexion auf verschiedenartigen Mechanismen basieren.11 Jaeger et al. waren 1996 die Ersten, die die PET zur Lokalisation regulärer und irregulärer Flexionskomponenten im Gehirn einsetzten. Sie registrierten bei neun englischsprachigen Probanden die neuronalen Aktivierungen, die mit dem Lesen bzw. der Produktion regulärer und irregulärer past tense Formen korrelierten. Tatsächlich fanden Jaeger et al. bei der Auswertung und dem Vergleich der Aktivierungen, die mit der Produktion regulärer und irregulärer past tense Formen assoziiert waren: „There are major differences in both the location and the amount of brain activation in the regular versus irregular tasks [...].“ (ebd.: 484)
Während bei der Produktion regulärer past tense Formen eine links frontale Aktivierung auftrat, beobachteten sie bei der Produktion irregulärer past tense Formen eine mehr posteriore Aktivierung im linken Temporallappen. Das Vorliegen distinkter neuronaler Aktivierungen bei der Produktion regulär und irregulär flektierter Formen werteten Jaeger et al. als Evidenz für eine dualistische Repräsentation der Flexion und unterschieden eine im Fron –––––––—–– 11
Eine genauere Beschreibung der Methodik und der Ergebnisse der hier vorgestellten Studien sowie eine vergleichende Diskussion findet sich in Kapitel 6 (Abschnitte 6.2 und 6.3.1), das sich mit der neuroanatomischen Lokalisation insbesondere der regulären Flexion befasst.
100 talhirn gelegene Regelkomponente von im Temporallappen gespeicherten irregulären Formen (ebd.: 488-489). Die links frontale Lokalisation regulärer Flexionsprozesse bestätigte sich in einer PETStudie von Laine et al. (1999) zur finnischen Kasusflexion. Ein Vergleich der Hirnaktivierungen, die mit der Verarbeitung monomorphemischer bzw. kasusflektierter Nomina korreliert waren, ergab einen Durchblutungsanstieg in links frontalen Arealen, den Laine et al. auf die Verarbeitung der regulären Kasusflexion zurückführen. Drei weitere bildgebende Studien erbrachten dagegen keine Evidenz für eine frontale Lokalisation der regulären Flexion und eine temporale Lokalisation irregulär flektierter Formen. Ullman, Bergida & O‘Craven (1997) fanden in einer fMRT-Studie zur Produktion regulärer und irregulärer past tense Formen des Englischen für die Produktion irregulärer past tense Formen eine stärkere Aktivierung in frontalen Kortexarealen und einen Aktivierungsrückgang in temporalen und temporo-parietalen Arealen. Bei der Produktion regulärer past tense Formen zeigte sich dagegen eine Aktivierung temporaler Regionen, während es im linken Frontalkortex zu einem Aktivierungsrückgang kam. Beretta et al. (2003) beobachteten in ihrer Studie zur Produktion regulär bzw. irregulär flektierter deutscher Partizipien und Nominalplurale zwar einen signifikant höheren und beidhemisphärisch lokalisierten Aktivitätsanstieg bei der Produktion irregulär flektierter Formen im Vergleich zu regulär flektierten Formen, es fanden sich jedoch keine Hirnareale, deren Aktivitätsanstieg allein mit der Produktion regulär bzw. allein mit der Produktion irregulär flektierter Formen korrelierte.12 Zwar führte die Produktion flektierter Formen zu einem Aktivitätsanstieg im linkshemisphärischen Broca-Areal, dieser war aber – entgegen den Befunden von Jaeger et al. – für irreguläre Formen signifikant stärker als für reguläre. Sach, Seitz & Indefrey (2004) konnten in ihrer PET-Studie zur Produktion regulärer und irregulärer Präterita und Partizipien des Deutschen bei einem direkten Vergleich des Durchblutungsanstiegs, der mit der Produktion regulär bzw. irregulär flektierter Verben verbunden war, keine signifikanten Unterschiede feststellen.13 Signifikant distinkte Aktivierungsmuster zeigten sich allerdings, als sie die Aktivierungsmuster bei der Produktion regulär bzw. irregulär flektierter Verben mit den Aktivierungsmustern der baseline-Bedingung verglichen, in der die entsprechenden flektierten Verben vorgegeben waren und nur gelesen werden mussten. Bei diesen Vergleichen war die Produktion regulär flektierter Verben mit einem signifikanten Durchblutungsanstieg in rechtshemisphärischen Hirnstrukturen korreliert (Basalganglien und Thalamus), während die Produktion irregulär flektierter Formen mit einem Durchblutungsanstieg in Kleinhirnbereichen einherging. Bei allen Unterschieden hinsichtlich der Hirnareale, die in den aufgeführten Studien für die Produktion regulär bzw. irregulär flektierter Formen verantwortlich gehalten werden, ist für die Frage, ob reguläre und irreguläre Flexion qualitativ unterschiedlich zu repräsentie–––––––—–– 12 13
Als regulärer Plural wurde der -s-Plural gewertet, als irregulärer Plural der -er-Plural. Ein vorläufiger Bericht dieser Studie wurde von Indefrey et al. (1997) publiziert. Indefrey et al. berichten, dass die Produktion regulär flektierter Formen mit einem Durchblutungsanstieg im Gyrus angularis, einem posterior im Parietallappen gelegenen Areal, einherging, die Produktion irregulärer Formen dagegen – unter anderem – mit einem Durchblutungsanstieg in frontalen Arealen der linken und rechten Hemisphäre. Diese Unterschiede erwiesen sich bei der rigideren statistischen Auswertung, wie sie in Sach, Seitz & Indefrey (2004) gewählt wurde, jedoch nicht mehr als signifikant.
101 ren sind, in erster Linie ausschlaggebend, ob distinkte Hirnaktivierungen mit der Produktion regulär und irregulär flektierter Formen assoziiert sind. Solche distinkten Aktivierungsmuster wurden in allen zur Zeit vorliegenden Studien beobachtet. Die differierenden Befunde der besprochenen Studien beruhen wesentlich auf Unterschieden im experimentellen Vorgehen, im Stimulusmaterial und in der Datenauswertung. So wurden z.B. jeweils unterschiedliche Aufgaben zur Ermittlung der mit der Produktion regulär und irregulär flektierter Formen korrelierten Durchblutungsänderungen herangezogen. Während Sach, Seitz & Indefrey sowie Beretta et al. direkt die Aktivierungen bei der Produktion regulärer und irregulärer Formen verglichen, kontrastierten Jaeger et al. und Ullman, Bergida & O‘Craven die Produktionsaufgabe mit einer Leseaufgabe bzw. mit einer einfachen Fixationsbedingung. Zudem verglichen Jaeger et al. die Aktivierungen bei der Produktion regulärer und irregulärer past tense Formen mit einer Leseliste, die sowohl irreguläre als auch reguläre Verben in einem unausgewogenen Zahlenverhältnis (14 irreguläre, 32 reguläre) enthielt. Ferner wurde das Stimulusmaterial – mit Ausnahme der Studie von Beretta et al. – in Blöcken präsentiert, die jeweils nur irreguläre bzw. nur reguläre Verben enthielten. Aufgrund der unterschiedlichen Stammänderungen erfordert die Produktion einer Liste von irregulären Formen jedoch einen größeren Verarbeitungsaufwand als die Produktion einer Liste regulär flektierter Formen. Schließlich verdeutlicht auch der Unterschied in den Ergebnissen der Studie von Sach, Seitz & Indefrey mit der Erstpublikation dieser Studie in Indefrey et al. (1997) (s. Fußnote 13), welche Bedeutung einer sorgfältigen und rigiden Datenauswertung zukommt. Noch sind PET und fMRT junge Methoden, für die sich allgemein akzeptierte Vorgehensweisen und Auswertungsverfahren erst etablieren. Letztendlich wird daher erst in weiteren Studien zu klären sein, ob sich distinkte Aktivierungsmuster für regulär und irregulär flektierte Formen konsistent beobachten lassen, und wenn ja, welche Hirnareale mit der Produktion regulär bzw. irregulär flektierter Formen befasst sind. Insgesamt kann als Ergebnis der EKP-, PET- und fMRT-Studien zur Flexion festgehalten werden, dass die Verarbeitung und Produktion regulär und irregulär flektierter Formen mit distinkten neuronalen Aktivierungen korreliert ist. Unter Annahme der Invarianz-Hypothese bieten die beobachteten neuronalen Distinktionen Evidenz für die Annahme, dass regulär und irregulär flektierte Formen auch mental distinkt zu repräsentieren sind. 4.1.6 Regulär und irregulär flektierte Formen sind selektiv störbar Schließlich wird als Argument für eine distinkte Repräsentation regulärer und irregulärer Flexion im mentalen Lexikon auch angeführt, dass Sprachstörungen selektiv nur regulär bzw. nur irregulär flektierte Formen beeinträchtigen können. Das Vorliegen solcher dissoziierter Störungen wird in der Neurolinguistik allgemein als Evidenz für zwei mental unterschiedlich zu repräsentierende kognitive Funktionen oder Module gesehen (vgl. Kap. 2.3). Dementsprechend werden selektive Beeinträchtigungen der regulären oder irregulären Flexion als Evidenz gegen konnektionistische Ansätze wie den von Rumelhart & McClelland (1986) gesehen, die von einer unitären Repräsentation regulär und irregulär flektierter Formen ausgehen. Tatsächlich sind solche selektiven Sprachstörungen in den letzten Jahren bei einer Reihe von neurologischen Erkrankungen festgestellt und detailliert beschrieben worden.
102 4.1.6.1 Selektive Beeinträchtigungen der regulären Flexion Über selektive Beeinträchtigungen der regulären Flexion wird bislang vor allem bei BrocaAphasie, bei Morbus Parkinson sowie bei den Entwicklungsstörungen Specific Language Impairment (SLI, im Deutschen auch als Dysgrammatismus bezeichnet) und Down Syndrom berichtet. Broca-Aphasie: Für keine der genannten Störungen wird die Frage, ob sie mit selektiven Beeinträchtigungen der regulären Flexion einhergehen, zur Zeit wohl so kontrovers diskutiert wie für die Broca-Aphasie. Auf der Basis eines Produktionsexperimentes, einer Leseaufgabe und eines Beurteilungstests, die sie mit englischsprachigen Broca-Aphasikern durchführten, postulierten Ullman et al. (1997, 2005) eine stärkere Beeinträchtigung der regulären englischen past tense Flexion im Vergleich zu irregulären Formen. Auch Marslen-Wislon & Tyler (1997, 1998), Tyler et al. (2002) sowie Longworth et al. (2005a) fanden in auditiven primingExperimenten bei agrammatischen Broca-Aphasikern im Vergleich zu unbeeinträchtigten Kontrollpersonen keinen priming-Effekt für regulär flektierte englische past tense Formen und belegten so, dass selektive Beeinträchtigungen der regulären Flexion nicht nur in der Sprachproduktion, sondern auch im Sprachverstehen auftreten können. Die Aussagekraft – insbesondere der Daten von Ullman et al. – wird jedoch von verschiedenen Seiten kritisiert. Die Kritik richtet sich zum einen gegen die Annahme, bei Broca-Aphasie wäre selektiv allein die reguläre Flexion, nicht aber die irreguläre Flexion beeinträchtigt. Nach Ansicht der Kritiker ist die selektive Beeinträchtigung der regulären Flexion, die in den o.g. Studien beobachtet wurde, ein Artefakt der unterschiedlichen phonologischen Komplexität regulär und irregulär flektierter englischer past tense Formen. Reguläre past tense Formen des Englischen seien beispielsweise aufgrund der durch die Affigierung entstehenden wortfinalen Konsonantencluster phonologisch komplexer als irregulär flektierte Formen (vgl. walk – walked, aber run - ran) (vgl. z.B. Stemberger 1994, Burzio 2002). Da bei Broca-Aphasie üblicherweise phonologische Beeinträchtigungen vorlägen, dürfe eine größere Beeinträchtigung regulär flektierter Formen nicht wundern (Bird et al. 2003, Faroqi-Shah & Thompson 2003, Lambon Ralph et al. 2005). Dementsprechend haben Bird et al. (2003) versucht zu zeigen, dass sich bei sorgfältiger Kontrolle der phonologischen Komplexität des Experimentmaterials keine selektive Beeinträchtigung der regulären Flexion mehr feststellen lässt. Ein weiterer Kritikpunkt richtet sich gegen die von Ullman, Tyler und Kollegen postulierte Universalität des regulären Flexionsdefizits bei Broca-Aphasie. Eine Reihe von Studien hat belegt, dass eine selektive Beeinträchtigung der regulären Flexion kein universell, sprachunabhängig gültiges Charakteristikum der Broca-Aphasie ist. So fanden sich beispielsweise bei der regulären Partizipflexion des Deutschen (Penke, Janssen & Krause 1999), des Niederländischen (Penke & Westermann 2006) und des Schwedischen (Ahlsén 1994) sowie bei der regulären Präteritumflexion des Spanischen und Katalanischen (de Diego Balaguer et al. 2004) keine selektiven Defizite der regulären Flexion (s. auch Kap. 6.3.2). Ob es zu selektiven Defiziten der regulären Flexion bei Broca-Aphasie kommt,
103 könnte folglich sowohl sprachspezifisch als auch von systemspezifischen Eigenschaften verschiedener Flexionssysteme abhängig sein (vgl. Kap. 6.4). Ein Flexionssystem, in dem selektive Defizite der regulären Flexion nach vorliegender Datenlage regelmäßig zu beobachten sind, ist die deutsche Pluralflexion. Cholewa & de Bleser (1995) berichten von einem Elizitationsexperiment zur deutschen Pluralflexion, bei dem sich für zwei der insgesamt vier getesteten agrammatischen Broca-Aphasiker eine selektive Beeinträchtigung der regelmäßigen Pluralflexion fand. Als regelmäßig werteten sie in ihrer Untersuchung alle die Pluralformen, die „[…] regelmäßig aus der phonologischen Form des Nomens vorhersagbar […]“ (ebd.: 272) sind. Nähere Angaben, welche Pluralflexive in diese Gruppe fallen, fehlen jedoch leider. In einem Elizitationsexperiment zur deutschen Pluralflexion konnten wir bestätigen, dass der reguläre -s-Plural bei deutschsprachigen Agrammatikern selektiv beeinträchtigt sein kann. Die Aufgabe der getesteten neun agrammatischen Broca-Aphasiker war es, zu vorgegebenen Singularformen die entsprechende Pluralform zu produzieren (siehe (6)). Pro Versuchsperson elizitierten wir jeweils 20 Pluralformen mit den Markierungen -s, -e, und -er sowie 40 Pluralformen auf -n (Penke & Krause 1999, 2002). (6)
Eine über die Fehlerraten gerechnete einfaktorielle Varianzanalyse (mit Messwiederholungen) ergab einen signifikanten Unterschied zwischen den Fehlerraten der einzelnen Pluralformen (F(3, 8) = 9.078, p = .012). Im Vergleich zu Pluralformen auf -e (Fehlerrate 36,4%), -er (Fehlerrate 25,1%) und -n (Fehlerrate 32,1%), die sich nicht signifikant voneinander unterschieden, waren die Fehlerraten für Pluralformen auf -s deutlich höher (Fehlerrate 62,4%).14 Ein Vergleich der Fehlerraten für -s-Plurale mit den Fehlerraten für die anderen Pluralformen ergab für alle neun Versuchspersonen signifikante Unterschiede (χ2, p < .05 pro Versuchsperson) (vgl. Abb. 4.5). Für acht der neun untersuchten Versuchspersonen waren -s-Plurale signifikant stärker beeinträchtigt als die anderen Pluralformen. Versuchsperson A.H. zeigte dagegen das umgekehrte Bild. Nicht nur waren die Pluralformen auf -s unbeeinträchtigt. Sie übergeneralisierte den -s-Plural auch fehlerhaft auf andere Nomina, was zu signifikant höheren Fehlerraten im Vergleich zum -s-Plural führte.15 Insgesamt –––––––—–– 14
Im Einzelnen ergaben posthoc Vergleiche der Fehlerraten mit dem (gepaarten) T-Test die folgenden Ergebnisse: - -s-Plurale versus -n-Plurale: p = .018; versus -er-Plurale: p = .002; versus -e-Plurale: p = .094;
- -n-Plurale versus -e-Plurale: p = .722; versus -er-Plurale: p = .507, - -e-Plurale versus -er-Plurale: p = .224. 15
Wir haben zum jetzigen Zeitpunkt keinen Hinweis darauf, warum sich Versuchsperson A.H. in Hinsicht auf den -s-Plural anders verhält als die anderen getesteten agrammatischen Versuchspersonen. Nach unseren Informationen unterscheidet sich A.H. weder hinsichtlich der neurologischen Schädigung noch im klinischen Erscheinungsbild der aphasischen Störung auffällig von den anderen Broca-Aphasikern. In allen anderen Eliziationsexperimenten, die wir mit dieser Probandengruppe durchführten, verhielt sich A.H. zudem konform zu den anderen Versuchspersonen.
104 ergeben die Fehlerraten von A.H. und den anderen untersuchten Aphasikern eine doppelte Dissoziation zwischen beeinträchtigten und erhaltenen Pluralmarkierungen.
Abb. 4.5: Fehlerraten für -s-Plurale im Vergleich zu anderen Nominalpluralen
Die selektive Beeinträchtigung des -s-Plurals, die hier bei acht der neun untersuchten Aphasiker vorliegt, wird ferner durch die Ergebnisse einer Pilotstudie bestätigt, die mit sechs agrammatischen Broca-Aphasikern durchgeführt wurde.16 Beeinträchtigungen des -s-Plurals fanden sich dort bei jeder der untersuchten Versuchspersonen (Penke 1998). Auch Mugdan (1977) berichtet von Beeinträchtigungen des -s-Plurals bei deutschsprachigen Broca-Aphasikern. Die Elizitation von Pluralformen für Kunstwörter, für die Mugdan einen -s-Plural erwartete, ergab einen klaren Unterschied zwischen Aphasikern und Kontrollpersonen: Während die Kontrollpersonen in 55% der Fälle – wie erwartet – den -s-Plural bildeten, antwortete nur einer der sieben getesteten Broca-Aphasiker mit einem -s-Plural (= 7% der Fälle). In 71% der Fälle reagierten die Aphasiker dagegen mit einem Nullplural. Auch wenn selektive Defizite der regulären Flexion kein sprach- und flexionssystemunabhängiges Kennzeichen der Broca-Aphasie sind und sich nicht bei jedem Individuum manifestieren, so lassen sie sich doch in bestimmten Flexionssystemen wie der englischen past tense Flexion und der deutschen Pluralflexion regelmäßig beobachten. –––––––—–– 16
Drei der Testpersonen der Pilotstudie (G.B., P.B. und W.W.) nahmen drei Jahre später auch am oben beschriebenen Pluraleliziationsexperiment teil.
105 Morbus Parkinson: Eine selektive Beeinträchtigung der regulären past tense Flexion postulieren Ullman et al. (1997) auch für Patienten mit Morbus Parkinson, einer degenerativen Hirnerkrankung tiefer gelegener Kernkomplexe, der Basalganglien, die in erster Linie zu Beeinträchtigungen der Motorik führt. Allerdings sind die von Ullman et al. für ihre fünf englischsprachigen Patienten vorgelegten Zahlen aufgrund der recht geringen Unterschiede in den Fehlerraten für reguläre und irreguläre Formen nicht völlig überzeugend. So wurden bei insgesamt 85% der regulären Verben past tense Formen mit der Endung -ed gebildet. Der Unterschied zu 88% korrekt produzierter irregulärer past tense Formen erscheint da wenig reliabel. Zudem wurde bei insgesamt 92% der ebenfalls getesteten Kunstverben das past tense mit der regulären Endung -ed gebildet. Die hohen Korrektheitswerte für reguläre Verben und die Fähigkeit, -ed produktiv zur Bildung neuer Formen einzusetzen, sprechen jedoch meiner Ansicht nach gegen ein Defizit im Bereich der regulären Flexion bei Morbus Parkinson. Tatsächlich konnte in weiteren Untersuchungen an englischsprachigen Patienten mit Morbus Parkinson kein Defizit der regulären past tense Flexion festgestellt werden (Almor et al. 2002, Longworth et al. 2005b). Auch unsere eigenen Arbeiten zur Flexion bei deutschsprachigen Patienten sprechen gegen eine selektive Beeinträchtigung der regulären Flexion bei Sprechern mit Morbus Parkinson (vgl. Penke et al. 2005). Wir elizitierten reguläre und irreguläre Partizipien und Nominalplurale bei zehn Patienten mit Morbus Parkinson. Das Experimentmaterial stammte aus unseren Untersuchungen bei Broca-Aphasikern, die bereits vorgestellt wurden (s. S. 60 und 103). Wie aus Abbildung 4.6 ersichtlich ist, ergaben sich keine Belege für ein selektives Defizit der regulären Flexion bei deutschen Sprechern mit Morbus Parkinson.17 Vielmehr erzielten die Patienten im Allgemeinen hohe Korrektheitswerte für regulär flektierte Partizipien und -s-Plurale. Lediglich 2,6% der regulären Partizipien und 4,6% der -s-Plurale wurden nicht korrekt produziert. Im Gegensatz zu den Daten von Ullman et al. (1997) lagen die Fehlerraten für reguläre Formen unter den Fehlerraten, die für irreguläre Partizipien (6,6%) bzw. irreguläre Nominalplurale auf -er und -n (10,2%) erzielt wurden (Vergleich reguläre-irreguläre Partizipien: Wilcoxon, p = .011, Vergleich reguläre-irreguläre Plurale: Wilcoxon, p = .11).18 Zudem übergeneralisierten die getesteten Patienten die Partizipendung -t und das Pluralaffix -s auf irreguläre Verben und Nomina (z.B. *gehebt, *Nachbars). 76% der 25 Fehler bei irregulären Partizipien und 19,5% der 41 Fehler bei irregulären Pluralen waren Übergeneralisierungen. Diese Fehler belegen, dass die Probanden produktiven Gebrauch von der regulären Flexion machen konnten. Resümieren lässt sich, dass selektive Beeinträchtigungen der regulären Flexion nach der zur Zeit vorliegenden Datenlage wohl kein Charakteristikum von Morbus Parkinson sind.
–––––––—–– 17 18
Der Unterschied zwischen regulären -s-Pluralen und irregulären -er und -n-Pluralen, der sich bei Patient F.O. zeigt, ist nicht signifikant (χ2, p > .05). Bei den getesteten -n-Pluralen handelt es sich um 20 Maskulina bzw. Neutra, deren Singularfom nicht auf Schwa endet (z.B. Muskel – Muskeln). Diese werden allgemein als irregulär angesehen (vgl. Kap. 1.3).
106
Abb. 4.6: Fehlerraten für reguläre und irreguläre Partizipien und Nominalplurale bei zehn deutschsprachigen Patienten mit Morbus Parkinson
Specific Language Impairment (SLI): Gut dokumentiert ist dagegen das Vorliegen einer selektiven Beeinträchtigung der regulären past tense und Pluralflexion bei englischsprachigen Kindern und Erwachsenen mit SLI. Unter diese relativ heterogene Kategorie fallen Sprachentwicklungsstörungen, die keine offensichtliche kognitive, soziale oder neurologische Ursache haben. Die betroffenen Kinder sind von normaler Intelligenz, zeigen keine Verhaltensstörungen oder emotionalen Auffälligkeiten und haben keine offensichtliche Hirnschädigung. Im englischsprachigen Raum gelten Beeinträchtigungen der Flexionsmorphologie als das Kernsymptom von SLI (für einen Überblick über die Literatur siehe z.B. Levy & Kavé 1999). In einer Reihe von Untersuchungen mit englischsprachigen SLI-Sprechern wurde beobachtet, dass die im normalen Spracherwerb üblichen Übergeneralisierungen regulärer Affixe fehlen, Frequenzeffekte auch für reguläre Formen auftreten und sich Probleme im Umgang mit Kunstverben zeigen, die normalerweise regulär flektiert werden (siehe z.B. Gopnik & Crago 1991, Gopnik 1994, Ullman & Gopnik 1999, van der Lely & Ullman 2001). Als möglicher Erklärungsansatz für diese Beobachtungen wird diskutiert, dass für SLI-Sprecher sowohl regulär als auch irregulär flektierte Formen als Vollformen gespeichert sein könnten. Auch in anderen Sprachen liegen Hinweise auf eine selektive Beeinträchtigung regulärer Flexionspro-
107 zesse bei SLI vor (vgl. z.B. Kehayia 1997 zum Griechischen und Französischen oder Royle, Jarema & Kehayia 1999 zum Französischen). Down Syndrom: Laws & Bishop (2003) berichten von einer selektiven Beeinträchtigung der regulären past tense Flexion bei englischsprachigen Jugendlichen mit Down Syndrom. Down Syndrom ist eine genetisch bedingte Entwicklungsstörung, die durch das Vorliegen einer zusätzlichen, dritten Kopie des Chromosoms 21 (Trisomie 21) verursacht ist (s. z.B. Chapman & Hesketh 2000). Neben einer allgemeinen geistigen Behinderung sind Defizite im Bereich der Morphosyntax – insbesondere Auslassungen gebundener und freier grammatischer Morpheme – ein Kennzeichen der Sprachproduktion von Menschen mit Down-Syndrom (vgl. Kernan & Sabsay 1996, Eadie et al. 2002, Laws & Bishop 2003, Schaner-Wolles 2004). In einem Elizitationsexperiment zu regulär und irregulär flektierten englischen past tense Formen beobachteten Laws & Bishop (2003), dass die von ihnen untersuchten 14 Kinder bzw. Jugendlichen mit Down Syndrom signifikant niedrigere Korrektheitswerte bei der Produktion regulärer past tense Formen erzielten (29,2%) als die elf Kontrollkinder vergleichbaren mentalen Alters (69,4%). Für irregulär flektierte past tense Formen unterschieden sich die Korrektheitswerte der beiden Probandengruppen dagegen nicht signifikant (Down Syndrom Probanden: 21,4%, Kontrollkinder: 40,9%). Ein Hinweis auf ein selektives Problem im Bereich der regulären Flexion ist auch, dass Übergeneralisierungsfehler, in denen eine regularisierte past tense Form für ein irreguläres Verb produziert wurde, in den Daten der Down Syndrom Probanden äußerst selten auftraten. Während 36% der Fehler, die den Kontrollkindern bei der Produktion irregulärer past tense Formen unterliefen, solche Übergeneralisierungen waren, machten Übergeneralisierungen nur 9% der Fehler der Down Syndrom Probanden aus. Es gibt jedoch auch Befunde, die gegen das Vorliegen einer selektiven Beeinträchtigung der regulären Flexion bei Down Syndrom sprechen. So erzielten die Down Syndrom Probanden von Laws & Bishop nicht nur bei der regulären, sondern auch bei der irregulären past tense Flexion sehr niedrige Korrektheitswerte (regulär: 29,2%, irregulär 21,4%), die sich nicht signifikant voneinander unterschieden. In einer Auswertung der Spontansprachdaten etwas jüngerer Kinder mit Down Syndrom fanden sich außerdem keine Belege für ein generelles Defizit im Bereich der regulären Flexion (Eadie et al. 2002). Die zehn von Eadie et al. untersuchten Down Syndrom Kinder erzielten beispielsweise für regulär flektierte englische Pluralformen Korrektheitswerte von über 90% und unterschieden sich damit nicht signifikant von den ebenfalls untersuchten Kontrollkindern. Ob selektive Defizite der regulären Flexion tatsächlich ein Charakteristikum der sprachlichen Beeinträchtigungen bei Down Syndrom sind, wird daher in weiteren Untersuchungen zu prüfen sein. 4.1.6.2 Selektive Beeinträchtigungen der irregulären Flexion Auch irregulär flektierte Formen können durch Sprachstörungen selektiv betroffen sein, während die reguläre Flexion ungestört bzw. signifikant besser erhalten ist: - Über eine selektive Beeinträchtigung ‚unregelmäßiger‘, d.h. nicht aus der phonologi-
108 schen Form des Nomens vorhersagbarer Pluralformen des Deutschen berichten Cholewa & de Bleser (1995) bei einer Aphasikerin (J.W.), die aufgrund einer degenerativen progredienten Demenz an einer agrammatischen Sprachstörung litt. - Ullman et al. (2005) diagnostizierten eine im Vergleich zu regulären Formen stärkere Beeinträchtigung irregulär flektierter englischer past tense Formen bei Aphasikern mit posterior gelegenen Hirnschädigungen, die bei flüssiger Sprachproduktion an Wortfindungsstörungen litten. - Ein selektives Defizit der irregulären past tense Flexion des Englischen fanden Ullman et al. (1997) bei einer Gruppe von fünf Patienten, die an Morbus Alzheimer litten, einer Erkrankung, die durch Ablagerungen so genannter Plaques zur Degeneration der Hirnrinde (insbesondere im Temporallappen) und zur Demenz führt. - Bei einer Gruppe von acht englischsprachigen Patienten mit semantischer Demenz, einer progressiven neurodegenerativen Erkrankung, die zu einer Atrophie insbesondere des Temporallappens führt und mit ausgeprägten Störungen in Wortfindung und Sprachverständnis einhergeht (vgl. z.B. Hodges et al. 1992, Mummery et al. 2000, Patterson & Hodges 2000), stellten Patterson et al. (2001) in einem Elizitationsexperiment eine selektive Beeinträchtigung der Produktion irregulärer past tense Formen fest. In einem ähnlichen Fall zeigte sich bei dem von Marslen-Wilson & Tyler (1998) beschriebenen englischsprachigen Patienten ES in einem auditiven priming-Experiment im Gegensatz zur unbeeinträchtigten Kontrollgruppe weder ein semantischer primingEffekt noch ein priming-Effekt für irregulär flektierte past tense Formen. - Tyler et al. (2002) berichten für vier Patienten, die durch eine Herpes Simplex Enzephalitis Schädigungen des Temporallappens der linken Hemisphäre erlitten hatten, von einer selektiven Beeinträchtigung der Produktion irregulärer englischer past tense Formen. Im Mittel konnten die untersuchten Patienten zwar 92% der regulären, aber nur 65% der elizitierten irregulären Formen korrekt produzieren. Ein ähnlicher Fall wird von Laiacona & Caramazza (2004) bei einem italienischen Patienten beschrieben. Während ihrem Patienten EA die Produktion regulär flektierter italienischer Pluralnomina (camera - camere ‚Zimmer’) in 99% der Fälle gelang, lagen seine Korrektheitswerte bei der Produktion irregulär flektierter Pluralnomina (pirata - pirati ‚Pirat’) nur bei 76%. Gemeinsam ist all diesen Patienten das Vorliegen von semantischen Defiziten bzw. Wortfindungsschwierigkeiten, die mit Läsionen insbesondere des Temporallappens einhergehen. Dass diese Störungen zu einer selektiven Beeinträchtigung irregulär flektierter Formen führen, stimmt mit der Annahme überein, dass irregulär – aber nicht regulär – flektierte Formen als Vollformen im mentalen Lexikon gespeichert und daher wie andere lexikalische Einträge auch von Wortfindungsstörungen bzw. semantischen Defiziten betroffen sind. Broca-Aphasie: Auch bei Broca-Aphasikern kann es zu selektiven Defiziten irregulär flektierter Formen kommen. Dies konnten wir bei deutschen und niederländischen Broca-Aphasikern nachweisen (vgl. Penke, Janssen & Krause 1999, Penke & Westermann 2006). In einem hier bereits vorgestellten Experiment (vgl. S. 60) elizitierten wir bei elf deutschsprachigen agrammatischen Broca-Aphasikern Partizipformen für 39 reguläre und 39 starke Verben, die hinsichtlich ihrer Lemma- und Partizipformfrequenzen vergleichbar
109 waren, sowie auch Partizipformen für fünf Kunstverben. Ein Vergleich der Fehlerraten für reguläre und starke Verben ergab für acht der elf untersuchten Aphasiker (M.T. bis A.H., vgl. Abb. 4.7) klare Unterschiede in den Fehlerzahlen. Anders als bei den in Abschnitt 4.1.6.1 genannten Studien zur Broca-Aphasie hatten diese acht Aphasiker jedoch Probleme mit irregulären Partizipien (mittlere Fehlerrate 34,5%), während die reguläre Flexion gar nicht oder nur minimal beeinträchtigt war (mittlere Fehlerrate 3,7%).
Abb. 4.7: Fehlerraten bei der Produktion regulärer und irregulärer Partizipien (nach Penke, Janssen & Krause 1999)
Für alle acht Aphasiker war der häufigste Fehlertyp bei starken Verben die Übergeneralisierung des regulären Partizipflexivs -t. Zudem setzten diese acht Aphasiker das reguläre Affix -t produktiv zur Bildung von Partizipformen für Kunstverben ein (für eine Diskussion der Unterschiede zwischen deutschen und englischsprachigen Broca-Aphasikern siehe Kapitel 6.3.2). Diese Daten belegen, dass bei Broca-Aphasikern die irreguläre Flexion selektiv beeinträchtigt sein kann, während die reguläre Flexion intakt bzw. signifikant besser erhalten ist und produktiv zur Bildung von Partizipformen eingesetzt werden kann. Ein Beleg dafür, dass es sich bei der stärkeren Beeinträchtigung irregulärer Partizipien um ein charakteristisches Phänomen deutschsprachiger Broca-Aphasiker handeln könnte, findet sich auch in der klassischen Aphasieliteratur. So stellte bereits Kussmaul in seiner auf das Jahr 1877 datierenden Agrammatismusdefinition fest, dass Agrammatiker die „[…] schwache Beugung der starken […]“ vorzögen (ebd.: 196). Und auch Kerschensteiner et al. (1978) konstatieren in ihrer Beschreibung der Broca-Aphasie: „Produktive Regeln, d.h. solche, die im Sprachsystem genereller verwendet werden, sind besser erhalten als solche, die nur für wenige Formen gelten.“ (ebd.: 238). Vergleichbare Daten liegen auch aus anderen Sprachen vor. In einem Elizitationsexperiment, das wir zur niederländischen Partizipflexion durchführten, erzielten die getesteten zwölf Broca-Aphasiker bei der Produktion regulär flektierter Partizipformen (z.B. open- - geopend ‚öffnen’, oder blaf- - geblaft ‚bellen’) durchgängig hohe Korrektheitswerte
110 von im Mittel 95%. Der Korrektheitswert für irreguläre Partizipien (z.B. spin- - gesponnen ‚spinnen’) war demgegenüber mit nur 79,3% signifikant niedriger (Wilcoxon, p = .006) (Penke & Westermann 2006). Ahlsén (1994) sowie Laine et al. (1994) berichten über eine bilingual schwedisch-finnische Broca-Aphasikerin (JS). In einem Elizitationsexperiment zum Schwedischen erzielte JS signifikant höhere Fehlerraten bei der Produktion irregulärer Vergangenheitsformen (55%), die wie im Englischen durch eine Stammveränderung gebildet werden (z.B. knyta ‚knoten-INFINITIV‘ - knöt ‚knoten-PAST‘), als bei der Produktion regulärer Vergangenheitsformen (10,3%), die durch Affigierung von -de gebildet werden. Auch Luzzatti & de Bleser (1996) erwähnen für einen der beiden von ihnen untersuchten italienischen Broca-Aphasiker eine Beeinträchtigung irregulärer Nominalplurale (z.B. uovo uova ‚Ei - Eier’). Die ebenfalls elizitierten regulären Formen (z.B. posto - posti ‚Platz Plätze’) waren demgegenüber relativ gut erhalten. Williams Syndrom: Eine selektive Beeinträchtigung der irregulären Flexion wurde in einer Reihe von Studien auch beim Williams Syndrom festgestellt, einer seltenen genetisch bedingten Hirnentwicklungsstörung, die mit spezifischen Charakteristika im körperlichen Erscheinungsbild, organischen Beeinträchtigungen, z.B. von Herz- und Nierenfunktion, und einer generellen Retardierung einhergeht, die insbesondere visuell-konstruktive und visuell-räumliche Fähigkeiten betrifft. Im Gegensatz zur stark beeinträchtigten räumlichen Kognition erscheinen sprachliche, insbesondere syntaktische, Fähigkeiten weitgehend unbetroffen. Für einen Überblick über kognitive, neurobiologische und genetische Charakteristika des Williams Syndroms verweise ich auf Bellugi et al. (1999). In Elizitationsexperimenten zur past tense und Pluralflexion verglichen Clahsen & Almazan (1998, 2001) sowie Clahsen, Ring & Temple (2004) die Leistungen einer Gruppe von englischen Jugendlichen mit Williams Syndrom mit den Leistungen einer Gruppe von unbeeinträchtigten Kindern, die hinsichtlich ihres mentalen Alters mit den Versuchspersonen vergleichbar waren. Dabei zeigten sich für die untersuchten Jugendlichen mit Williams Syndrom selektive Probleme mit irregulären Formen. Die reguläre Flexion war im Vergleich zur Kontrollgruppe dagegen unbeeinträchtigt (vgl. auch Thomas et al. 2001). Über ähnliche Befunde berichten auch Capirci, Sabbadini & Volterra (1996), die – ohne jedoch genaue Daten zu nennen – bei einem italienischen Mädchen mit Williams Syndrom eine im Vergleich zu unbeeinträchtigten Kindern verlängerte Periode von Übergeneralisierungen (z.B. prendato statt preso ‚genommen‘) feststellten, sowie Pléh, Lukács & Racsmány (2003), die bei ungarischen Jugendlichen mit Williams Syndrom selektive Beeinträchtigungen bei der Produktion irregulär flektierter Kasusformen und Nominalplurale beobachteten. Die Beobachtung, dass das Williams Syndrom mit einer Beeinträchtigung irregulärer Formen einhergeht, konnten wir auch in Untersuchungen bei deutschsprachigen Jugendlichen mit Williams Syndrom bestätigen (Krause & Penke 2002, Penke & Krause 2004). In einem Experiment zur deutschen Partizipflexion elizitierten wir für fünf Williams Syndrom Probanden und 15 Kontrollkinder vergleichbaren mentalen Alters jeweils 23 regulär und 26 irregulär flektierte Partizipien. Das Vorgehen war dabei im Wesentlichen identisch zu dem bereits erwähnten Vorgehen bei der Untersuchung aphasischer Versuchspersonen: Unseren Probanden wurden auf Karten gedruckte Sätze mit Verbformen der 1. Person Singular Präsens vorgelegt und vorgelesen, für die dann eine Partizipform gebildet werden sollte.
111 Die Datenauswertung ergab für reguläre Partizipien keinen signifikanten Unterschied zwischen den Korrektheitswerten der Williams Syndrom Probanden (98,3%) und der Kontrollkinder (98,2%) (vgl. Tab. 4.3). Im Vergleich zu den Korrektheitswerten für reguläre Partizipien waren die Korrektheitswerte der Williams Syndrom Probanden für irreguläre Partizipien mit nur 73,1% signifikant niedriger (χ2, p < .05). Allerdings traf dies auch auf die Kontrollkinder zu, die für irreguläre Partizipien nur vergleichbar niedrige Korrektheitswerte (72,9%) erreichten. Dass auch unbeeinträchtigte Kontrollkinder für irregulär flektierte Formen häufig niedrigere Korrektheitswerte erzielen als für regulär flektierte Formen (Thomas et al. 2001, Lukács, Pléh & Racsmány 2004), ist von Thomas et al. (2001) als Beleg gegen eine selektive Beeinträchtigung der regulären Flexion bei Williams Syndrom gewertet worden. Schließlich zeigten auch unbeeinträchtigte Kinder für irregulär flektierte Formen eine Leistungsminderung und folglich entsprächen die Leistungen der Williams Syndrom Probanden sowohl für regulär als auch für irregulär flektierte Formen den Leistungen unbeeinträchtigter Kinder vergleichbaren mentalen Alters. Ein sorgfältiger Vergleich der Fehlerdaten deckt jedoch einen entscheidenden Unterschied zwischen Jugendlichen mit Williams Syndrom und den unbeeinträchtigten Kontrollkindern auf: Während unsere Kontrollkinder – in Übereinstimmung mit den in Kapitel 3.1 diskutierten Erwerbsdaten – vor allem die im Testmaterial enthaltenen seltenen irregulären Partizipien übergeneralisierten, betrafen Übergeneralisierungen bei den Williams Syndrom Probanden dagegen signifikant häufiger frequente irreguläre Partizipien (vgl. Tab. 4.3). Die Beeinträchtigung, die Sprecher mit Williams Syndrom im Bereich der irregulären Flexion haben, manifestiert sich also nicht im Bereich der seltenen irregulären Formen, die wegen ihrer niedrigen Frequenz potentiell allen Sprechern Schwierigkeiten beim lexikalischen Zugriff bereiten, sondern bei den häufigen irregulären Formen, deren Zugriff unbeeinträchtigten Kontrollpersonen in der Regel gelingt.19
Tab. 4.3: Ergebnisse für reguläre und irreguläre Partizipien bei deutschsprachigen Jugendli chen mit Williams Syndrom und Kontrollkindern (nach Penke & Krause 2004) n.s. kein signifikanter, * signifikanter Unterschied zwischen Williams Syndrom Probanden und Kontrollkindern
–––––––—–– 19
Für Ergebnisse zur regulären und irregulären Pluralflexion des Deutschen verweise ich auf Penke & Krause (2004).
112 Clahsen & Temple (2003) führen die beobachteten Probleme mit irregulär flektierten Formen auf Unterschiede im lexikalischen Zugriffsprozess zurück. Im Unterschied zu unbeeinträchtigten Sprechern erfolge der Zugriff auf das mentale Lexikon bei Menschen mit Williams Syndrom schneller, aber auch nachlässiger, was zu Schwierigkeiten mit der Aktivierung lexikalischer Informationen führe, die tiefer in eine hierarchische Struktur eingebettet sind. Dieses Problem äußert sich laut Clahsen & Temple nicht nur in Aufgaben zur semantischen Kategorisierung, in denen distinktive semantische Merkmale abgerufen werden müssen, sondern beeinträchtigt auch den Zugriff auf irregulär flektierte Formen, die in hierarchisch geordneten Vererbungsbäumen (Wunderlich & Fabri 1995, Wunderlich 1996a, siehe Kap. 3.4) gespeichert sind. Zusammenfassung: Wie die Darstellung in 4.1.6.1 und 4.1.6.2 gezeigt hat, sind selektive Defizite der regulären bzw. irregulären Flexion relativ häufig und bei verschiedenen Sprachstörungen zu beobachten. Diese Defizite legen, wie in Kapitel 2.3 erläutert, den Schluss nahe, dass regulär und irregulär flektierte Formen mental distinkt zu repräsentieren sind. Da das Auftreten dissoziierter Störungen jedoch prinzipiell auch in anderen Systemen möglich ist (vgl. Shallice 1988 und die Diskussion in Kap. 2.3), bietet das Vorliegen selektiver Defizite nicht zwangsläufig Evidenz für distinkte Repräsentationen. Es gilt jedoch umgekehrt, dass die selektive Störbarkeit regulär und irregulär flektierter Formen eine notwendige Vorhersage dualistischer Flexionstheorien ist: Wenn reguläre und irreguläre Flexion mental und neuronal qualitativ distinkt repräsentiert sind, dann sollten sie von Hirnschädigungen auch selektiv betroffen werden können. Diese Vorhersage wird durch die vorliegenden Daten bestätigt. 4.1.7 Zusammenfassung Wie dieser Überblick verdeutlicht hat, ist die Frage, wie reguläre und irreguläre Flexion mental zu repräsentieren sind, in den letzten 20 Jahren mit einer Vielzahl psycho- und neurolinguistischer Methoden untersucht worden. Auch wenn in Einzelfällen die Ursachen für divergierende Ergebnisse noch nicht abschließend geklärt sind (siehe Ergebnisse zum priming und zu bildgebenden Verfahren), ergibt sich doch in der Zusammenschau der mit so verschiedenen Methoden erzielten Ergebnisse ein beeindruckend konsistentes Bild: Übereinstimmend deuten die vorgestellten Studien auf eine qualitativ distinkte Repräsentation regulärer und irregulärer Flexion hin. Die in Kapitel 3 diskutierten Einflüsse von Wortformfrequenz und phonologischer Ähnlichkeit auf die Verarbeitung und den Zugriff irregulär flektierter Formen liefern Evidenz für eine Vollformspeicherung dieser Formen in einem assoziativen Gedächtnisspeicher. Dass sich für regulär flektierte Formen weder Frequenz- noch Ähnlichkeitseffekte zeigen, spricht entsprechend gegen eine Vollformspeicherung dieser Formen im mentalen Lexikon. Die bei der Verarbeitung regulär flektierter Formen auftretenden priming-Effekte und die im Spracherwerb beobachteten Morphemgrenzeffekte deuten vielmehr darauf hin, dass Stamm und Affix distinkt zu repräsentierende Entitäten sind. Die Untersuchungen mit sprachgestörten Sprechern sowie die Resultate aus EKP-, PET- und
113 fMRT-Studien sprechen zudem dafür, dass reguläre und irreguläre Flexion neuronal distinkt repräsentiert sind. Auf der Basis der in diesem Kapitel und in Kapitel 3 diskutierten Befunde ergibt sich ein Gesamtbild aus assoziativ gespeicherten irregulären Formen und regulär flektierten Formen, die nicht gespeichert sind, sondern produktiv durch eine symbolmanipulierende Operation gebildet werden. Dieses Bild entspricht einer dualistische Konzeption der Flexion, in der eine qualitative Distinktion zwischen gespeicherten irregulären und regelbzw. affixbasierten regulären Formen angenommen wird (z.B. Pinker & Prince 1988, Jensen 1990, Wunderlich & Fabri 1995, Wunderlich 1996a).
4.2 Die Debatte zwischen Symbolisten und Konnektionisten Den Bemühungen von psycho- bzw. neurolinguistischer Seite, Evidenz für eine qualitative Distinktion von regulärer und irregulärer Flexion beizubringen, stehen die nicht minder intensiven Bemühungen von Vertretern eines antisymbolistischen Konnektionismus gegenüber, neuronale Netze zu konstruieren, die die oben diskutierten Ergebnisse simulieren können, obwohl sie von einer einheitlichen Vollformspeicherung regulär und irregulär flektierter Formen ausgehen.20 Gelänge dies, so die Argumentation von konnektionistischer Seite, dann wäre einer unitär-assoziativen Repräsentation flektierter Formen gegenüber einer dualistischen Repräsentation der Vorzug zu geben. Schließlich sei eine unitär-assoziative Repräsentation flektierter Formen sparsamer als eine dualistische Repräsentation, bei der außer einem assoziativen Speichermechanismus auch eine Regelkomponente angenommen wird. Nach dem Prinzip Occam’s Razor sei deshalb der einfacheren, weniger komplexen Theorie der Vorzug zu geben (z.B. McClelland & Plaut 1999, Westermann 2000).21 Ein aktueller Gegenstand dieser Kontroverse ist, ob konnektionistische Netze, die eine unitäre Vollformrepräsentation regulär und irregulär flektierter Formen annehmen, selektive Defizite der regulären bzw. irregulären Flexion, wie sie bei neurologischen Störungen beobachtet werden (vgl. Abschnitt 4.1.6), simulieren können. Von Vertretern des Symbolis–––––––—–– 20
21
Neuronale Netze sind nicht notwendig auf antisymbolistische Repräsentationen festgelegt (vgl. z.B. Shastri & Ajjanagadde 1993, Marcus 2001). Da der Kontroverse über die repräsentationale Erfassung der regulären Flexion jedoch die Debatte über die Notwendigkeit symbolischer Repräsentationen zugrunde liegt, handelt es sich bei den hier diskutierten konnektionistischen Modellen um Modelle, die symbolische Repräsentationen ablehnen. Im Folgenden werde ich den Begriff ‚Konnektionismus‘ vereinfachend mit antisymbolistischen Ansätzen gleichsetzen. Gegen dieses Argument lässt sich jedoch vorbringen, dass aufgrund der vielen zu spezifizierenden Parameter konnektionistischer Netze, wie der Anzahl der Knoten und Schichten, der Verbindungen zwischen den Knoten, des zu wählenden Lernalgorithmus und der Transferfunktion, tatsächlich gar nicht klar ist, inwieweit diese Modelle wirklich sparsamer sind (vgl. z.B. McCloskey 1991, Marcus 1998b, Green 1998b). Überdies mag die Annahme eines unitären Repräsentationsmechanismus zwar sparsamer sein als die Annahme zweier distinkter Repräsentationsweisen, hinsichtlich der Speicherökonomie sind unitär-konnektionistische Modelle jedoch alles andere als sparsam (vgl. Kap. 1.1.3).
114 mus wird die Frage, ob unitäre konnektionistische Netze die in Abschnitt 4.1 dargestellten Befunde simulieren können, verneint (vgl. z.B. Pinker 1999, Marcus 1998a, b). Tatsächlich erweist sich der Typ des konstruktivistischen Netzes (vgl. Westermann 2000) dabei jedoch als recht erfolgreich. Weniger als die vermeintliche Unfähigkeit, die vorhandenen Daten zu simulieren, erscheint mir die antisymbolistische Position des Konnektionismus als der kritische Faktor, der die Unzulänglichkeit dieser Modelle der Sprachrepräsentation begründet. 4.2.1 Der Aufbau konnektionistischer neuronaler Netze Neuronale Netze bestehen aus einer großen Anzahl einfacher Verarbeitungseinheiten, so genannter units oder Knoten, die in verschiedenen Schichten angeordnet sind. In Weiterentwicklung des zweischichtigen Netzwerks von Rumelhart & McClelland (1986) bestehen neuere neuronale Netze meistens aus drei Schichten: einer Schicht von Eingabeknoten, der input-Schicht, einer Schicht von Ausgabeknoten, der output-Schicht, und einer Schicht interner Knoten, dem so genannten hidden layer (vgl. Abb. 4.8).22 Dieser Aufbau modelliert ein äußerst vereinfachtes kognitiv-neuronales System, in dem sensorische Informationen über eine interne Verarbeitungs- und Repräsentationsschicht zu einer spezifischen Reaktion führen. Prinzipiell lassen sich Netze mit lokalen Repräsentationen von Netzen mit verteilten (distributed) Repräsentationen unterscheiden. In einem lokalistischen Netzwerk steht jeder Knoten der Eingabeschicht für ein anderes Konzept oder Wort. Folglich ist jeweils nur ein Knoten dieser Schicht aktiviert (für eine Darstellung und Diskussion dieser Netzwerke vgl. z.B. Page 2000). In Netzwerken mit verteilter Repräsentation, die für die Simulation von Flexionsprozessen üblicherweise verwendet werden, repräsentieren Knoten bestimmte Merkmale (z.B. phonologische). Jede Eingabe aktiviert entsprechend der enthaltenen Merkmale eine Menge der Knoten der Eingabeschicht. In Anlehnung an die Funktionsweise von Neuronen interagieren die Knoten der Schichten des Netzes über gewichtete Verbindungen miteinander. Jeder Knoten ist dabei eine Verrechnungseinheit, die eingehende Aktivierungen gewichtet, aufsummiert und mittels einer Transferfunktion eine Ausgabeaktivierung berechnet, die an die mit ihm verbundenen Knoten der nächsten Schicht weitergereicht wird. In künstlichen neuronalen Netzen kommen verschiedene Arten von Transferfunktionen zur Anwendung. Bei linearen Funktionen beispielsweise ist die Ausgabeaktivität proportional zur Eingabeaktivität. Bei Schwellenwertfunktionen dagegen wird eine festgelegte Ausgabeaktivität nur dann erzeugt, wenn die Summe der Eingabeaktivierungen einen bestimmten Schwellenwert überschreitet. Während die Transferfunktion vorgegeben und fest implementiert ist, werden die Verbin–––––––—–– 22
Die interne Schicht (hidden layer) ist eine interne Verarbeitungsschicht, in der die Aktivierungen der Eingabeknoten umgewichtet werden können. Dies ist notwendig, weil ein Netz ohne interne Schicht, in dem lediglich Eingabe- und Ausgabeknoten miteinander verbunden sind, selbst einfache Funktionen, wie das exklusive ODER (XOR: entweder A oder B), nicht repräsentieren kann: Wenn in einem Netz mit zwei Eingabeknoten und einem Ausgabeknoten die Aktivierung jeweils eines von zwei Eingabeknoten zur Aktivierung des Ausgabeknotens führt, dann führt auch die Aktivierung beider Eingabeknoten zur Aktivierung des Ausgabeknotens. Der Einbau einer internen Schicht ermöglicht es, durch Umgewichtung der Eingabeaktivierungen solche Funktionen zu lernen und zu repräsentieren (vgl. Minsky & Papert 1969, Marcus 2001).
115 dungsgewichtungen zwischen den Knoten des Netzes beim Lernen verändert. Durch die Veränderung der Verbindungsgewichtungen passt sich das Netz dem Lernproblem an.
Abb. 4.8: Skizze eines neuronalen Netzes (Abdruck mit freundlicher Genehmigung von Spektrum der Wissenschaft 2005, aus SdW 11/1992, S. 136 oben)
Die Aufgabe eines Netzes bei einem Lernvorgang besteht darin, für eine gegebene Aktivierung in der Eingangsschicht eine bestimmte Aktivierung in der Ausgangsschicht zu erzeugen. Ausschlaggebend für den Lernprozess sind dabei nicht explizite Regeln, sondern Lernen vollzieht sich allein auf der Basis von Erfahrungen, d.h. auf der Basis der dem Netz präsentierten Aktivitätsmuster. Bei einem überwachten Lernvorgang wird dem Netz eine Eingangsaktivierung präsentiert und die vom Netz gelieferte Ausgabe mit der gewünschten Ausgabe verglichen. Durch die Anwendung eines Lernalgorithmus, wie z.B. des backpropagation-Algorithmus (Rumelhart, Hinton & Williams 1986), werden anschließend die Verbindungsgewichtungen so verändert, dass sich die Ausgabe des Netzes der gewünschten Ausgabe weiter annähert. Ein solcher Lernzyklus wird so lange wiederholt, bis das Netz seine Leistung nicht mehr verbessern kann. (Für eine Einführung in Aufbau und Funktionsweise neuronaler Netze vgl. z.B. Hinton 1992, Marcus 2001). In konnektionistischen, neuronalen Netzen beruhen Wissensrepräsentation, Lernen und Verarbeitung allein auf den Prinzipien der assoziativen Verknüpfung und Aktivierung. Da diese Prinzipien nach Ansicht des Konnektionismus allen kognitiven Funktionen zugrunde liegen, sind konnektionistische Netze nicht domänen-spezifisch, d.h. sprachliche sowie nicht-sprachliche kognitive Leistungen basieren hier auf denselben Lern- und Repräsentationsmechanismen. Im Bereich der Flexionsmorphologie führt die einheitliche Architektur dazu, dass regulär flektierte Formen genauso wie irregulär flektierte durch gewichtete Verbindungen produziert und verarbeitet werden, die eine Aktivierung der Eingangsschicht auf eine Aktivierung der Ausgabeschicht abbilden. Flexionsregeln oder kombinatorische Pro-
116 zesse, die ein Affix mit einer beliebigen Instanz einer abstrakten Kategorie, eines Symbols, wie [+ V] verknüpfen, werden in konnektionistischen neuronalen Netzen gemeinhin abgelehnt (vgl. z.B. Rumelhart & McClelland 1986, Elman et al. 1996). Dementsprechend bestehen antisymbolistische Ansätze auf einer unitären Repräsentation flektierter Formen, der zufolge sowohl regulär als auch irreguläre flektierte Formen als Vollformen in der assoziativen Netzwerkstruktur gespeichert sind. Dualistische Flexionstheorien, nach denen regulär flektierte Formen durch Anwendung einer mentalen Regel der Art ‚V + -ed → past tense’ (z.B. Marcus et al. 1992, Marcus et al. 1995, Pinker 1999) oder durch einen Affigierungsprozess (z.B. Wunderlich 1992, 1996a, Wunderlich & Fabri 1995) gebildet werden, vertreten dagegen einen symbolistischen Ansatz zur menschlichen Sprachfähigkeit und Kognition. 4.2.2 Der Wettstreit Ein Kernstück der Kontroverse zwischen dualistischen und unitär-konnektionistischen Ansätzen zur Flexion ist, ob und inwieweit die in Kapitel 4.1 vorgestellten psycho- und neurolinguistischen Befunde zur Verarbeitung und Repräsentation regulär und irregulär flektierter Wörter in unitär-konnektionistischen Netzen simuliert werden können. Diese Kontroverse um die Beschreibungsadäquatheit unitär-konnektionistischer Simulationen wurde 1986 von Rumelhart & McClelland ins Leben gerufen, die auf der Basis ihrer Netzwerk-Simulation von Erwerb und Produktion englischer past tense Formen (vgl. S. 81–82) argumentierten, für die Repräsentation regulär flektierter Formen sei keine symbolmanipulierende Operation der Art ‚V + -ed → past tense’ notwendig. Ihr Anspruch, das von ihnen entwickelte Modell könne die vorliegenden Daten zum past tense Erwerb detailgetreu simulieren, konnte jedoch zunächst von Pinker & Prince (1988) zurückgewiesen werden. Kritik am Modell von Rumelhart & McClelland: Pinker & Prince sowie Marcus et al. (1992) konnten z.B. zeigen, dass die Simulation eines U-förmigen Erwerbsverlaufs im Modell von Rumelhart & McClelland von der in verschiedenen Trainingsphasen unterschiedlichen Verteilung regulär und irregulär flektierter Verben im Trainingskorpus abhängig war. Während das Netz zunächst nur mit zehn hochfrequenten Verben trainiert wurde, von denen acht irregulär waren, korrelierte der Beginn der Übergeneralisierungen irregulärer Verben mit einem Anschwellen des Trainingskorpus auf 410 Verben, von denen 80% regulär flektiert waren. Marcus et al. (1992) konnten auf der Basis ihrer umfangreichen Untersuchung zum past tense Erwerb des Englischen jedoch zeigen, dass der Anteil regulär flektierter Verben im input während des Erwerbsverlaufs relativ stabil ist und der Beginn der Übergeneralisierungsphase im Spracherwerb nicht mit einer so gravierenden quantitativen Veränderung im input der Kinder einhergeht. Als weiteren Kritikpunkt führen Pinker & Prince das Problem der Behandlung von Homonymen an, die unterschiedlich flektiert werden. In einem Modell wie dem von Rumelhart & McClelland, das sich bei der Produktion von past tense Formen, ohne die Semantik zu berücksichtigen, allein auf phonologische Merkmale stützt, aktivieren homonyme Formen wie break und brake oder ring, wring und das denominale Verb ring mit der Bedeutung ‚einkreisen‘ dieselben Knoten der Eingangsschicht. Für identische Eingangs-
117 aktivierungen muss das Netz jedoch auch identische Ausgangsaktivierungen ausgeben. Für homonyme Verben muss das Netz also dieselbe past tense Form produzieren, obwohl die korrekten past tense Formen broke und braked bzw. rang, wrung und ringed lauten. Pinker & Prince sowie Marcus et al. (1995) gaben auch zu bedenken, dass Analogiebildungen des Netzes auf nicht-trainierte Verben von der Frequenzverteilung der trainierten Formen und von der Merkmalsähnlichkeit der nicht-trainierten Verben mit den bereits erworbenen Verben abhängen. So wurden unbekannte Verben nur deshalb überwiegend mit -ed gebildet, weil Verben mit einer auf -ed endenden past tense Form die häufigste dem Netz präsentierte Klasse waren und neuronale Netze diese Frequenzverteilung repräsentieren und zur Analogiebildung nutzen. Entsprechend postulierten sie, dass eine Flexionsregel, die nur auf wenige Formen angewendet wird, wie der -s-Plural des Deutschen, von neuronalen Netzen nicht per Analogiebildung produktiv eingesetzt werden sollte. Ferner konnten Pinker & Prince (1988) sowie Prasada & Pinker (1993) zeigen, dass merkmalsbasierte neuronale Netze Schwierigkeiten mit der past tense Produktion von nicht-trainierten Verben haben, wenn diese hinsichtlich ihrer Merkmale den bereits erworbenen Formen nicht ähneln. Bei der Eingabe eines Stimulus in ein konnektionistisches Netz wird eine Reihe von Knoten aktiviert, die meist phonologische Merkmale enkodieren. Aus der Menge der bereits gelernten Merkmale ergibt sich der so genannte Eingaberaum (input space) des Netzes. Auch für bislang unbekannte Stimuli kann das Netz eine Ausgabe produzieren, wenn ihre Merkmale in diesen Eingaberaum fallen. Ist dies jedoch nicht der Fall, weil die Teststimuli hinsichtlich ihrer phonologischen Merkmale nicht mit den bisher gehörten Stimuli übereinstimmen, dann gelangen konnektionistische Netze nicht zu einer sinnvollen Reaktion. Während also menschliche Versuchspersonen in der Untersuchung von Prasada & Pinker für ungewöhnlich klingende Verben wie ploamph als past tense Form ohne Probleme ploamphed produzierten, hatten die von ihnen getesteten neuronalen Netze erhebliche Schwierigkeiten mit dieser Aufgabe (Weitere Verdeutlichungen dieses Problems finden sich in Marcus 1998a, b, 2001, Marcus et al. 1999, vgl. aber Ramscar 2002). Im Gefolge der kritischen Diskussionen des Modells von Rumelhart & McClelland kam ein Wettlauf zwischen Verfechtern symbolistisch-dualistischer und konnektionistischunitärer Ansätze in Gang, der bis heute anhält. Im Zuge dieses Wettstreits versucht die symbolistische Seite mit immer neuen Untersuchungen, Evidenz gegen eine Vollformspeicherung regulär flektierter Formen und für die Notwendigkeit symbolmanipulierender Operationen zu erbringen (vgl. Kap. 4.1). Die konnektionistische Seite kontert mit neuen neuronalen Netzwerkmodellen, in denen versucht wird, die Daten, die Symbolisten als Evidenz für symbolmanipulierende mentale Operationen anführen, in einer unitär-assoziativen Netzwerkstruktur zu simulieren. In einer recht provokanten Darstellung hat Gary Marcus diese konnektionistischen Bemühungen wie folgt kommentiert: „[...] one argument for modeling the past tense with two mechanisms is that regular and irregular inflection appear to behave in systematically different ways in a wide variety of contexts. Yet no single connectionist model addresses even half of the phenomena Pinker outlines, and some of the phenomena Pinker describes have yet to be addressed. What’s relevant here is that the response of connectionists has been to build a separate model for each problem raised by Pinker, e.g. one model for why denominal verbs receive regular inflection (Daugherty et al., 1993), another for handling defaults for low-frequency verbs (Hare et al., 1995), another to distinguish homonyms that have different past tense forms (MacWhinney and Leinbach, 1991), and still another for handling a U-shaped developmental sequence (Plunkett and Marchman, 1993). These models
118 differ from one another in their input representations, their output representations, and their training regimes; there is thus far no evidence that they can be put together in a single ‚uniform‘ model, and to my knowledge no attempt has been made to do so.“ (Marcus 1998a: 171)
Diese Darstellung wird den Resultaten konnektionistischer Simulationen jedoch nicht gerecht. So sind durchaus Modelle entwickelt worden, die mehr als nur eines der in Kapitel 4.1 dargestellten Ergebnisse simulieren können. Besonders vielversprechend erscheinen mir die von Gert Westermann entworfenen konstruktivistischen Netze zur Simulation des englischen past tense und der deutschen Partizipflexion (Westermann 1997, 1998, 2000, Westermann, Willshaw & Penke 1999, Penke & Westermann 2006). Das konstruktivistische Modell von Westermann: Im Unterschied zu herkömmlichen konnektionistischen Netzen ist in den konstruktivistischen Netzen Westermanns die Anzahl der Knoten in der internen Schicht nicht vorgegeben. Die interne Schicht besteht vielmehr zunächst nur aus zwei Knoten und entwickelt sich erst im Laufe des Trainings. Die Knoten der internen Schicht werden über eine Gaußsche Funktion aktiviert. Jeder Knoten der internen Schicht bildet so eine Art rezeptives Feld, das statt auf Aktivierungen einer bestimmten Stärke auf Aktivierungen in einer bestimmten Region der internen Schicht reagiert. Da das Netz auf der Eingangsebene mit phonologischen Merkmalen operiert, aktivieren phonologisch ähnliche Verben, wie z.B. lachen und machen oder hören und schwören, zunächst jeweils dasselbe rezeptive Feld (bzw. denselben Knoten) in der internen Schicht (vgl. Abb. 4.9 und 4.10A).
Abb. 4.9: Architektur des konnektionistischen Netzes von Westermann zu Beginn der Lernphase (Abbildung von Gert Westermann)
Immer wenn eine Änderung der Gewichtungen zu und von den Knoten der internen Schicht zu keiner weiteren Verbesserung der Leistungen des Netzes bei der Partizipproduktion führt, wird ein neuer Knoten eingefügt. Da im Beispiel für hören und schwören unterschiedliche Partizipformen zu erzeugen sind (gehört und geschworen), werden im Laufe des Trainings neue rezeptive Felder in der internen Schicht gebildet, um diese beiden
119 Verben hinsichtlich ihrer unterschiedlichen Partizipformen zu diskriminieren (vgl. Abb. 4.10B). Der konstruktivistische Mechanismus stellt sicher, dass immer nur genau soviel Knoten in der internen Schicht eingebaut werden, wie zur Lösung einer spezifischen Aufgabe erforderlich sind. Gelingt die Partizipproduktion bei phonologisch ähnlichen Verben, die dasselbe rezeptive Feld aktivieren, wie z.B. lachen und machen, wird also kein neuer Knoten integriert (vgl. Abb. 4.10B). Der konstruktivistische Lernmechanismus bewirkt den Aufbau und die Parzellierung der internen Schicht in der Art, dass phonologisch ähnliche Verben, die derselben Partizipklasse angehören, im selben rezeptiven Feld repräsentiert sind. Während eine solche cluster-Bildung phonologisch ähnlicher Verben für starke Verben auch in dualistischen Ansätzen zur Flexion angenommen wird (vgl. Kap. 3.4), sind im unitär-konnektionistischen Modell von Westermann auch reguläre Verben so erfasst.
Abb. 4.10: Die Entwicklung der internen Schicht in Westermanns konstruktivistischem Netzwerkmodell (Abbildung von Gert Westermann)
Das konstruktivistische Netz Westermanns meisterte nicht nur den Erwerb regulär und irregulär flektierter past tense bzw. Partizipformen zu 100% – eine Aufgabe, mit der nicht wenige der in der Literatur vorgeschlagenen konnektionistischen Netze bereits Probleme haben (z.B. Rumelhart & McClelland 1986, MacWhinney & Leinbach 1991, Daugherty & Seidenberg 1992). Während des Trainings produzierte das Netz auch Übergeneralisierungen, die den beim kindlichen Erwerb beobachteten Frequenz- und Ähnlichkeitseffekten entsprachen. Zudem war es in der Lage, auch ungewöhnlich klingende Verben in vergleichbarer Weise wie die menschlichen Versuchspersonen von Prasada & Pinker (1993) zu übergeneralisieren (vgl. Westermann 2000). 4.2.3 Eine aktuelle Kontroverse - die Simulation selektiver Schädigungen Eine aktuelle Kontroverse zwischen Vertretern dualistischer und unitär-konnektionistischer Ansätze ist, inwieweit selektive Defizite regulär bzw. irregulär flektierter Formen in konnektionistischen Netzen simuliert werden können. Selektive Defizite wurden und
120 werden in der kognitiven Neuropsychologie und der Neurolinguistik als schlagkräftiger Beweis für die Wissensrepräsentation in distinkten mentalen/neuronalen Modulen angesehen (vgl. Kap. 2.3 und die Diskussion in Shallice 1988). Dementsprechend wurde in den letzten Jahren verschiedentlich versucht, selektive Defizite und doppelte Dissoziationen durch Schädigungen konnektionistischer Netze zu simulieren, um zu belegen, dass die Existenz solcher Defizite nicht zwangsläufig auf distinkte Module verweist (vgl. z.B. Marchman 1993, Bullinaria & Chater 1995, Joannisse & Seidenberg 1999, Westermann 2000, Juola & Plunkett 2000). Das Modell von Joanisse & Seidenberg: Ein aktuelles Modell, das den Anspruch erhebt, die in der Literatur beschriebenen selektiven Defizite im Bereich der regulären bzw. irregulären past tense Flexion simulieren zu können, ist das Modell von Joanisse & Seidenberg (1999). In dem von ihnen konstruierten konnektionistischen Netz ist die Produktion regulärer past tense Formen kritisch von phonologischen Informationen abhängig. Die Produktion irregulärer Formen hängt dagegen von einer nicht näher erläuterten ‚semantischen’ Schicht ab, in der jedes Verb durch einen Knoten repräsentiert ist. Diese Netzarchitektur soll widerspiegeln, dass die Verknüpfung zwischen der Präsens- und past tense Form eines regulären Verbs entscheidend von der hohen phonologischen Übereinstimmung beider Formen geleistet werden kann, während diese Verknüpfung bei irregulären Verben – aufgrund ihrer geringeren phonologischen Übereinstimmung – mehr von deren semantischer Übereinstimmung abhängt. Entsprechend resultieren in der Simulation von Joanisse & Seidenberg aus der Schädigung dieser als ‚semantisch’ bezeichneten Informationen stärkere Beeinträchtigungen irregulärer past tense Formen. Die Schädigung phonologischer Informationen führt dagegen zu einem Defizit bei der Produktion regulär flektierter Formen. In einer Reihe von Folgestudien wurde seitdem zu zeigen versucht, dass das von Joanisse & Seidenberg auf der Basis ihrer Netzwerksimulation postulierte Erklärungsmodell die beobachteten selektiven Störungsmuster bei den verschiedenen neurologischen Erkrankungen zutreffend erfasst. Selektive Defizite der regulären Flexion sollen dabei notwendig an phonologische Störungen gekoppelt sein, während selektive Defizite der irregulären Flexion aus semantischen Defiziten resultieren sollen (vgl. Patterson et al. 2001, Bird et al. 2003, Braber et al. 2004, Lambon Ralph et al. 2005). Tatsächlich treten selektive Defizite der irregulären Flexion bei neurologischen Schädigungen auf, die zu Beeinträchtigungen im Bereich der Semantik führen, so z.B. bei Morbus Alzheimer (Ullman et al. 1997), bei semantischer Demenz (Marslen-Wilson & Tyler 1998, Patterson et al. 2001) oder bei Herpes Simplex Enzephalitis (Tyler et al. 2002, Laiacona & Caramazza 2004, vgl. Kap. 4.1.6.2). Bird et al. (2003), Braber et al. (2004) und Lambon Ralph et al. (2005) haben zudem Daten von englischsprachigen Broca-Aphasikern vorgelegt, die belegen sollen, dass die selektive Beeinträchtigung der regulären past tense Flexion, die bei englischsprachigen Broca-Aphasikern beobachtet wird (vgl. Ullman et al. 1997, 2005), nicht auf einer morphologischen, sondern auf einer phonologischen Störung beruht. Tatsächlich sind Defizite im Bereich der Phonologie und Phonetik ein regelmäßig anzutreffendes Symptom der Broca-Aphasie (vgl. Kean 1977, Huber, Poeck & Weniger 1982). Bildgebende Studien haben zudem Belege dafür gefunden, dass das Broca-Areal in Prozesse der phonologischen Verarbeitung involviert ist (vgl. z.B. Demonet et al. 1992,
121 1994, Indefrey & Levelt 2000, 2004, Crivello et al. 2002). Diese Beeinträchtigungen sind nach Ansicht von Bird et al. (2003) auch die Ursache für die Probleme, die englischsprachige Broca-Aphasiker bei der Produktion regulärer past tense Formen zeigen, da reguläre past tense Formen im Vergleich zu irregulären eine größere phonologische Komplexität aufweisen. Die höhere phonologische Komplexität regulärer past tense Formen des Englischen soll sich dabei maßgeblich aus den wortfinalen Konsonantenclustern ergeben, die durch Affigierung von -ed entstehen (vgl. walk - walked aber run - ran). Kontrolliert man diese Variable und wählt reguläre und irreguläre past tense Formen vergleichbarer phonologischer Komplexität (z.B. pulled vs. built), dann – so Bird et al. (2003) – gleichen sich die Fehlerraten für regulär und irregulär flektierte Formen an. Lassen sich jedoch auch die Daten deutscher und niederländischer Broca-Aphasiker mit diesem Modell erfassen? Anders als bei Englischen Broca-Aphasikern, ist bei deutschen und niederländischen Broca-Aphasikern die irreguläre Partizipflexion selektiv betroffen, während die reguläre Partizipflexion gut erhalten ist. Es macht jedoch bei einer vergleichbaren neurologischen Schädigung wenig Sinn anzunehmen, dass englischsprachige BrocaAphasiker, nicht aber deutsche und niederländische Broca-Aphasiker, an phonologischen Störungen leiden; deutsche und niederländische Broca-Aphasiker, nicht aber englische Broca-Aphasiker, dagegen semantische Defizite aufweisen. Allerdings könnte man Bird et al. folgend argumentieren, dass irreguläre Partizipformen im Deutschen und Niederländischen phonologisch komplexer sind, da sie durch die -(e)n Endung im Vergleich zum Stamm eine Silbe mehr aufweisen und dadurch eine Resyllabifizierung erforderlich ist (vgl. [zINk] - [g´zUN.k´n] aber [blINk] - [g´blINkt]). Die zugrunde liegende phonologische Störung würde daher im Deutschen bzw. Niederländischen – anders als im Englischen – die phonologisch komplexeren irregulären Partizipien stärker betreffen als die regulären Partizipien. Doch selbst wenn sich irreguläre Partizipien im Deutschen und Niederländischen auf einer unabhängig evaluierten Skala der phonologischen Komplexität als komplexer erwiesen als reguläre Partizipien, erklärt dieser Vorschlag nicht, warum reguläre englische past tense Formen so stark, reguläre deutsche und niederländische Partizipien dagegen so wenig beeinträchtigt sind. Reguläre englische past tense Formen (z.B. danced) und reguläre deutsche (getanzt) bzw. niederländische Partizipien (gedanst) sind hinsichtlich ihrer phonologischen Komplexität weitgehend vergleichbar: Sie werden durch Hinzufügung eines koronalen Plosivs gebildet, was in der Regel zu einem wortfinalen Konsonantencluster führt. Dennoch unterscheiden sich die Leistungen aphasischer Sprecher bei der Produktion regulärer Formen erheblich. Während die publizierten Korrektheitswerte englischer Broca-Aphasiker bei der Produktion regulärer past tense Formen im Mittel zwischen 20% und 50% rangieren und auch die Leistungen einzelner Aphasiker nie 80% übersteigen (Ullman et al. 1997, Bird et al. 2003, Faroqi-Shah & Thompson 2003, 2004), liegen die entsprechenden Mittelwerte für deutsche und niederländische Broca-Aphasiker bei über 90% (91,2% für 13 untersuchte deutschsprachige Broca-Aphasiker und 95% für zwölf niederländische Broca-Aphasiker in Penke & Westermann (2006)). Auch wäre bei einem phonologischen Defizit zu erwarten, dass Aphasiker statt der phonologisch komplexen irregulären Formen gehäuft unmarkierte Stammformen (trink statt getrunken) produzierten, so wie dies bei englischsprachigen Broca-Aphasikern bei der Produktion regulärer past tense Formen zu beobachten ist (vgl. Ullman et al. 1997, Bird et al. 2003, Faroqi-Shah & Thompson 2004). Dieser Fehlertyp ist in den Daten deutscher und niederländischer Aphasiker jedoch selten. Der bei weitem
122 häufigste Fehlertyp bei der Produktion irregulärer Partizipien ist in beiden Sprachen die Übergeneralisierung der regulären Partizipflexion auf starke Verben (getrinkt) – ein Fehler, der ausgerechnet zur Produktion der nach Bird et al. so problematischen Konsonantencluster führt.23 Nicht nur, dass ein phonologisches Defizit die Daten der deutschen und niederländischen Broca-Aphasiker nicht erfassen kann, auch die kausale Verknüpfung von phonologischen bzw. semantischen Defiziten und resultierenden Defiziten der regulären bzw. irregulären Flexion, die im Modell von Joanisse & Seidenberg postuliert wird, lässt sich nicht aufrecht erhalten. So erweisen sich semantische Defizite und selektive Beeinträchtigungen der irregulären Flexion als unabhängig voneinander. Tyler et al. (2004) berichten von drei englischsprachigen Patienten mit semantischer Demenz, die keine Defizite bei der Produktion irregulär flektierter past tense Formen hatten, während umgekehrt Miozzo (2003) bei einem englischsprachigen amnestischen Aphasiker mit einer selektiven Beeinträchtigung der irregulären Flexion keine Evidenz für eine semantische Störung finden konnte. Gegen eine kausale Verknüpfung von phonologischem Defizit und Beeinträchtigung der regulären Flexion sprechen auch die Daten von Tyler, Randall & Marslen-Wilson (2002), die bei vier englischsprachigen Broca-Aphasikern mit selektiven Defiziten im Bereich der regulären past tense Flexion keine Belege für eine phonologische Störung fanden. Als Resümee bleibt, dass das Netzwerkmodell von Joanisse & Seidenberg zwar selektive Defizite der regulären bzw. irregulären Flexion im Bereich der englischen past tense Flexion simulieren kann, diese Simulationen aber auf einer kausalen Kopplung zwischen phonologischen bzw. semantischen Störungen einerseits und selektiven Defiziten der regulären bzw. irregulären Flexion andererseits basieren, die sich nicht aufrecht erhalten lässt. Eine rein phonologische Erklärung der beobachteten selektiven Defizite kann zudem nicht erfassen, warum bei Broca-Aphasie zwar die reguläre englische past tense Flexion, nicht aber die ähnliche reguläre Partizipflexion des Deutschen und Niederländischen beeinträchtigt ist. Selektive Defizite im Modell von Westermann: Auch in Westermanns konstruktivistischem Netz ist die Simulation der Defizite deutscher Broca-Aphasiker (vgl. Kap. 4.1.6.2) gelungen – jedoch ohne dass die erfolgreiche Simulation von einer kausalen Kopplung an ein phonologisches oder semantisches Defizit abhängig ist (Westermann, Willshaw & Penke 1999, Westermann 2000, Penke & Westermann 2006). Westermann simulierte die Vorgänge bei einer Aphasie, indem er steigende prozentuale Anteile der Verbindungsgewichtungen im Netz entfernte und so das gesamte Netz schädigte. Abbildung 4.11 verdeutlicht die Resultate der von Westermann durchgeführten 4.000 Simulationen, bei denen in 200 Durchgängen in 20er Schritten jeweils 5% der Gewichtungen mehr entfernt wurden. Die Diagonale trennt die Fälle, in denen irreguläre Formen stärker betroffen sind als reguläre (unterhalb der Diagonalen), von den Fällen, in denen eine stärkere Beeinträchtigung regulär flektierter Formen vorliegt (oberhalb der Diagonalen). –––––––—–– 23
Auch Befunde zur Produktion deutscher -n-Plurale liefern Evidenz gegen die Annahme, die Defizite von Broca-Aphasikern im Bereich der Flexion seien durch eine phonologische Störung verursacht. So erweisen sich bei gleicher phonologischer Komplexität der Pluralformen -n-Plurale bei Maskulina und Neutra (Hemden) als beeinträchtigt, die Produktion von -n-Pluralen bei Feminina (Lampen) gelingt dagegen gut (vgl. dazu Kap. 5.2.1).
123 Die größeren grauen Punkte geben die Leistungen an, die 13 von uns untersuchte deutschsprachige Broca-Aphasiker in einem Elizitationsexperiment zur regulären und irregulären Partizipflexion erzielten (vgl. Penke & Westermann 2006 sowie Kap. 4.1.6.2 und 6.3.2).24
Abb. 4.11: Leistungen des konstruktivistischen Netzes Westermanns bei der Produktion deutscher Partizipien in Simulationen mit globaler Schädigung des Netzes (Abbildung von Gert Westermann)
Wie aus der Graphik ersichtlich, führen solche globalen Schädigungen des Netzes nie zu einer selektiven Beeinträchtigung der regulären Flexion bei gutem Erhalt der irregulären Flexion (linke obere Ecke der Graphik). Stattdessen sind irregulär flektierte Formen – trotz der unitär-assoziativen Repräsentation für regulär und irregulär flektierte Partizipien – fast immer stärker beeinträchtigt als reguläre Formen (siehe Punkte unterhalb der Diagonalen). Dieses Resultat entspricht den Daten, die wir bislang für deutschsprachige Broca-Aphasiker gesammelt haben (vgl. Penke, Janssen & Krause 1999, Penke & Westermann 2006). Auch bei diesen betreffen selektive Defizite nie die reguläre, sondern die irreguläre Partizipflexion (vgl. Abb. 4.7 und 6.4). –––––––—–– 24
Um eine bessere Vergleichbarkeit der Daten von aphasischen Versuchspersonen und Netzwerkmodell zu gewährleisten, wurden – anders als in den Datenübersichten in Abb. 4.7 und 6.4 – bei der Berechnung der korrekten und inkorrekten Reaktionen der aphasischen Versuchspersonen nicht nur fehlerhafte Partizipendungen, sondern auch fehlende Reaktionen, in denen keine Partizipform produziert wurde, als inkorrekt bewertet. In der Netzwerksimulation lassen sich diese Fehlertypen nicht unterscheiden. Ein Fehler tritt auf, wenn der korrekte Ausgabeknoten nicht aktiviert wird.
124 Im konstruktivistischen Modell von Westermann dient der Aufbau der internen Schicht fast ausschließlich der Repräsentation irregulär flektierter Formen. Diese benötigen folglich mehr Ressourcen des Netzes und sind dementsprechend von einer globalen Verminderung der Ressourcen stärker betroffen. Wie ein Vergleich der Simulationen mit den Ergebnissen der von uns untersuchten Aphasiker ergibt, zeigt sich eine sehr große Übereinstimmung zwischen den simulierten und den beobachteten Schädigungsprofilen. Dies könnte darauf hindeuten, dass die neuronale Repräsentation irregulärer Verben im mentalen Lexikon ebenfalls mehr Ressourcen bindet als die Repräsentation regulärer Verben. Irreguläre Formen könnten daher von weiter gestreuten Schädigungen des Gehirns, wie sie durch einen Schlaganfall resultieren, stärker betroffen sein. Die Annahme, dass starke Verben mehr Ressourcen zu ihrer Repräsentation benötigen als reguläre Verben und daher störungsanfälliger sind, ist allerdings noch kein Beleg für eine unitär-konnektionistische Repräsentation der Flexion. Auch in dualistischen Flexionsmodellen werden für die Speicherung starker Verben mehr Gedächtniskapazitäten als für die Repräsentation regulärer Verben benötigt. Während z.B. in Wunderlichs Minimalistischer Morphologie (Wunderlich 1992, Wunderlich & Fabri 1995) für reguläre Verben nur der Basiseintrag im mentalen Lexikon gespeichert ist, müssen für starke Verben auch die abgelauteten Stämme und damit größere Informationsmengen gespeichert werden. Die geglückte Simulation eines selektiven Defizits im konstruktivistischen Netz von Westermann bietet folglich keinen zwingenden Beleg für eine unitär-assoziative Repräsentation regulär und irregulär flektierender Verben. Sie verdeutlicht lediglich den bereits von Shallice (1988) gemachten Punkt, dass aus dem Vorliegen selektiver Störungen nicht zwingend auf eine modulare Organisation geschlossen werden kann, das Vorliegen einer dissoziierten Störung also sowohl mit dualistischen als auch mit unitären Flexionsmodellen vereinbar ist. Ob über die Simulation selektiver Defizite hinaus eine Simulation sämtlicher der in 4.1 vorgetragenen Befunde in einem konnektionistischen Modell möglich sein wird, ist eine empirische Frage. Das konstruktivistische Netz von Westermann verdeutlicht jedoch, dass konnektionistische Simulationen durchaus erfolgreich sein können. Seidenberg (1994) weist daher zurecht darauf hin, dass sich gegen konnektionistische Modelle gerichtete Argumente der Art ‚the models will never be able to do this’ schon des Öfteren durch neue Modellierungen als hinfällig erwiesen haben. 4.2.4 Pros und Kontras – die Diskussion um konnektionistische Netze Mittlerweile liegt eine kaum mehr überschaubare Menge von Modellen vor, die den Anspruch erheben, zumindest einige der in Kapitel 4.1 vorgestellten Daten zur Distinktion regulär und irregulär flektierter Formen auch in einer unitär-assoziativen Netzwerkarchitektur simulieren zu können, und die architektonischen Details dieser Modelle, die über Erfolg oder Misserfolg der Simulationen entscheiden, sind für den Laien kaum zu durchdringen. Daher möchte ich im Folgenden einige Argumente vorstellen und diskutieren, die unabhängig von spezifischen Modellen und Simulationen für bzw. gegen konnektionistische Modelle vorgebracht werden.25 –––––––—–– 25
Für einen Überblick über konnektionistische Modelle und Simulationen sowie für weitere Argumente gegen die antisymbolistische Position des Konnektionismus verweise ich auf Marcus (2001).
125 Konnektionistische Netze verzichten auf angeborenes domänen-spezifisches Wissen: Ein Grund, warum konnektionistische Simulationen für die Linguistik interessant sind, liegt darin, dass Aspekte der Repräsentation der menschlichen Sprachfähigkeit, die in der generativen Linguistik durch Chomskys Prinzipien- und Parametertheorie (Chomsky 1980a, b, 1981) zunächst als zufriedenstellend beantwortet galten, im Konnektionismus erneut aufgeworfen wurden. Eine der zentralen Fragen der Linguistik betrifft das so genannte ‚logische Problem des Spracherwerbs’, also die Frage, was Kinder in die Lage versetzt, unter den üblichen Bedingungen eine beliebige natürliche Sprache zu erwerben (vgl. z.B. Fanselow & Felix 1987). Aufgeworfen wurde dieses Problem durch Chomskys poverty-of-stimulus-Argument (z.B. Chomsky 1965, 1980b), demzufolge eine erhebliche Diskrepanz besteht zwischen der Beschaffenheit der sprachlichen Erfahrungen, die ein Kind machen kann, und der Komplexität des sprachlichen Wissenssystems, das erworben wird. So hört das Kind während des Spracherwerbs lediglich eine endliche Menge der möglichen Strukturen seiner Muttersprache, erwirbt jedoch die Fähigkeit, eine prinzipiell infinite Menge auch bis dahin ungehörter Sätze zu verstehen, zu produzieren und zu beurteilen (quantitative Unterdeterminiertheit). Diese Fähigkeit setzt voraus, dass das Kind hinter das Regelsystem seiner Sprache kommt. Der input, den es erhält, besteht jedoch nicht aus Regeln, sondern aus konkreten Äußerungen, aus denen es die zutreffenden Generalisierungen ableiten muss (qualitative Unterdeterminiertheit) (vgl. z.B. Fanselow & Felix 1987). Ein Lernmechanismus, der auf der Basis des inputs unbeschränkt Hypothesen ableitet und testet, läuft jedoch Gefahr, am so genannten subset-superset-Problem zu scheitern (Gold 1967, vgl. auch Pinker 1989). Umfasst die zu testende Hypothese eine Übermenge der tatsächlich in der Zielsprache erlaubten Strukturen – nämlich die erlaubten Strukturen und darüber hinaus noch nichterlaubte Strukturen –, dann benötigt das Kind explizite Evidenz über die Ungrammatikalität dieser Strukturen (negative Evidenz), da es von ihrem Nichtvorkommen im input allein nicht auf ihre Ungrammatikalität schließen darf. Zahlreiche Untersuchungen konnten jedoch zeigen, dass negative Evidenz Kindern nicht systematisch zur Verfügung steht und von ihnen auch nicht systematisch genutzt wird (vgl. z.B. Pinker 1994 für einen Überblick). Aus dem logischen Problem des Spracherwerbs (quantitative und qualitative Unterdeterminiertheit des kindlichen inputs sowie fehlende negative Evidenz) leitet sich die Annahme ab, der Hypothesenraum des Kindes müsse intern eingeschränkt sein, um einen erfolgreichen Spracherwerb zu garantieren. Mit der Prinzipien- und Parametertheorie (Chomsky 1980a, b, 1981) stellte Chomsky ein Grammatikmodell vor, das dies gewährleistet. Nach seiner Vorstellung verfügt das Kind über ein genetisch verankertes, sprachspezifisches Wissenssystem – die Universalgrammatik (UG). Die UG besteht zum einen aus universell für alle Sprachen geltenden Wohlgeformtheitsprinzipien, zum anderen stellt sie ein System von Strukturoptionen, den Parametern, zur Verfügung. Prinzipien und Parameter schränken den Hypothesenraum in größtmöglichem Maße ein. Der Spracherwerb beschränkt sich in diesem Ansatz auf die Festlegung der in der zu erwerbenden Sprache gültigen Parameterwerte. Deren Festlegung wird durch geeignete input-Daten (positive Evidenz) ausgelöst. Der Spracherwerb vollzieht sich nach dieser Vorstellung im Zusammenspiel von angeborenem, sprachspezifischem Wissenssystem (UG) und sprachlichem input des Kindes. Neben einem Erwerbsmodell liefert die Prinzipien- und Parametertheorie auch eine Erklärung für die Ähnlichkeiten und Variationsmöglichkeiten zwischen den Sprachen der
126 Welt. Während die universell gültigen Prinzipien die Gemeinsamkeiten zwischen den Sprachen erfassen, erlauben Parameter begrenzte Variationsmöglichkeiten zwischen den Sprachen. Die Beobachtung von Universalien sowie auch die Zusammenhänge zwischen verschiedenen syntaktischen Phänomenen (z.B. Subjektauslassungen, Fehlen von Expletiva und bestimmte Stellungsmöglichkeiten des Subjekts, die im so genannten pro-drop-Parameter zusammengefasst sind) können in diesem Modell gut erklärt werden. Während Chomskys Prinzipien- und Parametermodell bei der Lösung des Spracherwerbsproblems auf angeborene sprachspezifische Strukturen setzt, greift der Konnektionismus die vielfältigen Bedenken auf, die in anderen Denkgebäuden wie dem Funktionalismus (Givón 1979, Bates & MacWhinney 1982, Elman et al. 1996) oder dem Konstruktivismus (z.B. Piaget 1980, Quartz & Sejnowski 1997, Westermann 2000) gegen Chomskys nativistischen, domänen-spezifischen Erwerbsmechanismus vorgebracht wurden (vgl. Penke & Rosenbach 2004). Das Verdienst des Konnektionismus ist es, gezeigt zu haben, wie erfolgreich einfache, auf Frequenz und Ähnlichkeit basierende und nicht-sprachspezifische Lernmechanismen sein können (vgl. z.B. Elman et al. 1996, Seidenberg & MacDonald 1999). Tatsächlich spielen solche Lernvorgänge im Spracherwerb, beispielsweise bei der Segmentierung des Sprach-inputs, eine wichtige Rolle (vgl. z.B. Saffran, Aslin & Newport 1996, Jusczyk 2001, Gómez & Gerken 2001). Konnektionistische Netze weisen gewisse Ähnlichkeiten mit dem Gehirn auf: Neben der gelungenen Demonstration des Potentials einfachster Netze und assoziativer, domänen-unspezifischer Lernmechanismen wird als ein weiterer Vorteil konnektionistischer Netze gesehen, dass die Organisations- und Arbeitsprinzipien konnektionistischer Netze eine größere Ähnlichkeit zu den realen Vorgängen im Gehirn aufweisen, als dies in symbolistischen Ansätzen der Fall ist (vgl. z.B. Smolensky 1988, Sejnowski 1986, Müller 1992, Churchland & Sejnowski 1992, Elman et al. 1996 sowie Smolensky 1999). Smolensky (1988) z.B. schreibt: „There seems no denying, however, that the subconceptual [= konnektionistischer] level is significantly closer to the neural level than is the conceptual [= symbolischer] level […]“ (ebd.: 9) (Erläuterungen von der Autorin)
So ähnelt der Aufbau der Knoten eines Netzes mit Eingangs- und Ausgabeverbindungen und einer Berechnungseinheit dem Aufbau von Nervenzellen. Die Transferfunktion, die die erhaltenen Aktivierungen aufsummiert und über die Aktivierung nachgeschalteter Knoten entscheidet, soll die Vorgänge, die zur Aktivierung von Neuronen führen, simulieren. Und die Vielzahl der gewichteten Verbindungen zwischen Knoten spiegelt die komplexe Vernetzung der Nervenzellen im Gehirn. Die Vernetzung der Knoten konnektionistischer Netze ermöglicht überdies eine parallele Informationsverarbeitung, die als notwendig erachtet wird, da eine serielle Informationsverarbeitung aufgrund der geringen Nervenleitgeschwindigkeiten des Gehirns ausgeschlossen werden kann (Müller 1992). Dass die einfachen Verarbeitungsvorgänge in neuronalen Netzen (gewichten, summieren, aktivieren) zu einem Verhalten führen, das traditionell als regelbasierte Symbolmanipulation beschrieben wurde, spricht auch all diejenigen an, die mit der Frage, wie Symbole und Regeln im Gehirn implementiert sein könnten, ihre Schwierigkeiten haben. In den Worten MacWhinneys (2000):
127 „Neural networks require that the computations involved in the models echo the connectionist architecture of the brain. [...]. Neurons do not send Morse code, symbols do not run down synapses, and brain waves do not pass phrase structure.“ (ebd.: 123)
Selbst Vertreter des Symbolismus (z.B. Fodor & Pylyshyn 1988, Pinker 1999, Marcus 1999) sehen als einen wichtigen Beitrag des Konnektionismus, dass er einen Anhaltspunkt dafür liefert, wie klassische, symbolmanipulierende Systeme in der neuronalen Architektur des Gehirns implementiert sein könnten. Dieser Enthusiasmus erscheint jedoch übereilt. Zum einen gibt es doch recht erhebliche Unterschiede zwischen der Organisation und Arbeitsweise von Nervenzellen und den Knoten konnektionistischer Netze (vgl. z.B. Crick & Asanuma 1986). Knoten konnektionistischer Netze können daher im besten Fall als Modelle eines idealisierten Standardneurons angesehen werden. Der äußerst komplexen Vorgänge bei der Aktivierung von Nervenzellen sowie bei den durch Lernvorgängen ausgelösten synaptischen Veränderungen werden diese Knoten jedoch nicht gerecht. Entsprechend beschreibt Francis Crick seine Rolle bei der Entstehung des Klassikers der konnektionistischen Literatur, dem Sammelband Parallel Distributed Processing (Rumelhart & McClelland et al. 1986), wie folgt: „[...] almost my only contribution to their efforts was to insist that they stop using the word neurons for the units of their networks […]“ (Crick 1995: 186) (Hervorhebung im Original)
Auch andere Aspekte der neuronalen Organisation, wie das Auftreten unterschiedlicher Neuronentypen und verschiedener Typen von Synapsen, die Schichten- und Säulenanordnung von Neuronen im Kortex sowie die nach Kortexareal variierende Art und Dichte der Neuronen (vgl. z.B. Kolb & Wishaw 1993 für eine Einführung in die Organisationsprinzipien des Kortex), finden in konnektionistischen Netzen keinen Niederschlag (vgl. z.B. Lamm 1998, Hoffman 1998). Weitere Kritik zielt vor allem auf die Vorgänge während der Lernphase konnektionistischer Netze. So wird überwachten Lernprozeduren wie dem backpropagation-Algorithmus vorgeworfen, unrealistische Annahmen über Lernvorgänge zu implementieren. Auch die Frage, ob es für die entgegen der Verarbeitungsrichtung laufende Information über die Diskrepanz zwischen Ziel und tatsächlicher Ausgabe ein neuronales Vorbild gibt, ist umstritten (vgl. z.B. Page 2000). Außerdem ist die Lerndauer in konnektionistischen Netzen in kritischer Weise von der Netzgröße abhängig. Größere Netze benötigen mehr Beispiele, mehr Trainingsdurchläufe und mehr Berechnungszeit. Für Netze von der Größe des Gehirns führt dies jedoch zu unrealistischen Szenarien (Hinton 1992). Ein weiteres Problem, das durch die spezifischen Lernverfahren konnektionistischer Netze bedingt ist, ergibt sich durch das stability-plasticity dilemma (Grossberg 1987, McCloskey & Cohen 1989). Dieses kennzeichnet das Problem eines lernenden Systems, einmal Gelerntes stabil zu bewahren und vor Überschreibungen zu schützen, dennoch aber plastisch genug zu sein, um auch neu zu Lernendes noch repräsentieren zu können. Probleme treten auf, weil in konnektionistischen Netzen zur Berechnung der fehlerminimierenden Gewichtungsänderungen das gesamte Trainingsset berücksichtigt werden muss. All das bereits Gelernte, das nicht mehr in diesem Trainingsset enthalten ist, ist vor Überschreibungen nicht geschützt. Dieses catastrophic interference genannte Problem tritt bei Lernvorgängen des Menschen jedoch nicht auf: Menschliche Versuchspersonen sind durchaus in der Lage, mehrere völlig unabhängige Trainingssets zu lernen, ohne dass es zu
128 einem Verlust der zuerst gelernten Information kommt.26 Angesichts dieser Probleme wirft Page (2000) die Frage auf, welche Aussagekraft konnektionistische Modelle überhaupt noch hätten, wenn sich zeigte, dass sich die Festsetzung der Verbindungsgewichtungen, die den Lernvorgang charakterisieren und die Wissensrepräsentation kodieren, niemals aus den neuronalen Mechanismen unseres Gehirns ergeben könnte (für eine ähnliche Kritik vgl. Green 1998a und die daran anschließenden Diskussionen). Letztlich bietet auch der Konnektionismus keine Lösung für die Frage, wie Bedeutung im neuronalen Substrat des Gehirns implementiert ist. Konnektionistische Netze sind insofern lediglich eine Variante des ‚Chinesischen Zimmers’ von Searle (1980, 1990). In Searles chinesischem Zimmer sitzt ein Mensch, der nach festgelegten formalen Regeln für bestimmte visuelle Eingabezeichen, die zufällig chinesische Wörter sind, bestimmte visuelle Zeichen ausgibt, die auch zufällig chinesische Wörter sind. Die Regeln sind dabei so gefasst, dass die Ausgaben von den Antworten eines chinesischen Sprechers nicht zu unterscheiden sind. Der Mensch im Zimmer beherrscht allerdings kein Chinesisch. Für ihn sind Ein- und Ausgaben völlig sinnlos. Searle fragt nun, ob man in diesem Fall dem Zimmer Kenntnisse des Chinesischen zusprechen könne. Ursprünglich wendete sich Searle mit diesem Gedankenexperiment gegen die Annahme, Denken sei nichts weiter als die nach rein formalen, syntaktischen Regeln ausgeführte Manipulation von Symbolen. Der Einwand greift aber auch für konnektionistische Modelle (vgl. aber Churchland & Smith Churchland 1990). Die formalen Regeln, nach denen der Mensch im chinesischen Zimmer für Eingaben Ausgaben erzeugt, sind dabei lediglich durch ein Nachschlagewerk ersetzt, in dem für jede Eingabe eine Ausgabe notiert ist. Konnektionistische Modelle sind in dieser Hinsicht tatsächlich nicht näher an der Lösung des Problems, wie mentale Zustände oder Repräsentationen im Gehirn entstehen, als symbolistische Ansätze. Konnektionistische Netze gehen von einer Kontinuität der Lernmechanismen von Mensch und Tier aus: Ein traditionelles, auf Darwin zurückgehendes Ziel der psychologischen Lernforschung ist es, eine Kontinuität der mentalen Fähigkeiten zwischen menschlichen und nicht-menschlichen Lebensformen zu begründen (vgl. Gluck & Bower 1988, Macphail 1996). Da alle bisher untersuchten Wirbeltiere zu assoziativem Lernen fähig sind und dies relativ unkontrovers als Basis der nicht-menschlichen Lernfähigkeit gesehen wird (Macphail 1996, Thomas 1996, Deacon 1998), erscheint es – nicht zuletzt angesichts der relativ geringen –––––––—–– 26
Um das Fehlen einer katastrophalen Interferenz beim Menschen zu erklären, haben McClelland, McNaughton & O‘Reilly (1995) zwei unterschiedliche Lernprozeduren in zwei distinkten Arealen des Gehirns vorgeschlagen. Demzufolge ermöglicht der Hippocampus ein schnelles Lernen von Assoziationen, während sich die Langzeitspeicherung im Neocortex vollzieht. Um eine Überschreibung des dort bereits gespeicherten Materials zu verhindern, wird gleichsam ein Trainingsset für den Neocortex konstruiert, das neben den kurzfristig im Hippocampus abgelegten Assoziationen auch andere bereits im Langzeitgedächtnis gespeicherte Assoziationen enthält. Page (2000) hat darauf hingewiesen, dass dieser Vorschlag das Problem der catastrophic interference lediglich aus dem Neocortex auf den Hippocampus verlagert. Auch sei unklar, wie aus dem Langzeitspeicher eine repräsentative Menge der input-Aktivierungen, mit denen er vormals trainiert wurde, extrahiert werden könne.
129 genetischen Unterschiede zwischen den verschiedenen Spezies – als vorteilhaft, auch menschliche kognitive Fähigkeiten so weit als möglich auf assoziative Mechanismen zurückzuführen.27 „[...] interest in relating human cognition to configurations of elementary associative connections has recently been revived by the development of adaptive networks as models of cognitive processes [...] This theoretical movement represents a return to a traditional goal of psychology, which was to view complex human abilities as emerging from configurations of elementary associative processes that could be studied in simple organisms.“ (Gluck & Bower 1988: 227)
Allerdings stellt sich in diesem Fall das Problem, warum nicht-menschliche Spezies (zumindest spontan) nicht in der Lage sind, ein Kommunikationssystem zu entwickeln, das die Charakteristika der menschlichen Sprachfähigkeit aufweist (vgl. Macphail 1996, Deacon 1998). Wie Macphail (1996) schreibt: „[…] the acquisition of language cannot be explained in terms of the operation of associationformation devices of general application: if that was true, then non-humans, in which such devices can readily be demonstrated, should be capable of language acquisition.“ (ebd.: 287).28
Außerdem gibt es auch in der Lerntheorie Befunde, die dafür sprechen, dass Menschen neben assoziativen Mechanismen noch über komplexere, regelbasierte und Hypothesen testende Systeme verfügen, also eine Diskontinuität in den kognitiven Fähigkeiten von Mensch und Tier vorliegt. Ein klassischer Effekt, der bei assoziativen Lernvorgängen bei Tier und Mensch beobachtet werden kann, ist der so genannte peak-shift-Effekt (Hanson 1959, Mackintosh 1997). Trainiert man z.B. Tauben darauf, zwei Stimuli (S+ und S-) zu diskriminieren, die zwar eine distinkte zentrale Tendenz haben, sich aber aus in einer Dimension überlappenden Elementen zusammensetzen, dann zeigt sich die beste Diskriminationsleistung nicht für den trainierten Stimulus S+ selbst, sondern für einen Stimulus, der auf der gegebenen Dimension in der Nähe von S+, aber weiter von S- entfernt liegt als S+. Bei Präsentation von Stimuli, die zunehmend von S+ entfernt sind, verschlechtert sich die Diskriminationsleistung dann wieder. Abbildung 4.12 verdeutlicht den peak-shift-Effekt und seine Erklärung an einem schematischen Beispiel, in dem Stimuli 3 (S+) und 4 (S-) unterschieden werden sollen. Da Stimulus 3 sich zwar überwiegend aus Elementen der –––––––—–– 27
28
Inwieweit nicht-menschliche Spezies zur Symbolmanipulation fähig sind, wird – wie aufgrund der hier skizzierten Debatte zwischen Symbolisten und Konnektionisten nicht anders zu erwarten ist – ebenfalls sehr kontrovers diskutiert (vgl. z.B. Thomas 1996, Deacon 1998). Auf der Basis der vorliegenden Daten zum Erwerb sprachähnlicher Systeme durch nichtmenschliche Primaten – insbesondere Gorillas, Schimpansen und Bonobos – hat sich innerhalb der linguistischen Gemeinschaft der Konsens herausgebildet, dass bislang keine Evidenz für einen dem Menschen vergleichbaren Spracherwerb vorliegt (z.B. Terrace et al. 1978, Seidenberg & Petitto 1979, Pinker 1994, aber Savage-Rumbaugh 1990, Savage-Rumbaugh et al. 1993). Deacon (1998) führt aus, dass selbst wenn Sprachlernexperimente mit Primaten Evidenz für die Herausbildung eines grammatischen Systems ergäben, die Frage bliebe, warum diese Fähigkeit zum Beispiel Haustieren, die häufig einem ähnlichen Sprach-input wie Kinder ausgesetzt seien, abgehe. Seiner Meinung nach lässt sich dieser Unterschied nicht auf einen quantitativen Unterschied in der Intelligenz zurückführen, da selbst einfachste symbolische Systeme, deren Erwerb durchaus im Rahmen der kognitiven Möglichkeiten von Haustieren sein sollte, von nicht-menschlichen Spezies spontan nicht erworben werden können.
130 Kategorie 3 zusammensetzt, jedoch auch Elemente benachbarter Kategorien (2 und 4) enthält, werden bei Erwerb der Kategorie S+ auch die Elemente benachbarter Kategorien aktiviert. Der Erwerb der Kategorie 4 (S-) führt dagegen zu einer Hemmung der beteiligten Elemente. In der Summe führt das dazu, dass die Unterscheidung von Stimulus 4 (S-) für den Stimulus 2 noch besser gelingt als für den trainierten Stimulus 3, da Stimulus 2 insgesamt ein höheres Aktivierungsniveau als 3 hat. Für den Stimulus 1, der noch weiter von der gelernten Kategorie S+ entfernt ist, gelingt die Unterscheidung von 4 (S-) dann wieder deutlich schlechter, da das Aktivierungsniveau von 1 unter dem des Stimulus 2 liegt.
Abb. 4.12: Schematische Darstellung des peak-shift-Effekts (nach Mackintosh 1997)
Ein solcher peak-shift-Effekt, der Folge merkmalsbasierter assoziativer Lernprozeduren ist, tritt bei entsprechenden experimentellen Untersuchungsdesigns sowohl bei Tauben als auch bei Menschen auf (vgl. Mackintosch 1997). Anders als bei Tauben zeigt sich der peak-shiftEffekt bei menschlichen Versuchspersonen jedoch dann nicht, wenn diese in der Lage sind, eine abstrakte Relation zwischen den zwei zu unterscheidenden Stimuli zu entdecken, die dann auf andere Stimuli generalisiert werden kann. So zeigen zwar Tauben, die trainiert wurden, Licht mit einer Wellenlänge von 550 nm (Nanometer) (S+) von Licht mit einer Wellenlänge von 560 nm (S-) zu unterscheiden, einen peak-shift-Effekt: D.h. die Unter-
131 scheidung von Licht mit einer Wellenlänge von 560 nm gelingt für Licht mit einer Wellenlänge von 540 nm zunächst sogar besser. Die Unterscheidungsleistung nimmt dann aber mit zunehmender Entfernung von S+ (530 nm, 520 nm ...) ab (vgl. Hanson 1959, Mackintosh 1997). Bei menschlichen Versuchspersonen dagegen verbesserten sich die Leistungen sogar, je weiter die Wellenlängen der getesteten Stimuli von S+ abwichen (vgl. Mackintosh 1997). Nach Mackintosh (1997) zeigen diese Befunde dementsprechend: „The results of this [...] set of experiments suggest that, under certain circumstances, an elementary associative learning theory provides as accurate an account of the behavior of people as it does of pigeons. As these experiments also provide clear evidence that, under other circumstances, human subjects will behave in a quite different way, the implication is, that they also possess other, more complex systems for solving problems and learning about the world in which they live.“ (ebd.: 894)
Die Kompositionalität, Produktivität und Systemhaftigkeit sprachlicher Repräsentationen kann mit konnektionistischen Netzen nicht erfasst werden: Seit den ersten konnektionistischen Simulationen hat es prinzipielle Kritik am Konnektionismus gegeben. Am einflussreichsten war in dieser Hinsicht sicher die 1988 in der Zeitschrift Cognition veröffentlichte Arbeit von Fodor & Pylyshyn, die zu einer mehrere Jahre umspannenden Diskussion zwischen Konnektionisten und Symbolisten führte. Fodor & Pylyshyn nennen als Evidenz für die Annahme, dass insbesondere sprachliche Fähigkeiten auf symbolverarbeitenden Prozessen beruhen, Produktivität sowie Systemhaftigkeit und Kompositionalität kognitiver Repräsentationen. Das Argument der Produktivität geht auf Chomskys Überlegungen zur menschlichen Sprachfähigkeit zurück, die von ihm als eine prinzipiell unbegrenzte Fähigkeit, Sätze zu erzeugen, zu verstehen oder zu beurteilen, angesehen wird (Chomsky 1957, 1965). Um die unbegrenzten Ausdrucksmöglichkeiten, also die Produktivität der Sprachfähigkeit, in einem finiten System zu erfassen, benötigt man Chomsky zufolge Symbole, die sich kombinieren lassen. Die Systemhaftigkeit kognitiver Fähigkeiten ergibt sich aus der Kenntnis der strukturellen Beziehungen, die zwischen Symbolen bestehen, so wie sie z.B. in den Phrasenstrukturregeln der Syntax zum Ausdruck kommen. Die Kompositionalität kognitiver Fähigkeiten bezieht sich dagegen auf die Semantik kognitiver Repräsentationen. Fodor & Pylyshyn erläutern Kompositionalität und Systemhaftigkeit am Beispiel der Teil-Ganzes-Beziehung. Eine Regel der Art ‚wenn A&B dann A’ lässt sich auch in konnektionistischen Netzen implementieren. Ein Knoten, der die Eingabe A&B repräsentiert, würde dann einen Knoten aktivieren, der die Ausgabe A hervorbrächte. Im Gegensatz zu klassischen Modellen besteht in antisymbolistischen konnektionistischen Modellen allerdings weder strukturell noch semantisch eine Teil-Ganzes-Beziehung zwischen beiden Knoten. Knoten A repräsentiert keine Teilmenge des Knotens A&B, er ist also keine Konstituente des Knotens A&B. Da Knoten A&B keine kombinatorische Struktur bzw. Syntax hat, könnte er genauso gut als ‚Z’ bezeichnet werden. Aufgrund der fehlenden kombinatorischen Struktur des Knotens A&B ergibt sich auch seine Bedeutung nicht aus der Bedeutung zweier Knoten mit der Bedeutung A und B. Laut Fodor & Pylyshyn liegt das Hauptproblem des Konnektionismus also darin, dass in einem konnektionistischen Netz die Relation ‚X ist eine Konstituente von Y’ nicht repräsentiert werden kann. Fodor & Pylyshyn schließen dementsprechend:
132 „What’s deeply wrong with Connectionist architecture is this: Because it acknowledges neither syntactic nor semantic structure in mental representations, it perforce treats them not as a generated set but as a list. But lists, qua lists, have no structure; any collection of items is a possible list. And, correspondingly, on Connectionist principles, any collection of (causally connected) representational states is a possible mind. So, as far as Connectionist architecture is concerned, there is nothing to prevent minds that are arbitrarily unsystematic.“ (ebd.: 49)
4.2.5 Zusammenfassung und Diskussion Ein großes Verdienst des Konnektionismus liegt darin, auf der Basis konnektionistischer Simulationen eine Gegenposition zu starken nativistischen Positionen wie der Prinzipienund Parametertheorie entworfen zu haben, in der die menschliche Sprachfähigkeit auf angeborenen, sprachspezifischen Repräsentationen basiert. Die Fähigkeit, auf der Basis domänen-unspezifischer assoziativer Lernvorgänge verschiedenste kognitive Fähigkeiten zu erwerben, ohne dass dafür auf ‚angeborenes’ domänen-spezifisches Wissen zurückgegriffen werden muss, ist sicher eine besondere Stärke konnektionistischer Netze. Sie zwingt uns, darüber nachzudenken und zu spezifizieren, was domänen-spezifische, angeborene Charakteristika der menschlichen Sprachfähigkeit sein könnten. Tatsächlich haben solche Überlegungen in der theoretischen Linguistik mittlerweile zu Modifikationen geführt, die das Ziel haben, den Umfang angeborener sprachspezifischer Komponenten zu minimieren. Neben dem Verzicht auf Parameter wird dabei versucht, sprachspezifische Prinzipien durch Prinzipien zu ersetzen, die nicht sprachspezifisch sind, sondern allgemeine Forderungen nach Ökonomie oder Vollständigkeit von Repräsentationen beinhalten, generelle Strukturierungsprinzipien ausdrücken oder den Anwendungsbereich einer Operation begrenzen (vgl. z.B. Bierwisch 1992, 1996, Fanselow 1991, 1992, 1993, Haider 1993, 1996, Chomsky 1992, 1995, Kayne 1994, Eisenbeiss 2002, Wunderlich 2004). Sprachspezifische Repräsentationen ergeben sich dabei erst durch die Anwendung dieser Prinzipien auf sprachliches Material. So wurde z.B. das detaillierte x-bar-Schema durch die einfache Operation merge abgelöst (Chomsky 1995), Wortstellungsparameter wie der Kopfparameter durch Prinzipien ersetzt, die fordern, dass alle Strukturen rechtsverzweigen (Kayne 1994) und Köpfe konsistent platziert werden (Fanselow 1993), und sprachspezifische Prinzipien wie das elsewhere-Prinzip gegen sprachunspezifische Prinzipien wie das Spezifizitätsprinzip ausgewechselt, dass das Zusammenspiel von Regeln und Ausnahmen auch in anderen kognitiven Domänen regelt (Eisenbeiss 2002, Wunderlich 2004). Von diesen Bestrebungen losgelöst ist jedoch die Frage zu bewerten, ob die menschliche Sprachfähigkeit (oder auch andere kognitive Fähigkeiten) auf der Manipulation von Symbolen basiert. Mit dem Bereich der regulären und irregulären Flexion schien ein leicht zu erfassender, überschaubarer Gegenstand vorzuliegen, an dem diese grundlegende Frage untersucht werden konnte. In den Jahren der Auseinandersetzung zwischen Konnektionisten und Vertretern dualistischer Ansätze zur Flexion hat sich der Fokus der Kontroverse jedoch immer weiter verschoben: „The past tense question originally became popular in 1986 when Rumelhart and McClelland (1986a) asked whether we really have mental rules. Unfortunately, as the proper account of the past tense has become increasingly discussed, Rumelhart and McClelland’s straightforward
133 question has become twice corrupted. Their original question was ‚Does the mind have rules in anything more than a descriptive sense?’ From there, the question shifted to the less insightful ‚Are there two processes or one?’ and finally to the very uninformative ‚Can we build a connectionist model of the past tense?’“ (Marcus 2001: 82-83)
In den letzten 20 Jahren wurde in experimentellen Arbeiten eine umfangreiche und beeindruckende Sammlung von Beobachtungen zusammengetragen, die Evidenz für eine qualitativ unterschiedliche Repräsentation regulär und irregulär flektierter Formen liefern. Ob antisymbolistische konnektionistische Netze in der Lage sein werden, diese Beobachtungsdaten zu simulieren, ist letztlich eine empirische Frage. Es liegen jedoch durchaus bereits Modelle – wie Westermanns konstruktivistisches Netz – vor, die eine Reihe der in Kapitel 4.1 diskutierten Phänomene simulieren können. Unabhängig von der empirischen Frage, ob die Simulation der Beobachtungsdaten zur regulären und irregulären Flexion gelingen wird, ist jedoch Folgendes zu bedenken: Selbst wenn konnektionistische Simulationen die vorliegenden Daten zu Erwerb, Verarbeitung, Produktion und Beeinträchtigung regulär und irregulär flektierter Formen in einer assoziativen Netzstruktur erfassen könnten, wäre dies weder ein Beweis für eine unitär-assoziative Repräsentation regulär und irregulär flektierter Formen noch Evidenz gegen symbolmanipulierende kognitive Operationen im Allgemeinen und gegen eine symbolbasierte Repräsentation der regulären Flexion im Besonderen. Derart gelungene Simulationen würden lediglich belegen, dass die vorhandene Datenlage mit beiden vorgeschlagenen Repräsentationsmodellen kompatibel ist. Bei der Bewertung der Adäquatheit konnektionistischer Simulationen muss jedoch auch bedacht werden, dass die zur Zeit diskutierten Modelle auf gravierende Weise zu kurz greifen. Selbst eine scheinbar einfache Operationen wie die Bildung einer flektierten Form setzt eine Reihe komplexer kognitiver Operationen voraus, die weit über die einfache, assoziative Verknüpfung zweier Wortformen hinausgehen, die konnektionistische Netze zur Zeit leisten können. Beispielsweise können die konzeptuell-semantischen Faktoren, die erst zur Verwendung flektierter Elemente führen, in den heutigen konnektionistischen Netzen nicht erfasst werden. Die Verwendung einer Pluralform setzt z.B. voraus, dass die Instanzen, auf die ein Nomen referiert, zählbar und kumulierbar sind. Für Massenomina wie Mehl, bei denen dies nicht möglich ist, ist die Bildung einer Pluralform ausgeschlossen.29 Da konnektionistische Netze über keine Repräsentationsebene verfügen, auf der dieses (kategoriale) Wissen erfasst ist, sondern ihre Ausgabe allein auf der Basis der Übereinstimmung und Frequenz der Merkmale des Eingaberaums bestimmen, ist die Ungrammatikalität einer Pluralform wie Mehle für sie nicht erkennbar. Ohne eine solche Repräsentationsebene können konnektionistische Netze zwar lernen, eine gegebene Eingabemenge mit den jeweils korrekten Ausgaben zu verknüpfen, das System der Pluralflexion haben sie jedoch nicht erworben. Grundlegende Erwägungen zur Produktivität der menschlichen Sprachfähigkeit sowie zur Systemhaftigkeit und Kompositionalität sprachlicher Repräsentationen, wie sie von Fodor & Pylyshyn (1988) vorgebracht wurden, sprechen meiner Ansicht nach klar gegen antisymbolistische konnektionistische Ansätze. Die Fähigkeit, auf der Basis spezifischer Instanzen Kategorien zu abstrahieren und diese durch kognitive Operationen zu manipulieren, ist eine zentrale kognitive Fähigkeit des Menschen. Ohne sie kann die menschliche –––––––—–– 29
Dies gilt natürlich nur, wenn Mehl auch als Massenomen verwendet wird.
134 Sprachfähigkeit nicht erfasst werden. Die zentralen Merkmale der Sprachfähigkeit sind Systemhaftigkeit und Kompositionalität sowie die diskrete Infinitheit (Chomsky 1988b) sprachlicher Repräsentationen. Der Begriff der diskreten Infinitheit bezeichnet die Fähigkeit, mit diskreten Einheiten und (rekursiven) Kombinationsoperationen eine unbegrenzte Menge an Ausdrücken generieren zu können.30 Die Erzeugung einer prinzipiell unbegrenzten Menge sprachlicher Ausdrücke, die eine systematische und kompositionale Strukturierung aufweisen, setzt jedoch zwingend voraus, dass die Kombinationsregeln mit Kategorien wie Verb, Nomen oder Affix operieren, die Abstraktionen ihrer möglichen Instanzen sind. Die Fähigkeit, auf der Basis einer begrenzten Menge konkreter input-Daten abstrakte Repräsentationen zu generalisieren, konnten Marcus et al. (1999) bereits bei sieben Monate alten Säuglingen nachweisen. In ihrer Untersuchung präsentierten sie Säuglingen Silbenfolgen wie li-ti-li oder ga-ti-ga. Anschließend testeten sie, ob die untersuchten Säuglinge in der Lage waren, auch bei ihnen unbekannten Stimuli zu den Trainingsstimuli konsistente Silbenfolgen (etwa wo-fe-wo) von anderen Silbenfolgen (etwa wo-fe-fe) zu unterscheiden. Nach Marcus et al. setzt dies voraus, dass aus den gehörten Silbenfolgen ein abstraktes Muster ABA generalisiert wird, das dann auch auf unbekannte Stimuli angewendet werden kann. Tatsächlich waren die untersuchten Säuglinge zu dieser Abstraktion in der Lage. Antisymbolistische konnektionistische Netze sind dazu laut Marcus et al. (vgl. auch Marcus 1998b, 1999, 2001) jedoch nicht fähig, da sie neue input-Daten nur auf der Basis ihrer Merkmalsähnlichkeit zu bereits gelernten Stimuli verarbeiten, aber kein abstraktes Schema generalisieren können. Stimmen dagegen die Teststimuli hinsichtlich ihrer phonologischen Merkmale nicht mit den bisher gehörten Stimuli überein, wie dies im Testmaterial von Marcus et al. der Fall war, dann gelangen konnektionistische Netze – im Gegensatz zu Säuglingen – nicht zu einer sinnvollen Reaktion. Die Reaktion der Säuglinge lässt nach Marcus et al. daher nur den Schluss zu, dass bereits Babys in der Lage sind, aus kleinsten Datenmengen Regeln zu abstrahieren, die Relationen zwischen Variablen erfassen. Während der Aufbau und die Manipulation symbolischer Repräsentationen selbst Babys mühelos zu gelingen scheint, ist er anderen Spezies wahrscheinlich nicht (bzw. nur nach extensivem Training) möglich (vgl. Bierwisch 1992, Deacon 1998, Jenkins 2000, Marcus 2001). Deacon (1998) verdeutlicht die Schwierigkeiten, die selbst Schimpansen beim Aufbau symbolischer Repräsentationen haben, anhand der Ergebnisse einer experimentellen Untersuchung von Sue Savage-Rumbaugh und Duane Rumbaugh (vgl. auch SavageRumbaugh et al. 1978, 1980, Savage-Rumbaugh 1986). Ziel dieses Experimentes war es, Schimpansen ‚Wörter’ in Form von so genannten Lexigrammen (willkürlichen Symbolen auf einer Computertastatur) sowie eine einfache Kombinationsregel dieser Lexigramme beizubringen. Die Schimpansen lernten dabei zwei ‚Verb’-Lexigramme (z.B. das Lexigramm mit der Bedeutung geben) und vier Lexigramme für Nahrungsmittel. Diese Lexigramme sollten dann in einer ‚Verb-Nomen’-Kombination verwendet werden, die den Schimpansen mit vier Beispielen präsentiert wurde. Zwar stellte der Erwerb der –––––––—–– 30
Diese Eigenschaft kommt auch dem Zahlensystem zu. Nicht-menschliche Kommunikationssysteme haben diese Eigenschaft dagegen nicht. Sie nutzen entweder ein begrenztes Repertoire diskreter Einheiten, die jedoch nicht kombinierbar sind, oder ihre Ausdrucksmöglichkeiten sind zwar prinzipiell unbegrent, werden jedoch nicht durch die Kombination diskreter Einheiten erreicht. So wird beispielsweise die Entfernung von einer Futterquelle bei Bienen durch die Intensität des Tanzes kodiert (vgl. Chomsky 1988b, Jenkins 2000).
135 Lexigramme, der eine Assoziation von Form und Bedeutung verlangt, kein größeres Problem dar. Der Erwerb der Kombinationsregel, der eine abstrakte Kategorisierung in ‚Verb/Tätigkeit’- und ‚Nomen/Nahrungsmittel’-Lexigramme erfordert, gelang jedoch erst nach einem äußerst aufwändigen Trainingsregime, in dem den Schimpansen zunächst über assoziative Lernprozeduren nicht nur die zulässigen, sondern auch die unzulässigen Lexigrammkombinationen beigebracht werden mussten. Anschließend wurde dann nur noch die Produktion der zulässigen Kombinationen belohnt, während die Produktion unerwünschter Kombinationen nicht mehr zu einer Belohnung führte. Nach tausenden von Trainingsdurchgängen produzierten die Schimpansen schließlich nur noch die gewünschten Kombinationen und waren außerdem ohne ein weiteres extensives Training in der Lage, ein neu eingeführtes Nahrungsmittellexigramm korrekt zu kombinieren. Die mühelose Integration des neuen Lexigramms belegt, dass sie schließlich nicht nur Assoziationen zwischen verschiedenen Lexigrammen und bestimmten Ereignissen (Belohnung oder nicht) gelernt, sondern eine abstrakte Kategorisierung von verschiedenen Typen von Lexigrammen und eine abstrakte Kombinationsregel, die über diesen Typen operiert, erworben hatten. Dass dieser Erwerb jedoch die Präsentation, das Lernen und das anschließende Verlernen der unzulässigen Kombinationen erforderte, verdeutlicht die Unterschiede in den symbolischen Fähigkeiten von Schimpansen und Menschen. Die Herausbildung mentaler, abstrakte Kategorien enthaltender Repräsentationen sowie die Manipulation dieser Kategorien durch ein kombinatorisches System, das es ermöglicht, hierarchische Relationen zwischen Kategorien herzustellen, sind Fähigkeiten, ohne die die menschliche Sprachfähigkeit nicht erfasst werden kann. Konnektionistische Netze, die symbolische mentale Repräsentationen ablehnen, mögen zwar einen begrenzten Datenbereich adäquat simulieren, ein Modell unseres sprachlichen Wissens können sie meiner Ansicht nach jedoch nicht bieten.
5 Affixeinträge
Die in Kapitel 4.1 dargelegten Ergebnisse aus psycho- und neurolinguistischen Untersuchungen zur Flexionsmorphologie sprechen dafür, dass regulär flektierte Formen nicht als flektierte Vollformen im mentalen Lexikon gespeichert sind, sondern bei Bedarf durch eine produktive Operation gebildet werden. Bei Morphologen, die eine solche dualistische Sicht der Flexion teilen, gehen jedoch die Ansichten darüber auseinander, wie Flexionsaffixe in der Grammatik dann zu repräsentieren sind und ob sie mental einen eigenständigen Status haben (vgl. auch Kap. 1.1). Ziel dieses Kapitels ist es, diese Kontroversen zu skizzieren und darzustellen, was psycho- und neurolinguistische Befunde zur Klärung der Diskussionspunkte beitragen können.
5.1 Haben Affixe lexikalische Einträge? Eine grundlegende Kontroverse in der Morphologie betrifft die Frage, ob Flexionsaffixe eigene Einträge im mentalen Lexikon haben oder ob Flexion durch die Anwendung von Flexionsregeln geleistet wird, die phonologisches Material ohne eigenständigen lexikalischen Status an eine lexikalische Wurzel hinzufügen, die diese Wurzel aber auch verändern oder kürzen können. 5.1.1 Theoretische Kontroversen In Item-and-Arrangement Modellen der Morphologie (nach der Klassifikation von Hockett 1954) werden alle morphologischen Operationen als agglutinierend aufgefasst. Dementsprechend werden Morpheme als eigenständige lexikalische Objekte gesehen, die miteinander verknüpft werden (vgl. z.B. Spencer 1991, 1998, Coates 2000, Plungian 2000). In einem solchen Rahmen können grundsätzlich auch Flexionsaffixe als eigenständige lexikalische Objekte aufgefasst werden. Morphologische Ansätze, die Affixe als Morpheme mit eigenständigen lexikalischen Einträgen sehen, sind z.B. die Ansätze von Lieber (1980, 1992), Williams (1981), Selkirk (1982), Sproat (1985), Di Sciullo & Williams (1987), Jensen (1990) sowie auch die Minimalistische Morphologie von Wunderlich (Wunderlich & Fabri 1995, Wunderlich 1996a, b). Die Lexikoneinträge der Affixe müssen dabei außer Informationen über die phonologische Form der Affixe und über die morphosyntaktischen Merkmale, die sie realisieren, auch Informationen darüber enthalten, an welche lexikalischen Elemente sie affigiert werden können. In Wunderlichs Minimalistischer Morphologie beispielsweise sind Flexionsaffixe lexikalische Köpfe, die für phonologische und kategoriale Informationen spezifiziert sind. Input-Bedingungen geben die Merkmale an, die an einem Stamm instantiiert sein müssen, damit Stamm und Affix verknüpft werden können. Die morphosyntaktische Information, die durch das Affix hinzugefügt wird, wird als output
138 bezeichnet. Affixe sind gebundene Elemente, die Stämme einer bestimmten Kategorie wählen, um ihre Informationen für die Syntax verfügbar zu machen. Der vielleicht wichtigste Aspekt, der aus dieser konkatenativen Sicht der Flexionsmorphologie resultiert, ist, dass alle morphologischen Operationen als strikt additiv angesehen und erfasst werden müssen. Durch die Konkatenation eines Stamms mit einem Flexionsaffix wird sowohl phonologische Substanz als auch morphosyntaktische Information hinzugefügt. Während Flexionsaffixe Strukturen also lediglich aufbauen können, sind Regeln intrinsisch weniger restringiert. Eine Regel erlaubt es gleichermaßen, Strukturen auf- oder abzubauen. Damit erscheint der ‚Regel’-Ansatz als mächtiger – weil weniger restringiert. Aus heuristischen Gründen wäre daher die Auffassung, dass Flexionsaffixe in Lexikoneinträgen zu repräsentieren sind, vorzuziehen, wenn sie sich empirisch bei der Erfassung der Daten bewährt. Nicht-konkatenative morphologische Phänomene: Nicht alle morphologischen Operationen scheinen sich jedoch in dieses agglutinative Gesamtbild zu fügen, das im Rahmen des Item-and-Arrangement Ansatzes postuliert wird (vgl. Anderson 1992). Als Evidenz gegen agglutinative Item-and-Arrangement Modelle wird insbesondere auf nicht-konkatenative morphologische Phänomene verwiesen, die beispielsweise die phonologische Substanz einer Wurzel verändern oder sie zu zerstören scheinen (z.B. Tilgung, Ablaut, Umlaut, Metathese). Einer anderen morphologischen Tradition folgend, die auf Sapir (1921) zurückgeführt wird, werden solche modifikatorischen oder subtraktiven Marker als morphologische Operationen aufgefasst, die auf Stämme angewendet werden, um neue Stämme oder Wortformen zu produzieren (vgl. Spencer 1991, 1998, Wurzel 2000). Da sich nicht-konkatenative morphologische Phänomene dem agglutinativen Ideal zu widersetzen scheinen, wird im Sinne einer einheitlichen theoretischen Erfassung häufig gefordert, alle morphologischen Operationen als Anwendungen morphologischer Regeln oder Prozesse zu charakterisieren. So weist z.B. Stump (1998, 2001) darauf hin, dass die Annahme, reguläre Affixe hätten lexikalische Einträge, eine qualitative Distinktion zwischen konkatenativen und nicht-konkatenativen flexivischen Exponenten bedinge. „[…] it entails that the manner in which played comes from play is, in theoretical terms, quite separate from the manner in which sang comes from sing. This distinction, however, is poorly motivated.“ (Stump 1998: 35)
Wie in Kapitel 4.1 aufgezeigt wurde, ist der Unterschied zwischen regulärer und irregulärer Flexion tatsächlich jedoch keinesfalls unmotiviert. Die aufgeführten psycho- und neurolinguistischen Befunde haben vielmehr Evidenz für eine qualitative Distinktion der beiden Flexionstypen erbracht. Nur regulär flektierte Formen basieren demzufolge auf einer produktiven morphologischen Operation, während irregulär flektierte Formen als Vollformen in strukturierten lexikalischen Einträgen gespeichert sind. Während eine qualitative Distinktion zwischen regulärer und irregulärer Flexion als notwendig erscheint, ist eine andere Frage, ob sämtliche Phänomene, die nicht-konkatenativen morphologischen Operationen zugerechnet werden, durch Theorien im Item-andArrangement Rahmen erfasst werden können. Diese empirische Frage ist noch nicht geklärt. Zumindest die Minimalistische Morphologie hat sich jedoch bereits bei der Erfas-
139 sung auch nicht-konkatenativer Phänomene bewährt (vgl. z.B. die Analysen der Verbflexion des Georgischen und des klassischen Arabisch in Wunderlich 1996a und Wunderlich & Fabri 1995). In einer Reanalyse der Perfektbildung in Tohono O’odham, die als klassischer Fall einer Tilgungsoperation aufgeführt wird (z.B. Anderson 1992), konnte Steins (2000) beispielsweise zeigen, dass auch scheinbar nicht-konkatenative morphologische Prozesse von morphembasierten Theorien erfasst werden können. Steins argumentiert, dass der Exponent der Kategorie PERFEKT im Tohono O’odham gar nicht der gekürzte Verbstamm, sondern ein Suffix (-t) ist, das an ein Auxiliar affigiert wird. Die Tilgung von Segmenten des Verbstamms erscheint dagegen lediglich als ein phonologisch bedingter Nebeneffekt. Dass sich eine morphembasierte Erfassung aller nicht-konkatenativer Phänomene letztendlich als möglich erweist, kann daher nicht von vornherein ausgeschlossen werden. Unterschiede zwischen Lexemen und Affixen: Als weiteres Argument gegen Affixeinträge wird aufgeführt, dass eine Gleichsetzung von Lexikoneinträgen für lexikalische Hauptkategorien (hier Beards Terminologie folgend Lexeme genannt) und Affixeinträgen aufgrund ihres unterschiedlichen Verhaltens nicht gerechtfertigt ist. Beard (1987, 1988) nennt z.B. folgende Unterschiede von Affixen und Lexemen: Seiner Auffassung nach gibt es zwar Nullaffixe, die morphosyntaktische Merkmale ohne einen overten morphologischen Marker instantiieren, jedoch keine solchen Lexeme. Auch gehörten Lexeme jeweils nur einer syntaktischen Kategorie an, während Affixe wie das englische Suffix -ing Wörter verschiedener syntaktischer Kategorien (Verben, Adjektive oder Nominalisierungen) ableiten würden. Schließlich sei die Klasse der Affixe geschlossen, also nicht erweiterbar, während das Inventar der Lexeme offen und damit erweiterbar sei (vgl. auch Spencer 1991). Die Schlagkraft dieser Argumente hängt jedoch kritisch von der Behandlung dieser Punkte in der jeweiligen morphologischen Theorie ab. So werden z.B. in der Minimalistischen Morphologie Nullaffixe explizit abgelehnt. Affixlose Stämme erhalten die relevante morphosyntaktische Information stattdessen, indem sie in einer Paradigmenzelle, die für bestimmte morphosyntaktische Merkmale spezifiziert ist, im Kontrast zu anderen Wortformen morphosyntaktische Merkmale zugewiesen bekommen (vgl. Kap. 5.3.1). Auch gibt es Sprachen (z.B. Tonganisch, vgl. Broschart 1995) und morphologische Ansätze, in denen Lexeme nicht für die Wortkategorie spezifiziert sind (vgl. z.B. Marantz 1997, Harley & Noyer 1999). Schließlich kann auch die Tatsache, dass Affixe geschlossenen Klassen angehören, kaum gegen Affixeinträge im mentalen Lexikon sprechen, da Lexikoneinträge für freie funktionale Morpheme, die ebenfalls geschlossenen Klassen angehören (z.B. Konjunktionen), in jedem Fall angenommen werden müssten. Natürlich gibt es klare Unterschiede zwischen Affixeinträgen und den Einträgen lexikalischer Hauptkategorien. So handelt es sich bei Affixen immer um gebundene Morpheme, die spezifizieren müssen, an welche Stämme sie affigiert werden können. Wortformeinträge – sowie in vielen Sprachen auch lexikalische Wurzeln und Stämme – sind dagegen freie Morpheme, die keine Affixe auswählen. Lexeme und Affixe sind häufig auch durch phonologische Unterschiede gekennzeichnet. So ist die phonologische Form der Affixe häufig kürzer als die von Lexemen. In einer Reihe von Sprachen müssen Affixe im Gegensatz zu Lexemen zudem keine Vokale enthalten und nutzen nur ein begrenztes Set von Phonemen, wie z.B. koronale Konsonanten und Schwa (vgl. Dressler 1985, Paradis & Prunet 1991,
140 Booij 2000a, Bybee 2000). All diese Unterschiede sind mit der Annahme zweier distinkter Typen von Lexikoneinträgen für Affixe und lexikalische Hauptkategorien jedoch durchaus vereinbar. Warum eine solche Distinktion lexikalischer Einträge abzulehnen ist, erscheint nicht nachvollziehbar. Schnittstelle Morphologie-Syntax: Ein weiterer Diskussionspunkt betrifft die Frage, wie der Schnittstellencharakter der Flexion zwischen syntaktischer Funktion und phonologischer Realisierung adäquat zu erfassen ist (vgl. Kap. 1.1.2). Morphosyntaktische Merkmale wie PERSON, GENUS oder NUMERUS müssen in syntaktischen Phrasenstrukturrepräsentationen vorhanden und zugreifbar sein, da sie z.B. für die Herstellung von Kongruenzrelationen zwischen verschiedenen syntaktischen Konstituenten notwendig sind. In Ansätzen, die Affixeinträge annehmen, müssen diese Einträge auch Informationen darüber enthalten, welche morphosyntaktischen Merkmale sie instantiieren. Morphosyntaktische Merkmale wären demnach sowohl im Lexikon als auch in der Syntax vorhanden. In schwach lexikalistischen Ansätzen wird eine solche Verteilung morphosyntaktischer Informationen jedoch als redundant angesehen (vgl. Spencer 1991, 2000, Borer 1998, Aronoff 2000). Um diese Redundanz aufzuheben, wird argumentiert, der Bereich der Flexion falle allein in die Zuständigkeit der Syntax, da morphosyntaktische Merkmale in der Syntax in jedem Fall vorhanden sein müssten. Die Syntax regelt in diesen Ansätzen die Verteilung morphosyntaktischer Merkmale. Die Realisierung dieser Merkmale erfolgt dann in der phonologischen Komponente. Die Existenz einer eigenständigen morphologischen Komponente wird demzufolge bestritten (z.B. Chomsky 1965, Matthews 1972, 1974, Aronoff 1976, Anderson 1982, 1992, vergleiche auch die Darstellungen in Spencer 1991, 2000, Borer 1998, Aronoff 2000). Aber das Argument, Affixeinträge führten zu einer doppelten und daher unökonomischen Repräsentation morphosyntaktischer Merkmale, ist ebenfalls nicht zwingend stichhaltig. In Ansätzen wie dem Minimalistischen Programm (Chomsky 1992, 1995) oder der Minimalistischen Morphologie (Wunderlich & Fabri 1995, Wunderlich 1996a, b) werden vollflektierte Wortformen in die Syntax projiziert und dort lediglich hinsichtlich ihrer Merkmalskompatibilität überprüft. Morphosyntaktische Merkmale existieren in solchen Ansätzen also gar nicht unabhängig voneinander in zwei verschiedenen Komponenten der Grammatik, die dann miteinander abgeglichen werden müssten (vgl. z.B. Spencer 1991). Vielmehr werden morphosyntaktische Merkmale erst durch die Affigierung von Flexionsmorphemen der Syntax zur Verfügung gestellt. Die Frage der Ökonomie: Schließlich wird als Argument gegen Affixeinträge auch auf den Aspekt der repräsentationellen Ökonomie verwiesen. In seiner Diskussion der verschiedenen Typen morphologischer Ansätze unterscheidet Aronoff (2000) zwischen minimalistischen und maximalistischen Herangehensweisen an das Lexikon. Das Bestreben minimalistischer Morphologen sei es dabei: „[…] to make the lexicon as small as possible, in the number, variety and content of lexical entries [...]“ (ebd.: 348)
141 Die Annahme von Affixeinträgen widerspricht folglich einer minimalistischen Konzeption des Lexikons, die dem Bestreben folgt, den Speicheraufwand zu minimieren. Diese Auffassung von Ökonomie basiert auf traditionellen Vorstellungen zum menschlichen Sprachvermögen, in der ein Lexikon, das lediglich idiosynkratische Informationen über Morpheme enthält, von einer Berechnungskomponente – der Grammatik – unterschieden wird. Diese enthält die Regeln, nach denen die Einträge des Lexikons zu komplexeren morphologischen oder phrasalen Einheiten verknüpft werden können (vgl. z.B. Chomsky 1965, sowie Kap. 1.1.3). Sowohl morphologische als auch syntaktische Regeln sind dabei Teil dieser Berechnungskomponente. Allerdings ist nicht ersichtlich, wieso diese Auffassung von Lexikon und Grammatik einem Ansatz, in dem Affixeinträge angenommen werden, hinsichtlich ökonomischer Gesichtspunkte insgesamt überlegen sein sollte. Auch eine Flexionsregel muss Informationen zu ihrem Anwendungsbereich, zu den morphosyntaktischen Merkmalen, die durch ihre Anwendung instantiiert werden, und zu ihrer phonologischen Realisierung enthalten. Auch diese Informationen müssen, da sie idiosynkratisch und nicht vorhersehbar sind, gespeichert sein. Während diese Informationen in Ansätzen, die Affixeinträge annehmen, in den lexikalischen Einträgen der Affixe abgespeichert sind, müssen sie in ‚Regel’-Ansätzen in einer Berechnungskomponente aufgeführt sein. Ein kleineres und daher hinsichtlich des Speicheraufwands minimiertes Lexikon muss in ‚Regel’-Ansätzen also durch eine größere und daher hinsichtlich des Speicheraufwands maximierte Berechnungskomponente erkauft werden. Die Speicherung von Affixeinträgen erfordert dagegen zwar einen höheren Speicheraufwand im mentalen Lexikon, die Berechungskomponente kann jedoch, wie z.B. in der Minimalistischen Morphologie, auf die Operation ‚verkette’ (z.B. Stamm und Affix) reduziert werden. Mir ist kein externes Kriterium bekannt, demzufolge die Speicherung in einer Berechungskomponente ökonomischer ist als eine Speicherung im Lexikon. Regeln erscheinen in Hinsicht auf den Speicheraufwand also nicht ökonomischer als Affixeinträge. Fazit: Das Item-and-Arrangement Konzept kann als Ideal morphologischer Beschreibungen angesehen werden (vgl. z.B. Spencer 1991). Wortformen werden in Theorien, die diesem Rahmen folgen, durch die Verknüpfung von Morphemen gebildet. Dementsprechend verfügen auch Affixe über Einträge im mentalen Lexikon. Die gegen diese Konzeption vorgebrachten Einwände, die eine einheitliche Erfassung konkatenativer regulärer und nicht-konkatenativer irregulärer Flexion fordern, Unterschiede zwischen Lexemen und Affixen anführen oder sich auf eine redundanzfreie Schnittstelle zwischen Syntax und Lexikon bzw. auf allgemeine repräsentationelle Ökonomie berufen, überzeugen nicht. Inwieweit alle regulären, nicht-konkatenativen morphologischen Phänomene von Item-and-Arrangement Ansätzen erfasst werden können, muss sich empirisch erweisen. Zumindest für das Deutsche, dessen Flexionsmorphologie sich als konkatenativ repräsentieren lässt (vgl. z.B. Wunderlich & Fabri 1995, Wunderlich 1996a, b, 1999), deuten jedoch experimentelle Ergebnisse darauf hin, dass auch Affixe Einträge im mentalen Lexikon haben, sie also ‚Dinge’ und nicht ‚Regeln’ sind.1 –––––––—–– 1
Ausführliche Diskussionen der Kontroverse zwischen ‚Regel’-Ansätzen und ‚Eintrags’-Ansätzen finden sich z.B. in Spencer (1991, 1998, 2000), Plungian (2000) oder Stump (1998, 2001).
142 5.1.2 Psycho- und neurolinguistische Evidenz für Affixeinträge Effekte der Affixfrequenz in einem lexikalischen Entscheidungsexperiment: Clahsen und Mitarbeiter (Clahsen et al. 2001) testeten in einem visuellen lexikalischen Entscheidungsexperiment die Reaktionszeiten für die Verarbeitung flektierter deutscher Adjektive. Durch sorgfältige Auswahl des Stimulusmaterials gelang es ihnen, Einflüsse der Wortformfrequenz der flektierten Adjektive von Effekten der Frequenz des Affixes zu trennen. Sie verglichen dafür die Reaktionszeiten auf Adjektive, die mit -m (z.B. ruhigem) bzw. mit -s (z.B. ruhiges) flektiert waren. Betrachtet man die Frequenzverteilung der mit -m bzw. -s flektierten Adjektive, dann zeigt sich, dass -s ungefähr doppelt so häufig an Adjektiven vorkommt wie -m.2 Clahsen und Mitarbeiter wählten für ihr Stimulusmaterial Adjektive mit vergleichbarer Stammfrequenz, die sich jedoch in ihrer Wortformfrequenz unterschieden: Die Hälfte der Adjektive trat häufiger mit -m auf als mit -s, die andere Hälfte war dagegen häufiger mit -s flektiert als mit -m. Tabelle 5.1 verdeutlicht die Auswahl des Stimulusmaterials beispielhaft.
Tab. 5.1: Beispiel des Stimulusmaterials von Clahsen et al. (2001)
Ist allein die Stammfrequenz für die lexikalischen Entscheidungszeiten maßgebend, dann dürften sich keine Unterschiede in den Reaktionszeiten der vier getesteten Adjektivgruppen finden, da die präsentierten Adjektive vergleichbare Stammfrequenzen aufwiesen. Sind die Entscheidungszeiten dagegen maßgeblich von der Wortformfrequenz abhängig, dann müssten sich unabhängig von der jeweiligen Flexionsendung für die häufiger vorkommenden Adjektive der Gruppen (i) und (iv) schnellere Reaktionszeiten als für die selteneren Adjektive der Gruppen (ii) und (iii) ergeben. Sind die Reaktionszeiten dagegen durch die Frequenz der jeweiligen Flexionsaffixe beeinflusst, dann sollten unabhängig von den Unterschieden in den Wortformfrequenzen mit -s flektierte Adjektive (Gruppen (ii) und (iv)) schneller verarbeitet werden als mit -m flektierte Adjektive (Gruppen (i) und (iii)), da -s deutlich häufiger an Adjektiven auftritt als -m (s.o.). Tatsächlich waren die Reaktionszeiten für die mit -s flektierten Adjektive (Gruppen (ii) und (iv)) signifikant kürzer als die Reaktionszeiten für die mit -m flektierten Adjektive (Gruppen (i) und (iii)). Effekte der Wortformfrequenz zeigten sich dagegen nicht. Weder –––––––—–– 2
Clahsen et al. geben die folgenden Werte zur Frequenzverteilung von Adjektiven, die mit -m bzw. mit -s flektiert sind: type-Frequenz -s: 2.286, token-Frequenz -s: 12.828, type-Frequenz -m: 1.264, token-Frequenz -m: 5.965 (lt. CELEX-Datenbank).
143 der Vergleich der Reaktionszeiten für seltene und häufiger vorkommende mit -m flektierte Adjektive (Gruppe (i) vs. Gruppe (iii)) noch der entsprechende Vergleich für die mit -s flektierten Adjektive (Gruppe (ii) vs. Gruppe (iv)) erbrachten signifikante Verarbeitungsunterschiede (vgl. Tab. 5.2).
Tab. 5.2: Reaktionszeiten im lexikalischen Entscheidungstest von Clahsen et al. (2001)
Frequenzeffekte, wie sie in lexikalischen Entscheidungsexperimenten auftreten, werden allgemein als Reflex des für den Zugriff auf einen lexikalischen Eintrag benötigten Aufwands gesehen. Ein häufig vorkommendes Wort verfügt über eine stärkere Gedächtnisspur zu seinem lexikalischen Eintrag als ein seltener vorkommendes Wort. Der für den Zugriff auf einen gespeicherten Lexikoneintrag benötigte Zeitaufwand ist entsprechend für häufig vorkommende Wörter geringer als für selten vorkommende Wörter. Dass Clahsen et al. in ihrem lexikalischen Entscheidungsexperiment einen Effekt der Affixfrequenz gefunden haben, spricht folglich dafür, dass auch Affixe so wie lexikalische Hauptkategorien über eigene Einträge im mentalen Lexikon verfügen, deren Zugreifbarkeit von der Vorkommenshäufigkeit des jeweiligen Affixes abhängt.3 Effekte der Affixfrequenz bei agrammatischen Broca-Aphasikern: Die Annahme, dass auch Flexionsaffixe Lexikoneinträge haben, deren Zugreifbarkeit von der Vorkommenshäufigkeit des jeweiligen Affixes abhängt, erlaubt eine interessante Spekulation über das Auftreten affixspezifischer Defizite in Sprachstörungen. Unsere Untersu–––––––—–– 3
Grundsätzlich könnte dieses Ergebnis zwar auch mit einer prozessualen Erklärung erfasst werden. Die schnelleren Reaktionszeiten der mit -s flektierten Adjektive könnten dann darauf zurückgeführt werden, dass häufiger angewandte Regeln mit einem kürzeren Verarbeitungsaufwand einhergehen als seltener angewandte Regeln. Dieser Erklärungsansatz kann allerdings weder die Frequenzeffekte, die bei der Verarbeitung monomorphematischer Wörter auftreten (vgl. Balota 1994), noch Effekte der Stammfrequenz bei regulär flektierten Wörtern mit vergleichbarer Wortformfrequenz (vgl. z.B. Clahsen et al. 2001) erfassen, da Frequenzeffekte in diesen Fällen eindeutig den lexikalischen Zugriff, nicht aber eine Regelanwendung widerspiegeln. Ein prozessualer Ansatz zur Erklärung der Affixfrequenzeffekte würde daher bedingen, dass für Frequenzeffekte tatsächlich zwei unterschiedliche Vorgänge verantwortlich sind: zum einen der Zugriff auf gespeicherte lexikalische Einträge (Wurzeln, Stämme und Wortformen), zum anderen das Anwenden einer Flexionsregel. Für eine solche Interpretation ist mir jedoch keine Evidenz bekannt. Da die gängige Annahme, dass Frequenzeffekte den Zugriff auf Lexikoneinträge – ob auf Wurzeln, Stämme, Wortformen oder Affixe – widerspiegeln, einen einheitlichen Erklärungsansatz für alle beobachteten Frequenzeffekte ermöglicht, ist ihr der Vorzug zu geben.
144 chungen zur Fehleranfälligkeit irregulär flektierter Partizipien bei agrammatischen BrocaAphasikern haben ergeben, dass der Zugriff auf selten vorkommende irreguläre Partizipien weniger gut gelingt als der Zugriff auf häufig vorkommende irreguläre Partizipien. Wir haben dies in Übereinstimmung mit anderen Befunden zur Broca-Aphasie dahingehend interpretiert, dass es bei Broca-Aphasikern zu Zugriffsstörungen auf lexikalische Einträge kommen kann (vgl. Kap. 3.2). Sind auch Affixe in lexikalischen Einträgen repräsentiert, dann sollten die Probleme aphasischer Sprecher beim Lexikonzugriff grundsätzlich auch Affixeinträge betreffen können. Tatsächlich finden sich in unseren Daten Hinweise, dass dies der Fall sein könnte. Zum einen könnten Unterschiede in der Affixfrequenz für die Unterschiede zwischen erhaltener regulärer Partizipflexion, aber gestörter regulärer Pluralflexion auf -s verantwortlich sein. Wie in den Kapiteln 4.1.6.1 und 4.1.6.2 dargestellt, hatten die von uns getesteten deutschsprachigen Broca-Aphasiker kaum Probleme mit der regulären Partizipflexion. Die Produktion von -s-Pluralen war dagegen nur bei einer der getesteten Versuchspersonen unbeeinträchtigt. Ein Unterschied zwischen dem -s-Plural und der regulären Partizipflexion ist, dass der -s-Plural trotz seiner Produktivität lediglich bei sehr wenigen lexikalischen Einträgen auftritt. Die 6 Millionen Wörter umfassende CELEX-Datenbank (Baayen et al. 1993) führt lediglich für 7% der Nomina einen -s-Plural auf (vgl. Clahsen 1999). Im Gegensatz dazu machen schwache Verben, die das Partizip mit -t bilden, ca. 78% der in der CELEX-Datenbank aufgeführten Verben aus (vgl. Marcus et al. 1995, Clahsen 1999). Möglich wäre demnach, dass die Beeinträchtigung des -s-Plurals durch Probleme beim Zugriff auf den lexikalischen Eintrag dieses seltenen Pluralaffixes verursacht ist. Der Zugriff auf den Eintrag des Partizipsuffixes -t dagegen ist aufgrund der deutlich höheren Vorkommenshäufigkeit dieses Suffixes unproblematisch. Die Bildung regulär flektierter Partizipien ist folglich intakt.4 Ein weiterer Anhaltspunkt dafür, dass bei agrammatischen Broca-Aphasikern der Zugriff auf selten vorkommende Affixe beeinträchtigt sein könnte, kommt aus einer Untersuchung der deutschen Präteritumflexion bei sechs Broca-Aphasikern. Die Präteritumflexion des Deutschen weist große Ähnlichkeiten mit der englischen past tense Flexion auf. Irreguläre Formen werden durch eine Stammänderung markiert (z.B. wasch - wusch), reguläre Formen werden durch Affigierung mit -te gebildet (z.B. lach - lachte). Mit Ausnahme der Präteritumformen der Auxiliare und Modalverben werden Präteritumformen in der Spontansprache jedoch nur noch relativ selten verwendet. Jede der sechs Versuchspersonen wurde aufgefordert, für fünf seltene schwache (Mittel der Wortformfrequenz 17,8) und fünf seltene starke Verben (Mittel der Wortformfrequenz 17,2) die jeweiligen Präteritumformen zu bilden. Den Versuchspersonen wurde dafür auf einer Karte ein Kontextsatz vorgegeben (z.B. Maria hört ständig Musik.). Eine zweite –––––––—–– 4
Durch Unterschiede in der Wortformfrequenz kann die unterschiedliche Beeinträchtigung der regulären Partizipflexion und des regulären -s-Plurals dagegen nicht erklärt werden. Zum einen waren die Wortformfrequenzen der seltenen regulären Partizipien und -s-Plurale im Stimulusmaterial vergleichbar (22 seltene reguläre Partizipien von insgesamt 39, Mittel der Wortformfrequenz = 9, zehn seltene -s-Plurale von 20, Mittel der Wortformfrequenz = 8). Zum anderen belegen die Ergebnisse aus Kapitel 4.1.1, dass bei regulär flektierten Wörtern keine Effekte der Wortformfrequenz auftreten, da regulär flektierte Wörter nicht als Vollformen im mentalen Lexikon gespeichert sind.
145 vorgelegte Karte führte dann einen Präteritumkontext ein, in dem die entsprechende Verbform zu ergänzen war (z.B. Gestern _____ Maria den ganzen Tag Musik.). Die Versuchspersonen wurden durch Übungsbeispiele mit der Aufgabe vertraut gemacht. Die Fehleranalyse ergab einen deutlichen Unterschied zwischen schwachen und starken Verben. Die reguläre Präteritumflexion war dabei mit 56,7% korrekten Reaktionen besser erhalten als irregulär flektierte Formen (Korrektheitswert 26,7%). Dieser Unterschied zwischen stärker beeinträchtigten irregulären Formen und besser erhaltenen regulären Formen entspricht unseren Befunden zur Partizipflexion (vgl. Kap. 4.1.6.2). Die reguläre Präteritumflexion war jedoch im Vergleich zur regulären Partizipflexion, für die der entsprechende Korrektheitswert bei 91% lag, deutlich stärker beeinträchtigt. Auffällig war auch, dass das Präteritumaffix -te lediglich in drei Fällen (= 13,6%) auf starke Verben übergeneralisiert wurde. Der vergleichbare Übergeneralisierungswert lag in unserer Partizipelizitation bei 79,7%. Der Vergleich der Ergebnisse der beiden Elizitationsexperimente legt nahe, dass die – gemessen an der regulären Partizipflexion – stärkere Beeinträchtigung der regulären Präteritumflexion durch Probleme beim Zugriff auf das seltenere Präteritumaffix -te verursacht sein könnte. Ein Zugriffsproblem würde auch erklären, warum das reguläre Präteritumaffix kaum auf starke Verben übergeneralisiert wurde. Um der Frage nachzugehen, inwieweit die Fehlerraten der von uns untersuchten deutschsprachigen Broca-Aphasiker bei der Produktion regulär flektierter Formen durch die Vorkommenshäufigkeit der jeweiligen regulären Affixe beeinflusst ist, stellten wir Fehlerraten unserer aphasischen Probanden und Angaben zur Affixfrequenz gegenüber. Dabei konzentrierten wir uns auf diejenigen regulären Affixe, für die Frequenzangaben in der Literatur vorliegen bzw. durch eine automatisierte Abfrage der CELEX-Datenbank leicht ermittelt werden konnten. Abbildung 5.1 führt die durchschnittlichen Fehlerraten auf, die unsere aphasischen Probanden in verschiedenen Untersuchungen für insgesamt fünf verschiedene reguläre Affixe erzielten (s. die durchgezogene Linie und die jeweils linke Achse der Graphiken): das reguläre Subjekt-Verb-Kongruenzaffix der 2. Person Singular -st (Fehlerraten aus Janssen & Penke 2002, vgl. Kap. 5.3.2), das reguläre Partizipaffix -t (Fehlerraten aus Penke, Janssen & Krause 1999), der reguläre -s-Plural und der reguläre -n-Plural bei Feminina, die auf Schwa enden (Fehlerraten aus Penke & Krause 1999, 2002, vgl. Kap. 4.1.6.1 und 5.2.1). Für diese regulären Affixe sind jeweils zwei Frequenzwerte angegeben (s. jeweils gepunktete Linie und rechte Achsen der Graphiken). Die obere Abbildung gibt an, für wie viele Simplexverben bzw. Simplexnomina der CELEX-Datenbank eine mit dem entsprechenden Affix flektierte Form aufgeführt ist (type-Frequenz). Die untere Abbildung führt auf, wie häufig die entsprechenden Affixe in der CELEX-Datenbank insgesamt an Nomina und Verben vorkommen (token-Frequenz).5 Beispielsweise ist für 988 der Simplexverben in der CELEX-Datenbank eine -t-flektierte reguläre Partizipform aufgelistet, insgesamt enthält die 6.000.000 Einträge umfassende Datenbank 40.196 Vorkommen von regulären Partizipien (lt. Westermann 2000). Die elf in Penke, Janssen & Krause (1999) untersuchten Broca-Aphasiker produzierten im Durchschnitt 9% der regulären Partizipien falsch. Im Gegensatz dazu listet die CELEX-Datenbank nur 208 Simplexnomina mit einem -s-Plural auf. Insgesamt enthält die Datenbank 22.720 Vorkommen -s-flektierter –––––––—–– 5
Die Frequenzangaben für das Partizipsuffix -t stammen aus Westermann (2000), die Angaben für den -s-Plural aus Marcus et al. (1995). Alle anderen Frequenzangaben wurden durch automatisierte Abfragen der CELEX-Datenbank (Baayen et al. 1993) ermittelt.
146 Nomina. Die durchschnittliche Fehlerrate der neun von Penke & Krause (1999) untersuchten Broca-Aphasiker bei der Produktion -s-flektierter Nomina betrug 62,4%.
Abb. 5.1: Korrelation zwischen Affix-Frequenz und durchschnittlichen Fehlerraten agrammatischer Broca-Aphasiker für fünf reguläre Flexionsaffixe des Deutschen
Wie die Abbildung verdeutlicht, ergeben die Leistungen deutschsprachiger Broca-Aphasiker im Bereich der regulären Flexionsmorphologie ein komplexes Bild. Während die reguläre Partizipflexion oder auch die reguläre Subjekt-Verb-Kongruenzflexion in der Regel gut erhalten sind, ist der reguläre -s-Plural stark beeinträchtigt. In der Gegenüberstellung der Fehlerraten mit der Vorkommenshäufigkeit der entsprechenden regulären Flexionsaffixe ist eine negative Korrelation zwischen sinkender Vorkommenshäufigkeit und steigender Fehleranfälligkeit erkennbar: Je seltener ein Affix verwendet wird, desto mehr Fehler unterlaufen aphasischen Probanden bei seiner Verwendung. Dies spricht dafür, dass die unterschiedlichen Beeinträchtigungen regulärer Flexionsaffixe bei unseren aphasischen Proban-
147 den durch Probleme beim Zugriff auf selten verwendete Affixe verursacht sind. Dieser Erklärungsvorschlag bietet nicht nur einen einheitlichen Erklärungsansatz für die Beeinträchtigungen agrammatischer Broca-Aphasiker bei der Produktion regulär und irregulär flektierter Formen, er stimmt auch gut mit dem Befund Clahsens et al. (2001) überein, dass lexikalische Entscheidungszeiten durch die Frequenz eines Affixes beeinflusst sind. Beide Beobachtungen, die Abhängigkeit lexikalischer Entscheidungszeiten und aphasischer Beeinträchtigungen von der Frequenz eines Flexionsaffixes, deuten darauf hin, dass Flexionsaffixe über eigene Einträge im mentalen Lexikon verfügen, deren Zugreifbarkeit von der Vorkommenshäufigkeit des jeweiligen Affixes beeinflusst ist. Auch die in Kap. 4.1.4 vorgestellten Morphemgrenzeffekte fügen sich in dieses Bild. Formen wie Naomis [an´tUtt], in denen stammfinales [t] und Affix -t direkt aufeinander folgen, sprechen dafür, dass Affixe eigenständige Entitäten sind, die über eine Verknüpfungsoperation mit einem Stamm verbunden werden.
5.2 Wie sehen Affixeinträge aus? Sind Flexionsaffixe in Lexikoneinträgen repräsentiert, dann stellt sich die Frage, wie diese Einträge aussehen. Wie oben bereits skizziert, müssen Affixeinträge Informationen über die phonologische Form der Affixe, über die morphosyntaktischen Merkmale, die sie instantiieren (der output), und über die lexikalischen Elemente, an die sie affigiert werden können (input-Spezifikation), aufführen. Gegenstand dieses Kapitels ist es, output und input-Bedingungen näher zu spezifizieren. 5.2.1 Input-Spezifizierung Die Frage der input-Spezifizierung von Affixen ist verknüpft mit der Frage, ob reguläre Flexion in ihrer Anwendung auch beschränkt sein kann. Diese Kontroverse hat sich in erster Linie an der psycholinguistischen Erfassung der nominalen Pluralflexion des Deutschen im Rahmen des Dual-Mechanism Modells entzündet. In Pinkers Dual-Mechanism Modell (Pinker & Prince 1988, Pinker 1998, 1999) sind irregulär flektierte Formen als Vollformen gespeichert, während regulär flektierte Formen durch Anwendung einer mentalen Regel bei Bedarf gebildet werden. Die Regelanwendung wird dabei durch das elsewhere-Prinzip (Kiparsky 1973, 1983) eingeschränkt, d.h. die Regel wird nur dann angewendet, wenn keine gespeicherte Form im mentalen Lexikon vorliegt. Das Dual-Mechanism Modell wurde auf der Basis der englischen past tense Flexion entwickelt, für die lediglich ein regulärer Affigierungsprozess anzunehmen ist. Alle Formen, die nicht durch Affigierung des past tense Morphems -ed gebildet werden, werden demgegenüber als gespeicherte Vollformen angesehen. Bei der Übertragung des DualMechanism Modells auf den Bereich der deutschen Pluralflexion wurde diese Systematik übernommen. Das System der deutschen Nominalplurale ist jedoch wesentlich komplexer als die englische past tense Flexion.
148 Nominalplurale werden im Deutschen durch vier verschiedene Endungen (-e, -er, -(e)n und -s) markiert oder sie bleiben unmarkiert. Aufgrund seines weiten Anwendungsbereichs und seiner relativen Unbeschränktheit hinsichtlich der morphophonologischen Umgebungen, in denen er auftreten kann, herrscht weitgehend Einigkeit darüber, den -s-Plural als den default-Plural des Deutschen zu betrachten (vgl. Bornschein & Butt 1987, Janda 1990, Marcus et al. 1995, Wiese 1996, Bartke 1998, Clahsen 1999, Wunderlich 1999). Alle anderen Formen werden im Dual-Mechanism Ansatz zur deutschen Pluralflexion dagegen als irregulär flektierte Formen angesehen, die im mentalen Lexikon gespeichert sind (vgl. Marcus et al. 1995, Bartke, Marcus & Clahsen 1996, Bartke 1998, Clahsen, Eisenbeiss & Sonnenstuhl 1997, Weyerts et al. 1997, Sonnenstuhl, Eisenbeiss & Clahsen 1999, Clahsen 1999). Im Ergebnis wird damit die reguläre Flexion mit der default-Flexion gleichgesetzt, die qualitativ unbeschränkt ist und immer dann eingesetzt wird, wenn keine gespeicherte Form vorliegt. Dieser Vorschlag zur Erfassung der deutschen Pluralflexion und insbesondere die damit einhergehende Gleichsetzung von regulärer und default-Flexion sind in der Literatur auf Kritik gestoßen (vgl. z.B. Dressler 1999, Indefrey 1999, Wegener 1999, Wiese 1999, Wunderlich 1999). Denn nicht nur wären nach dem Dual-Mechanism Vorschlag ca. 93% der deutschen Pluralformen gespeichert, sondern auch völlig prädiktable Pluralformen – wie z.B. der -n-Plural bei Feminina, die in der Singularform auf Schwa enden (z.B. Blume - Blumen, hier -nfem) – wären als irregulär anzusehen. In den o.g. Arbeiten zum Dual-Mechanism Ansatz der deutschen Pluralflexion wurde tatsächlich jedoch kaum thematisiert, ob auch prädiktable Pluralformen wie -nfem-Plurale als gespeichert anzusehen sind oder ob sie durch Anwendung einer Affigierungsoperation gebildet werden, die allerdings im Vergleich zur default-Flexion hinsichtlich ihres Anwendungsbereichs beschränkt sein müsste. Da es Pinker, Clahsen und Kollegen in ihren experimentellen Untersuchungen in erster Linie darum ging, Evidenz gegen konnektionistische Ansätze zu erbringen, die eine Vollformspeicherung für alle Formen postulieren, verglichen sie die Reaktionen für den default-Plural -s mit den Reaktionen auf klar irreguläre Plurale wie -er-Plurale und -n-Plurale von Maskulina und Neutra, deren Singularform nicht auf Schwa endet (-nnonfem). Lediglich in unserer EKP-Studie (Weyerts et al. 1997, vgl. Kap. 4.1.5) testeten wir neben korrekt bzw. inkorrekt markierten Pluralformen auf -s und -nnonfem (z.B. *Karussellen, *Muskels) auch -nfem-Plurale, die entweder korrekt oder mit der Endung -s markiert waren (*Blumes). Dabei führte die inkorrekte Affigierung mit -s sowohl für -nnonfem-Plurale als auch für -nfem-Plurale zu einer LAN, die mit inkorrekten Affigierungsoperationen korreliert ist. Wir werteten den vergleichbaren LAN-Effekt zunächst als Evidenz dafür, dass es sich bei beiden Typen von -n-Pluralen um irreguläre Formen handelt. Eine alternative Interpretation ist jedoch möglich: Der LAN-Effekt könnte in beiden Fällen auch mit der jeweils inkorrekten Affigierung des default-Markers -s korreliert sein, ohne Aussagen über die Repräsentation der beiden -n-Pluraltypen zu erlauben. Um die Kontroverse zu klären, ob mit Ausnahme der default-Flexion alle anderen flektierten Pluralformen des Deutschen irreguläre Formen sind oder ob es neben der defaultFlexion noch weitere reguläre Flexion gibt, führten wir ein Elizitationsexperiment mit agrammatischen Broca-Aphasikern und ein lexikalisches Entscheidungsexperiment mit unbeeinträchtigten Versuchspersonen durch (Penke & Krause 1999, 2002).
149 Frequenzeffekte in den Fehlerraten agrammatischer Broca- Aphasiker: Wir kontrastierten zwei Typen von -n-Pluralen: den völlig prädiktablen -nfem-Plural, der in einer Reihe von Arbeiten als regulär betrachtet wird (z.B. Bittner 1994, Wiese 1996, Wunderlich 1999), und den klar irregulären -nnonfem-Plural (vgl. z.B. Wiese 1996, Clahsen 1999, Wunderlich 1999). Wie in den Kapiteln 3.2 und 4.1.1 dargelegt, werden die Fehlerraten aphasischer Sprecher für irregulär flektierte Formen durch deren Wortformfrequenz beeinflusst, während sich vergleichbare Effekte für regulär flektierte Formen nicht zeigen. Wir nutzten diesen Effekt, um zu untersuchen, ob es sich auch bei -nfem-Pluralen so wie bei -nnonfem-Pluralen um irreguläre, gespeicherte Formen handelt. Neben Pluralformen auf -s, -er und -e elizitierten wir bei neun deutschsprachigen BrocaAphasikern 40 Pluralformen auf -n: 20 davon waren -nfem-Plurale, 20 -nnonfem-Plurale (vgl. Penke & Krause 1999, 2002). Um Frequenzeffekte in den Fehlerraten feststellen zu können, wählten wir für beide Typen von -n-Pluralen Pluralformen von vergleichbarer Frequenz. Jede Gruppe enthielt dabei zehn häufige (CELEX-Pluralfrequenz jeweils > 35, Wortfrequenz jeweils >55) und zehn seltene Pluralformen (CELEX-Pluralfrequenz jeweils regular past-tense verb production?“ – In: Brain and Language 93, 106-119. Lamm, C. (1998): „Does brain activity-oriented modelling solve the problem?“ – In: Psycholoquy 9. ftp://ftp.princeton.edu/pub/harnad/Psycholoquy/1998.volume.9/psycholoquy.98.9.19.connectionist -explanation.16.lamm.
236 Lasser, I. (2002): „The roots of root infinitives: Remarks on infinitival main clauses in adult and child language.“ – In: Linguistics 40, 767-796. Laudanna, A., Badecker, W., Caramazza, A. (1992): „Processing inflectional and derivational morphology.“ – In: Journal of Memory and Language 31, 333-348. Laws, G., Bishop, D. (2003): „A comparison of language abilities in adolescents with Down syndrome and children with Specific Language Impairment.“ – In: Journal of Speech, Language, and Hearing Research 46, 1324-1339. Leben, William (1973). Suprasegmental Phonology. – Dissertation, MIT. van der Lely, H., Ullman, M.T. (2001): „Past tense morphology in specifically language impaired and normally developing children.“ – In: Language and Cognitive Processes 16, 177-217. Leonard, L.B., Bortolini, U., Caselli, M.C., McGregor, K., Sabbadini, L. (1992): „Morphological deficits in children with specific language impairment: The status of features in the underlying grammar.“ – In: Language Acquisition 2, 151-179. Levelt, W. (1989): Speaking: From Intention to Articulation. – Cambridge, MA: MIT Press. Levi Y., Kavé, G. (1999): „Language breakdown and linguistic theory: A tutorial overview.“ – In: Lingua 107, 95-143. Levine, M. (1966): „Hypothesis testing behavior by humans during discrimination learning.“ – In: Journal of Experimental Psychology 71, 331-338. Lieber, R. (1980): The Organization of the Lexicon. – Dissertation, MIT. – (1992): Deconstructing Morphology: Word Formation in Syntactic Theory. – Chicago: University of Chicago Press. Liégeois, F., Baldeweg, T., Connelly, A., Gadian, D. G., Mishkin, M., Vargha-Khadem, F. (2003): „Language fMRI abnormalities associated with FOXP2 gene mutation.“ – In: Nature Neuroscience 6, 1230–1237. Lindner, K: (1998): „Overgeneralization revisited: The case of German past participles.“ – In : R. Fabri, A. Ortmann, T. Parodi (eds.): Models of Inflection, 152-174. Tübingen: Niemeyer. Lively, S.E., Pisoni, D.B., Goldinger, S.D. (1994): „Spoken word recognition: Research and theory.“ – In: M.A. Gernsbacher (ed.): Handbook of Psycholinguistics, 265-301. San Diego: Academic Press. Lobben, M. (1991): Pluralization of Hausa Nouns, Viewed from Psycholinguistic Experiments and Child Language Data. – Dissertation, Universität Oslo. Locke, J.L. (1997): „A theory of neurolinguistic development.“ – In: Brain and Language 58, 265326. Logothetis, N.K., Pauls, J., Augath, M., Trinath, T., Oeltermann, A. (2001): „Neurophsyiological investigations of the basis of the fMRI signal.“ – In: Nature 412, 150-157. Longworth, C.E., Marslen-Wilson, W., Randall, B., Tyler, L. (2005a): „Getting to the meaning of the regular past tense: Evidence from neuropsychology.“ – In: Journal of Cognitive Neuroscience 17, 1087-1097. Longworth, C.E., Keenan, S.E., Barker, R.A., Marslen-Wilson, W., Tyler, L. (2005b): „The basal ganglia and rule-governed language use: Evidence from vascular and degenerative conditions.“ – In: Brain 128, 584-596. Lonzi, L., Luzzatti, C. (1993): „Relevance of adverb distribution for the analysis of sentence representation in agrammatic patients.“ – In: Brain and Language 45, 306-317. Lukács, A., Pléh, C., Racsmány, M. (2004): „Language in Hungarian children with Williams syndrome.“ – In: S. Bartke, J. Siegmüller (eds.): Williams Syndrome across Languages, 187-220. Amsterdam: Benjamins. Lukatela, G., Mandic, Z., Gligorijevic, B., Kostic, A., Savic, M., Turvey, M. (1978): „Lexical decision for inflected nouns.“ – In: Language and Speech 21, 166-173. Lukatela, G., Gligorijevic, B., Kostic, A., Turvey, M. (1980): „Representation of inflected nouns in the internal lexicon.“ – In: Memory and Cognition 8, 415-423.
237 Luzzatti, C., de Bleser, R. (1996): „Morphological processing in Italian agrammatic speakers: Eight experiments in lexical morphology.“ – In: Brain and Language 54, 26-74. Macdonald, C., Macdonald, G. (eds.) (1995): Connectionism: Debates on Psychological Explanation. Vol. 2, 199-222. Oxford: Blackwell. Mackintosh, N.J. (1997): „Has the wheel turned full circle? Fifty years of learning theory, 19461996.“ – In: The Quarterly Journal of Experimental Psychology 50A, 879-898. Macphail, E.M. (1996): „Cognitive function in mammals: the evolutionary perspective.“ – In: Cognitive Brain Research 3, 270-290. MacWhinney, B. (1978): Processing a First Language: The Acquisition of Morphophonology. – Chicago: University of Chicago Press. – (1999): „Emergent language.“ – In : M. Darnell, E.A. Moravcsik, F. Newmeyer, M. Noonan, K.M. Wheatley (eds.): Functionalism and Formalism in Linguistics, 361-386. Amsterdam: Benjamins. – (2000): „Connectionism and language learning.“ – In: M. Barlow, S. Kenner (eds.): Usage-Based Models of Language, 121-149. Stanford, CA: CSLI. MacWhinney, B., Bates, E., Kliegl, R. (1984): „Cue validity and sentence interpretation in English, German, and Italian.“ – In: Journal of Verbal Learning and Verbal Behavior 23, 127-150. MacWhinney, B., Bates, E. (1989): The Crosslinguistic Study of Sentence Processing. – Cambridge: Cambridge University Press. MacWhinney B., Leinbach, J., Taraban, R., McDonald, J. (1989): „Language learning: Cues or rules?“ – In: Journal of Memory and Language 28, 255-277. MacWhinney, B., Leinbach, J. (1991): „Implementations are not conceptualizations: Revising the verb learning model.“ – In: Cognition 40, 121-157. Marantz, A. (1997): „No escape from syntax: Don‘t try morphological analysis in the privacy of your own lexicon.“ – In: Penn Working Papers in Linguistics 4, 201-255. Marchman, V.A. (1993): „Constraints on plasticity in a connectionist model of the English past tense.“ – In: Journal of Cognitive Neuroscience 5, 215-234. Marchman, V.A., Bates, E. (1994): „Continuity in lexical and morphological development: A test of the critical mass hypothesis.“ – In: Journal of Child Language 21, 339-366. Marcus, G.F. (1998a): „Can connectionism save constructivism?“ – In: Cognition 66, 153-182. – (1998b): „Rethinking eliminative connectionism.“ – In: Cognitive Psychology 37, 243-282. – (1999): „Connectionism: With or without rules?“ – In: Trends in Cognitive Sciences 3, 168-170. – (2001): The Algebraic Mind: Integrating Connectionism and Cognitive Science. – Cambridge, MA.: MIT Press. Marcus, G.F., Pinker, S., Ullman, M., Hollander, M., Rosen, T.J., Xu, F. (1992): Overregularization in Language Acquisition. – Chicago: University of Chicago Press. Marcus, G.F., Brinkmann, U., Clahsen, H., Wiese, R., Pinker, S. (1995): „German inflection: The exception that proves the rule.“ – In: Cognitive Psychology 29, 189-256. Marcus, G., Vijayan, S., Bandi Rao, S., Vishton, P.M. (1999): „Rule learning in 7-month-old infants.“ – In: Science 283, 77-80. Marin, O.S.M., Saffran, E.M., Schwartz, M.F. (1976): „Dissociations of language in aphasia: Implications for normal function.“ – In: S.R. Harnad, H.S. Steklis, J. Lancaster (eds.): Origin and Evolution of Language and Speech, 868-884. New York: New York Academy of Sciences. Markowitsch, H.J. (2001): „Neuropsychologie des menschlichen Gedächtnisses.“ – In: Spektrum der Wissenschaft – Digest: Rätsel Gehirn, 52-61. van Marle, J. (2000): „Paradigmatic and syntagmatic relations.“ – In: G. Booij, C. Lehmann, J. Mugdan, W. Kesselheim, S. Skopetas (eds.): Morphology: An International Handbook on Inflection and Word-Formation. Vol. 1, 225-234. Berlin: de Gruyter. Marslen-Wilson, W. (1989): „Access and integration: Projecting sound onto meaning.“ – In: W. Marslen-Wilson (ed.): Lexical Representation and Process, 392-408. Cambridge, MA: MIT-Press.
238 Marslen-Wilson, W., Tyler, L. (1980): „The temporal structure of spoken language understanding.“ – In: Cognition 8, 1-71. Marslen-Wilson, W., Hare, M., Older, L. (1993): „Inflectional morphology and phonological regularity in the English mental lexicon.“ – In: Proceedings of the 15th Annual Conference of the Cognitive Science Society, 693-698. Hillsdale, NJ: Lawrence Erlbaum. Marslen-Wilson, W., Tyler, L. (1997): „Dissociating types of mental computation.“ – In: Nature 387, 592-594. – (1998): „Rules, representations, and the English past tense.“ – In: Trends in Cognitive Sciences 2, 428-435. Maslen, R.J.C., Theakston, A.L., Lieven, E., Tomasello, M. (2004): „A dense corpus study of past tense and plural overregularization in English.“ – In: Journal of Speech, Language, and Hearing Research 47, 1319-1333. Matthews, P. (1972): Inflectional Morphology. – Cambridge: Cambridge University Press. – (1974): Morphology. – Cambridge: Cambridge University Press. Mayerthaler, W. (1981): Morphologische Natürlichkeit. – Wiesbaden: Athenaion. McCarthy, John (1986): „OCP effects: Gemination and antigemination.“ – In: Linguistic Inquiry 17, 207-263. McCawley, J.D. (1980): „Tabula si, rasa no!“ – In: The Behavioral and Brain Sciences 3, 26-27. McClelland, J.L., Rumelhart, D.E. (1981): „An interactive activation model of context effects in letter perception: Part 1. An account of basic findings.“ – In: Psychological Review 88, 375-407. McClelland, J.L., McNaughton, B.L., O’Reilly, R.C. (1995): „Why are there complementary learning systems in the hippocampus and neocortex: Insights from the successes and failures of connectionist models of learning and memory.“ – In: Psychological Review 102, 419-457. McClelland, J.L., Plaut, D.C. (1999): „Does generalization in infant learning implicate abstract algebra-like rules?“ – In: Trends in Cognitive Sciences 3, 166-168. McCloskey, M. (1991): „Networks and theories: The place of connectionism in cognitive science.“ – In: Psychological Science 2, 387-395. McCloskey, M., Cohen, N.J. (1989): „Catastrophic interference in connectionist networks: The sequential learning problem.“ – In: G.H. Bower (ed.): The Psychology of Learning and Motivation. Vol. 24, 109-165. New York: Academic Press. Meaburn, E., Dale, P.S., Craig, I.W., Plomin, R. (2002): „Language-impaired children: No sign of the FOXP2 mutation.“ – In: Cognitive Neuroscience and Neuropsychology 13, 1075-1077. Medin, D.L., Ross, B.H. (1989): „The specific character of abstract thought: Categorization, problem solving, and induction.“ – In: R.J. Sternberg (ed.): Advances in the Psychology of Human Intelligence. Vol. 5. Hillsdale, NJ: Erlbaum. Menn, L., Obler, L.K. (1990a): „Methodology: Data collection, presentation, and guide to interpretation.“ – In: L. Menn, L. Obler (eds.): Agrammatic Aphasia: A Cross-Language Narrative Sourcebook. Vol. 1, 13-35. Amsterdam: Benjamins. – (1990b): „Cross-language data and theories of agrammatism.“ – In: L. Menn, L. Obler (eds.): Agrammatic Aphasia: A Cross-Language Narrative Sourcebook. Vol. 2, 1369-1388. Amsterdam: Benjamins. Mészáros, É. (2001): „Person and number agreement in Agrammatism.“ – In: Acta Linguistica Hungarica 48, 217-242. Meunier, F., Marslen-Wilson, W. (2004): „Regularity and irregularity in French verbal inflection.“ – In: Language and Cognitive Processes 19, 561-580. Meyer, D.E., Schvanefeldt, R.W. (1971): „Facilitation in recognizing pairs of words: Evidence of a dependence between retrieval operations.“ – In: Journal of Experimental Psychology 90, 227-234. Miller, M. (1976): Zur Logik der frühkindlichen Sprachentwicklung: Empirische Untersuchungen und Theoriediskussion. – Stuttgart: Klett. Minsky, M.L., Papert, S.A. (1969): Perceptrons. – Cambridge, MA: MIT Press.
239 Miozzo, M. (2003): „On the processing of regular and irregular forms of verbs and nouns: Evidence from neuropsychology.“ – In: Cognition 87, 101-127. Moe, A.J., Hokins, C.J., Rush, R.T. (1982): The Vocabulary of First-Grade Children. – Springfield, IL: Thomas. Morrison, C.M., Ellis, A.W. (1995): „Roles of word frequency and age of acquisition in word naming and lexical decision.“ – In: Journal of Experimental Psychology: Learning, Memory, and Cognition 21, 116-133. Morton, J. (1969): „The interaction of information in word recognition.“ – In: Psychological Review 76, 165-178. Mugdan, J. (1977): Flexionsmorphologie und Psycholinguistik. – Tübingen: Gunter Narr. Müller, R.-A. (1992): „Modularism, holism, connectionism: old conflicts and new perspectives in aphasiology and neuropsychology.“ – In: Aphasiology 6, 443-475. – (1996): „Innateness, autonomy, universality? Neurobiological approaches to language.“ – In: The Behavioral and Brain Sciences 19, 611-631. Mummery, C.J., Patterson, K., Price, C.J., Ashburner, J., Frackowiak, R.S.J., Hodges, J.R. (2000): „A voxel-based morphometry study of semantic dementia: The relationship of temporal lobe atrophy to cognitive deficit.“ – In: Annals of Neurology 47, 36-45. Munakata, Y. (2001): „Graded representations in behavioral dissociations.“ – In: Trends in Cognitive Sciences 5, 309-315. Münte, T.F., Heinze, H.-J., Mangun, G.R. (1993): „Dissociation of brain activity related to syntactic and semantic aspects of language.“ – In: Journal of Cognitive Neuroscience 5, 335-344. Murray, W. (1982): Sentence Matching: The Influence of Meaning and Structure. – Dissertation, Monash University. Napps, S. (1989): „Morphemic relationships in the lexicon: Are they distinct from semantic and formal relationships?“ – In: Memory and Cognition 17, 729-739. Napps, S., Fowler, C.A. (1987): „Formal relationships among words and the organization of the mental lexicon.“ – In: Journal of Psycholinguistic Research 16, 257-272. Neef, M. (1998): „A declarative path through the jungle of German noun inflection.“ – Arbeiten des SFB 282 „Theorie des Lexikons“ 102. Neely, J.H. (1991): „Semantic priming effects in visual word recognition: A selective review of current findings and theories.“ – In: D. Besner, G. Humphreys (eds.): Basic Processes in Reading: Visual Word Recognition, 264-336. Hillsdale, NJ: Erlbaum. Neuhaus, E., Penke, M. (2003): „Wh-question production in German Broca’s aphasia.“ – In: Brain and Language 87, 59-60. von Neumann, J. (1958): The Computer and the Brain. – New Haven, Conn. Newbury, D.F., Bonora, E, Lamb, J.A. et al. (2002): „FOXP2 is not a major suceptibility gene for autims or specific language impairment.“ – In: American Journal of Human Genetics 70, 13181327. Newell, A., Simon, H.A. (1972): Human Problem Solving. – Engelwood Cliffs, N.J.: Prentice-Hall. Newman, A., Izvorski, R., Davis, L., Neville, H., Ullman, M.T. (1999): „Distinct electrophysiological patterns in the processing of regular and irregular verbs.“ – In: Journal of Cognitive Neuroscience Supplement, 47-48. Niemi, J., Laine, M., Hänninen, R., Koivuselka-Sallinen, P. (1990): „Agrammatism in Finnish: Two case studies.“ – In: L. Menn, L. Obler (eds.): Agrammatic Aphasia: A Cross-Language Narrative Sourcebook. Vol. 2, 1013-85. Amsterdam: Benjamins. Nosofsky, R.M., Palmeri, T.J., McKinley, S.C. (1994): „Rule-plus-exception model of classification learning.“ – In: Psychological Review 101, 53-79. Obler, L., Gjerlow, K. (1999): Language and the Brain. – Cambridge: Cambridge University Press. Ojemann, G. (1983): „Brain organization for language from the perspective of electrical stimulation mapping.“ – In: The Behavioral and Brain Sciences 6, 189-230.
240 Ojemann, G. (1991): „Cortical organization of language.“ – In: The Journal of Neuroscience 11, 2281-2287. Orsolini, M., Marslen-Wilson, W. (1997): „Universals in morphological representation: Evidence from Italian.“ – In: Language and Cognitive Processes 12, 1-47. Osterhout, L., Mobley, L. (1995): „Event-related brain potentials elicited by failure to agree.“ – In: Journal of Memory and Language 34, 739-773. Ouhalla, J. (1993): „Functional categories, agrammatism and language acquisition.“ – In: Linguistische Berichte 143, 3-36. Page, M. (2000): „Connectionist modelling in psychology: A localist manifesto.“ – In: The Behavioral and Brain Sciences 23, 443-512. Palm, G. (1988): „Assoziatives Gedächtnis und Gehirntheorie.“ – In: Spektrum der Wissenschaft 6, 54-64. Paradis, D., Prunet, J.-F. (eds.) (1991): Phonetics and Phonology. The Special Status of Coronals. Internal and External Evidence. – San Diego: Academic Press. Patterson, K., Hodges, J.R. (2000): „Semantic dementia: One window on the structure and organisation of semantic memory.“ – In: L. Cermak (ed.): Handbook of Neuropsychology: Memory Disorders, 289-309. Amsterdam: Elsevier. Patterson, K., Lambon Ralph, M.A., Hodges, J.R., McClelland, J.L. (2001): „Deficits in irregular past-tense verb morphology associated with degraded semantic knowledge.“ – In: Neuropsychologia 39, 709-724. Penke, M. (1998): Die Grammatik des Agrammatismus: Eine linguistische Untersuchung zu Wortstellung und Flexion bei Broca-Aphasie. – Tübingen: Niemeyer. – (2000): „Unpruned trees in German Broca’s aphasia.“ – In: The Behavioral and Brain Sciences 23, 46-47. – (2001): „Controversies about CP: A comparison of language acquisition and language impairments in Broca’s aphasia.“ – In: Brain and Language 77, 351-363. Penke, M., Weyerts, H., Gross, M., Zander, E., Münte, T.F., Clahsen, H. (1997): „How the brain processes complex words: An event-related potential study of German verb inflections.“ – In: Cognitive Brain Research 6, 37-52. Penke, M., Janssen, U., Krause, M. (1999): „The representation of inflectional morphology: Evidence from Broca’s aphasia.“ – In: Brain and Language 68, 225-232. Penke, M., Krause, M. (1999): „Broca’s aphasia and German plural formation.“ – In: Brain and Language 69, 311-313. – (2002): „German noun plurals – a challenge to the Dual-Mechanism Model.“ – In: Brain and Language 81, 303-311. – (2004): „Regular and irregular inflectional morphology in German Williams syndrome.“ – In: S. Bartke, J. Siegmüller (eds.): Williams Syndrome across Languages, 245-270. Amsterdam: Benjamins. Penke, M., Rosenbach, A. (2004): „What counts as evidence in linguistics? An Introduction.“ – In: M. Penke, A. Rosenbach (eds.): What Counts as Evidence in Linguistics – the Case of Innateness. Sonderband der Zeitschrift Studies in Language 28, 480-526. Penke, M., Janssen, U., Eisenbeiss, S. (2004): „Psycholinguistic evidence for the underspecification of morphosyntactic features.“ – In: Brain and Language 90, 423-433. Penke, M., Janssen, U., Indefrey, P., Seitz, R. (2005): „No evidence for a rule/procedural deficit in German patients with Parkinson’s disease.“ – In: Brain and Language. Penke, M., Westermann, G. (2006): „Broca’s area and inflectional morphology: Evidence from Broca’s aphasia and computer modeling.“ – In: Cortex. Piaget, J. (1980): „The psychogenesis of knowledge and its epistemological significance.“ – In: M. Piattelli-Palmarini (ed.): On Language and Learning: The Debate between Jean Piaget and Noam Chomsky, 23-34. London: Routledge & Kegan Paul.
241 Pinker, S. (1984): Language Learnability and Language Development. – Cambridge, MA: Harvard University Press. – (1989): Learnability and Cognition: The Acquisition of Argument Structure. – Cambridge, MA: MIT Press. – (1994): The Language Instinct: How the Mind Creates Language. – New York: William Morrow and Company. – (1997): „Words and rules in the human brain.“ – In: Nature 387, 547-548. – (1998): „Words and rules.“ – In: Lingua 106, 219-242. – (1999): Words and Rules. – New York: Basic Books. – (2000): Wörter und Regeln. – Heidelberg: Spektrum Akademischer Verlag. Pinker, S., Mehler, J. (eds.) (1989): Connections and Symbols. – Cambridge, MA: MIT-Press. Pinker, S., Prince, A. (1988): „On language and connectionism: Analysis of a parallel distributed processing model of language acquisition.“ – In: Cognition 28, 73-193. Pinker, S., Ullman, M.T. (2002): „The past and future of the past tense.“ – In: Trends in Cognitive Sciences 6, 456-463. Plag, I. (2000): „Irregular past tense formation in English interlanguage.“ – In: Plag, I., K.P. Schneider (eds.): Language Use, Language Acquisition and Language History, 134-149. Trier: WVT. Pléh, C., Lukács, A., Racsmány, M. (2003): „Morphological patterns in Hungarian children with Williams syndrome and the rule debates.“ – In: Brain and Language 86, 377-383. Plungian, V.A. (2000): „Die Stellung der Morphologie im Sprachsystem.“ – In: G. Booij, C. Lehmann, J. Mugdan, W. Kesselheim, S. Skopetas (eds.): Morphology: An International Handbook on Inflection and Word-Formation. Vol. 1, 22-34. Berlin: de Gruyter. Plunkett, K., Marchman, V. (1993): „From rote learning to system building: acquiring verb morphology in children and connectionist nets.“ – In: Cognition 48, 21-69. Poeck, K. (1981): „Was verstehen wir unter aphasischen Syndromen?“ – In: H. Schnelle (Hg.): Sprache und Gehirn, 97-109. Frankfurt a.M.: Suhrkamp. – (81992): Neurologie. – Berlin: Springer. Poeppel, D., Hickok, G. (2004): „Towards a new functional anatomy of language.“ – In: Cognition 92, 1-12. Popper, K. (1935): Logik der Forschung: Zur Erkenntnistheorie der modernen Naturwissenschaft. – Wien: Springer. Pothos, E.M. (2005): „The rules versus similarity distinction.“ – In: The Behavioral and Brain Sciences 28, 1-49. Prasada, S., Pinker, S. (1993): „Generalization of regular and irregular morphological patterns.“ – In: Language and Cognitive Processes 8, 1-51. Pulvermüller, F. (1999a): „Words in the brain’s language.“ – In: The Behavioral and Brain Sciences 22, 253-336. – (1999b): „Please mind the brain, and brain the mind.“ – In: The Behavioral and Brain Sciences 22, 1035-1036. Quartz, S.R., Sejnowski, T.J. (1997): „The neural basis of cognitive development: A constructivist manifesto.“ – In: The Behavioral and Brain Sciences 20, 537-596. Raichle, M.E. (1994): „Bildliches Erfassen von kognitiven Prozessen.“ – In: Spektrum der Wissenschaft 6, 56-63. – (1998): „Behind the scenes of functional brain imaging: A historical and physiological perspective.“ – Proceedings of the National Academy of Sciences USA 95, 765-772. Ramscar, M. (2002): „The role of meaning in inflection: Why the past tense does not require a rule.“ – In: Cognitive Psychology 45, 45-94. Rasmussen, T., Milner, B. (1977): „The role of early left brain injury in determining lateralization of cerebral speech functions.“ – Annals of the New York Academy of Sciences 299, 355-369.
242 Rice, S., Libben, G., Derwing, B. (2002): „Morphological representation in an endangered polysynthetic language.“ – In: Brain and Language 81, 473-486. Rodriguez-Fornells, A., Clahsen, H., Lleó, C., Zaake, W., Münte, T.F. (2001): „Event-related brain responses to morphological violations in Catalan.“ – In: Cognitive Brain Research 11, 47-58. Rosch, E. (1975): „Cognitive Representations of Semantic Categories.“ – In: Journal of Experimental Psychology 104, 192-233. – (1978): „Principles of categorization.“ – In: E. Rosch, B. Lloyd (eds.): Cognition and Categorization, 27-48. Hillsdale, NJ: Erlbaum. Royle, P., Jarema, G., Kehayia, E. (1999): „What is a word? Recognizing polymorphemic lexical items in DLI.“ – In: Brain and Language 68, 254-261. Rueckl, J.G., Galantucci, B. (2005): „The locus and time course of long-term morphological priming.“ – In: Language and Cognitive Processes 20, 115-138. Rugg, M.D. (1987): „Dissociations of semantic priming, word and non-word repetition by eventrelated potentials.“ – In: Quarterly Journal of Experimental Psychology 39A, 123-148. – (1999): „Functional neuroimaging in cognitive neuroscience.“ – In: C.M. Brown, P. Hagoort (eds.): The Neurocognition of Language, 15-36. Oxford: Oxford University Press. Rumelhart, D.E., McClelland, J.L., the PDP Research Group (eds.) (1986): Parallel Distributed Processing: Explorations in the Microstructure of Cognition. Vol. 1+2. – Cambridge, MA: MIT Press. Rumelhart, D.E., McClelland, J.L. (1986): „On learning the past tenses of English verbs.“ – In: D.E. Rumelhart, J.L. McClelland, the PDP Research Group (eds.): Parallel Distributed Processing: Explorations in the Microstructure of Cognition. Vol. 2: Psychological and Biological Models, 216-271. Cambridge, MA: MIT Press. Rumelhart, D.E., Hinton, G.E., Williams, R.J. (1986): „Learning representations by backpropagation procedures.“ – In: Nature 323, 533-536. Sach, M., Seitz R.J., Indefrey, P. (2004): „Unified inflectional processing of regular and irregular verbs: A PET study.“ – In: Neuroreport 15, 533-537. Saffran, J.R., Aslin, R.N., Newport, E.L. (1996): „Statistical learning by eight-month-old infants.“ – In: Science 274, 1926-1928. Saffran, E.M., Sholl, A. (1999): „Clues to the functional and neural architecture of word meaning.“ – In: C.M. Brown, P. Hagoort (eds.): The Neurocognition of Language, 241-272. Oxford: Oxford University Press. Sapir (1921): Language. – New York: Harcourt, Brace, and World. Sandra, D. (1998): „What linguists can and can’t tell you about the human mind: A reply to Croft.“ – In: Cognitive Linguistics 9, 361-378. Savage-Rumbaugh, E.S. (1986): Ape Language: From Conditioned Response to Symbol. – New York: Columbia University Press. – (1990): „Language acquisition in a nonhuman species: Implications for the innateness debate.“ – In: Developmental Psychobiology 23, 599-620. Savage-Rumbaugh, E.S., Rumbaugh, D.M., Boysen, S. (1978): „Symbolization, language and chimpanzees: A theoretical reevalution based on initial language acquisition processes in four young Pan troglodytes.“ – In: Brain and Language 6, 265-300. Savage-Rumbaugh, E.S., Rumbaugh, D.M., Smith, S.T, Lawson, J. (1980): „Reference: The linguistic essential.“ – In: Science 210, 922-925. Savage-Rumbaugh, E.S., Murphy, J., Sevcik, R.A., Brakke, K.E., Williams, S.L., Rumbaugh, D.M. (1993): Language Comprehension in Ape and Child. – Chicago: University of Chicago Press. Savin, H.B. (1963): „Word-frequency effect and errors in the perception of speech.“ – In: Journal of the Acoustical Society of America 35, 200-206. Scalise, S. (1988): „Inflection and derivation.“ – In: Linguistics 26, 561-581.
243 Schaner-Wolles, C. (2004): „Spared domain-specific cognitive capacities? Syntax and morphology in Williams syndrome and Down syndrome.“ – In: S. Bartke, J. Siegmüller (eds.): Williams Syndrome across Languages, 93-124. Amsterdam: Benjamins. Schmidt, R.F. (231987): „Integrative Leistungen des Zentralnervensystems.“ – In: R.F. Schmidt, G. Thews (Hgg.): Physiologie des Menschen, 132-175. Berlin: Springer. Schriefers, H., A.D. Friederici, Graetz, P. (1992): „Inflectional and derivational morphology in the mental lexicon: Symmetries and asymmetries in repetition priming.“ – In: Quarterly Journal of Experimental Psychology 44, 373-390. Schütze, C.T. (1996): The Empirical Base of Linguistics. Grammaticality Judgments and Linguistic Methodology. – Chicago: University of Chicago Press. Di Sciullo, A.-M., Williams, E. (1987): On the Definition of Word. – Cambridge, MA: MIT Press. Searle, J.R. (1980): „Minds, brains, and programs.“ – In: The Behavioral and Brain Sciences 3, 417458. – (1990): „Ist der menschliche Geist ein Computerprogramm?“ – In: Spektrum der Wissenschaft 3, 40-47. Segalowitz, S.J., Chevalier, H. (1998): „Event-related potential (ERP) research in neurolinguistics: Part I.“ – In: B. Stemmer, H.A. Whitaker (eds.): Handbook of Neurolinguistics, 95-109. San Diego: Academic Press. Seidenberg, M.S. (1994): „Language and connectionism: The developing interface.“ – In: Cognition 50, 385-401. Seidenberg, M.S., Petitto, L. (1979): „Signing behavior in apes: A critical review.“ – In: Cognition 7, 177-215. Seidenberg, M.S., Hoeffner, J.H. (1998): „Evaluating behavioral and neuroimaging data on past tense processing.“ – In: Language 74, 104-122. Seidenberg, M.S., MacDonald, M.C. (1999): „A probabilistic constraints approach to language acquisition and processing.“ – In: Cognitive Science 23, 569-588. Seidenberg, M.S., Arnoldussen, A. (2003): „The brain makes a distinction between hard and easy stimuli: Comments on Beretta et al..“ – In: Brain and Language 85, 527-530. Sejnowski, T.J. (1986): „Open questions about computation in cerebral cortex.“ – In: D.E. Rumelhart, J.L. McClelland, the PDP Research Group (1986) (eds.): Parallel Distributed Processing: Explorations in the Microstructure of Cognition. Vol. 2.: Psychological and Biological Models, 372-389. Cambridge, MA: MIT Press. Selkirk (1982): The Syntax of Words. – Cambridge, MA: MIT Press. Shallice, T. (1988): From Neuropsychology to Mental Structure. – Cambridge: Cambridge University Press. Shapiro, K., Caramazza, A. (2003): „Grammatical processing of nouns and verbs in left frontal cortex?“ – In: Neuropsychologia 41, 1189-1198. Shastri, L., Ajjanagadde, V. (1993): „From simple associations to systematic reasoning: A connectionist representation of rules, variables and dynamic bindings using temporal synchrony.“ – In: The Behavioral and Brain Sciences 16, 417-449. Shattuck-Hufnagel, S. (1979): „Speech errors as evidence for a serial order mechanism in sentence production.“ – In: W.E. Cooper, E.C.T. Walker (eds.): Sentence Processing: Psycholinguistic Studies Presented to Merrill Garrett, 295-342. Hillsdale, NJ: Lawrence Erlbaum. Shaywitz, B., Shaywitz, S., Pugh, K., Constable, R., Skudlarski, P., Fulbright, R., Bronen, R., Fletcher, J., Shankweiler, D., Katz, L., Gore, J. (1995): „Sex differences in the functional organization of the brain for language.“ – In: Nature 373, 607-609. Siebert, S. (1999): Wortbildung und Grammatik: Syntaktische Restriktionen in der Struktur komplexer Wörter. – Tübingen: Niemeyer. SLI Consortium (2002): „A genomewide scan identifies two novel loci involved in specific language impairment.“ – In: American Journal of Human Genetics 70, 384-398.
244 Slobin, D. (1991): „Aphasia in Turkish: Speech production in Broca’s and Wernicke’s patients.“ – In: Brain and Language 41, 149-164. Sloman, S.A. (1996): „The empirical case for two systems of reasoning.“ – In: Psychological Bulletin 119, 3-22. Smith Churchland, P., Sejnowski, T.J. (1992): The Computational Brain. – Cambridge, MA: MIT Press. Smith, E.E., Langston, C., Nisbett, R.E. (1992): „The case for rules in reasoning.“ – In: Cognitive Science 16, 1-40. Smolensky, P. (1988): „On the proper treatment of connectionism.“ – In: The Behavioral and Brain Sciences 11, 1-73. – (1999): „Grammar-based connectionist approaches to language.“ – In: Cognitive Science 23, 589613. Sonnenstuhl, I., Eisenbeiss, S., Clahsen, H. (1999): „Morphological priming in the German mental lexicon.“ – In: Cognition 72, 203-236. Sonnenstuhl, I., Huth, A. (2002): „Processing and representation of German –n plurals: A dual mechanism approach.“ – In: Brain and Language 81, 276-290. Spencer, A. (1991): Morphological Theory: An Introduction to Word Structure in Generative Grammar. – Oxford: Blackwell. – (1998): „Morphophonological operations.“ – In: A. Spencer, A.M. Zwicky (eds.): The Handbook of Morphology, 123-143. Oxford: Blackwell. – (2000): „Morphology and syntax.“ – In: G. Booij, C. Lehmann, J. Mugdan, W. Kesselheim, S. Skopetas (eds.): Morphology: An International Handbook on Inflection and Word-Formation. Vol. 1, 312-334. Berlin: de Gruyter. Sproat, R. (1985): On Deriving the Lexicon. – Dissertation, MIT. Squire, L.R., Knowlton, B.J. (1995): „Memory, hippocampus, and brain systems.“ – In: M.A. Gazzaniga (ed.): The Cognitive Neurosciences, 825-837. Cambridge, MA: MIT-Press. Stanners, R.F., Neiser, J.J., Hernon, W.P., Hall, R. (1979): „Memory representation for morphologically related words.“ – In: Journal of Verbal Learning and Verbal Behavior 18, 399412. Steins, C. (2000): „How to account for non-concatenative phenomena in a morpheme-based theory.“ – In: B. Stiebels, D. Wunderlich (eds.): Lexicon in Focus, 105-122. Berlin: Akademie-Verlag. Stemberger, J.P. (1984): „Structural errors in normal and agrammatic speech.“ – In: Cognitive Neuropsychology 1, 281-313. – (1989): „The acquisition of morphology: Analysis of a symbolic model of language acquisition.“ – Manuskript, University of Minnesota. – (1994): „Rule-less morphology at the phonology-lexicon interface.“ – In: R. Corrigan, G. Iverson, S. Lima (eds.): The Reality of Linguistic Rules, 147-169. Amsterdam: Benjamins. Stemberger, J.P., MacWhinney, B. (1986): „Frequency and the lexical storage of regularly inflected forms.“ – In: Memory and Cognition 14, 17-26. – (1988): „Are inflected forms stored in the lexicon?“ – In: M. Hammond, M. Noonan (eds.): Theoretical Morphology, 101-116. San Diego: Academic Press. Stiebels, B. (2002): Typologie des Argumentlinkings: Ökonomie und Expressivität. Berlin: AkademieVerlag. Stowe, L., Wijers, A.A., Willemsen, A., Reuland, E., Paans, A.M., Vaalburg, W. (1994): „PET studies of language: An assessment of the reliability of the technique.“ – In: Journal of Psycholinguistic Research 23, 499-527. Stowe, L., Haverkort, M., Zwarts, F. (2005): Rethinking the neurological basis of language. – In: Lingua 115, 997-1042. Stump, G.T. (1993): „On rules of referral.“ – In: Language 69, 449-479.
245 Stump, G.T. (1998): „Inflection.“ – In: A. Spencer, A.M. Zwicky (eds.): The Handbook of Morphology, 13-43. Oxford: Blackwell. – (2001): Inflectional Morphology: A Theory of Paradigm Structure. – Cambridge: Cambridge University Press. Taft, M. (1979): „Recognition of affixed words and the word frequency effect.“ – In: Memory and Cognition 7, 263-272. Taft, M., Foster, K.I. (1975): „Lexical storage and retrieval of prefixed words.“ – In: Journal of Verbal Learning and Verbal Behavior 14, 638-647. Taylor, J. (1989): Linguistic Categorization: Prototypes in Linguistic Theory. – Oxford: Clarendon Press. Terrace, H.S., Pettito, L.A., Sanders, R.J., Bever, T.G. (1978): „Can an ape create a sentence?“ – In: Science 206, 891-900. Tesak, J. (1991): „Agrammatismus.“ – In: G. Blanken (Hg.): Einführung in die linguistische Aphasiologie, 157-199. Freiburg: Hochschulverlag. – (1992): „Verb inflections, prepositions, and articles in German agrammatism.“ – In: M. Laine, J. Niemi, P. Koivuselkä-Sallinen (eds.): Proceedings of the 4th Finnish conference of neurolinguistics. Joensuu: University Press. Teuber, H.-L. (1955): „Physiological psychology.“ – In: Annual Review of Psychology 9, 267-296. Thomas, R.K. (1996): „Investigating cognitive abilities in animals: unrealized potential.“ – In: Cognitive Brain Research 3, 157-166. Thomas, M.S.C., Grant, J., Barham, Z., Gsödl, M., Laing, E., Lakusta, L., Tyler, L., Grice, S., Paterson, S., Karmiloff-Smith, A. (2001): „Past tense formation in Williams syndrome.“ – In: Language and Cognitive Processes 16, 143-176. Tissot, R., Mounin, G., Lhermitte, F. (1973): L’Agrammatisme. – Brüssel: Dessart. Tsvjetkova, L.S., Glozman, Z.M. (1978): Agrammatism pri afasji. – University of Moscow Press. Tyler, L. (1992): Spoken Language Comprehension: An Experimental Approach to Disordered and Normal Processing. – Cambridge, MA: MIT Press. – (1994): „Morphological deficits in aphasia: Problems of representation, access or integration?“ – In: Linguistische Berichte 6, 202-218. Tyler, L., Randall, B., Marslen-Wilson, W. (2002): „Phonology and neuropsychology of the English past tense.“ – In: Neuropsychologia 40, 1154-1166. Tyler, L., deMornay-Davies, P., Anokhina, R., Longworth, C., Randall, B., Marslen-Wilson, W. (2002): „Dissociations in processing past tense morphology: Neuropathology and behavioral studies.“ – In: Journal of Cognitive Neuroscience 14, 79-94. Tyler, L., Stamatakis, E.A., Jones, R.W., Bright, P., Acres, K., Marslen-Wilson, W. (2004): „Deficits for semantics and the irregular past tense: A causal relationship?“ – In: Journal of Cognitive Neuroscience 16, 1159-1172. Ullman, M.T. (1999a): „Acceptability ratings of regular and irregular past-tense forms: Evidence for a dual-system model of language from word frequency and phonological neighbourhood effects.“ – In: Language and Cognitive Processes 14, 47-67. – (1999b): „The functional neuroanatomy of inflectional morphology.“ – In: The Behavioral and Brain Sciences 22, 1041-1042. – (1999c): „Naming tools and using rules: Evidence that a frontal/basal-ganglia system underlies both motor skill knowledge and grammatical rule use.“ – In: Brain and Language 69, 316-318. – (2001): „The declarative/procedural model of lexicon and grammar.“ – In: Journal of Psycholinguistic Research 30, 37-69. – (2004): „Contributions of memory circuits to language: the declarative/procedural model.“ – In: Cognition 92, 231-270. Ullman, M.T., Bergida, R., O’Craven, K.M. (1997): „Distinct fMRI activation patterns for regular and irregular past tense.“ – In: NeuroImage 5, 549.
246 Ullman, M.T., Corkin, S., Coppola, M., Hickok, G., Growdon, J., Koroshetz, W., Pinker, S. (1997): „A neural dissociation within language: Evidence that the mental dictionary is part of declarative memory, and that grammatical rules are processed by the procedural system.“ – In: Journal of Cognitive Neuroscience 9, 266-276. Ullman, M.T., Gopnik, M. (1999): „Inflectional morphology in a family with inherited specific language impairment.“ – In: Applied Psycholinguistics 20, 51-117. Ullman, M.T., Izvorski, R., Love, T., Yee, E., Swinney, D., Hickok, G. (2005): Neural correlates of lexicon and grammar: Evidence from the production, reading, and judgement of inflection in aphasia. – In: Brain and Language 93, 185-238. Uylings, H., Malofeeva, L., Bogolepova, I., Amunts, K., Zilles, K. (1999): „Broca’s language area from a neuroanatomical and developmental perspective.“ – In: C.M. Brown, P. Hagoort (eds.): The Neurocognition of Language, 319-336. Oxford: Oxford University Press. Vaas, R. (2000): „Gedächtnis.“ – In: H. Hauser et al. (Hgg.): Lexikon der Neurowissenschaft. Bd. 2, 37-43. Heidelberg: Spektrum Akademischer Verlag. Valian, V. (1991): „Syntactic subjects in the early speech of American and Italian children.“ – In: Cognition 40, 21-81. Vargha-Khadem, F., Watkins, K.E., Alcock, K.J., Fletcher, P., Passingham, R.E. (1995): „Praxic and non-verbal cognitive deficits in a large family with a genetically transmitted speech and language disorder.“ – In: Proceedings of the National Academy of Sciences of the USA 92, 930–933. Vargha-Khadem, F., Watkins, K.E., Price, C.J. et al. (1998): „Neural basis of an inherited speech and language disorder.“ – In: Proceedings of the National Academy of Sciences of the USA 95, 12695– 12700. van der Velde, F., de Kamps, M. (in Druck): „Neural blackbord architectures of combinatorial structures in cognition.“ – In: The Behavioral and Brain Sciences. de Villiers, J.G. (1978): „Fourteen grammatical morphemes in acquisition and aphasia.“ – In: A. Caramazza, E.B. Zurif (eds.): Language Acquisition and Language Breakdown, 121-144. Baltimore: John Hopkins University Press. Warrington E.K., Shallice, T. (1984): „Category specific semantic impairments.“ – In: Brain 107, 829-854. Watkins, K. E., Vargha-Khadem, F., Ashburner, J. et al. (2002): „MRI analysis of an inherited speech and language disorder: Structural brain abnormalities.“ – In: Brain 125, 465–478. Waugh, L.R., Lafford, B.A. (2000): „Markedness.“ – In: G. Booij, C. Lehmann, J. Mugdan, W. Kesselheim, S. Skopetas (eds.): Morphology: An International Handbook on Inflection and WordFormation. Vol. 1, 272-281. Berlin: de Gruyter. Wegener, H. (1999): „Die Pluralbildung im Deutschen – ein Versuch im Rahmen der Optimalitätstheorie.“ – In: Linguistik online 4. Weigl, E., Bierwisch, M. (1970): „Neuropsychology and linguistics: Topics of common research.“ – In: Foundations of Language 6, 1-18. Westermann, G. (1997): „A constructivist neural network learns the past tense of English verbs.“ – In: Proceedings of the GALA 1997 Conference on Language Acquisition, 393-398. Edinburgh: HCRC. – (1998): „Emergent modularity and U-shaped learning in a constructivist neural network learning the English past tense.“ – In: Proceedings of the 20th Annual Conference of the Cognitive Science Society, 1130-1135. Hillsdale, NJ: Erlbaum. – (2000): Constructivist Neural Network Models of Cognitive Development. – Dissertation, University of Edinburgh. Westermann, G., Willshaw, D., Penke, M. (1999): „A constructivist neural network model of German verb inflection in agrammatic aphasia.“ – In: Proceedings of the 9th International Conference on Artificial Neural Networks, 916-921.
247 Weyerts, H. (1995): „The acquisition of inflectional morphology: The case of German participles.“ – In: Amsterdam Series in Child Language Development 66, 181-202. – (1997): Reguläre und irreguläre Flexion: Psycholinguistische und neurophysiologische Ergebnisse zu Erwerb, Verarbeitung und mentaler Repräsentation. – Dissertation, Universität Düsseldorf. Weyerts, H., Clahsen, H. (1994): „Netzwerke und symbolische Regeln im Spracherwerb: Experimentelle Ergebnisse zur Entwicklung der Flexionsmorphologie.“ – In: Linguistische Berichte 154, 430-460. Weyerts, H., Penke, M., Dohrn, U., Clahsen, H., Münte, T.F. (1997): „Brain potentials indicate differences between regular and irregular German plurals.“ – In: Neuroreport 8, 957-962. Wiese, B. (in Druck): „Form and function of verbal ablaut.“ – In: R. Sackmann (Hg.): Studies in Integrational Linguistics. Amsterdam: Benjamins. Wiese, R. (1987a): „Versprecher als Fenster zur Sprachstruktur.“ – In: Studium Linguistik 21, 45-55. – (1987b): „Phonologie und Morphologie des Umlauts im Deutschen.“ – In: Zeitschrift für Sprachwissenschaft 6, 227-248. – (1996): The Phonology of German. – Oxford: Oxford University Press. – (1999): On default rules and other rules. – In: The Behavioral and Brain Sciences 22, 1043-1044. Wilder, C., Gärtner, H.-M. (1996): „Introduction.“ – In : C. Wilder, H.-M. Gärtner, Bierwisch, M. (eds.): The Role of Economy Principles in Linguistic Theory, 1-35. Berlin: Akademie-Verlag. Williams, E. (1981): „On the notions ‚lexically related‘ and ‚head of word‘.“ – In: Linguistic Inquiry 12, 245-274. – (1994): Remarks on lexical knowledge. – In: Lingua 92, 7-34. Wittgenstein, L. (1953): Philosophische Untersuchungen – Philosophical Investigations. – Oxford: Blackwell. Wunderlich, D. (1992): „A minimalist analysis of German verb morphology.“ – Arbeiten des SFB 282 „Theorie des Lexikons“ 21. – (1993): „Funktionale Kategorien im Lexikon.“ – In: F. Beckmann, G. Heyer (Hgg.): Theorie und Praxis des Lexikons, 54-73. Berlin: de Gruyter. – (1996a): „A minimalist model of inflectional morphology.“ – In: C. Wilder (ed.): The Role of Economy Principles in Linguistic Theory, 267-298. Berlin: Akademie-Verlag. – (1996b): „Minimalist morphology: The role of paradigms.“ – In: Yearbook of Morphology 1995, 93-114. – (1997): „Der unterspezifizierte Artikel.“ – In: C. Dürscheid, K.H. Ramers, M. Schwarz (Hgg.): Sprache im Fokus, 47-55. Tübingen: Niemeyer. – (1999): „German noun plural reconsidered.“ – In: The Behavioral and Brain Sciences 22, 10441045. - (2004): „Why assume UG?“ – In: M. Penke, A. Rosenbach (eds.): What Counts as Evidence in Linguistics – the Case of Innateness. Sonderband der Zeitschrift Studies in Language 28, 615-640. Wunderlich, D., Fabri, R. (1995): „Minimalist Morphology: An approach to inflection.“ – In: Zeitschrift für Sprachwissenschaft 14, 236-294. Wurzel, W.U. (1984): Flexionsmorphologie und Natürlichkeit. – Berlin: Akademie-Verlag. – (1990): „The mechanism of inflection: Lexicon representations, rules, and irregularities.“ – In: W.U. Dressler, H.C. Luschutzky, O.E. Pfeiffer, Rennison, J.R. (eds.): Contemporary Morphology, 203-216. Berlin: de Gruyter. – (2000): „Morphology as a discipline.“ – In: G. Booij, C. Lehmann, J. Mugdan, W. Kesselheim, S. Skopetas (eds.): Morphology: An International Handbook on Inflection and Word-Formation. Vol. 1, 1-15. Berlin: de Gruyter. Xu, F., Pinker, S. (1995): „Weird past tense forms.“ – In: Journal of Child Language 22, 531-556.
248 Yip, Moira (1998): „Identity avoidance in phonology and morphology.“ – In: S. LaPointe, D. Brentari, P. Farrell (eds.).: Morphology and its Relation to Phonology and Syntax, 216-246. Stanford, CA: CSLI Publications. Zeki, S.M. (1992): „Das geistige Abbild der Welt.“ – In: Spektrum der Wissenschaft 11, 54-63. Ziegler, W. (1997): „Die Rolle der Stammganglien in der Sprachproduktion.“ – In: Neurolinguistik 11, 133-166. Zingeser, L., Berndt, R.S. (1990): „Retrieval of nouns and verbs in agrammatism and anomia.“ – In: Brain and Language 39, 14-32. Zwicky, A.M. (1985): How to describe inflection.“ – In: Berkeley Linguistic Society 11, 371-386. – (1991): „Systematic versus accidental phonological identity.“ – In: F. Plank (ed.): Paradigms: The Economy of Inflection, 113-131. Berlin: Mouton de Gruyter.