307 119 8MB
German Pages 346 [362] Year 2018
Sprachverarbeitung im Zweitspracherwerb
DaZ-Forschung
Deutsch als Zweitsprache, Mehrsprachigkeit und Migration Herausgegeben von Bernt Ahrenholz Christine Dimroth Beate Lütke Martina Rost-Roth
Band 13
Sprachverarbeitung im Zweitspracherwerb
Herausgegeben von Sarah Schimke und Holger Hopp
ISBN 978-3-11-045180-1 e-ISBN (PDF) 978-3-11-045635-6 e-ISBN (EPUB) 978-3-11-045417-8 ISSN 2192-371X Library of Congress Cataloging-in-Publication Data A CIP catalog record for this book has been applied for at the Library of Congress. Bibliografische Information der Deutschen Nationalbibliothek Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über http://dnb.dnb.de abrufbar. © 2018 Walter de Gruyter GmbH, Berlin/Boston Druck und Bindung: CPI books GmbH, Leck ♾ Gedruckt auf säurefreiem Papier Printed in Germany www.degruyter.com
Inhalt Holger Hopp und Sarah Schimke Einleitung: Fragestellungen, Modelle und Methoden in der L2-Verarbeitungsforschung 1
I Sprache und Gehirn Jutta L. Mueller Neurophysiologische Verfahren zur Untersuchung der Verarbeitung 31 einer L2
II Wörter Andrea Weber und Mirjam Broersma Die Erkennung gesprochener Wörter in einer L2 Denisa Bordag und Thomas Pechmann Genuserwerb und -verarbeitung in einer L2 Gunnar Jacob Morphologische Verarbeitung bei L2-Lernern
55
75
93
III Sätze Maren Schmidt-Kassow, M. Paula Roncaglia-Denissen und Sonja A. Kotz Die Rolle des Trochäus bei der L1- und L2-Satzverarbeitung im Deutschen 119 Holger Hopp Kasus- und Genusverarbeitung des Deutschen im Satzkontext Valentina Cristante und Sarah Schimke Die Verarbeitung von Passivsätzen und OVS-Sätzen im kindlichen L2-Erwerb 169
141
VI
Inhalt
IV Kontexte: Pronomen Claudia Felser Verarbeitung von Pronomen bei erwachsenen L2-Lernern
195
Sarah Schimke, Saveria Colonna, Israel de la Fuente und Barbara Hemforth L1-Einfluss und allgemeine Lernereffekte bei der Auflösung ambiger Pronomen in einer L2 221 Hana Klages und Johannes Gerwien Die Interpretation anaphorischer Pronomina bei Kindern im L1- und frühen L2-Erwerb 247
V Perspektiven Mona Timmermeister und Monika S. Schmid Zusammenhänge zwischen Attrition der L1 und L2-Erwerb
277
Carrie Jackson, Courtney Johnson Fowler, Bianca Gavin und Nick Henry Zusammenhänge zwischen der Sprachverarbeitung und dem Erwerb neuer Strukturen bei erwachsenen L2-Lernern 299 Monique Flecken und Christiane v. Stutterheim Sprache und Kognition: Sprachvergleichende und lernersprachliche Untersuchungen zur Ereigniskonzeptualisierung 325
Holger Hopp und Sarah Schimke
Einleitung: Fragestellungen, Modelle und Methoden in der L2-Verarbeitungsforschung Dieser Band gibt einen Überblick über Fragestellungen, Modelle, Methoden und empirische Evidenz zur online Sprachverarbeitung bei Lernern¹ des Deutschen als Zweitsprache (L2). Als Teil der Psycholinguistik untersucht die Forschung zur L2Verarbeitung die mentalen Repräsentationen und Prozesse, die der Produktion und dem Verstehen einer L2 zugrunde liegen. Die Forschung zur Sprachverarbeitung bei L2-Lernern hat sich in den letzten Jahren zu einem wichtigen Teilbereich der L2-Erwerbsforschung entwickelt. Traditionell liegt der Fokus der L2-Erwerbsforschung auf einer Beschreibung der Verläufe und Etappen, in denen die Zielsprache erworben wird. Dabei besteht die untersuchte Evidenz meist aus von Lernern schriftlich oder mündlich produzierten Äußerungen, oder aus ihrer Interpretation oder Beurteilung von Texten oder einzelnen Sätzen. Die Forschung zur L2-Verarbeitung untersucht die vorgelagerten Prozesse, die zu einer Äußerung bzw. Interpretation führen, und erweitert damit den Fokus der L2-Erwerbsforschung in dreierlei Hinsicht. Erstens ist die Verarbeitung des sprachlichen Inputs eine offensichtliche Voraussetzung für den Spracherwerb. Verarbeitungsstudien können dabei Erkenntnisse darüber liefern, ob sich Verarbeitungsmechanismen zwischen L2Lernern und Muttersprachlern unterscheiden, zum Beispiel in der Gewichtung unterschiedlicher sprachlicher und nicht-sprachlicher Informationen oder in der Geschwindigkeit der Verarbeitung. Zweitens stellt die Fähigkeit, den sprachlichen Input zu verarbeiten, einen wichtigen Aspekt der sprachlichen Kompetenz dar. Damit ist sie nicht nur Voraussetzung, sondern gleichzeitig auch ein Objekt des Erwerbsprozesses. Drittens kann die Verarbeitungsforschung die Interaktion von kognitiven Prozessen und sprachlichem Wissen bei Lernern untersuchen, die sich in vielerlei Hinsicht unterscheiden können, zum Beispiel in der Erstsprache (L1), dem Alter zu Erwerbsbeginn, der Erwerbsdauer oder in ihren kognitiven Fähigkeiten oder Kapazitäten.
Hiermit sind selbstverständlich sowohl Personen weiblichen als auch männlichen Geschlechts gemeint. Zur besseren Lesbarkeit werden in diesem und allen folgenden Kapiteln des Bandes maskuline Formen verwendet. Holger Hopp, Technische Universität Braunschweig Sarah Schimke, Westfälische Wilhelms-Universität Münster DOI 10.1515/9783110456356-001
2
Holger Hopp und Sarah Schimke
In diesem Band liegt der Schwerpunkt auf dem Deutschen als Zielsprache, das in allen Beiträgen soweit wie möglich in den Blick genommen wird. Auch wenn viele Fragen der Sprachverarbeitungsforschung im Prinzip unabhängig von der Zielsprache sind, eignen sich bestimmte Sprachen jeweils besonders gut für die Untersuchung bestimmter Fragen oder Phänomene. Im Vergleich zum Englischen, das im Bereich der L2-Erwerbsforschung besonders häufig als Zielsprache untersucht wird, verfügt das Deutsche zum Beispiel über eine reichere Flexionsmorphologie, eine freiere Wortstellung und ein umfangreicheres Inventar an Pronomina. Diese Eigenschaften stellen besondere Herausforderungen im L2-Erwerb dar, die in diesem Band aus einer Verarbeitungsperspektive betrachtet werden. Die einzelnen Beiträge in diesem Band decken verschiedene linguistische Ebenen, verschiedene Lernertypen und verschiedene psycholinguistische Methoden ab. Sie stellen zum einen den bisherigen Forschungsstand dar und zeigen zum anderen Forschungslücken und -desiderata auf, um anschlussfähige Ideen und Anregungen für zukünftige Forschung zu geben. In dieser Einleitung grenzen wir zuerst den Bereich der L2-Verarbeitungsforschung näher ein und definieren zentrale Begriffe. Im zweiten Teil stellen wir wichtige Fragestellungen und Modelle in der Forschung zur L2-Verarbeitung vor. Im dritten Teil beschreiben wir die experimentellen Methoden, die in diesem Bereich eingesetzt werden. Abschließend skizzieren wir die einzelnen Beiträge in diesem Sammelband.
1 L2-Verarbeitung: Themen, Bereiche und Definitionen Die Forschung zur L2-Verarbeitung untersucht, welche Prozesse L2-Lerner anwenden,wenn sie Äußerungen in der Zielsprache produzieren oder verstehen, und wie die zugrundeliegenden Repräsentationen am besten modelliert werden können. Eine zentrale Beobachtung in der Psycholinguistik ist, dass Sprache inkrementell, d. h. sukzessive verarbeitet wird. Hörer warten nicht, bis etwa ein Satz komplett gesprochen wurde, bis sie anfangen, ihn zu dekodieren und zu interpretieren. Umgekehrt werden auch während der Sprachproduktion Informationen schrittweise von der Konzeptualisierung zur Artikulation einer Äußerung weitergegeben. Zentraler Gegenstand der Sprachverarbeitungsforschung ist die Untersuchung dieser inkrementellen Prozesse, das sogenannte Online-Verhalten. Wenn wir in diesem Band von einer L2 und von L2-Lernern sprechen, dann fassen wir diese Begriffe sehr weit. Eine L2 ist jede Sprache, deren Erwerb erst nach
Einleitung: Fragestellungen, Modelle und Methoden
3
Beginn des L1-Erwerbs einsetzt, und die also nicht von Geburt an erworben wird. Damit wird der bilinguale L1-Erwerb in diesem Band nicht behandelt (siehe Müller et al. 2009). Diese Definition eines L2-Lerners ist unabhängig von der Kompetenz in der Sprache und von den Umständen des Spracherwerbs. Für viele Fragestellungen ist es aber natürlich sinnvoll, weitere Unterscheidungen zu treffen. So wird häufig ein Unterschied zwischen L2-Lernern nach Erwerbstyp und Erwerbsalter gemacht. Hinsichtlich des Erwerbstyps wird zwischen dem ungesteuerten Erwerb in einer natürlichen Immersionsumgebung und dem gesteuerten Erwerb im Fremdsprachenunterricht unterschieden. Der gesteuerte Erwerb wird dabei auch als Fremdsprachenerwerb oder Fremdsprachenlernen bezeichnet und so vom ungesteuerten L2-Erwerb abgegrenzt. Zum anderen wird in der neueren Forschung zur Mehrsprachigkeit häufig ein Unterschied zwischen dem L2-Erwerb und dem L3-Erwerb, beziehungsweise allgemein dem Erwerb weiterer Sprachen jenseits der L2, gemacht (z. B. Flynn, Foley & Vinnitskaya 2004; Rothman 2011). Auch differenzieren viele Studien nach Erwerbsalter zwischen kindlichen und erwachsenen Lernern einer L2. In diesem Band grenzen die Autoren in den einzelnen Beiträgen gegebenenfalls die Diskussion auf bestimmte Erwerbstypen näher ein. Schließlich soll nicht unerwähnt bleiben, dass sich die L2-Verarbeitungsforschung in jüngerer Zeit vermehrt auch mit dem Einfluss der L2 auf die Erstsprache(n) mehrsprachiger Sprecher beschäftigt (siehe Timmermeister & Schmid in diesem Band). Als Teil der Psycholinguistik ist die Forschung zur L2-Verarbeitung ein interdisziplinärer Forschungsbereich, in dem Inhalte und Modelle sowohl aus der Sprachwissenschaft als auch aus der Psychologie zusammenkommen. Einerseits greift die Verarbeitungsforschung auf sprachwissenschaftliche Definitionen von Sprachstruktur, sprachlichen Einheiten und Regularitäten zur Beschreibung sprachlichen Wissens zurück. Auf der anderen Seite wird für die Modellierung der mentalen Prozesse in der Sprachverarbeitung auf psychologische Theorien zur Informationsverarbeitung und zu Gedächtnisstrukturen zurückgegriffen. Traditionell wird in der L2-Verarbeitungsforschung – wie in der Psycholinguistik im Allgemeinen – zwischen Sprachverständnis und Sprachproduktion unterschieden, die oftmals separat untersucht und auch modelliert werden (siehe aber Pickering & Garrod 2013; MacDonald 2013). In beiden Modalitäten werden jeweils unterschiedliche linguistische Ebenen erforscht. In der Wortverarbeitung (auch lexikalische Verarbeitung) wird die Struktur des mentalen Lexikons untersucht, d. h. die Speicherung und Vernetzung von phonologischen, orthografischen, semantischen und morphosyntaktischen Eigenschaften von Wörtern. Die Wortproduktion teilt sich in die Komponenten Konzeptualisierung (Was sage ich?), Formulierung (Wie sage ich es?) und Artikulation (Wie produziere ich es?; Levelt 1989). Umgekehrt stehen im Wortverständnis die Prozesse des lexikalischen Zugriffs auf das mentale Lexikon, der Auswahl eines
4
Holger Hopp und Sarah Schimke
bestimmten Wortes aus dem Lexikon und die lexikalische Integration von Wörtern in Sätze und Kontexte im Mittelpunkt der Forschung. In der Satzverarbeitung (auch Parsing) wird untersucht, wie Wörter zu größeren Strukturen zusammengefügt werden und diesen Strukturen eine Interpretation zugewiesen wird. In der Satzproduktion wird umgekehrt die schrittweise Konstruktion eines Satzes untersucht. Im Deutschen beschäftigen sich viele Studien mit der Wortstellung (Der Vater sieht den Sohn gegenüber Der Sohn sieht den Vater) aber auch mit morphosyntaktischen Markierungen, insbesondere von Kasus (Den Vater sieht der Sohn). Eine besondere Rolle in der Forschung zur Satzverarbeitung spielen ambige Sätze (Der Mann sieht die Frau mit dem Fernglas). Diese Sätze haben die Eigenschaft, dass sie zeitweise oder global mit mehreren strukturellen Analysen, d. h. verschiedenen Interpretationen, vereinbar sind. In unserem Beispiel kann etwa „mit dem Fernglas“ entweder „die Frau“ modifizieren oder sich auf das Verb „sieht“ beziehen. Die Untersuchung, welche Analyse bevorzugt wird, erlaubt Einblicke in Verarbeitungsstrategien, die auch bei nicht ambigen Sätzen angewandt werden. Auch in der Diskursverarbeitung werden häufig Ambiguitäten untersucht, etwa von pronominalen Formen (Der Vater sieht den Sohn, und er…), um allgemeine Verarbeitungsprinzipien zu entschlüsseln. Neben der referentiellen Kohärenz, wie sie zum Beispiel durch Pronomen hergestellt wird, spielt auch die relationale Kohärenz, also die Verarbeitung von Diskursrelationen, eine zunehmende Rolle in der L2-Diskursverarbeitungsforschung (siehe z. B. Foucart et al. 2016). In diesen verschiedenen sprachlichen Bereichen interessiert die L2-Verarbeitungsforschung, ob L2-Lerner über ähnliche sprachliche Repräsentationen verfügen und vergleichbare Verarbeitungsprozesse wie Muttersprachler anwenden und inwieweit Eigenschaften der L1 eine Rolle spielen. Dabei liegt der Anspruch in der L2-Verarbeitungsforschung nicht nur darin zu klären, wie und ob sich Lerner von Muttersprachlern unterscheiden, sondern die Sprachverarbeitung von mehrsprachigen Sprechern systematisch zu verstehen und zu modellieren. In diesem Zusammenhang spricht man von der Modellierung einer Zwischengrammatik (Interlanguage, Selinker 1972) oder Lernervarietät (Klein & Perdue 1997; Dimroth 2013). Dabei deutet der Begriff Zwischengrammatik an, dass diese Grammatik sowohl transferierte Elemente der L1 und anderer Sprachen als auch Elemente der Zielsprache enthalten kann. Der Begriff Lernervarietät betont insbesondere, dass das sprachliche System, das ein Lerner benutzt, als eine gleichberechtigte Varietät der jeweiligen Zielsprache betrachtet werden kann, ebenso wie die Standardvarietät oder andere Varietäten, wie Regiolekte oder Soziolekte (vgl. Dimroth 2013). Die Lernervarietät wird also als ein systematisches sprachliches System verstanden, d. h. als eine mentale Grammatik, die linguistisch beschrieben und psycholinguistisch untersucht werden kann. Dabei zeigt eine Lernervarietät typischerweise mehr Variation als eine vollständig erworbene
Einleitung: Fragestellungen, Modelle und Methoden
5
(Mutter)sprache und entwickelt sich im Prozess des L2-Erwerbs ständig fort. Mithin kann der L2-Erwerb als der fortwährende Übergang von einer Lernervarietät zur nächsten Varietät bis hin zur Zielsprache beschrieben werden. Dabei erreichen nicht alle L2-Lerner eine zielsprachliche Kompetenz in der L2. Wenn Lerner im L2-Erwerb in einer nicht-zielsprachlichen Lernervarietät stagnieren, wird dies als Fossilisierung bezeichnet (Selinker 1972; Long 2003). Ein besonderes Augenmerk vieler Studien zur L2-Verarbeitung liegt darauf, ob sich Fossilisierung und andere Abweichungen der Lernervarietät von der Zielsprache als Konsequenz von L2-spezifischen Verarbeitungsstrategien oder von sonstigen Beschränkungen der L2-Verarbeitung verstehen lassen (z. B. Clahsen & Felser 2006; Phillips & Ehrenhofer 2015).
2 Sprachverarbeitung: Fragestellungen In diesem Abschnitt skizzieren wir die zentralen Fragestellungen und Modelle in der L2-Verarbeitungsforschung. Wir gehen zunächst auf den Aufbau und Prozesse des Sprachverarbeitungssystems ein, indem wir diskutieren, ob L2-Lerner über ein oder mehrere Sprachsysteme verfügen, ob und wie sie sprachliche Informationen implizit verarbeiten und ob verschiedene Informationstypen unterschiedlich gewichtet werden. Im zweiten Schritt betrachten wir die Rolle von Lernerunterschieden in L1, Erwerbsalter und hinsichtlich kognitiver Faktoren. Zuletzt skizzieren wir die Bedeutung der Sprachverarbeitung sowohl für das Sprachlernen als auch das Sprachlehren in der Fremdsprachendidaktik.
2.1 Architektur des bilingualen Sprachverarbeitungssystems: Ein System oder zwei Systeme? Eine der zentralen Frage in der L2-Forschung ist, ob L2-Lerner über ein sprachübergreifendes oder zwei getrennte sprachliche Systeme verfügen. In der Spracherwerbsforschung wird diese Frage dahingehend gestellt, ob ein Lerner zwei getrennte sprachliche Regelsysteme erwirbt oder ob (evtl. zeitlich begrenzt) eine volle oder auch teilweise Überlappung oder Fusion der L1- und L2-Grammatiken besteht (z. B.Volterra & Taeschner 1978). In der Neurolinguistik wird diese Frage auf die neuronale Repräsentation zweier Sprachen bezogen und untersucht, ob L1 und L2 in den gleichen oder unterschiedlichen Hirnregionen verarbeitet werden (als Überblick, siehe Wartenburger 2012). In der Psycholinguistik liegt hingegen der Fokus häufig auf dem Zugang zu sprachlichem Wissen in mehr als einer Sprache. So wird die Frage nach dem
6
Holger Hopp und Sarah Schimke
sprachlichen System zumeist unter dem Begriff der Selektivität des Zugangs bzw. der Koaktivierung der Sprachen verfolgt (selective access/co-activation). Mit anderen Worten, es wird erforscht, ob L2-Lerner, wenn sie die Zielsprache sprechen, hören oder lesen, nur das L2-Lexikon und die L2-Grammatik aktivieren, oder ob die L1 auch aktiviert und damit zugänglich ist. Unter der Annahme, dass es zwei getrennte Systeme für L1 und L2 gibt, sollte die Sprachverarbeitung bei L2-Lernern im Prinzip wie bei Muttersprachlern bzw. bei L1-Lernern der jeweiligen Sprache ablaufen. Während eine Sprache gesprochen oder verstanden wird, wäre nach dieser Vorstellung die jeweils andere Sprache nicht zugänglich. Diese Auffassung war bis in die 90er Jahre des vergangenen Jahrhunderts dominant und hat zu Modellen der L2-Verarbeitung geführt, die im Wesentlichen monolinguale Modelle mit einer Verarbeitungsroute um eine zweite Route für die L2 erweitert haben (z. B. de Bot 1992). Seit dem Diktum des Neurolinguisten François Grosjeans, dass ein bilingualer Sprecher nicht die Summe zweier Monolingualer ist („A bilingual is not two monolinguals in one person.“; Grosjean 1989), hat sich die jedoch Überzeugung durchgesetzt, dass die L2-Verarbeitung nicht nur als Erweiterung der muttersprachlichen Verarbeitung verstanden werden kann. Neuere Ansätze modellieren daher explizit die Koexistenz zweier Sprachen in den mentalen Repräsentationen und Prozessen eines mehrsprachigen Sprechers. Am deutlichsten wird dies in der lexikalischen Verarbeitung (siehe Bordag & Pechmann; Weber & Broersma in diesem Band). Nahezu alle Modelle nehmen an, dass bilinguale Sprecher nur eine konzeptuelle Repräsentation (z. B. [HUND]) haben, die mit zwei lexikalischen Einträgen verbunden ist (z. B. DOG – HUND). Jedoch sind diese Einträge nicht voneinander getrennt. Das Bilingual Interactive Activation Model Plus (BIA+) Modell der Worterkennung (Dijkstra & van Heuven 2002) geht z. B. davon aus, dass Wörter aus beiden (oder mehreren) Sprachen in einem einzigen mentalen Lexikon eines bilingualen Sprechers gespeichert sind. Die einzelnen Wörter sind zwar nach der Sprachzugehörigkeit annotiert (z. B. DOGenglisch – DOSEdeutsch), diese Annotation spielt jedoch bei der Worterkennung zunächst keine Rolle, so dass beim lexikalischen Zugriff durch die partielle phonologische oder orthografische Information „DO“ sowohl DOG als auch DOSE aktiviert werden und in einen Wettbewerb miteinander treten. Erst in einem späteren Stadium werden die Annotationen „gelesen“, so dass der Sprecher das jeweils sprachadäquate Wort aus dem Set der aktivierten Wörter auswählt. In anderen Modellen, wie dem Bilingual Language Interaction Network for Comprehension of Speech (BLINCS; Shook & Marian 2013) wird ganz auf Sprachannotation verzichtet. Ähnliche Modelle finden sich in der Satzproduktion. Im Shared Syntax Modell (Hartsuiker & Pickering 2008) wird etwa angenommen, dass syntaktische Konstruktionen sprachunabhängig verarbeitet werden und somit die Verwendung z. B. einer Passivkonstruktion in der einen
Einleitung: Fragestellungen, Modelle und Methoden
7
Sprache die gleiche Konstruktion in der anderen Sprache aktiviert. Evidenz für die mittlerweile allgemein akzeptierte Annahme, dass die Sprachen mehrsprachiger Sprecher auf allen linguistischen Ebenen in Kontakt miteinander stehen, kommt auch aus Studien zum code-switching, bei dem Sprecher innerhalb einer Äußerung die Sprache wechseln (siehe Riehl 2014: Kapitel 6; für experimentelle Untersuchungen, z. B. Kootstra 2012). Vor diesem Hintergrund wird nun untersucht, inwieweit es Beschränkungen der gemeinsamen Aktivierung gibt, d. h. ob etwa ein deutsches Wort in einem anderssprachigen Satzkontext, z. B. einem rein englischsprachigen Satz, aktiviert wird (als Überblick van Assche, Duyck & Hartsuiker 2012) oder ob syntaktische Koaktivierung über Phrasengrenzen hinweg besteht (z. B. Jacob et al. 2016). In diesem Zusammenhang ist eine weitere wichtige Forschungsfrage, inwieweit L2Sprecher die jeweils andere Sprache aktiv unterdrücken (Inhibition). Das Inhibitory-Control Modell (Green 1998) postuliert, dass mehrsprachige Lerner Mechanismen der exekutiven Kontrolle einsetzen, um die Aktivierung der jeweils anderen Sprache zu inhibieren. In diesem Zusammenhang wird gegenwärtig insbesondere erforscht, ob die fortwährende Inhibition von Sprachen bei mehrsprachigen Sprechern positive Auswirkungen auf die kognitive Entwicklung von Kindern und die Leistungsfähigkeit im Alter hat (der sogenannte bilingual advantage, ‚bilingualer Vorteil‘; als Überblick Bialystok 2009).
2.2 Implizite Nutzung sprachlichen Wissens in Echtzeit Neben der Systemfrage liegt ein weiterer zentraler Forschungsbereich darin, zu untersuchen, inwieweit L2-Lerner sprachliches Wissen über die Zielsprache in Echtzeit abrufen und in der Verarbeitung nutzen können. Einige Modelle gehen davon aus, dass erwachsene Lerner nur eingeschränkten oder gar keinen Zugriff auf abstraktes syntaktisches bzw. morphologisches Wissen haben (z. B. Clahsen & Felser 2006; Silva & Clahsen 2008; Hawkins & Chang 1997; Jiang 2007). In ihren Annahmen stützen sich diese Modelle auf die Theorie der kritischen Periode (Lenneberg 1967; siehe auch Abschnitt 2.5), nach der sich nach der Kindheit qua neurophysiologischer Maturation (Reifung) ein Zeitfenster schließt, in dem Sprachen vollständig erworben werden können. Manche Varianten dieser Theorie gehen dabei davon aus, dass es kritische Perioden für einzelne sprachliche Ebenen geben kann, die zum Teil bereits in der frühen Kindheit angesetzt werden (Meisel 2009). In neuropsychologischen Ansätzen zur Sprachverarbeitung wird der Kontrast zwischen Spracherwerb innerhalb und nach der kritischen Periode als Unterschied in der Zugänglichkeit von prozeduralem und deklarativem Wissen beschrieben (Ullman 2005). Eine verwandte Differenzierung wird in der angewandten Linguistik mit den
8
Holger Hopp und Sarah Schimke
Begriffen implizites Wissen und explizites Wissen getroffen (z. B. Ellis et al. 2009). Dabei ist explizites Wissen bewusst zugänglich, während implizites Wissen nicht bewusst zugänglich und häufig prozeduraler Natur ist. Die Forschung zur Sprachverarbeitung beschäftigt sich, wie oben dargestellt, vor allem mit dem impliziten sprachlichen Wissen, das während der Verarbeitung angewandt wird. Es hat sich jedoch als aufschlussreich erwiesen, Maße impliziten und expliziten Wissens in Beziehung zueinander zu setzen. Dies kann erreicht werden, wenn Probanden zu dem gleichen Phänomen eine Aufgabe durchführen, bei der die Sprachverarbeitung direkt erfasst wird (online Daten, z. B. aus einem Eyetracking Experiment, s.u.) und eine Aufgabe, in der explizites Wissen über das jeweilige Phänomen erfasst wird, wie es zum Beispiel in einem Fragebogen oder einer Bildauswahlaufgabe möglich ist (offline Daten). Das Verhältnis von offline zu online Daten kann dabei unterschiedlich sein. Zum einen können online Daten auf mehr sprachliches Wissen hinweisen als offline Daten. Dieses Verhältnis findet sich oft bei kindlichen L2-Lernern. Kindliche Lerner haben weniger explizites Wissen über Sprache als erwachsene Lerner. Darüber hinaus unterscheiden sich insbesondere junge Lerner im Vorschulalter von erwachsenen Lernern dadurch, dass sie weniger weit entwickelte exekutive Funktionen haben (Hughes 2011). Zu diesen zählen unter anderem das Arbeitsgedächtnis und die inhibitorische Kontrolle. Ein Mangel an inhibitorischer Kontrolle oder an Arbeitsgedächtniskapazität kann zum Beispiel in einer Bildauswahlaufgabe dazu führen, dass ein Kind ein Bild wählt, das nicht dem Inhalt eines dazu gehörten Satzes entspricht, selbst wenn das Kind während der Verarbeitung des Satzes eine korrekte Interpretation aufgebaut hat (Höhle, Fritzsche & Müller 2016). Diese Eigenschaften führen dazu, dass bei Kindern in offline Aufgaben, die ein bewusstes Urteil über Sprache erfordern, häufig weniger sprachliches Wissen sichtbar wird als in online Aufgaben. Dies gilt sowohl für Kinder in ihrer L1 (z. B. Huang et al. 2013, Höhle, Fritzsche & Müller 2016) als auch für Kinder in einer L2 (z. B. Chondrogianni & Marinis 2012; Cristante & Schimke in diesem Band), aber auch etwa für erwachsene L2-Lerner am Anfang des L2-Erwerbs (z. B. Osterhout et al. 2006). Hier können online Daten also Einblicke in sprachliches Wissen erlauben, dessen Existenz in offline Daten nicht ersichtlich ist. Zum anderen kann sich in online Daten weniger sprachliches Wissen zeigen als in offline Daten. Dieses Muster findet sich oft bei erwachsenen L2-Lernern, die offline Wissen über ein Phänomen zeigen, dessen online Nutzung während der Sprachverarbeitung sich aber nicht nachweisen lässt. Ein solches Muster kann auf verschiedene Weisen interpretiert werden. Einerseits kann ein solcher Unterschied zwischen offline und online Verhalten darauf hinweisen, dass Lerner zwar explizites Wissen oder Wissen über Sprache in einem Bereich der L2 haben, jedoch kein sprachliches Wissen, das mit dem impliziten und prozeduralen sprachlichen
Einleitung: Fragestellungen, Modelle und Methoden
9
Wissen von Muttersprachlern vergleichbar wäre. Andererseits kann der Unterschied so interpretiert werden, dass Lerner zwar sprachliches Wissen in dem untersuchten Bereich der L2 besitzen, es aber nicht in Echtzeit nutzen können. Hierfür könnten z. B. die geringe Automatisierung der Verarbeitungsprozesse in einer L2, höhere Anforderungen an das Arbeitsgedächtnis oder weitere individuelle Unterschiede (siehe Abschnitt 2.6) verantwortlich sein. Mangelnde Evidenz für die online Nutzung sprachlichen Wissens in einer L2 in Experimenten ist also nicht immer auf das Fehlen dieses Wissens zurückzuführen. Daher sind gerade in der L2-Verarbeitung Aspekte der unterschiedlichen Gewichtung sprachlicher Informationen in L1 und L2, des Einflusses der L1 und individueller Unterschiede zwischen Lernern in Erwerbsalter, Kompetenzniveau in der L2 und kognitiven Ressourcen zu berücksichtigen. Diese Faktoren besprechen wir im Folgenden.
2.3 Gewichtung unterschiedlicher Typen sprachlicher Informationen Sprachliches Wissen gliedert sich in unterschiedliche Bereiche, d. h. zum Beispiel phonologisches, lexikalisches, semantisches und morphosyntaktisches Wissen. Ein wichtiges Thema in der L2-Verarbeitungsforschung ist, wie L2-Lerner unterschiedliche sprachliche Informationen gewichten und ob sie sich in dieser Hinsicht von Muttersprachlern unterscheiden. In der Wortverarbeitung wird die Hypothese untersucht, dass sich L2-Lerner eher auf orthografische, aber weniger auf morphologische Eigenschaften von Wörtern konzentrieren (siehe Jacob in diesem Band). In der Satzverarbeitung gibt es Ansätze, die postulieren, dass erwachsene L2-Lerner sich im Verständnis der Zielsprache mehr auf lexikalische, semantische und kontextuelle Informationen als auf morphosyntaktische Hinweisreize und grammatische Strukturen stützen (Shallow Structure Hypothese; Clahsen & Felser 2006). Andere Modelle gehen davon aus, dass L2-Lerner jeden Alters besondere Schwierigkeiten mit sprachlichen Phänomenen haben, die Informationen von verschiedenen sprachlichen Ebenen, also z. B. Syntax und Diskursinformationen, zusammenbringen (z. B. Pronomeninterpretation, Topikalisierung, etc.). Nach der Schnittstellenhypothese (Interface Hypothese; Sorace 2011) können L2-Sprecher diese Integration unterschiedlicher Informationen nicht immer in Echtzeit leisten. Nicht zuletzt kann die Gewichtung von sprachlichen Informationen in der L2 auch von einer unterschiedlichen Gewichtung von Informationen in der L1 beeinflusst werden.
10
Holger Hopp und Sarah Schimke
2.4 Einfluss der L1 Wie in Abschnitt 2.1 dargestellt, gehen moderne Sprachverarbeitungstheorien davon aus, dass es enge Verknüpfungen zwischen den sprachlichen Repräsentationen der verschiedenen Sprachen mehrsprachiger Sprecher gibt. Dies impliziert, dass sich Sprachen während der Verarbeitung gegenseitig beeinflussen können. Dieser Einfluss kann prinzipiell in beide Richtungen stattfinden, unabhängig von der Sprachkompetenz in den jeweiligen Sprachen und von ihrem Status als L1 oder L2 (Schmid & Köpke 2017). Wenn die L1 die L2-Verarbeitung beeinflusst, spricht man von Transfer bzw. Interferenz aus der L1. Diese Begriffe werden oft in der Forschung nicht klar voneinander abgegrenzt. Transfer bezieht sich vornehmlich auf den systematischen Einfluss z. B. von grammatischen Strukturen der L1 in der L2, wohingegen Interferenz den temporären Einfluss von Eigenschaften der L1 in der Sprachproduktion oder im Sprachverständnis bezeichnet. L1-Effekte zeigen sich in der Sprachverarbeitung zum Beispiel in der Nutzung eines Artikels mit dem grammatischen Geschlecht aus der L1 in der L2 (siehe Bordag & Pechmann in diesem Band) oder der Nutzung der L1-Satzstellung in der L2 (siehe Jackson et al. in diesem Band). In Modellen der L2-Verarbeitung wird der Einfluss der L1 größtenteils über den Verlauf des L2-Erwerbs betrachtet. In der Wortverarbeitung nimmt etwa das Revised Hierarchical Model (Kroll & Stewart 1994) an, dass sich L2-Lerner anfänglich die Bedeutung eines Wortes in der L2 (z. B. englisch meat) über das Übersetzungsäquivalent in der L1 erschließen (z. B. deutsch Fleisch), da keine direkten Verbindungen zwischen dem L2-Wort und semantisch-konzeptuellen Repräsentationen bestehen. Erst mit steigender Sprachfertigkeit bauen Lerner direkte Verbindungen zwischen L2-Wörtern und semantisch-konzeptuellen Repräsentationen auf. Im Bereich des Satzverständnisses nimmt das funktionalistische Wettbewerbsmodell (Competition Model; z. B. MacWhinney 2005) an, dass die Auswahl und Gewichtung von Informationen zur Satzinterpretation, sogenannte Hinweisreize (cues), bei L2-Lernern zunächst aus der L1 übernommen wird. Aufgrund der freien Wortstellung sind im Deutschen zum Beispiel die wichtigsten Hinweisreize für die Satzinterpretation Kasus und Subjekt-Verb-Kongruenz, im Englischen hingegen ist die Wortstellung der wichtigste Hinweisreiz. L2-Lerner übertragen zunächst die Hinweisreize aus der L1 in die L2 und nutzen sie in der L2Verarbeitung, bevor sie langsam die Hinweisreize der L2 und ihre Gewichtung erwerben. Auch in formalen grammatischen Ansätzen zum L2-Erwerb bzw. der L2Verarbeitung wird vorhergesagt, dass L2-Lerner zunächst die L1-Grammatik nutzen, um die Zielsprache zu verarbeiten und sich so gerade zu Beginn des L2-Er-
Einleitung: Fragestellungen, Modelle und Methoden
11
werbs umfangreicher Transfer findet (Full Transfer/Full Access/Full Parse; Schwartz & Sprouse 1996; Dekydtspotter, Schwartz, & Sprouse 2006). Diesen Modellen ist gemeinsam, dass das Ausmaß des L1-Transfers von der Sprachkompetenz in der L2 abhängt und sich umso weniger Transfer in Spracherwerb und Sprachverarbeitung aus der L1 findet, je fortgeschrittener ein Lerner in der L2 ist (siehe Abschnitt 2.6). Jedoch finden sich auch bei sehr fortgeschrittenen L2Lernern mit hoher Sprachkompetenz noch Einflüsse der L1 auf lexikalischer Ebene (z. B. Van Hell & Tanner 2012), und auch die L1-Grammatik ist beim Satzverstehen in der L2 noch aktiv (z. B. Thierry & Wu 2007; Hopp 2010, 2016).
2.5 Einfluss des Erwerbsalters Wenn ein Lerner eine L2 oder weitere Sprachen im Alter von 0 – 3 Jahren zu erwerben beginnt, spricht man von simultanem bilingualen Erstspracherwerb, bzw. sukzessiven bilingualem Erstspracherwerb, wenn die Sprachen nacheinander in dieser Alterspanne begonnen wurden (z. B. De Houwer 2009). Wenn ein Kind im Alter von ca. 4– 10 Jahren mit einer L2 beginnt, wird vom kindlichen oder frühen L2Erwerb gesprochen (z. B. Unsworth 2013). Lerner, die erst mit oder nach der Pubertät mit dem Lernen einer L2 beginnen, nennt man späte oder erwachsene L2Lerner. Der Vergleich von L2-Lernern unterschiedlichen Erwerbsalters ist relevant, um zu untersuchen (1) ob bestimmte sprachliche Lern- und Verarbeitungsmechanismen vom Erwerbsalter abhängig sind und (2) ob und wie sich der frühe L2Erwerb bei Kindern, die mehrere Sprachen gleichzeitig erwerben, vom späten L2Erwerb, der vor dem Hintergrund einer vollständig erworbenen L1 stattfindet, unterscheidet. Untersuchungen zu Alterseffekten auf Lern- und Verarbeitungsprozesse wurden insbesondere im Kontext der oben erwähnten Hypothese zu der kritischen oder sensitiven Periode (Lenneberg 1967) durchgeführt. Während ein Vorteil des frühen Erwerbsbeginns einer L2 allgemein anerkannt ist, bleibt strittig, ob die Fähigkeit, eine L2 auf hohem Niveau zu lernen, mit steigendem Alter unmöglich wird (kritische Periode, vgl. die fundamental difference Hypothese, Bley-Vroman 1990) oder ob sich mit steigendem Alter nur die Wahrscheinlichkeit eines erfolgreichen Erwerbs graduell verringert. Einige Modelle nehmen etwa an, dass sich die L1 im Laufe der Zeit immer stärker „eingräbt“ (entrenchment; MacWhinney 2005) und in der L2 interferiert, dass die Motivation zur sozialen Anpassung an eine neue (Sprach)gemeinschaft im höheren Alter sinkt (Pagonis 2009), oder auch physiologische und kognitive Grundlagen für erfolgreichen Spracherwerb, wie Hörfähigkeit oder Arbeitsgedächtnis, sich verändern. Derartige Faktoren könnten den L2-Erwerb mit fortschreitendem Alter immer schwieriger
12
Holger Hopp und Sarah Schimke
werden lassen, ohne dass notwendigerweise grundsätzlich andere Lern- oder Verarbeitungsmechanismen involviert sind als im frühen Erwerb. Die Frage, ob es eine kritische Periode für den L2-Erwerb gibt, ist also weiterhin offen, und es bedarf mehr Studien zu L2-Lernern mit unterschiedlichen Erwerbsaltern. Der Blick auf die Sprachverarbeitung bei kindlichen L2-Lernern ist dabei aber nicht nur interessant, um die Hypothese der kritischen Periode zu untersuchen. Weitere wichtige Untersuchungsfragen betreffen die Wechselwirkung zwischen L2-Erwerb und kognitiver Entwicklung sowie die wechselseitige Beeinflussung sprachlicher Systeme, die sich alle noch in einer dynamischen Entwicklungsphase befinden. So ist z. B. eine naheliegende Annahme, dass die L1 umso mehr Einfluss nehmen kann, je länger sie bereits benutzt wurde und je aktivierter und eingeschliffener demnach die Repräsentationen und Prozesse sind, die mit ihr zusammenhängen (MacWhinney 2005, s.o.). Demnach sollte die L1 bei kindlichen L2-Lernern weniger Einfluss haben als bei erwachsenen L2-Lernern, und bei jüngeren Kindern weniger als bei älteren. Ob dies tatsächlich immer so gilt, muss allerdings noch weiter untersucht werden. In der Spracherwerbsforschung gibt es zudem Vorschläge, wonach verschiedene linguistische Ebenen in einem unterschiedlich jungen Alter von L1-Einflüssen betroffen seien (vgl. Schwartz 2009; Meisel 2009). Sowohl in der Erwerbsforschung wie in der Verarbeitungsforschung liegen jedoch bisher noch nicht genug Studien mit kindlichen L2-Lernern aus verschiedenen Erstsprachen vor, um diese Vorschläge zu überprüfen.
2.6 Einfluss individueller Unterschiede Während ursprünglich vor allem nach Unterschieden zwischen L2-Lernern und Muttersprachlern gefragt wurde, rücken gerade in jüngerer Zeit Unterschiede zwischen L2-Lernern immer mehr in das Zentrum der Forschung zur L2-Verarbeitung. Studien zu individuellen Unterschieden sind aus zwei Gründen wichtig. Zum einen dienen sie dazu, individuelle Voraussetzungen für den Verarbeitungsund damit eventuell auch Lernerfolg in der L2 zu bestimmen. Zum anderen erlaubt die Erforschung individueller Unterschiede eine weitere Perspektive auf die Frage, ob es kategorische Effekte des Alters auf den L2-Erwerb gibt (siehe Abschnitt 2.5). Neben dem Erwerbsalter wird die L2-Verarbeitung durch eine Vielzahl von individuellen Lernerunterschieden beeinflusst. Am häufigsten werden Unterschiede in der Sprachkompetenz oder Sprachfertigkeit (proficiency) von L2-Lernern in Produktion oder im Verständnis untersucht. Sowohl in der Worterkennung und -produktion (z. B. Van Hell & Tanner 2012) als auch in der Satzverarbeitung (z. B. Hopp 2010) zeigen Studien, dass eine höhere Sprachfertigkeit in der L2 zu stärker zielsprachlicher Verarbeitung und geringeren L1-Effekten führt (siehe
Einleitung: Fragestellungen, Modelle und Methoden
13
Abschnitt 2.4). In den meisten Studien wird das Kompetenzniveau mittels standardisierter Tests oder auch durch Selbsteinschätzungen der Lerner gemessen. Des Weiteren werden generelle Lernerfaktoren wie Sprachlerntalent (language aptitude) und die Anzahl der Sprachen bei mehrsprachigen Sprechern (DeAngelis 2007) untersucht. Spezifisch für die Forschung zur Sprachverarbeitung relevant sind individuelle Unterschiede in der Kapazität des verbalen Arbeitsgedächtnisses, in dem sprachliche Informationen zwischengespeichert und dann wieder abgerufen werden können. Gerade bei komplexeren Phänomenen in der L2 wird untersucht, inwieweit Lernerunterschiede im Arbeitsgedächtnis zu Unterschieden in der Verarbeitung führen. Hierzu werden (standardisierte) Instrumente zur Messung der verbalen Arbeitsgedächtnisspanne in der L1 und/oder in der L2 sowie zur Messung der non-verbalen Arbeitsgedächtnisspanne (etwa mit geometrischen Figuren) als sprachneutrales Maß benutzt. Weitere Faktoren sind individuelle Variation in der Dekodierfähigkeit in der lexikalischen Verarbeitung (z. B. Hopp 2014, 2016), in Lese- oder Verarbeitungsgeschwindigkeit (z. B. Roberts & Felser 2011; Kaan, Ballantyne & Wijnen 2014) oder in der Fähigkeit zur Inhibition (exekutive Kontrolle, z. B. Teubner-Rhodes et al. 2016).
2.7 Rolle der Sprachverarbeitung für Lernen In vielen Modellen zum Spracherwerb ist die Sprachverarbeitung wichtiger Antrieb für das Lernen.Wie oben dargestellt (siehe Abschnitt 2.4) gehen viele Modelle des L2-Erwerbs davon aus, dass L2-Lerner zunächst die L1-Grammatik transferieren, und dass darauffolgend eine allmähliche Restrukturierung weg von der L1 hin zu der Zielsprache erfolgt, da der zielsprachliche Input nicht mit der L1Grammatik verarbeitet werden kann (z. B. Schwartz, Dekydtspotter & Sprouse 2003; Dekydtspotter & Renaud 2014). Durch ein Scheitern der L1-basierten Verarbeitungsstrategien bei der Entschlüsselung des zielsprachlichen Inputs wird somit der Lerner gezwungen, seine Grammatik zu restrukturieren. In neueren Ansätzen wird zudem erforscht, wie Lerner in der Sprachverarbeitung ihre Annahmen über die Struktur und Eigenschaften der L2 gegen den Input testen und daraus lernen können. Viele Studien zeigen, dass Hörer Vorhersagen über den sprachlichen Input machen, bevor sie ihn vollständig hören (Prädiktion; siehe Kuperberg & Jaeger 2016). So grenzen z. B. deutsche Muttersprachler beim Hören eines feminin markierten Artikels die möglichen folgenden Nomen ein, d. h. sie sagen voraus, dass das folgende Nomen aus der Klasse der Feminina kommt.Wenn diese Erwartungen nun für einen Sprachenlerner im Input nicht erfüllt werden, z. B. weil die Lernergrammatik nicht der Zielsprache ent-
14
Holger Hopp und Sarah Schimke
spricht, erhält der Lerner durch den Input Feedback und ggf. Evidenz dafür, wie die Zielsprache funktioniert. Wenn also ein Lerner des Deutschen als L2 glaubt, das Nomen Karte sei maskulin, erwartet er, Karte zusammen mit dem Artikel der zu hören. Wenn nun aber Karte beständig mit femininen Artikeln auftaucht, wird die Vorhersage des Lerners widerlegt. Aufgrund dieser falschen Vorhersage und der anschließenden Korrektur durch den Input kann der Lerner nun seine Annahmen über die L2 modifizieren (siehe Hopp in diesem Band). Allerdings wurde für L2-Lerner beobachtet, dass sie weniger oder nur in einzelnen sprachlichen Bereichen Vorhersagen in der Sprachverarbeitung machen (z. B. Grüter, Rohde & Schafer 2016; als Überblick, Kaan 2014). Damit haben L2-Lerner auch weniger Möglichkeiten, aus dem Input zu lernen. Mithin sind also Unterschiede in der Sprachverarbeitung, hier in der Fähigkeit, grammatische Vorhersagen zu machen, möglicherweise ein Teil der Erklärung dafür, dass der L2Erwerb variabler, häufig weniger erfolgreich und in vielen Entwicklungsphasen auch langsamer ist als der kindliche (L1‐) Erwerb (Phillips & Ehrenhofer 2015). Auch die in Abschnitt 2.3 erwähnte Beobachtung, dass (erwachsene) L2-Lerner während der Sprachverarbeitung morphosyntaktischen Hinweisreizen ein relativ geringeres Gewicht geben, könnte in einem Zusammenhang mit (mangelndem) Lernerfolg stehen. Denn nur wenn bestimmte Hinweisreize überhaupt wahrgenommen und genutzt werden, kann ihre Rolle in der Zielgrammatik entschlüsselt werden (s.a. Jackson et al., in diesem Band). Die Forschung, welche Rolle die Sprachverarbeitung für den Erwerb von zielsprachlichem Wissen spielt, steht erst am Anfang, und zentrale Fragen sind noch ungeklärt, z. B. wie sprachlicher Input verarbeitet werden muss, damit eine L2 gelernt wird (z. B. Carroll 2001; Sharwood-Smith & Truscott 2014). Letztlich berühren diese Themen zentrale Fragestellungen zu der Architektur des Sprachsystems und dem Verhältnis von sprachlichem Wissen (mentaler Grammatik) und Sprachverarbeitungssystem (z. B. Lewis & Phillips 2015; O′Grady 2013). Jenseits dieser fundamentalen Fragen knüpft aber die Forschung zur L2-Verarbeitung durch das Aufgreifen von Fragen zum Sprachenlernen Verbindungen zur Fremdsprachendidaktik.
2.8 Konsequenzen für die Fremdsprachendidaktik In neueren Studien im Bereich der Fremdsprachendidaktik und der angewandten Linguistik wird mittels Methoden der L2-Verarbeitungsforschung untersucht, welche Lern- und Lehrmethoden zu erfolgreichem Erwerb impliziten sprachlichen Wissens führen (z. B. Loewen 2015). Hierbei stehen zwei Fragen im Mittelpunkt. Erstens wird untersucht, wie der sprachliche Input derart gestaltet werden kann,
Einleitung: Fragestellungen, Modelle und Methoden
15
dass er verarbeitet und damit verstanden wird. Zum Beispiel kann die Komplexität des sprachlichen Inputs an die Entwicklungsstufen von L2-Lernern angepasst werden, so dass sie die relevanten Informationen im Input auch verarbeiten können (Pienemann 1998). Zweitens ist wichtig zu verstehen, wie der sprachliche Input so gestaltet werden kann, dass er sprachliches Lernen fördert (z. B. Carroll 2001; Sharwood-Smith & Truscott 2014.) Im Rahmen des Processing Instruction Ansatzes von VanPatten (2012) werden explizit Erkenntnisse der Sprachverarbeitungsforschung in didaktische Methoden umgesetzt, so dass im Unterricht spezifische Aspekte des L2-Inputs hervorgehoben bzw. Aufgaben (tasks) entwickelt werden, die besonders auf Strukturen oder Phänomene abstellen, die schwierig zu verarbeiten sind (siehe Jackson et al. in diesem Band). Der Überblick über acht zentrale Themenbereiche der L2-Verarbeitungsforschung macht deutlich, dass Studien zur L2-Verarbeitung zentrale Fragen des L2Erwerbs untersuchen. Diese Studien zeichnen sich dadurch aus, dass sie mittels des Einsatzes zeitsensitiver Methoden Einblicke in den Ablauf unbewusster Prozesse in Sprachverständnis und -produktion bieten.
3 Methoden in der L2-Verarbeitungsforschung In der Forschung zur L2-Verarbeitung wird eine Vielzahl von Methoden verwandt. Zunächst kann zwischen behavioralen (auch verhaltensbasierten) Methoden, die die Reaktion und Reaktionszeit im Verhalten eines Probanden messen, und neurophysiologischen Methoden, die Hirnaktivität während der Sprachverarbeitung messen, unterschieden werden. Im Folgenden stellen wir die Charakteristika der wichtigsten Methoden vor, die in der Sprachverarbeitungsforschung verwandt werden und auch in den Beiträgen in diesem Band vertreten sind.
3.1 Behaviorale Methoden Mit dem Begriff behaviorale Methoden werden grundsätzlich alle Methoden beschrieben, in denen die Reaktion eines Probanden gemessen wird, unabhängig davon, ob diese nach Präsentation eines (sprachlichen) Stimulus, d. h. offline, oder aber während der Stimuluspräsentation, also online, erfolgt. In der Psycholinguistik dominieren Methoden, die das Verhalten von Probanden über Reaktionszeiten online messen und so Einsicht in die Dynamik sprachlicher Verarbeitungsprozesse bieten. Die Länge der Reaktionszeit wird als Korrelat der Dauer bzw. der Anzahl der mentalen Operationen interpretiert, die ein Proband benötigt,
16
Holger Hopp und Sarah Schimke
um eine Aufgabe zu erfüllen. Bei diesen Methoden ist also die Verarbeitungsgeschwindigkeit ein indirektes Maß kognitiver Aktivität.
3.1.1 Bildbenennung und Bild-Wort-Interferenz Die Bildbenennung ist eine Aufgabe aus der Sprachproduktionsforschung, in der der Zugriff auf das mentale Lexikon gemessen wird. Probanden sehen hierbei ein Bild und benennen dieses so schnell wie möglich. In der Analyse wird die Zeitdauer zwischen der Präsentation des Bildes und dem Beginn der Artikulation des Wortes durch den Probanden gemessen. Die Benennungszeiten sind abhängig von Wortlänge und -frequenz. In der L2-Forschung werden Bildbenennungsaufgaben eingesetzt, um die Architektur des mehrsprachigen mentalen Lexikons zu untersuchen. Dazu werden häufig Wörter untersucht, die sich durch eine formbasierte Ähnlichkeit in der L1 und der L2 auszeichnen, z. B. Kognaten, d. h.Wörter mit identischer phonologischer Form und gleicher Bedeutung (deutsch-englisch: FILM) oder aber interlinguale Homophone, die eine gleiche Form aber eine unterschiedliche Bedeutung haben (BOOT). Form- bzw. bedeutungsbasierte Übereinstimmungen führen zu schnellerer Bildbenennung, Bedeutungsinkongruenzen aber zu langsamerer Benennung im Vergleich zu neutralen Kontrollwörtern, die keine Äquivalenz in der anderen Sprache aufweisen. In vielen Studien werden Probanden gebeten, das Bild mit einer Nominalphrase, d. h. Artikel und Nomen, zu benennen, so dass auch morphosyntaktische Aspekte, wie z. B. Übereinstimmung von grammatischem Geschlecht zwischen L1 und L2 untersucht werden können (vgl. Bordag & Pechmann in diesem Band). Oftmals wird Bildbenennung in einem Bild-Wort-Interferenz Paradigma mit der Worterkennung gekoppelt. Hierbei soll ein Bild benannt werden, ein zeitgleich präsentiertes Distraktorwort aber ignoriert werden (Abbildung 1). Dieses Wort ist mit dem Bildobjekt z. B. phonologisch, semantisch oder assoziativ verwandt. Auch wenn der Proband das Wort eigentlich ignorieren soll, zeigen Unterschiede in der Benennungszeit des Bildes zwischen verwandten Wort-Bild Paarungen gegenüber nicht verwandten Wort-Bild Paarungen, dass das Wort automatisch gelesen wird und die Benennung beeinflusst.
Abbildung 1: Beispiel für Bild-Wort-Interferenz
Einleitung: Fragestellungen, Modelle und Methoden
17
In der Analyse werden Benennungsgenauigkeit und -geschwindigkeit erfasst. Im Vergleich der Bildbenennung zwischen unrelatiertem und verwandtem Wort wird zusätzlich die Zeit der Präsentation (die sogenannte stimulus-onset-asynchrony; SOA) variiert, d. h. das Wort kann entweder vor dem Bild, gleichzeitig oder nach dem Bild präsentiert werden. Diese Variation führt zu unterschiedlichen Effekten verschiedener Wort-Bild Relationen. So wird die Bildbenennung durch semantisch verwandte Wörter bei vorzeitiger bzw. gleichzeitiger Präsentation verlangsamt, bei phonologisch verwandten Wörtern findet hingegen eine Beschleunigung der Bildbenennung statt, jedoch nur bei späterer Präsentation des Wortes. Durch die gezielte Manipulation von Art der Relatiertheit und SOA können so unterschiedliche Stadien der Wortproduktion untersucht werden. Bild-WortInterferenzexperimente in der L2-Verarbeitungsforschung untersuchen, inwieweit phonologische oder semantische Wettbewerberworte aus der anderen Sprache einen Einfluss auf die Worterkennung haben (vgl. Bordag & Pechmann; Weber & Broersma in diesem Band).
3.1.2 Lexikalische Entscheidung Lexikalische Entscheidungsaufgaben werden vornehmlich in der psycholinguistischen Forschung zur Worterkennung, d. h. dem Zugriff auf das mentale Lexikon, eingesetzt. In einer solchen Aufgabe werden dem Probanden Buchstabenreihen von Wörtern (z. B. HUND) und Nicht-Wörtern (z. B. HRIND) auf dem Bildschirm oder auditiv präsentiert, und der Proband entscheidet durch einen Tastendruck so schnell wie möglich, ob die Buchstabenreihe tatsächlich ein Wort ist. In der Analyse werden die Antwortgenauigkeit und die Antwortgeschwindigkeit gemessen. Diese Maße differenzieren Wörter abhängig von Wortfrequenz, Bekanntheit, Wortlänge und Erwerbsalter, zeigen aber auch Unterschiede bei NichtWörtern zwischen z. B. phonotaktisch unmöglichen Nicht-Wörtern (PFKIT) oder aber nicht lexikalisierten Pseudo-Wörtern (PIND). Dies erlaubt es, zu untersuchen, welche Beziehungen, z. B. auf phonologischer, orthografischer und semantischer Ebene, zwischen Wörtern im mentalen Lexikon bestehen. In der L2-Verarbeitungsforschung wird die lexikalische Entscheidung eingesetzt, um zu untersuchen, inwiefern der Zugriff auf L2-Wörter im mentalen Lexikon verlangsamt ist, ob es Unterschiede in Effekten von z. B. Frequenz zwischen L1 und L2 gibt und insbesondere, ob der Zugriff auf Wörter in einer Sprache von formaler oder semantisch-assoziativer Ähnlichkeiten mit Wörtern der jeweils anderen Sprache beeinflusst wird (z. B. Jacob in diesem Band).
18
Holger Hopp und Sarah Schimke
3.1.3 Priming Im Priming (deutsch: Bahnung oder Voraktivierung) wird der Effekt eines vorherig präsentierten Reizes (Prime) auf die Reaktion eines Probanden auf ein Ziel (Target) gemessen. Die Zielreaktion wird häufig mit einer lexikalischen Entscheidung gekoppelt, in der Antwortgenauigkeit und -geschwindigkeit gemessen wird. Andere Formen der Zielreaktion sind semantische oder andere klassifikatorische Urteile oder aber die Benennung z. B. eines Wortes. Bei all diesen Reaktionen wird analysiert, inwiefern sich die Reaktion auf ein Zielitem (z. B. HUND) zwischen einem Prime, das mit dem Ziel verwandt ist (z. B. KNOCHEN) und einem unverwandten Prime (z. B. KRÄUTER) unterscheidet. Ein Primingeffekt tritt auf beim direkten oder Wiederholungspriming (HUND-HUND), beim assoziativen Priming (KNOCHEN-HUND), beim semantischen Priming von Wörtern aus dem gleichen Bedeutungsfeld (KATZE-HUND), beim phonologischen Priming (MUND-HUND) und dem orthografischen Priming (HUSTEN-HUND). Zusätzlich wird im morphologischen Priming untersucht, inwieweit der Stamm ein komplexes Wort primt (BAU – BAUEN; vgl. Jacob in diesem Band), und im syntaktischen Priming, inwiefern eine Satzstruktur, z. B. Passiv, zu einer vermehrten Produktion von weiteren Passivsätzen führt. Von positivem Priming spricht man, wenn ein Prime die Reaktion beschleunigt und von negativem Priming, wenn die Reaktion durch das Prime im Vergleich zum unverwandten Prime verlangsamt wird. Es wird weiterhin zwischen automatischem Priming, in dem das Prime nur kurz präsentiert wird, so dass es der Proband nicht bewusst wahrnimmt (kurzer SOA: 20 bis 80 ms), und dem bewussten Priming unterschieden, in dem das Prime länger präsentiert wird (langer SOA: über 100 ms). Priming ist nicht nur zwischen Wörtern und Sätzen innerhalb einer Modalität möglich (also zum Beispiel von geschriebenen zu geschriebenen Wörtern), sondern findet sich auch zwischen Modalitäten, zum Beispiel in Experimenten, in denen das Prime schriftlich und das Ziel auditiv präsentiert wird (cross-modal priming). In der L2-Verarbeitungsforschung wird Priming insbesondere eingesetzt, um zwischensprachlichen Einfluss auf phonologischer, morphologischer, semantischer und syntaktischer Ebene zu untersuchen. Ein weiterer Forschungszweig untersucht den Zusammenhang zwischen Priming und (implizitem) Lernen (vgl. Jackson et al. in diesem Band).
3.1.4 Selbstgesteuertes Lesen Das selbstgesteuerte Lesen ist eine vielgenutzte Methode im Bereich der Satzverarbeitung. Bei dieser Methode werden Sätze in einzelne Segmente (Wörter oder Phrasen) aufgeteilt. Auf einem Computer liest der Proband diese Segmente und
Einleitung: Fragestellungen, Modelle und Methoden
19
bestimmt durch Tastendruck, wie lange ein Segment jeweils präsentiert wird. Diese Zeit wird dann gemessen und als Lesezeit des Segments interpretiert. Im Vergleich zu Methoden, in denen Wörter oder Phrasen in schneller und im Experiment festgelegter Geschwindigkeit präsentiert werden (rapid serial visual presentation), bestimmt der Proband im selbstgesteuerten Lesen die Präsentationsrate der Segmente also selbst. Es gibt verschiedene Arten des selbstgesteuerten Lesens, die sich hinsichtlich der Präsentationsform der Segmente unterscheiden. Die bei weitem gebräuchlichste Art ist das in (1) illustrierte sogenannte moving window Format, in dem der komplette Satz zunächst durch typographische Zeichen verdeckt ist und der Proband dann die einzelnen Segmente nacheinander aufrufen kann (Just, Carpenter & Wooley 1982). (1) ——–—–—den Onkel———- —––—. Mit dem Aufrufen des folgenden Segments wird das vorherige Segment wieder verdeckt, so dass der Eindruck eines sich bewegenden Sichtfensters entsteht. Das selbstgesteuerte Lesen wird zur Untersuchung der inkrementellen Verarbeitung von (zeitweilig) ambigen Sätzen oder ungrammatischen Sätzen eingesetzt. In der Analyse werden die Lesezeiten zweier Satztypen, die sich auf genau einem Segment unterscheiden, segmentweise verglichen. So wird bestimmt, inwiefern Probanden unmittelbar eine Ambiguität oder Ungrammatikalität wahrnehmen und ihre Lesezeiten sich auf den jeweiligen Segmenten in einem ambigen bzw. ungrammatischen Satz gegenüber einem wohlgeformten Satz verlangsamen. In der L2-Verarbeitunsforschung wird das selbstgesteuerte Lesen in Studien zu syntaktischen Ambiguitäten, Ungrammatikalität oder syntaktischem Transfer eingesetzt (vgl. Hopp in diesem Band; Jackson et al. in diesem Band).
3.1.5 Eyetracking Im Eyetracking werden in der Sprachverarbeitungsforschung Blickbewegungen der Probanden beim Lesen oder bei dem Betrachten von Bildstimuli während der auditiven Sprachverarbeitung gemessen. Mittels spezieller Geräte kann durch infrarotbasierte Videoaufnahmen die Blickrichtung eines Probanden auf den Bildschirm bis zu 1000 Mal pro Sekunde bestimmt werden, so dass diese Methode eine sehr hohe zeitliche Auflösung bietet. Augenbewegungen charakterisieren sich durch die schnelle Abfolge von Fixierungen und Pupillenbewegungen, sogenannten Sakkaden. Bei Fixierungen können visuelle Stimuli wahrgenommen werden, wohingegen während der Sakkaden keine visuellen Informationen aufgenommen werden können. In der Psycholinguistik steht daher die Analyse der
20
Holger Hopp und Sarah Schimke
Dauer und Anzahl von Fixierungen als Maß der Aufmerksamkeit und kognitiven Informationsverarbeitung im Mittelpunkt. Eyetracking wird als Methode für die unterschiedlichsten Phänomene auf sublexikalischer, lexikalischer oder syntaktischer Ebene eingesetzt. In der Psycholinguistik sind zwei Arten des Eyetracking dominant: Lesestudien und Visual World-Studien.
Lesestudien Anders als vielleicht zu vermuten, zeichnet sich Lesen nicht durch das lineare Abscannen eines Satzes von links nach rechts aus. Vielmehr werden nicht alle Wörter in einem Satz fixiert und gerade kurze oder Funktionswörter übersprungen (skipping). Demgegenüber fixieren Leser manche Wörter – abhängig von deren Eigenschaften bzw. deren Funktion in einem Satz – auch mehrfach. Auch sind nur ca. 85 – 90 % aller Augenbewegung vorwärts, d. h. in die Leserichtung, gerichtet und ca. 10 – 15 % sind rückwärtsgerichtet und stellen sogenannte Regressionen dar (Rayner 1998). Regressionen entstehen bei Verständnisschwierigkeiten durch unerwartete, komplexe oder ambige Satzglieder, die das abermalige Lesen vorheriger Textteile erfordern. In Studien, die Eyetracking während des Lesens anwenden, werden Segmente, sogenannte Areas of Interest (AOIs) definiert, die entweder einzelne Wörter oder Phrasen umfassen können. Für die jeweilige AOI werden dann verschiedene Maße erfasst, z. B. die Dauer der ersten Fixierung (first fixation duration), die typischerweise von Wortcharakteristika abhängt und daher oftmals als Maß des lexikalischen Zugriffs interpretiert wird. Des Weiteren wird die Summe aller Fixierungen in einer AOI, bevor diese in Leserichtung verlassen wird, bestimmt, die sogenannte initiale (first-pass) Lesezeit. Diese Maße der initialen Lesezeit werden mit der vorläufigen Integration eines Segments in die inkrementelle Satzinterpretation in Verbindung gebracht. Darüber hinaus werden Lesezeiten analysiert, die abermaliges Lesen einer Region umfassen, z. B. regression path time, second pass reading time und auch die Gesamtlesedauer einer AOI, die alle Fixierungen addiert. Schließlich wird die Anzahl der Regressionen aus einer AOI bestimmt. Diese späteren Maße werden als Ausdruck der Revision oder Überprüfung interpretiert. Aufgrund der unterschiedlichen Maße erlaubt Eyetracking während des Lesens den Einblick in verschiedene Stadien der Wort- bzw. Satzverarbeitung. Im Bereich der L2-Verarbeitungsforschung wird Eyetracking während des Lesens vor allem zur Untersuchung von ambigen oder komplexen Sätzen und von lexikalischem oder morphosyntaktischem Transfer aus der L1 eingesetzt (vgl. Felser; Hopp in diesem Band).
Einleitung: Fragestellungen, Modelle und Methoden
21
Visual World Eyetracking Im sogenannten Visual Word Eyetracking werden die Blickbewegungen auf szenische Bilder (wie z. B. in Abbildung 2) während der auditiven Sprachverarbeitung gemessen. Die Methode beruht darauf, dass eine enge Koppelung von gehörter Sprache und visueller Aufmerksamkeit besteht.Wenn Probanden zum Beispiel die Instruktion hören, auf einen bestimmten Gegenstand zu klicken (z. B. Click on the candy, vgl. Allopenna, Magnuson & Tanenhaus 1998), so schauen sie nicht erst auf das Objekt, wenn sie es tatsächlich anklicken, sondern sobald sie das Wort candy (Bonbon) im sprachlichen Input identifizieren (vgl. auch Weber & Broersma in diesem Band). Für die Datenanalyse werden ebenfalls AOIs definiert, die zumeist ein Objekt bzw. einen Ausschnitt des Displays umfassen. Für diese AOIs wird sowohl die Anzahl der Fixierungen in einer AOI gemessen als auch der zeitliche Verlauf der Fixierungen in verschiedenen AOIs abhängig von dem sprachlichen Stimulus abgetragen. Das Visual World-Paradigma wird zur Untersuchung der unterschiedlichsten psycholinguistischen Phänomene eingesetzt, in denen Wettbewerbsprozesse oder antizipatorische Prozesse eine Rolle spielen. Befinden sich etwa in einem Bild neben dem Zielobjekt (candy, ‚Bonbon‘) weitere Objekte, die einen phonologisch ähnlichen Wortanfang (candle, ‚Kerze‘) haben, zeigen Probanden anfänglich vermehrte Fixierungen auf beide Objekte, bis die Unterschiede am Wortende die Instruktion disambiguieren (Allopenna, Magnuson & Tanenhaus 1998). Neben phonologischen Überlappungen führen auch semantische, assoziative und konzeptuelle Ähnlichkeiten zu Wettbewerbseffekten in der Sprachverarbeitung (Huettig, Rommers & Meyer 2011). Die hohe zeitliche Auflösung im Eyetracking erlaubt es, diesen Wettbewerb sichtbar zu machen. Antizipatorische Prozesse wurden unter anderem von Altmann & Kamide (1999) untersucht. Sie zeigten, dass Probanden bereits beim Hören des Wortes eat im Satz The boy will eat the cake auf den Kuchen in Abbildung 2 blickten. Lexikalische oder grammatische Informationen können so zu prädiktiven Blickbewegungen auf Referenten führen, bevor diese benannt werden. In Visual World-Experimenten führen die Probanden entweder eine Aktion aus, z. B. klicken sie mit der Maus auf den benannten Referenten, oder aber sie betrachten die Bilder nur passiv. In der L2-Verarbeitungsforschung wird das Visual World-Paradigma zur Untersuchung aller sprachlicher Ebenen eingesetzt (vgl. Cristante & Schimke; Felser; Hopp; Schimke et al. in diesem Band). Zusätzlich nutzen Forscher Eyetracking für Studien zur Verbindung von sprachlichen und kognitiven Repräsentationen (von Stutterheim & Flecken in diesem Band).
22
Holger Hopp und Sarah Schimke
Abbildung 2: Display aus Studie von Altmann & Kamide (1999) (erneut abgedruckt mit Genehmigung von ELSEVIER.)
3.2 Neurophysiologische Verfahren Neurophysiologische Verfahren, die die neuronalen Prozesse der Sprachverarbeitung untersuchen, lassen sich in temporale Verfahren, die vornehmlich die zeitliche Dynamik sprachlicher Verarbeitung in den Blick nehmen, und bildgebende Verfahren, die die räumliche Verteilung sprachlicher Prozesse untersuchen, einteilen. Die Messung der Hirnaktivität koppelt sich jeweils an die visuelle oder auditive Präsentation von sprachlichen Stimuli. Zu den temporalen Verfahren, die in der Psycholinguistik eingesetzt werden, zählt die Elektroenzelographie (EEG), die, wenn sie zeitlich an sprachliche Stimuli gekoppelt ist, ereigniskorrelierte Potentiale (EKP, englisch ERP) erfasst. Zu den wichtigsten bildgebenden Verfahren zählen die funktionelle Magnetresonanztomographie (fMRT) und Positronsemissionstomographie (PET) sowie infrarotlichbasierte Verfahren wie die Nahinfrarotresonanzspektrographie (NIRS). Neuere Verfahren, wie z. B. die Magnetenzelographie (MEG), verbinden temporale und bildgebende Maße und bieten eine hohe zeitliche wie räumliche Auflösung von sprachbezogenen neuronalen Prozessen. Im Kapitel von Mueller (in diesem Band) wird auf die wichtigsten Verfahren näher eingegangen. In der L2-Verarbeitungsforschung stehen die Fragen im Mittelpunkt, inwieweit L2-Lerner vergleichbare EEG-Komponenten in der zeitlichen Verarbeitung der Zielsprache im Vergleich zu Muttersprachlern zeigen, und ob die L2 in den gleichen Hirnarealen wie die L1 verarbeitet wird.
Einleitung: Fragestellungen, Modelle und Methoden
23
4 Überblick über Aufbau und Kapitel in diesem Sammelband Dieser Band bietet einen aktuellen Überblick über die Forschungsbereiche der L2Verarbeitungsforschung und dokumentiert den gegenwärtigen Forschungsstand. Die einzelnen Beiträge decken verschiedene linguistische Ebenen und unterschiedliche psycholinguistische Methoden ab. Die Auswahl der Beiträge spiegelt dabei die Schwerpunkte der gegenwärtigen Forschung in diesen Bereichen wider, so dass nicht alle Ebenen und Methoden im gleichen Maße repräsentiert sind. In Kapitel 2 gibt Jutta Mueller zunächst einen einführenden Überblick über neurolinguistische Verfahren und deren Anwendung in der L2-Verarbeitungsforschung. Der folgende zweite Abschnitt widmet sich der lexikalischen Verarbeitung. Andrea Weber und Mirjam Broersma diskutieren, wie L2-Lerner Wörter in der L1 und L2 erkennen und inwiefern die jeweils andere Sprache dabei mit aktiviert wird. Denisa Bordag und Thomas Pechmann fokussieren in ihrem Beitrag auf das grammatische Geschlecht als lexikalischer Eigenschaft von Nomen im Deutschen und stellen die Frage, wie L2-Lerner Genus erwerben und ob sie Genusinformationen aus der L1 bei der Verarbeitung des deutschen Genus aktivieren. Im Kapitel von Gunnar Jacob wird besprochen, ob L2-Lerner komplexe Wörter morphologisch in Stamm und Affixe segmentieren und inwiefern Unterschiede zwischen Flexion und Derivation zu finden sind. Der dritte Abschnitt befasst sich mit der Verarbeitung von Sätzen. Das Kapitel von Maren Schmidt-Kassow, M. Paula Roncaglia-Denissen und Sonja A. Kotz gibt einen Überblick über neurolinguistische Untersuchungen zur Interaktion von Rhythmus und Satzstruktur. Im Zentrum steht die Frage, inwieweit L2-Lerner metrische Korrelate von syntaktischer Struktur bemerken und zum Erkennen von Satzgliederung nutzen können. Holger Hopp bespricht, wie erwachsene L2-Lerner zentrale morphosyntaktische Eigenheiten des Deutschen, d. h. Kasus- und Genusmarkierung auf Nomen, online in die Satzinterpretation integrieren und ob sie diese Merkmale nutzen können, um syntaktische Vorhersagen zu treffen. Valentina Cristante und Sarah Schimke besprechen die Verarbeitung von Wortstellungsvariation bei kindlichen L2-Lernern des Deutschen. Der vierte Abschnitt behandelt den Einfluss des referentiellen Kontexts auf die L2-Sprachverarbeitung am Beispiel der Pronomeninterpretation. Claudia Felser gibt einen Überblick über die Verarbeitung von Pronomen bei erwachsenen L2Lernern und erörtert, inwieweit diese Lerner eher auf diskursive denn auf syntaktische Strategien in der Auflösung pronominaler Referenz rekurrieren. Sarah Schimke, Saveria Colonna, Israel de la Fuente und Barbara Hemforth untersuchen
24
Holger Hopp und Sarah Schimke
das relative Gewicht von derartigen allgemeinen Lernerstrategien gegenüber L1Einflüssen. Im Beitrag von Hana Klages und Johannes Gerwien vergleichen die Autoren, inwiefern kindliche L1- und L2-Lerner unterschiedliche Hinweisreize nutzen, um die Referenz von Pronomen zu erschließen. Der fünfte Abschnitt enthält drei Beiträge, die Schnittstellen zwischen der L2Verarbeitungsforschung und anderen Forschungsbereichen betreffen. Mona Timmermann und Monika Schmid nehmen quasi das Spiegelbild des L2-Erwerbs in den Blick, nämlich die Erosion der muttersprachlichen Verarbeitung des Deutschen beim Erwerb einer anderen L2 (die sogenannte Attrition). Sie besprechen Attritionsphänomene auf phonologischer, lexikalischer und syntaktischer Ebene und diskutieren, inwieweit Attrition in unterschiedlichen Stadien auf den Verlust von grammatischem Wissen oder Schwierigkeiten im online Zugriff auf dieses Wissen in der Sprachverarbeitung zurückzuführen sind. Carrie Jackson, Courtney Johnson Fowler, Bianca Gavin und Nicholas Henry berichten von Studien zur gesteuerten Vermittlung von Kasus und Genus bei beginnenden Lernern. In ihrem Beitrag liegt der Schwerpunkt auf der Frage, inwieweit die Ergebnisse zur online Sprachverarbeitung von Kasus und Genus didaktisch genutzt werden können, um das Lernen der Morphosyntax des Deutschen zu unterstützen. Im letzten Kapitel dieses Bandes weiten Monique Flecken und Christiane von Stutterheim den Blick auf die Interaktion von sprachlicher Struktur und der Konzeptualisierung von außersprachlichen Ereignissen. Allen Beiträgen gemein ist das Verständnis, dass der Einsatz psycholinguistischer Verfahren nicht nur Einblicke in Prozesse der online Verarbeitung und Lernmechanismen von Sprache geben kann, sondern auch unser Verständnis der mentalen Repräsentation von sprachlichem Wissen durch Daten ergänzt, die mittels traditioneller offline Methoden nicht zugänglich sind. Damit verankern sie die L2-Verarbeitung als wichtigen Baustein in der Forschung zum L2-Erwerb.
Literaturangaben Allopenna, Paul D., James D. Magnuson & Michael K. Tanenhaus (1998): Tracking the time course of spoken word recognition using eye movements: Evidence for continuous mapping models. Journal of Memory and Language 38 (1), 419 – 439. Altmann, Gerry T. M. & Yuki Kamide (1999): Incremental interpretation at verbs: Restricting the domain of subsequent reference. Cognition 73 (3), 247 – 264. Bialystok, Ellen (2009): Bilingualism: The good, the bad, and the indifferent. Bilingualism: Language and Cognition 12 (1), 3 – 11. Bley-Vroman, Robert (1990): The logical problem of foreign language learning. Linguistic Analysis 20, 3 – 49.
Einleitung: Fragestellungen, Modelle und Methoden
25
Bot, Kees de (1992): A bilingual production model: Levelt’s ’Speaking’ model adapted. Applied Linguistics 13 (1), 1 – 24. Chondrogianni, Vicky & Theodoros Marinis (2012): Production and processing asymmetries in the acquisition of tense morphology by sequential bilingual children. Bilingualism: Language and Cognition 15 (1), 5 – 21. Clahsen, Harald, & Claudia Felser (2006): Grammatical processing in language learners. Applied Psycholinguistics 27 (1), 3 – 42. Carroll, Susanne E. (2001): Input and evidence: The raw material of second language acquisition. Amsterdam: John Benjamins. DeAngelis, Gessica (2007): Third or additional language acquisition. Clevedon, UK: Multilingual Matters. De Houwer, Annick (2009): Bilingual first language acquisition. Bristol: Multilingual Matters. Dekydtspotter, Laurent & Claire Renaud (2014): On second language processing and grammatical development: The parser in second language acquisition. Linguistic Approaches to Bilingualism 4, 131 – 166. Dekydtspotter, Laurent, Bonnie D. Schwartz & Rex A. Sprouse (2006): The comparative fallacy in L2 processing research. In Mary Grantham O’Brien, Christine Shea, & John Archibald (Hrsg.), Proceedings of the 8th Generative Approaches to Second Language Acquisition Conference, 33 – 40. Somerville, MA: Cascadilla Press. Dijkstra, Ton & Walter J.B. van Heuven (2002): The architecture of the bilingual word recognition system: From identification to decision. Bilingualism: Language and Cognition 5, 175 – 197. Dimroth, Christine (2013): Learner Varieties. Encyclopedia of Applied Linguistics. Blackwell. DOI: 10.1002/9781405198431.wbeal0673. Ellis, Rod, Shawn Loewen, Catherina Elder, Rosemary Erlam, Jennifer Philp & Hayo Reinders (2009): Implicit and Explicit Knowledge in Second Language Learning, Testing and Teaching. Bristol: Multilingual Matters. Flynn, Suzanne, Claire Foley & Inna Vinnitskaya (2004): The cumulative-enhancement model for language acquisition: Comparing adults’ and children’s patterns of development in first, second and third language acquisition. International Journal of Multilingualism 1, 3 – 17. Foucart Alice, Carlos Romero-Rivas, Bernharda L. Gort & Albert Costa (2016): Discourse comprehension in L2: Making sense of what is not explicitly said. Brain and Language 163, 32 – 41. Green, David W. (1998): Mental control of the bilingual lexicosemantic system. Bilingualism: Language and Cognition 1, 67 – 81. Grosjean, François (1989): Neurolinguists, beware! The bilingual is not two monolinguals in one person. Brain and Language 36, 3 – 15. Grüter, Theres, Hannah Rohde & Amy J. Schafer (2016): Coreference and discourse coherence in L2: The roles of grammatical aspect and referential form. Linguistic Approaches to Bilingualism. Online-first Artikel. doi: 10.1075/lab.15011.gru Hartsuiker, Robert. J. & Martin J. Pickering (2008): Language integration in bilingual sentence production. Acta Psychologica 128, 479 – 489. Hawkins, Roger & Cecilia Y. Chang (1997): The partial availability of Universal Grammar in second language acquisition: The ‘Failed Functional Features Hypothesis.’ Second Language Research 13 (3), 187 – 226.
26
Holger Hopp und Sarah Schimke
Höhle, Barbara, Tom Fritzsche & Anja Müller (2016): Children’s comprehension of sentences with focus particles and the role of cognitive control: An eye tracking study with German-learning 4-year-olds. PLoS ONE 11 (3), e0149870. Hopp, Holger (2010): Ultimate attainment in L2 inflectional morphology: Performance similarities between non-native and native speakers. Lingua 120 (4), 901 – 931. Hopp, Holger (2014): Working memory effects on the L2 processing of ambiguous relative clauses. Language Acquisition 21 (3), 250 – 278. Hopp, Holger (2016): Learning (not) to predict: Grammatical gender processing in adult L2 acquisition. Second Language Research 32 (2), 277 – 307. Huang, Yi T., Xiaobei Zheng, Xiangzhi Meng & Jesse Snedeker (2013): Children’s assignment of grammatical roles in the online processing of Mandarin passive sentences. Journal of Memory and Language, 69 (4), 589 – 606. Huettig, Falk, Jost Rommers & Antje S. Meyer (2011): Using the visual world paradigm to study language processing: A review and critical evaluation. Acta Psychologica 137, 151 – 171. Hughes, Claire (2011): Changes and challenges in 20 years of research into the development of executive functions. Infant and Child Development 20 (3), 251 – 71. Jacob, Gunnar, Kalliopi Katsika, Neiloufar Family & Shanley E.M. Allen (2016): The role of constituent order and level of embedding in cross-linguistic structural priming. Bilingualism: Language and Cognition 20 (2), 269 – 282. Jiang, Nan (2007): Selective integration of linguistic knowledge in adult second language acquisition. Language Learning 57 (1), 1 – 33. Just, Marcel A., Patricia A. Carpenter & Jacqueline D. Woolley (1982): Paradigms and processes in reading comprehension. Journal of Experimental Psychology: General 111 (2), 228 – 238. Kaan, Edith (2014): Predictive sentence processing in L2 and L1: What is different? Linguistic Approaches to Bilingualism 4 (2), 257 – 282. Kaan, Edith, Joyce C. Ballantyne & Frank Wijnen (2014): Effects of reading speed on second-language sentence processing. Applied Psycholinguistics 36 (4), 799 – 830. Klein, Wolfgang & Clive Perdue (1997): The basic variety (or: couldn’t natural language be much simpler?). Second Language Research 13 (4), 301 – 347. Kootstra, Gerrit J. (2012): Code-switching in monologue and dialogue: Activation and alignment in bilingual language production. Doktorarbeit. Nijmegen: Radboud Universiteit. Kroll, Judith F. & Erika Stewart (1994): Category interference in translation and picture naming: Evidence for asymmetric connections between bilingual memory representations. Journal of Memory and Language 33 (2), 149 – 174. Kuperberg, Gina T. & Florian T. Jaeger (2016): What do we mean by prediction in language comprehension? Language, Cognition and Neuroscience 31 (1), 32 – 59. Lenneberg, Eric H. (1967): Biological Foundations of Language. Hospital Practice 2(12), 59 – 67. Levelt, Willem J.M. (1989): Speaking. From intention to articulation. Cambridge, Mass: MIT Press. Lewis, Shevaun & Colin Phillips (2015): Aligning grammatical theories and language processing models. Journal of Psycholinguistic Research 44 (1), 27 – 46. Loewen, Shawn (2015): Introduction to instructed second language acquisition. London: Routledge.
Einleitung: Fragestellungen, Modelle und Methoden
27
Long, Michael (2003): Stabilization and fossilization in inter language development. In Catherine Doughty & Michael Long (Hrsg.), Handbook of second language acquisition, 487 – 536. Oxford: Blackwell. MacDonald, Maryellen C. (2013): How language production shapes language form and comprehension. Frontiers in Psychology 4, 226. MacWhinney, Brian (2005): A unified model of language acquisition. In Judith. F. Kroll & Annette M. B. de Groot (Hrsg.), Handbook of bilingualism: Psycholinguistic approaches, 49 – 67. New York: Oxford University Press. Meisel, Jürgen M. (2009): Second Language Acquisition in Early Childhood. Zeitschrift für Sprachwissenschaft 28 (1), 5 – 34. Müller, Natascha, Tanja Kupisch, Katrin Schmitz & Katja Cantone (2009): Einführung in die Mehrsprachigkeitsforschung: Deutsch, Französisch, Italienisch (Narr Studienbücher). Tübingen: Narr. O’Grady, William (2013): The illusion of language acquisition. Linguistic Approaches to Bilingualism 3, 253 – 85. Osterhout, Lee, Judith McLaughlin, Ilona Pitkanen, Cheryl Frenck-Mestre & Nicola Molinaro (2006): Novice learners, longitudinal designs, and event-related potentials: A paradigm for exploring the neurocognition of second-language processing. Language Learning 56 (1), 199 – 230. Pagonis, Giulio (2009): Kritische Periode oder altersspezifischer Antrieb. Was erklärt den Altersfaktor im Zweitspracherwerb? Eine empirische Fallstudie zum ungesteuerten Zweitspracherwerb des Deutschen durch russische Lernerinnen unterschiedlichen Alters. Frankfurt a.M.: Lang. Phillips, Colin & Lara Ehrenhofer (2015): The role of language processing in language acquisition. Linguistic Approaches to Bilingualism, 5 (4), 409 – 453. Pienemann, Manfred (1998): Language processing and second language development: Processability Theory. Amsterdam: John Benjamins. Pickering, Martin J. & Simon Garrod (2013): An integrated theory of language production and comprehension. Behavioral and Brain Sciences 36 (4), 329 – 347. Rayner, Keith (1998): Eye movements in reading and information processing: 20 years of research. Psychological Bulletin 134 (3), 372 – 422. Riehl, Claudia M. (2014): Mehrsprachigkeit. Eine Einführung. Darmstadt: Wissenschaftliche Buchgesellschaft. Roberts, Leah, & Claudia Felser (2011): Plausibility and recovery from garden-paths in second-language sentence processing. Applied Psycholinguistics 32 (2), 299 – 331. Rothman, Jason (2011): L3 syntactic transfer selectivity and typological determinacy: The Typological Primacy Model. Second Language Research 27 (1), 107 – 127. Schmid, Monika S. & Barbara Köpke (2017): First language attrition and bilingual development. Linguistic Approaches to Bilingualism. Schwartz, Bonnie D. (2009): Unraveling inflection in child L2 development. Language, Interaction and Acquisition (Aile… Lia) 1, 63 – 88. Schwartz, Bonnie D. & Rex A. Sprouse (1996): L2 cognitive states and the „Full Transfer/Full Access“ model. Second Language Research 12 (1), 40 – 72. Schwartz, Bonnie D., Laurent Dekydtspotter & Rex A. Sprouse (2003): Pouring the fire with gasoline: Questioning conclusions on L2 argument structure. In Juana M. Liceras, Helmut Zobl & Helen Goodluck (Hrsg.), Proceedings of the 6th Generative Approaches to Second
28
Holger Hopp und Sarah Schimke
Language Acquisition Conference (GASL 2002), 248 – 259. Somerville, MA: Cascadilla Proceedings Project. Selinker, Larry (1972): Interlanguage. International Review of Applied Linguistics 10, 209 – 231. Silva, Rena & Harald Clahsen (2008): Morphologically complex words in L1 and L2 processing: Evidence from masked priming experiments in English. Bilingualism: Language and Cognition 11 (2), 245 – 260. Sharwood-Smith, Mike & John Truscott (2014): The multilingual mind: a modular processing perspective. Cambridge: Cambridge University Press. Shook, Anthony, & Victoria Marian (2013): The Bilingual Language Interaction Network for Comprehension of Speech. Bilingualism: Language and Cognition 16 (2), 304 – 324. Sorace, Antonella (2011): Pinning down the concept of „interface“ in bilingualism. Linguistic Approaches to Bilingualism 1, 1 – 33. Teubner-Rhodes, Susan E., Alan Mishler, Ryan Corbett, Llorenç Andreu, Monica Sanz-Torrent, John C. Trueswell & Jared M. Novick (2016): The effects of bilingualism on conflict monitoring, cognitive control, and garden-path recovery. Cognition 250, 213 – 231. Thierry, Guillaume & Yan J. Wu (2007): Brain potentials reveal unconscious translation during foreign language comprehension. Proceedings of the National Academy of Sciences of the USA, 104 (30), 12530 – 12535. Ullman, Michael T. (2005): A cognitive neuroscience perspective on second language acquisition: The declarative/procedural model. In Cristina Sanz (Hrsg.), Mind and context in adult second language acquisition: Methods, theory and practice, 141 – 178. Washington, DC: Georgetown University Press. Unsworth, Sharon (2013): Current issues in multilingual first language acquisition. Annual Review of Applied Linguistics 33, 21 – 50. Van Assche, Eva, Wouter Duyck & Robert J. Hartsuiker (2012): Bilingual word recognition in a sentence context. Frontiers in Psychology 3, 174. Van Hell, Janet G. & Darren Tanner (2012): Second language proficiency and cross-language activation. Language Learning 62 (2), 148 – 171. VanPatten, Bill (2012): Input processing. In Susan M. Gass & Alison Mackey (Hrsg.), The Routledge handbook of second language acquisition, 268 – 281. Hoboken, NJ: Taylor & Francis. Volterra, Virginia & Traute Taeschner (1978): The Acquisition and Development of Language by Bilingual Children. Journal of Child Language 5 (2), 311 – 26. Wartenburger, Isabell (2012): Sprache und Gehirn. In: Barbara Höhle (Hg.). Psycholinguistik, 189 – 202. Berlin: Akademie Verlag
I Sprache und Gehirn
Jutta L. Mueller
Neurophysiologische Verfahren zur Untersuchung der Verarbeitung einer L2 Der Prozess und das Ergebnis des L2-Erwerbs unterscheiden sich oft mehr als deutlich vom L1-Erwerb. Die Beschreibung und Erklärung dieser besonderen Mechanismen des Lernens und der Verarbeitung einer Sprache sind Gegenstand von Modellen und Theorien des L2-Erwerbs (zur Übersicht, siehe Mitchell & Myles 2004; Doughty & Long 2003; Gass & Mackey 2013). Hinsichtlich der strukturellen und funktionellen neurophysiologischen Grundlagen der L2-Verarbeitung erfuhr die Forschung durch die Etablierung von Messverfahren, die direkt oder indirekt neuronale Aktivität und anatomische Strukturen des lebenden Gehirns abbilden, einen großen Erkenntnisschub. Die L2-Verarbeitung ist durch eine große Variabilität geprägt, die zum Beispiel durch unterschiedliche Sprachfertigkeiten, unterschiedliches Erwerbsalter, variable Lernumgebungen und verschiedene Sprachkombinationen begründet ist. Diese und weitere Faktoren tragen dazu bei, dass sich Lernprozesse und deren neuronale Grundlagen zwischen verschiedenen Lernern einer L2 unterscheiden. Mittlerweile liegen viele Studien aus verschiedenen Sprachen vor, die neuronale Prozesse während der L2-Verarbeitung untersuchen, und die nach und nach ein differenziertes Bild nicht-muttersprachlicher neuronaler Verarbeitungsprozesse entstehen lassen. Dabei steht es im Mittelpunkt herauszufinden, durch welche neuronalen Strukturen und Prozesse L2-Verarbeitung ermöglicht, oder aber auch erschwert wird. Zusätzlich zu verhaltensbasierten Verfahren, die helfen, Sprachverarbeitung auf einer psychologisch-funktionalen Ebene zu beschreiben, liefern neurophysiologische Verfahren also Erkenntnisse über die Funktionsweise des Gehirns als Sprachorgan. Trotz einer steigenden Forschungsaktivität zu neurophysiologischen Grundlagen der L2-Verarbeitung gibt es bislang kaum breit diskutierte oder gar akzeptierte neurokognitive Modelle der L2-Verarbeitung in einer Weise, wie sie für die Sprachverarbeitung im Allgemeinen zur Verfügung stehen (zum Beispiel, Bornkessel & Schlesewsky, 2006; Friederici 2002; Hagoort 2005; Hickok & Poeppel 2007). Neurokognitive Modelle der L2-Verarbeitung müssen einerseits einen Bezug zur L1-Verarbeitung enthalten, bei der die neuronale Repräsentation und Verarbeitung durchaus kontrovers diskutiert wird, andererseits müssen Veränderungsprozesse über die Zeit erfasst werden. Diese hohen Komplexitätsanforderungen mögen dazu beitragen, dass es kaum umfassende neurokognitive Prozessmodelle der L2-Verarbeitung gibt. BisJutta L. Mueller, Universität Osnabrück DOI 10.1515/9783110456356-002
32
Jutta L. Mueller
lang vorgeschlagene Modelle bewegen sich meist auf einer wenig spezifischen Erklärungsebene und beschreiben die neuronalen Grundlagen der L2-Verarbeitung und ihre Veränderung über die Zeit vor allem durch Ähnlichkeit vs. Unähnlichkeit zu L1Verarbeitung (Ullman 2001; Green 2003). Häufig beschränken sie sich auch auf die Erklärung einzelner linguistischer Bereiche, wie zum Beispiel das Lernen neuer Wörter (Rodríguez-Fornells et al. 2009). Mit der weiteren Verbreitung und Fortentwicklung der Methoden sind in Zukunft sicherlich weitere und spezifischere Erkenntnisse zu neurophysiologischen Grundlagen der L2-Verarbeitung zu erwarten, die letztendlich zu einem besseren theoretischen Verständnis des multilingualen Gehirns führen werden. Daher möchte ich eine Einführung in einige wichtige Methoden der kognitiven Neurowissenschaften liefern, die in den letzten Jahren auch in der Forschung zur L2-Verarbeitung immer mehr Verwendung finden. Es werden verschiedene Methoden auf der Grundlage der Elektroenzephalographie (EEG) und Magnetenzephalographie (MEG) vorgestellt, sowie funktionelle und strukturelle Magnetresonanztomographie (fMRT). Dabei werde ich den Fokus dieses Buches auf die L2-Verarbeitung des Deutschen im Blick behalten und die Methoden, wann immer möglich, anhand von ausgewählten Studien vorstellen, die die Verarbeitung von Deutsch als L2 untersuchen.
1 Elektroenzephalographie (EEG) Im Jahr 1929 zeichnete der Jenaer Forscher Hans Berger zum ersten Mal beim Menschen elektrische Aktivität auf der Kopfoberfläche auf – das Elektroenzephalogramm (EEG) war entdeckt (Berger, 1929). Das im EEG gemessene Potential enthält die Summe aller an der Oberfläche messbaren elektrischen Vorgänge im Kopf (also auch nicht-neuronaler Vorgänge wie zum Beispiel Augenbewegungen). Die eigentliche Hirnaktivität, die von Interesse ist, wird von großen Gruppen synchron feuernder und parallel ausgerichteter Nervenzellen produziert. Das bedeutet auch, dass ein großer Teil der stattfindenden Gehirnaktivität an der Kopfoberfläche überhaupt nicht gemessen werden kann, da die Nervenzellpopulationen in einer dafür ungünstigen Weise angeordnet sind. Jedoch mag diese Beschränkung auch zu einem gewissen Vorteil gereichen – um mit den Worten der EEG-Forscher Coles und Rugg zu sprechen: „Wenn wir die komplette Gehirnaktivität auf der Kopfoberfläche messen könnten, so wäre das Messergebnis so komplex, dass es schwierig oder unmöglich wäre, es zu analysieren.“ (Coles & Rugg, 1995, S.2, Übersetzung der Autorin). Bei der kontinuierlich gemessenen,
Neurophysiologische Verfahren zur Untersuchung der Verarbeitung einer L2
33
noch unanalysierten EEG-Aktivität sind schnelle und langsame Oszillationen¹ in verschiedenen Frequenzbereichen im Bereich von gerade über 0 bis 100 Hz überlagert. Bestimmte mentale Zustände sind durch die Vorherrschaft bestimmter Frequenzbereiche charakterisiert.
Abbildung 1: Die Abbildung zeigt die 5 wichtigsten Frequenzbänder, die im kontinuierlich gemessenen EEG-Signal häufig zu finden sind. Jedes Band ist charakterisiert durch bestimmte Frequenzbereiche, die ihm typischerweise zugeordnet werden.
So finden sich zum Beispiel im Tiefschlaf besonders viele langsame Frequenzen im sogenannten Delta-Bereich und im Wachzustand schnellere Wellen im Beta-Bereich. Für die neurowissenschaftliche Sprachforschung ist nun vor allem die Aktivität interessant, die direkt durch die Verarbeitung sprachlicher Stimuli ausgelöst wird. Um die Verknüpfung zwischen bestimmten sprachlichen Stimuli und der ihre Verarbeitung reflektierenden Gehirnaktivität herzustellen, können in einem Experiment jeweils diejenigen Abschnitte der Wellenform betrachtet werden, die während und nach der Darbietung bestimmter sprachlicher Stimuli gemessen wurden. Ich möchte hier zwei Analyseverfahren beschreiben: Das erste, die Methode der ereigniskorrelierten Potentiale (EKP) betrachtet Aktivität zu einem bestimmten Zeitpunkt während eines Verarbeitungsprozesses unabhängig von den einzelnen beteiligten Frequenzen. Die zweite Methode, die nachfolgend beschrieben wird, die Analyse oszillatorischer Hirnaktivität, untersucht die Rolle spezifischer Frequenzbereiche im EEG während sprachlicher Verarbeitungsprozesse. Die EKP-Methode ist in der L2-Verarbeitungsforschung seit vielen Jahren etabliert. Die Berechnung wird hier an einer Studie von Hahne (2001) erläutert, die die Verarbeitung semantischer und syntaktischer Information in gesprochenen
Als Oszillationen bezeichnet man elektrische Schwingungen verschiedener Geschwindigkeiten, die man in Hertz (Hz) misst. Eine Oszillation von 1 Hz bezieht sich auf eine Schwingung pro Sekunde.
34
Jutta L. Mueller
Sätzen bei deutschen Muttersprachlern und russischen L2-Lernern des Deutschen untersuchte. Die Probanden hörten Sätze der folgenden drei Bedingungen: (1) Die Tür wurde geschlossen. (2) *Der Ozean wurde geschlossen. (3) *Die Tür wurde im geschlossen. Während (1) ein korrekter Passivsatz ist, beinhaltet (2) eine Verletzung der Selektionsbeschränkung des Verbs schließen (d. h., eine semantische Verletzung) und (3) eine Verletzung der Wortkategorie, die nach der Präposition im auftreten darf (d. h., eine syntaktische Verletzung). Während die Probanden jeweils 48 verschiedene Beispiele der oben beschriebenen Satztypen hörten, wurde das kontinuierliche EEG mit auf der Kopfoberfläche angebrachten Elektroden aufgezeichnet. Später wurde jeweils aus den EEG-Abschnitten, die mit dem Beginn der Präsentation des Partizips in einer der drei Satzbedingungen zusammenfielen, ein Durchschnittswert gebildet. Dieses Vorgehen bezeichnet man auch als Mittelungsprozedur (vgl. Abbildung 2).
Abbildung 2: Schematische Darstellung der Mittelungsprozedur zur Berechnung ereigniskorrelierter Potentiale (EKPs). Negative Spannungen werden hier und in den folgenden EKPAbbildungen nach oben, positive nach unten abgetragen.
Die Logik dieser Vorgehensweise beruht auf der Annahme, dass ereigniskorrelierte Aktivität bei jeder Präsentation eines Stimulus der gleichen Art identisch ist, die gleichzeitig stattfindende Grundaktivität jedoch zufällig variiert. Durch die Mitte-
Neurophysiologische Verfahren zur Untersuchung der Verarbeitung einer L2
35
Abbildung 3: Die Abbildung dient zur Orientierung im menschlichen Gehirn und auf dem Kopf. Sie zeigt eine schematische Darstellung der linken Gehirnhälfte. Die wichtigsten sprachrelevanten kortikalen Hirnareale sind grau markiert und mit ihren lateinischen Bezeichnungen aufgeführt. Die großen Lappen sind eingerahmt und gekennzeichnet. Die Nummern beziehen sich auf die zytoarchitektonische Kartierung des Gehirns, die von Korbinian Brodmann im Jahre 1909 veröffentlicht wurde. Abbildung mit Genehmigung adaptiert aus Mueller, Rueschemeyer & Friederici (2006).
lungsprozedur wird somit diejenige Hirnaktivität isoliert, die mit der Stimulusverarbeitung zusammenhängt. Die resultierende Wellenform wird als ereigniskorreliertes Potential (EKP) bezeichnet. EKPs werden meist für verschiedene Stimulustypen separat berechnet, die dann miteinander verglichen werden können und entweder für jede Bedingung separat oder als Differenzpotential dargestellt. Sie können durch ihre Latenz (Onset des Potentials relativ zum Stimulusonset, auch Dauer), die Amplitude (Größe des Ausschlags, gemessen in Microvolt), Polarität (negative vs. positive Spannungsdifferenz) sowie die Topographie (Verteilung der Potentiale über der Kopfoberfläche) charakterisiert werden. Zur Bezeichnung der verschiedenen Regionen im menschlichen Gehirn gibt es einige Konventionen, die in Abbildung 3 illustriert sind. Auch wenn die Oberflächenverteilung keine eindeutige Auskunft über die Gehirnregion gibt, die das Muster verursacht, werden die Bezeichnung der Gehirnregionen doch oft für die Beschreibung von Verteilungsmustern verwendet. EKPMuster, die zuverlässig in bestimmten Stimuluskontexten auftreten, werden auch als Komponenten bezeichnet. Abbildung 4a zeigt die in der Studie von Hahne (2001) aufgetretene N400Komponente, die sich auf die negative Potentialdifferenz zwischen dem semantisch unpassenden und dem semantisch passenden Wort bezieht, die meist bei ca. 400 ms nach Stimulusonset am stärksten ausgeprägt ist. N400-Komponenten werden meist
36
Jutta L. Mueller
mit Problemen beim lexikalischen Zugriff und/oder der semantischen Integration von Wörtern in Verbindung gebracht (Lau, Phillips & Poeppel 2008; Kutas & Federmeier 2011) und sind häufig über der Kopfmitte und an Elektroden über dem Parietallappen (vgl. Abbildung 3) am stärksten. Die Ergebnisse der Studie zeigen einen quantitativen Unterschied in der Amplitude der N400 zwischen deutschen Muttersprachlern und russischen L2-Lernern des Deutschen.
Abbildung 4: Die Abbildung zeigt die EKP Ergebnisse einer Studie von Hahne (2001) für Muttersprachler (L1) und Zweitsprachlerner (L2) für die N400 (a), die ELAN (b) und die P600 (c) Komponente an beispielhaften Elektroden (Abbildung adaptiert aus Hahne 2001). Beispielsätze sind für die entsprechenden EKPs angegeben, die kritischen korrekten und inkorrekten Wörter, deren Signale gemittelt wurden, sind fett gedruckt. EKPs korrekter Wörter sind durch eine durchgezogene Line, diejenigen inkorrekter Wörter durch eine gestrichelte Linie gekennzeichnet.Die Skala zeigt die Ausrichtung der EKPs und die Platzierung der Beispielelektroden auf dem Kopf.
Im Vergleich dazu zeigte sich bei syntaktisch inkorrekten Partizipien ein anderes Muster. In Abbildung 4b sehen wir eine frühe Negativierung für die syntaktisch inkorrekten Partizipien. Eine solche Negativierung wird auch ELAN oder LAN genannt, was für early left anterior negativity oder left anterior negativity steht. Diese Komponenten werden häufig als Indikatoren für automatische syntaktische Prozesse betrachtet (Friederici 2002). In Hahnes Experiment zeigen die Mutter-
Neurophysiologische Verfahren zur Untersuchung der Verarbeitung einer L2
37
sprachler, nicht aber die L2-Lerner diese Komponente. Da E/LAN Komponenten in Studien zur L2-Verarbeitung nur sehr selten auftreten, wurde spekuliert, dass bestimmte automatisch ablaufende syntaktische Mechanismen von späten L2-Lernern nicht mehr erworben werden können (Hahne 2001; Weber-Fox & Neville 1996; Mueller et al. 2005). Studien mit sehr fortgeschrittenen L2-Lernern konnten jedoch zeigen, dass dies zumindest in einigen Bereichen doch möglich ist (vgl. Hahne, Mueller & Clahsen 2006; Rossi et al. 2006; Dowens et al. 2010). Ähnliches gilt für die sogenannte P600-Komponente, eine Positivierung bei ca. 600 ms nach Stimulusonset, die über posterioren Kopfbereichen auftritt. Abbildung 4c zeigt diese spätere positive Auslenkung, die ebenfalls für die syntaktische Verletzungsbedingung in der Studie von Hahne auftritt. Ähnlich wie die E/LAN wurde auch die P600 mit syntaktischen Prozessen in Verbindung gebracht, jedoch nicht mit automatischen, sondern mit eher kontrollierten Prozessen der syntaktischen Fehlerdetektion oder auch der Verarbeitung syntaktisch komplexer Sätze (Friederici 2002; Osterhout & Hagoort 1999). Neuere Studien, die P600Komponenten auch für bestimmte semantische Verletzungen berichteten (z. B. für thematische Verletzungen des Verbs, wie in For breakfast, the eggs would only eat toast and jam, Kuperberg et al. 2003) legen jedoch nahe, dass es sich bei dem in der P600 widergespiegelten Verarbeitungsprozess nicht um einen spezifisch syntaktischen Mechanismus handelt, sondern eher um einen domänenübergreifenden Prozess der sprachlichen Integration (Friederici 2011; Kuperberg 2007) oder der internen Überwachung des Verarbeitungsprozesses (van Herten, Chwilla & Kolk 2006; Sassenhagen, Schlesewsky & Bornkessel-Schlesewsky 2014). In Hahnes Studie zeigen die russischen L2-Lerner eine ähnliche P600 wie deutsche Muttersprachler (siehe Abb. 4c). Ein solches Ergebnis wurde in einigen Studien berichtet, in denen die L2-Lerner einen hohen Fertigkeitsgrad erreicht hatten (Hahne et al. 2006; Mueller et al. 2005; Rossi et al. 2006; Weber-Fox & Neville 1996). In anderen Studien wurde jedoch ein Ausbleiben der P600 in der L2-Verarbeitung beobachtet (z. B., Díaz et al. 2016; Hahne & Friederici 2001; McLaughlin et al. 2010; Weber-Fox & Neville 1996). Möglicherweise spielt sowohl der Fertigkeitslevel, als auch die strukturelle Ähnlichkeit zwischen L1 und L2 ein entscheidende Rolle bei der Frage, ob L2-Lerner eine muttersprachähnliche P600 aufweisen oder nicht (Díaz et al. 2016; Zawiszewski et al. 2011). Neben den drei oben beschriebenen sprachrelatierten EKP-Komponenten, gibt es noch eine Reihe weiterer EKPs, die in der Untersuchung des L2-Erwerbs von Interesse sind. So werden zum Beispiel frühe, ca. zwischen 80 und 150 ms nach Stimulusonset auftretende, Komponenten, wie die sogenannte N100 oder P200 häufig mit basalen sprachlichen Wahrnehmungs- und Aufmerksamkeitsprozessen in Verbindung gebracht (Sanders, Newport & Neville 2002; De Diego Balaguer et al. 2007). Die etwas später auftretende Mismatch Negativity (MMN), die
38
Jutta L. Mueller
auf phonologische Prozesse der Sprachverarbeitung reagiert, hat sich als besonders interessante Komponente zur Untersuchung der L2-Verarbeitung herauskristallisiert und wird im Abschnitt zu MEG genauer erläutert. Die Bezeichnungen der Komponenten orientieren sich an den oben beschriebenen charakteristischen Merkmalen (z. B. N100 für eine Negativierung bei ca. 100 ms nach Stimulusonset) oder auch an den ihnen zugeschriebenen Funktionen (z. B. Mismatch Negativity (MMN) für eine Negativierung, die bei der Detektion eines abweichenden Stimulus in einer Reihe von Standardstimuli auftritt). Ein großer Vorteil von EKPs im Vergleich zu manchen anderen neurophysiologische Verfahren wie z. B. fMRT ist die sehr hohe zeitliche Auflösung, die, je nach Abtastrate bei der Messung, im Bereich von bis zu unter einer Millisekunde liegt. Eine weitere Möglichkeit, das EEG zu nutzen, um etwas über neuronale Verarbeitung sprachlicher Stimuli zu erfahren, ist die Analyse der oszillatorischen Aktivität in den einzelnen Frequenzbereichen während des Verarbeitungsprozesses. Viele Forschungsarbeiten haben mittlerweile gezeigt, dass einzelne Frequenzbereiche spezifischen kognitiven Funktionen zugeordnet werden können und wahrscheinlich Prozesse der Informationsübertragung zwischen entfernten Gehirnbereichen widerspiegeln (Singer 2009; Ward 2003; Başar et al. 2001). Es stehen verschiedene rechnerische Verfahren zur Verfügung, anhand derer das EEG-Signal in seine Frequenzbestandteile zerlegt werden kann. Ein häufig verwendetes Verfahren ist die sogenannte Wavelet-Analyse (vgl. Herrmann, Busch & Grigutsch 2005, zur Einführung). Die daraus resultierenden Ergebnisse (= Amplitudenstärken für die einzelnen Frequenzbereiche über die Zeit hinweg) werden in einem sogenannten Zeit-Frequenz-Diagramm dargestellt, welches in Abbildung 5 beispielhaft dargestellt ist.
Abbildung 5: Die Abbildung zeigt, wie sich im Spontan-EEG eingebettete Oszillationen nach einer Wavelet-Analyse in einem Zeit-Frequenz-Diagramm darstellen lassen, so dass sowohl zeitliche als auch Frequenzinformation sichtbar bleibt. Abbildung adaptiert aus Gruber (2007).
Neurophysiologische Verfahren zur Untersuchung der Verarbeitung einer L2
39
Die Forschungen der letzten Jahre haben gezeigt, dass die Betrachtung einzelner Frequenzbänder zusätzliche Information über die einzelnen Prozesse der Sprachverarbeitung und deren Güte verraten kann. Die Wahrnehmung spezifischer akustischer Eigenschaften des Sprachsignals, wie die Strukturierung in Silbeneinheiten und darin eigebettete einzelne Segmente, spiegeln sich in miteinander verknüpften oszillatorischen Signalen wider (vgl. Giraud & Poeppel 2012). Sprachverarbeitung führt aber auch auf abstrakteren linguistischen Ebenen zu spezifischen oszillatorischen Mustern. So wurde gezeigt, dass syntaktische Prozesse der Phrasenbildung mit langsamen bis sehr langsamen Oszillationen im Delta-Bereich einhergehen, und zwar unabhängig von der akustischen Strukturierung des Signals (Ding et al. 2015). Arbeitsgedächtnisoperationen bei der Verarbeitung syntaktischer Relationen wurden mit dem Alpha-Frequenzband in Verbindung gebracht (Meyer, Obleser & Friederici 2013), semantische Prozesse während des Satzverstehens mit Modulationen im Theta-Band (Hagoort et al. 2004; Hald, Bastiaansen & Hagoort 2006). Ob und wie sich die einzelnen Frequenzbänder und deren Interaktionen im Zweitsprachbereich verhalten, ist weitestgehend ungeklärt und dürfte in den nächsten Jahren zu vermehrten Forschungsanstrengungen führen. Als Beispiel sei eine Studie von Vukovic & Shtyrov (Vukovic & Shtyrov 2014) angeführt, in der gezeigt wurde, dass der motorische Kortex bei der semantischen Verarbeitung von Handlungswörtern in der L1 und der L2 eine Rolle spielt. Bei L1- und L2-Sprechern führte die Verarbeitung von Handlungswörtern zu einer Desynchronisation der sogenannten μ-Aktivität, welche durch Oszillationen im Alpha und Beta-Bereich gekennzeichnet ist und eine Aktivierung motorischer Hirnbereiche indiziert (vgl. Pineda 2005).Vukovic & Shtyrov (2014) konnten jedoch zeigen, dass die μ-Aktivität in der L2 gegenüber der L1 reduziert war. Die Autoren schlussfolgern daraus, dass motorische Simulationsprozesse in der semantischen Verarbeitung von L1 und L2 eine Rolle spielen, in der L2 jedoch weniger stark ausgeprägt sind.
2 Magnetenzephalographie (MEG) Wenn Nervenzellpopulationen elektrische Spannung erzeugen, so fließt nicht nur Strom, sondern es entsteht auch ein Magnetfeld. Dieses Magnetfeld kann mit hohem technischen Aufwand über an der Kopfoberfläche anliegende Sensoren gemessen werden. Die Magnetenzephalographie (MEG) verfügt über die gleiche zeitliche Auflösung wie EEG, misst jedoch, bedingt durch die Eigenschaften von Magnetfeldern, nicht die gleichen Signale. Wie bei der EEG-Methode kann entweder die über alle Frequenzbänder gemittelte ereigniskorrelierte Aktivität zum Zeitpunkt der Stimulusverarbeitung betrachtet werden, oder gezielt Aktivität
40
Jutta L. Mueller
einzelner spezifischer Frequenzbänder. Bei der Illustration von MEG-Potentialen werden meist mehrere oder alle Messpunkte in einem Diagramm abgebildet. Die weiter unten beschriebene Möglichkeit der Quellenlokalisation erlaubt jedoch beim MEG eine weit präzisere Zuordnung der an der Oberfläche gemessenen Potentiale zu ihren jeweiligen Ursprungsorten als beim EEG. Die MEG-Komponenten, die häufig ihren EKP-Äquivalenten zugeordnet werden können, werden meist anhand ihrer Latenz und ihrer Amplitude oder in Bezug auf die relatierte kognitive Funktion beschrieben. Die Amplitude von MEG-Potentialen wird in Femtotesla (fT) gemessen. Die Anzahl der Studien im Bereich der L2-Verarbeitung ist im Vergleich zu EEG-Studien begrenzt (siehe Schmidt & Roberts 2009, für einen Überblick). Eine Reihe von Studien hat die Untersuchung der Verarbeitung und der Plastizität bei der Wahrnehmung nicht-muttersprachlicher Phoneme zum Ziel (Menning et al. 2002; Dobel, Lagemann & Zwitserlood 2009; Koyama et al. 2000; Koyama et al. 2003) und auch zu anderen linguistischen Funktionsbereichen sind einzelne Studien vorhanden. Als beispielhafte MEG-Studie zur Erläuterung der Methode wird hier die Studie von Koyama et al. (2003) beschrieben, welche die Verarbeitung des /r/-/l/-Kontrastes im Englischen durch japanische Muttersprachler genauer untersuchte. Ziel der Studie war, einer mögliche Ursache der Schwierigkeiten japanischer Muttersprachler, den Kontrast zwischen den Phonemen /l/ und /r/, wahrzunehmen, auf die Spur zu kommen. Das in dieser Studie verwendete Oddball-Paradigma ist sowohl in der EEG- als auch in der MEG-Forschung sehr weit verbreitet und erlaubt besonders gut, auditorische Wahrnehmungs- und Lernprozesse zu untersuchen. Dazu wurden die beiden Konsonanten mit einem Vokal – /a/ – kombiniert und in einer spezifischen Anordnung präsentiert. Im Oddball-Paradigma wird ein Standardstimulus häufig wiederholt (bezeichnet als Standard) und in einem kleinen Prozentsatz der Fälle (hier, 15 %) tritt ein abweichender Stimulus (bezeichnet als Deviant) auf. Da für die Analyse nur die Reaktion auf die Abweichung und nicht die Verarbeitung der physikalischen Stimuluseigenschaften gemessen werden soll, wird die Prozedur noch einmal mit vertauschten Standards und Devianten wiederholt (vgl. Abb. 6). Wie sehr häufig bei dieser experimentellen Anordnung wurden die Probanden instruiert, die auditorische Stimulation zu ignorieren, und sie sahen während der Stimulusdarbietung einen Film ohne Tonspur an. Somit werden die Wahrnehmungsprozesse aufmerksamkeits- und aufgabenunabhängig untersucht. Gerade bei Probandengruppen, deren Sprachverarbeitungsprozesse noch in der Entwicklung bzw. auf unsicherem Niveau sind, ist dies von großem Vorteil. Um nun diejenige Gehirnaktivität zu isolieren, die mit der Diskrimination des abweichenden Reizes zu tun hat, wird die gemittelte Aktivität aller oder einer Auswahl von Standardstimuli von derjenigen der Devianten abgezogen. Koyama et al.
Neurophysiologische Verfahren zur Untersuchung der Verarbeitung einer L2
41
Abbildung 6: (a) zeigt MEG Potentiale aus einer Studie von Koyama et al. (2003). Es sind linkshemisphärische Sensoren einer Versuchsperson für die Silbe /ra/ in der Deviantbedingung, in der Standardbedingung und das sich daraus ergebende Differenzpotential dargestellt. (b) zeigt einen Auschnitt der Stimulusanordnung in verschiedenen Testblöcken in dem in der Koyama et al. (2003) Studie verwendeten typischen Oddball-Paradigma. Abbildung mit Genehmigung adaptiert aus Koyama et al. (2003).
subtrahierten also unter anderem die Aktivierung für die Silbe /ra/ in der Standardbedingung von der Aktivierung für die Silbe /ra/ in der Deviantbedingung. Somit ist sichergestellt, dass der Aktivierungsunterschied auf die Diskrimination und nicht auf akustische Unterschiede zwischen verschiedenen Silben zurückgeführt werden kann. Damit erhält man, vorausgesetzt eine Diskrimination hat auf der messbaren neuronalen Ebene stattgefunden, eine Potentialdifferenz, meist in Form einer Negativierung im Zeitbereich von 100 – 200 ms nach Stimulusonset. Diese Negativierung wird bei EEG-Studien als Mismatch Negativity (MMN) bezeichnet und im MEG häufig als mMMN, wobei das kleine m für magnetic steht. Die spezifische Frage von Koyama et al. bezog sich nun darauf, ob die Wahrnehmung der Phoneme /l/ und /r/ durch die bevorzugte Verarbeitung des nachfolgenden Vokals /a/ beeinträchtigt sein würde. Solche Phänomene werden als rückwirkende Maskierung (backward masking) bezeichnet. Zu diesem Zwecke führten sie zwei Oddball-Experimente durch, einmal mit langem nachfolgenden Vokal und einmal mit kurzem. Im Falle von backward masking sollte die mMMN für die Diskriminierung der Konsonanten /l/ und /r/ vor einem langen Vokal reduziert sein. In der Tat zeigte sich eine solche Reduktion der mMMN für den langen Vokal, was darauf schließen läßt, dass backward masking ein Faktor sein könnte, der erklärt, weshalb es für L2-Lerner sehr schwer ist, manche Phonemdistinktionen einer L2 zu erwerben.
42
Jutta L. Mueller
Neben der zeitlichen und funktionellen Charakterisierung von Verarbeitungsprozessen kann sowohl das EEG- als auch MEG-Signal mithilfe verschiedener mathematischer Verfahren lokalisiert werden, d. h. bestimmten Quellengebieten im Gehirn zugeordnet werden. Bei allen Verfahren muss eine bestimmte Irrtumswahrscheinlichkeit in Kauf genommen werden, was an dem sogenannten inversen Problem liegt. Das inverse Problem bezeichnet die Uneindeutigkeit, die daraus resultiert, dass Signale aus unterschiedlichen hirninternen Quellen die gleiche Verteilung auf der Kopfoberfläche haben können. Sind der Ort und die Anzahl der Spannungsquellen unbekannt, so ist es ohne zusätzliche Annahmen also nicht möglich Quellen eindeutig zu bestimmen, selbst bei einem völlig störungsfreien Signal. Umgekehrt kann eine Spannungsverteilung auf der Kopfoberfläche berechnet werden, wenn die Spannungsquellen in einem Körper, sowie die physikalische Zusammensetzung des Körpers bekannt sind – dies ist das sogenannte Vorwärtsproblem, das eindeutig gelöst werden kann. Da jedoch die EEGQuellen meist nicht bekannt sind, wurden verschiedene mathematische Verfahren entwickelt, um diese zu rekonstruieren, zum Beispiel sogenannte Dipolmethoden, Minimum-Norm Verfahren und räumliche Filter. Vor allem wenn zusätzliche Randbedingungen bekannt sind, wie z. B. die Anzahl und grobe Lokalisation der Quellen, kann eine Quellenanalyse zusätzliche interessante Information liefern. Bei der MEG-Methode kann die Quellenbestimmung meist zuverlässiger erfolgen aufgrund des geringeren Einflusses der volumenleitenden Eigenschaften des Kopfes sowie der hohen Anzahl von Messpunkten. Sehr verallgemeinernd kann man sich MEG als eine ähnliche Methode wie EEG vorstellen, die weniger Signal aufzeichnet, jedoch das was sie aufzeichnet, besser den Quellen zuordnen kann. Genauere Beschreibungen der Verfahren zur Quellenlokalisation in EEG und MEG finden sich in Hansen, Kringelbach & Salmelin (2010), Handy (2005) und Luck (2014).
3 Funktionelle und strukturelle Magnetresonanztomographie (fMRT/MRT) Magnetresonanztomographie (MRT) ist ein bildgebendes Verfahren der Gehirnforschung, das sich die magnetischen Eigenschaften des im Gewebe enthaltenen Wasserstoffs zu Nutze macht um verschiedene Gewebearten des lebenden Gehirns abzubilden. Da Zellkörper (graue Substanz) und Nervenfasern (weiße Substanz) unterschiedlich viel Wasser und Fett enthalten, sind auf MRT-Bildern graue (Zellkörperverbände) und weiße Substanz (Faserbündel) diskriminierbar. In der funktionellen Magnetresonanztomographie (fMRT) nutzt man die magnetischen
Neurophysiologische Verfahren zur Untersuchung der Verarbeitung einer L2
43
Eigenschaften des Blutfarbstoffs Hämoglobin, das in sauerstoffarmem und sauerstoffreichem Blut in unterschiedlicher Konzentration enthalten ist. Somit kann die Sauerstoffversorgung in spezifischen Gehirnregionen abgebildet werden, die direkt durch die Aktivität lokaler größerer Nervenzellverbände (zum Beispiel während der Sprachverarbeitung) beeinflusst wird. Das gemessene Signal wird auch als BOLD-Signal (=blood oxygen level dependent signal) bezeichnet. Da die erhöhte Blutsauerstoffversorgung nach neuronaler Aktivität jedoch zeitverzögert erfolgt, können mit fMRT zwar sehr genaue Aussagen über die Lokalisation neuronaler Aktivität gemacht werden (bis zu weniger als 1 mm3 bei hohen Magnetfeldstärken), jedoch mit geringer zeitlicher Genauigkeit (im Sekundenbereich). Bei der Datenanalyse wird nun die Signalstärke für jede räumliche Messeinheit, den sogenannten Voxel, den man sich als dreidimensionalen Datenpunkt vorstellen kann, berechnet. Die Messergebnisse verschiedener experimenteller Bedingungen können anschließend Voxel für Voxel mit Hilfe verschiedener statistischer Methoden miteinander verglichen werden. Diejenigen Voxel, die für eine bestimmte Analyse ein zuvor festgelegtes Signifikanzkriterium erreichen, und somit als Indikatoren für eine Beteiligung der an der entsprechenden Stelle liegenden Gehirnareale gelten können, werden meist auf ein schematisches oder reales Abbild eines Gehirns projiziert (vgl. Abb. 7). Eine ausführlichere methodische Einführung findet sich zum Beispiel in Poldrack, Mumford & Nichols (2011). Als beispielhafte fMRT-Studie zur Verarbeitung von Deutsch als L2 möchte ich eine Studie von Wartenburger et al. näher erläutern (Wartenburger et al. 2003). Hier wurden verschiedenen Gruppen von L2-Lernern korrekte Sätze, Sätze mit syntaktischen Verletzungen und Sätze mit semantischen Verletzungen präsentiert. Es nahmen drei Gruppen italienischer Probanden teil. Die erste Gruppe erwarb Deutsch als zusätzliche L1 bereits ab der Geburt und zeichnete sich durch ein hohes Fertigkeitsniveau aus (Gruppe EAHP [early acquisition high proficiency]). Die zweite Gruppe zeigte ein ebenso hohes Fertigkeitsniveau bei postpubertärem L2Erwerb (Gruppe LAHP [late acquisition high proficiency]) und die dritte Gruppe erreichte ein geringeres Fertigkeitsniveau bei postpubertärem Erwerb (Gruppe LALP [late acquisition low proficiency]). Den Probanden wurden korrekte Sätze und solche mit syntaktischen und semantischen Verletzungen sowohl im Italienischen (L1) als auch im Deutschen (L2) visuell präsentiert, während der fMRTScanner die Gehirnaktivität aufzeichnete. Satzbeispiele der untersuchten Bedingungen sind im Folgenden aufgelistet.
44
Jutta L. Mueller
(1) Syntaktische Verletzung – L2: Der Hund laufen über die Wiese. (2) Syntaktische Verletzung – L1: I gatti ama cacciare i topi. (‚Die Katzen liebt es Mäuse zu fangen.‘) (3) Semantische Verletzung – L2: Das Reh erschießt den Jäger. (4) Semantische Verletzung – L1: La pannocchia mangia il maiale. (‚Der Maiskolben frisst das Schwein.‘) Die Idee, prozessspezifische Hirnaktivität durch die Subtraktion der Messungen zweier Bedingungen, die sich in genau dem interessierenden Merkmal unterscheiden, zu identifizieren, wird auch als Subtraktionsparadigma bezeichnet und sehr häufig in der neuro-kognitiven Forschung angewendet. Es wurde also die Aktivität während des Lesens der semantischen Bedingung in L1 von der semantischen Bedingung in L2 abgezogen (also 3 – 4). Die Vorgehensweise für die syntaktische Bedingung war analog (1– 2). Die resultierende Aktivierung konnte nun direkt zwischen den einzelnen Lernergruppen verglichen werden. Abbildung 7 zeigt, dass die Sätze mit syntaktischen Fehlern in der L2 zu unterschiedlichen Hirnaktivierungen für die einzelnen Lernergruppen führten.
Abbildung 7: Abbildung 7 zeigt Gruppenunterschiede in der Gehirnaktivierung bei der Verarbeitung der L2 aus einer Studie von Wartenburger et al. (2003). (A) zeigt eine stärkere Aktivierung des sogenannten Broca-Areals im Frontallappen für syntaktische Verarbeitungsprozesse in Abhängigkeit vom Erwerbsalter. Die schraffierten Regionen sind Bereiche mit statistisch signifikant höherer Aktivierung für die EAHP Gruppe im Vergleich zur LAHP Gruppe. Unterschiede in Zusammenhang mit dem Fertigkeitslevel (B) zeigten sich im hinteren Teil des linken Temporallappens (linkes Gehirn) und im rechten Parietallappen (rechtes Gehirn). Der angegeben x-Wert bezeichnet eine Position auf der Längsachse des Gehirns von links (negative Werte) nach rechts (positive Werte)(=sagittaler Schnitt), der z-Wert eine Position auf der horizontalen Achse von unten (negative Werte) nach oben (positive Werte) (=axialer Schnitt). Abbildung mit Genehmigung adaptiert aus Wartenburger et al. (2003).
Die unterschiedlichen Erwerbsalter führten trotz des vergleichbaren Fertigkeitslevels zu unterschiedlicher Aktivierung des sogenannten Broca-Areals, wel-
Neurophysiologische Verfahren zur Untersuchung der Verarbeitung einer L2
45
ches auch in anderen Studien mit bestimmten syntaktischen Funktionen, v. a. der Verarbeitung komplexer Strukturen, in Verbindung gebracht wurde (z. B. Makuuchi et al. 2009; Friederici et al. 2006). Unterschiedliche Fertigkeitsgrade führten hingegen zu unterschiedlicher Beteiligung anderer Hirnareale im Temporal- und Parietallappen. Aus diesen Ergebnissen folgerten die Autoren, dass die Art der Beteiligung des Broca-Areals bei der grammatischen Verarbeitung einer L2 erwerbsalterspezifischen Einflüssen, also möglicherweise einer kritischen oder sensiblen Periode, unterliegt. Ähnlich wie fMRT kann man mit der Methode der Nahinfrarotspektroskopie (NIRS) den Verlauf der Hirnaktivierung abbilden. Sie nutzt dazu die Applikation von Licht im Infrarotbereich auf der Kopfoberfläche. Die Absorptionseigenschaften sauerstoffhaltiger und nicht-sauerstoffhaltiger Blutbestandteile lassen ähnlich wie fMRT die Analyse der lokale Blutsauerstoffversorgung zu. Die Methode ist vor allem für Säuglinge sehr gut geeignet, liefert aber im Vergleich zu fMRT eine geringere räumliche Auflösung (meist 1,5 – 3 cm3). Aus diesem Grunde wird sie bei Erwachsenen seltener eingesetzt. Einzelne Studien zur L2-Verarbeitung, die auf NIRS Daten basieren, sind jedoch vorhanden, so zum Beispiel eine Studie zur kategorischen Wahrnehmung eines Phonemunterschieds im Japanischen bei japanischem Muttersprachlern und koreanischen L2-Lernern des Japanischen (Minagawa-Kawai, Mori & Sato 2005). Während bei einer Diskriminationsaufgabe keine Verhaltensunterschiede gefunden wurden, zeigten die Muttersprachler und L2-Lerner dennoch unterschiedliche Beteiligung des linken auditorischen Kortex (im Temporallappen) bei der Phonemverarbeitung. Die Analysemethoden für fMRT befinden sich in ständiger Weiterentwicklung. Zwei neuere Analyseverfahren, die in den letzten Jahren starke Verbreitung erfahren haben und die auch in Forschungen zur Sprachverarbeitung zum Zuge kommen, seien hier noch angerissen. Während bei der konventionellen Analyse von fMRT-Daten die Messergebnisse verschiedener Bedingungen Voxel für Voxel miteinander verglichen werden, wird bei der Multivoxel-Musteranalyse (multivoxel pattern analysis; MVPA) das Aktivierungsmuster mehrerer Voxel gemeinsam betrachtet, um aus den gemessenen Daten die spezifischen experimentellen Bedingungen vorherzusagen. In erster Linie kann mit einem derartigen Verfahren bestimmt werden, ob über mehrere Voxel verteilte Aktivierungsmuster zwischen verschiedenen Inputbedingungen diskriminieren. Durch die separate Betrachtung des Vorhersagebeitrages einzelner Regionen oder Voxel kann auch mit dieser Methode eine Lokalisierung der untersuchten Prozesse vorgenommen werden (siehe Pereira, Mitchell & Botvinick 2009;Tong & Pratte 2012, zur Einführung in die entsprechenden Methoden). Im Gebiet der Bilingualismusforschung gibt es bereits erste Studien, die diese Analysetechnik nutzen. So verglichen zum Beispiel Willms et al. (Willms et
46
Jutta L. Mueller
al. 2011) die Verarbeitung von Nomen und Verben bei Spanisch-Englisch Bilingualen in beiden Sprachen. Es zeigte sich, dass das Lesen von Verben im Vergleich zu Nomen sowohl im Spanischen als auch im Englischen zu höherer Aktivierung spezifischer Hirnareale führte, so zum Beispiel im linken Frontal- und Temporallappen. Eine zusätzliche MVPA innerhalb dieser Regionen ergab, dass anhand des Aktivierungsmusters zwischen Verben und Nomen diskriminiert werden konnte, jedoch nicht zwischen den verschiedenen Sprachen. Wortklassen scheinen also innerhalb dieser Arealen sprachunabhängig verarbeitet zu werden. Eine weitere Analysemethode, die voxelübergreifend nach Aktivierungsmustern sucht, ist die sogenannte resting-state Analyse, die sich auf die funktionelle Konnektivität entfernter Hirnareale während des Ruhezustands oder eines anderen stabilen Zustands bezieht. Hierbei werden die niedrigfrequenten Anteile des BOLD-Signals betrachtet und über verschiedene Voxel hinweg zueinander in Bezug gesetzt. Dafür stehen verschiedene mathematische Verfahren zur Verfügung (vgl., Margulies et al. 2010). Das Ergebnis einer solchen Analyse spiegelt zustandsspezifische Konnektivitätsmuster wider, die zum Beispiel mit interindividuellen Unterschieden hinsichtlich bestimmter kognitiver Fähigkeiten in Verbindung gebracht werden können. So wurde im Bereich der L2-Erwerbsforschung zum Beispiel ein Zusammenhang zwischen dem Erfolg beim Wortabruf in der L2 und der funktionellen Konnektivität zwischen einer Region im linken Frontalkortex (Insula und frontales Operculum) und dem linken posterioren Temporallappen gezeigt (Chai et al. 2016). Englischsprachige L2-Lerner des Französischen waren umso besser im Wortabruf, je höher der Konnektivitätswert war. Ein solches Ergebnis zeigt, dass das grundlegende funktionelle Zusammenspiel verschiedener Hirnareale durchaus ein Faktor sein könnte, der über den Verlauf des L2-Erwerbs mitentscheidet (Chai et al. 2016). Obwohl der Fokus dieses Bandes auf online Methoden zur L2-Forschung liegt möchte ich dieses Kapitel zu neurophysiologischen Methoden nicht schließen ohne darauf hinzuweisen, dass es einige moderne Verfahren zur strukturellen Bildgebung des menschlichen Gehirns gibt, die interessante Rückschlüsse auf die Funktionsweise des menschlichen Gehirns beim Lernen und Verarbeiten einer L2 zulassen und die ihrerseits mit Verfahren der funktionellen Bildgebung kombiniert werden können. Neben der funktionellen Bildgebung erlaubt MRT durch die Verwendung verschiedener Messparameter auch, hochauflösende Bilder anatomischer Hirnstrukturen zu erhalten. Über die klinische Relevanz anatomischer Messungen zu Zwecken der Diagnostik hinaus eröffnen genaue anatomische Messungen die Möglichkeit hirnstrukturelle Besonderheiten bei gesunden Probanden zu untersuchen und somit die strukturelle Plastizität des Gehirns im Angesicht unterschiedlicher Umwelten, Entwicklungsstufen oder auch genetischer Veranlagung zu untersuchen. MRT-Bilder können unterschiedliche Gewe-
Neurophysiologische Verfahren zur Untersuchung der Verarbeitung einer L2
47
bearten oder -eigenschaften besonders gewichten. So ist zum Beispiel in sogenannten T1-gewichteten Bildern die graue Substanz des Gehirns, also die Zellkörper, dunkel zu sehen und in T2-gewichteten Bildern die weiße Substanz, also die Verbindungen (Dendriten und Axone) der Zellen dunkel zu sehen. Bei der sogenannten diffusions-gewichteten Bildgebung (diffusion weighted imaging; DWI) sind die Verläufe der Faserverbindungen des Gehirns besonders gut analysierbar. Aus solchen anatomischen Bildern können mit spezifischen mathematischen Verfahren die strukturellen Besonderheiten von Gehirnen quantifiziert werden und zwischen verschiedenen Gruppen verglichen werden (vgl. Mechelli, Price, Friston, & Ashburner 2005; Mori & Zhang 2006). Im Zweitsprachbereich ist das vor allem interessant, um festzustellen, ob i) bestimmte anatomische Besonderheiten die Art und Effizienz von L2-Verarbeitung beeinflussen und/oder ii) L2-Erwerb selbst zu bestimmten anatomischen Veränderungen führt. Die Studie von Mechelli et al. (2004) war eine der ersten, die strukturelle MRTBilder in Zusammenhang mit neuronaler Plastizität beim L2-Erwerb bringen konnte. In der Studie wurde ein Zusammenhang zwischen der Intensität der grauen Substanz im linken inferioren Parietallappen sowie dem Fertigkeitslevel in der L2 (Englisch) bei italienischen Muttersprachlern nachgewiesen. Strukturelle und funktionelle MRT-Methoden können auch kombiniert werden. López-Barroso et al. (López-Barroso et al. 2013) untersuchten den Zusammenhang zwischen einem quantitativen Maß für die Beschaffenheit von Faserverbindungen und der Fähigkeit, neue (künstliche) Wortformen zu erlernen. Die Auswertung diffusionsgewichteter Bilder zeigte, dass ein Maß für die Ausprägung eines Teiles des linken Fasciculus arcuatus mit der Fähigkeit neue Wörter zu erlernen, korreliert. Der Fasciculus arcuatus ist ein mehrteiliges Faserbündel, das u. a. Areale im Temporallappen mit frontalen Arealen verknüpft. Die fMRT-Daten, die während der Wortlernaufgabe aufgezeichnet wurden, erlaubten eine Analyse der funktionellen Konnektivität zwischen denjenigen Regionen, die durch den Fasciculus arcuatus miteinander verbunden sind. Hier zeigte sich in einer ähnlichen Weise wie in den anatomischen Bildern ein Zusammenhang zwischen der linkshemisphärischen funktionellen Konnektivität zwischen temporalen und frontalen Gehirnbereichen und der Performanz in der Wortlernaufgabe. Somit konnte durch die Kombination struktureller und funktioneller bildgebender Methoden gezeigt werden, dass sowohl die Beschaffenheit des Fasciculus arcuatus als auch die entsprechende funktionelle Aktivierungen in den angrenzenden Hirnarealen mit dem Lernen neuer Wörter verknüpft sind.
48
Jutta L. Mueller
4 Zusammenfassung Das vorliegende Kapitel liefert einen Überblick über wichtige neurophysiologische Methoden, die im Bereich der L2-Verarbeitungsforschung aktuell eingesetzt werden. EEG, MEG, sowie MRT-basierte Methoden leisten einen wichtigen Beitrag zum Verständnis der neurokognitiven Prozesse, die während der Verarbeitung einer L2 stattfinden. Die einzelnen Methoden zeichnen sich durch besondere Vorzüge sowie Schwächen aus. So ist zum Beispiel EEG besonders gut geeignet, wann-Fragen zu beantworten, da die zeitliche Auflösung exzellent, die räumliche Auflösung jedoch relativ ungenau ist. MRT-basierte Methoden hingegen erlauben eine sehr genaue Zuordnung der Messdaten zu anatomischen Strukturen, beantworten also sehr gut wo-Fragen, sind jedoch in ihrer zeitlichen Auflösung sehr eingeschränkt. Gemeinsam betrachtet oder gar in Kombination aufgezeichnet können diese Methoden helfen, die neurobiologische Grundlage der menschlichen Fähigkeiten, mehrere Sprachen zu erwerben, besser zu verstehen. Sowohl die Messmethoden als auch die Auswertungsmethoden befinden sich in ständiger Weiterentwicklung, und es ist zu erwarten, dass neue Erkenntnisse zur Funktionsweise des Gehirns, die aus technischem und methodischen Fortschritt erwachsen, auch zum besseren Verständnis derjenigen Prozesse führen, die die Verarbeitung von Fremdsprachen unterstützen.
Literaturangaben Başar, Erol, Canan Başar-Eroglu, Sirel Karakaş & Martin Schürmann (2001): Gamma, alpha, delta, and theta oscillations govern cognitive processes. International Journal of Psychophysiology 39 (2 – 3), 241 – 248. Berger, Hans (1929): Über das Elektroenkephalogramm des Menschen. Archiv für Psychiatrie und Nervenkrankheiten 87, 527 – 570. Bornkessel, Ina & Matthias Schlesewsky (2006): The extended argument dependency model: a neurocognitive approach to sentence comprehension across languages. Psychological Review 113 (4), 787 – 821. Chai, Xiaoqian J., Jonathan A. Berken, Elise B. Barbeau, Jennika Soles, Megan Callahan, Jen-Kai Chen & Denise Klein (2016): Intrinsic Functional Connectivity in the Adult Brain and Success in Second-Language Learning. Journal of Neuroscience 36 (3), 755 – 761. Coles, Michael G.H. & Michael D. Rugg (1995): Event-related brain potentials: an introduction. In Michael D. Rugg & Michael G.H. Coles (Hrsg.), Electrophysiology of mind: Event-related brain potentials and cognition. Oxford University Press. De Diego Balaguer, Ruth, Juan M. Toro, Antoni Rodriguez-Formells & Anne-Catherine Bachaud-Lévi (2007): Different neurophysiological mechanisms underlying word and rule extraction from speech. PLoS One 2 (11), e1775. Díaz, Begoña, Kepa Erdocia, Robert F. de Menezes, Jutta L. Mueller, Nuria Sebastian-Galles & Itziar Laka (2016): Electrophysiological correlates of second-language syntactic processes
Neurophysiologische Verfahren zur Untersuchung der Verarbeitung einer L2
49
are related to native and second language distance regardless of age of acquisition. Frontiers in Psychology 7, 133. Ding, Nai, Lucia Melloni, Hang Zhang, Xing Tian & David Poeppel (2015): Cortical tracking of hierarchical linguistic structures in connected speech. Nature Neuroscience 19, 158 – 164. Dobel, Christian, Lothar Lagemann & Pienie Zwitserlood (2009): Non-native phonemes in adult word learning: evidence from the N400 m. Philosophical transactions of the Royal Society of London, Series B, Biological Sciences 364 (1536), 3697 – 709. Doughty, Catherine J. & Michael H. Long (2003): The Handbook of Second Language Acquisition. Malden, MA: Blackwell. Dowens, Margaret G., Marta Vergara, Horacio A. Barber & Manuel Carreiras (2010): Morphosyntactic processing in late second-language learners. Journal of Cognitive Neuroscience 22 (8), 1870 – 1887. Friederici, Angela D. (2002): Towards a neural basis of auditory sentence processing. Trends in Cognitive Sciences 6, 78 – 84. Friederici, Angela D. (2011): The brain basis of language processing: from structure to function. Physiological Reviews 91 (4), 1357 – 92. Friederici, Angela D., Christian J. Fiebach, Matthias Schlesewsky, Ina Bornkessel & von Cramon D. Yves (2006): Processing linguistic complexity and grammaticality in the left frontal cortex. Cerebral Cortex 16, 1709 – 1717. Gass, Susan M. & Alison Mackey (Hrsg.) (2013): The Routledge Handbook of Second Language Acquisition. New York: Routledge. Giraud, Anne-Lise & David Poeppel (2012): Cortical oscillations and speech processing: emerging computational principles and operations. Nature Neuroscience 15 (4), 511 – 7. Green, David (2003): Neural basis of lexicon and grammar in L2 acquisition: the convergence hypothesis. In R. van Hout, A. Hulk, F. Kuiken & Rouland van Hout, Aafke Hulk, Folkert Kuiken & Richard Towell (Hrsg.), The Lexicon-Syntax Interface in Second Language Acquisition, 197 – 218. Amsterdam: John Benjamins. Gruber, Thomas (2007): Signatures of memory traces in the brain. Induced Gamma Band Responses in the human EEG: Morphology, manipulation, use-dependent plasticity. Habilitationsschrift. Leipzig: Universität Leipzig. Hagoort, Peter (2005): On Broca, brain, and binding: a new framework. Trends in Cognitive Sciences 9 (9), 416 – 423. Hagoort, Peter, Lea Hald, Marcel C. M. Bastiaansen & Karl M. Petersson (2004): Integration of word meaning and world knowledge in language comprehension. Science 304, 438 – 441. Hahne, Anja (2001): What’s different in second-language processing? Evidence from event-related brain potentials. Journal of Psycholinguistic Research 30, 251 – 266. Hahne, Anja & Angela D. Friederici (2001): Processing a second language: Late learner’s comprehension mechanisms as revealed by event-related potentials. Bilingualism 4, 123 – 141. Hahne, Anja, Jutta L. Mueller & Harald Clahsen (2006): Morphological Processing in a Second Language: Behavioral and Event-related Brain Potential Evidence for Storage and Decomposition. Journal of Cognitive Neuroscience 18 (1), 121 – 134. Hald, Lea A., Marcel C. M. Bastiaansen & Peter Hagoort (2006): EEG theta and gamma responses to semantic violations in online sentence processing. Brain and Language 96 (1), 90 – 105. Handy, Todd (2005): Event-related potentials: A methods handbook. Cambridge: MIT Press.
50
Jutta L. Mueller
Hansen, Peter C., Morten L. Kringelbach & Riitta Salmelin (2010): MEG: An Introduction to Methods New York: Oxford University Press. Herrmann, Christoph S., Niko A. Busch & Maren Grigutsch (2005): EEG oscillations and wavelet analysis. Event-related potentials: A methods handbook, 229 – 259. Cambridge: MIT Press. Herten, Marieke van, Dorothee J. Chwilla & Hermann H. J. Kolk (2006): When heuristics clash with parsing routines: ERP evidence for conflict monitoring in sentence perception. Journal of Cognitive Neuroscience 18 (7), 1181 – 1197. Hickok, Gregory & David Poeppel (2007): The cortical organization of speech processing. Nature Reviews Neuroscience 8 (5), 393 – 402. Koyama, Sachiko, Reiko Akahane-Yamada, Atsuko Gunji, Rieko Kubo, Timothy P.L Roberts, Hirooki Yabe & Ryusuke Kakigi (2003): Cortical evidence of the perceptual backward masking effect on /l/ and /r/ sounds from a following vowel in japanese speakers. NeuroImage 18 (4), 962 – 974. Koyama, Sachiko, Atsuko Gunji, Hirooki Yabe, Reiko-Akahane Yamada, Shoko Oiwa, Rieko Kubo & Ryusuke Kakigi (2000): The masking effect in foreign speech sounds perception revealed by neuromagnetic responses. NeuroReport 11 (17), 3765 – 3769. Kuperberg, Gina R. (2007): Neural mechanisms of language comprehension: challenges to syntax. Brain research 1146, 23 – 49. Kuperberg, Gina R., Tatiana Sitnikova, David Caplan & Phillip K. Holcomb (2003): Electrophysiological distinctions in processing conceptual Relationships within simple sentences. Cognitive Brain Research 17, 117 – 129. Kutas, Marta & Kara D. Federmeier (2011): Thirty years and counting: finding meaning in the N400 component of the event-related brain potential (ERP). Annual review of psychology 62, 621 – 47. Lau, Ellen F., Colin Phillips & David Poeppel (2008): A cortical network for semantics: (de) constructing the N400. Nature Reviews Neuroscience 9, 920 – 933. López-Barroso, Diana, Marco Catani, Pablo Ripollés, Flavio Dell’Acqua, Antoni Rodríguez-Fornells & Ruth De Diego-Balaguer (2013): Word learning is mediated by the left arcuate fasciculus. Proceedings of the National Academy of Sciences of the United States of America 110 (32), 13168 – 73. Luck, Steven (2014): An Introduction to the Event-Related Potential Technique. The MIT Press. Makuuchi, Michiru, Jörg Bahlmann, Alfred Anwander & Angela D. Friederici (2009): Segregating the core computational faculty of human language from working memory. Proceedings of the National Academy of Sciences of the United States of America 106 (20), 8362 – 8367. Margulies, Daniel S., Joachim Böttger, Xiangyu Long, Yating Lv, Clare Kelly, Alexander Schäfer, Dirk Goldhahn, et al. (2010): Resting developments: a review of fMRI post-processing methodologies for spontaneous brain activity. Magma (New York, N.Y.) 23 (5 – 6), 289 – 307. McLaughlin, Judith, Darren Tanner, Ilona Pitkänen, Cheryl Frenck-Mestre, Kayo Inoue, Geoffrey Valentine & Lee Osterhout (2010): Brain Potentials Reveal Discrete Stages of L2 Grammatical Learning. Language Learning 60, 123 – 150. Mechelli, Andrea, Jenny T. Crinion, Uta Noppeney, John O’Doherty, John Ashburner, Richard S. Frackowiak & Cathy J. Price (2004): Neurolinguistics: structural plasticity in the bilingual brain. Nature 431 (7010), 757.
Neurophysiologische Verfahren zur Untersuchung der Verarbeitung einer L2
51
Mechelli, Andrea, Cathy Price, Karl Friston & John Ashburner (2005): Voxel-Based Morphometry of the Human Brain: Methods and Applications. Current Medical Imaging Reviews 1 (2), 105 – 113. Menning, Hans, Satoshi Imaizumi, Pienie Zwitserlood & Christo Pantev (2002): Plasticity of the human auditory cortex induced by discrimination learning of non-native, mora-timed contrasts of the Japanese language. Learning and Memory 9 (5), 253 – 267. Meyer, Lars, Jonas Obleser & Angela D. Friederici (2013): Left parietal alpha enhancement during working memory-intensive sentence processing. Cortex 49 (3), 711 – 21. Minagawa-Kawai, Yasuyo, Koichi Mori & Yutaka. Sato (2005): Different Brain Strategies Underlie the Categorical Perception of Foreign and Native Phonemes. Journal of Cognitive Neuroscience, 17 (9), 1376 – 1385 Mitchell, Rosamond & Florence Myles (2004): Second Language Learning Theories London: Arnold. Mori, Susumu & Jiangyang Zhang (2006): Principles of diffusion tensor imaging and its applications to basic neuroscience research. Neuron 51 (5), 527 – 39. Mueller, Jutta L., Anja Hahne, Yugo Fujii & Angela D. Friederici (2005): Native and nonnative speakers’ processing of a miniature version of Japanese as revealed by ERPs. Journal of Cognitive Neuroscience 17 (8), 1229 – 1244. Mueller, Jutta L., Shirley-Ann Rueschemeyer & Angela D. Friederici (2006): Aktivitätsmuster im Gehirn: Unterschiede und Gemeinsamkeiten beim Verstehen von Erst- und Zweitsprache. Neuroforum 2, 176 – 184. Osterhout, Lee & Peter Hagoort (1999): A superficial resemblance does not necessarily mean you are part of the family: Counterarguments to Coulson, King and Kutas (1998) in the P600/SPS-P300 debate. Language and Cognitive Processes 14 (1), 1 – 14. Pereira, Francisco, Tom Mitchell & Matthew Botvinick (2009): Machine learning classifiers and fMRI: a tutorial overview. NeuroImage 45 (1 Suppl), 199 – 209. Pineda, Jaime A. (2005): The functional significance of mu rhythms: translating „seeing“ and „hearing“ into „doing“. Brain research. Brain research reviews 50, 157 – 68. Poldrack, Russell A., Jeanette A. Mumford & Thomas E. Nichols (2011): Handbook of Functional MRI Data Analysis New York: Cambridge University Press. Rodríguez-Fornells, Antoni, Toni Cunillera, Anna Mestres-Missé & Ruth de Diego-Balaguer (2009): Neurophysiological mechanisms involved in language learning in adults. Philosophical transactions of the Royal Society of London. Series B, Biological sciences 364 (1536), 3711 – 3735. Rossi, Sonja, Manfred F. Gugler, Angela D. Friederici & Anja Hahne (2006): The impact of proficiency on syntactic second-language processing of German and Italian: Evidence from event-related potentials. Journal of Cognitive Neuroscience 18 (12), 2030 – 2048. Sanders, Lisa D., Elissa L. Newport & Helen J. Neville (2002): Segmenting nonsense: An event-related potential index of perceived onsets in continuous speech. Nature Neuroscience 5, 700 – 703. Sassenhagen, Jona, Matthias Schlesewsky & Ina Bornkessel-Schlesewsky (2014): The P600-as-P3 hypothesis revisited: single-trial analyses reveal that the late EEG positivity following linguistically deviant material is reaction time aligned. Brain and Language 137, 29 – 39. Schmidt, Gwen L. & Thimothy P. L. Roberts (2009): Second language research using magnetoencephalography: a review. Second Language Research 5 (1), 135 – 166.
52
Jutta L. Mueller
Singer, Wolf (2009): Distributed processing and temporal codes in neuronal networks. Cognitive neurodynamics 3 (3), 189 – 96. Tong, Frank & Michael S. Pratte (2012): Decoding patterns of human brain activity. Annual review of psychology 63, 483 – 509. Ullman, Michael T. (2001): The neural basis of lexicon and grammar in first and second language: The declarative/procedural model. Bilingualism: Language and Cognition 4, 105 – 122. Vukovic, Nikola & Yury Shtyrov (2014): Cortical motor systems are involved in second-language comprehension: evidence from rapid mu-rhythm desynchronisation. NeuroImage 102 (Pt 2), 695 – 703. Ward, Lawrence M. (2003): Synchronous neural oscillations and cognitive processes. Trends in Cognitive Sciences 7 (12), 553 – 559. Wartenburger, Isabella, Hauke R. Heekeren, Jubin Abutalebi, Stefano F. Cappa, Arno Villringer & Daniela Perani (2003): Early setting of grammatical processing in the bilingual brain. Neuron 37, 159 – 170. Weber-Fox, Christine M. & Helen J. Neville (1996): Maturational Constraints on Functional Specializations for Language Processing: ERP and Behavioral Evidence in Bilingual Speakers. Journal of Cognitive Neuroscience 8 (3), 231 – 256. Willms, Joanna L., Kevin A. Shapiro, Marius V. Peelen, Petra E. Pajtas, Albert Costa, Lauren R. Moo & Alfonso Caramazza (2011): Language-invariant verb processing regions in Spanish-English bilinguals. NeuroImage 57 (1), 251 – 61. Zawiszewski, Adam, Eva Gutierrez, Beatriz Fernandez & Itziar Laka (2011): Language distance and non-native syntactic processing: Evidence from event-related potentials. Bilingualism: Language and Cognition 14 (03), 400 – 411.
II Wörter
Andrea Weber und Mirjam Broersma
Die Erkennung gesprochener Wörter in einer L2 Um gesprochene Sprache zu verstehen, müssen Hörer die Bedeutung einer Äußerung anhand des akustischen Signals erkennen können. In einem frühen Stadium dieses Prozesses müssen sie dabei einzelne Wörter erkennen, genauer gesagt, das akustische Sprachsignal auf einzelne Wörter im mentalen Lexikon abbilden. In unserem mentalen Lexikon werden Informationen zur phonetischen und phonologischen Form von Wörtern, aber auch zu ihren grammatischen Eigenschaften und ihrer Bedeutung gespeichert. Ein zentrales Thema in der psycholinguistischen Forschung zur gesprochenen Worterkennung sind die Mechanismen, mittels derer Hörer das Sprachsignal auf Wörter im mentalen Lexikon abbilden und auf diese Worte zugreifen. Das Signal gesprochener Sprache entfaltet sich in der Zeit: man hört nicht alle Laute eines Wortes auf einmal, sondern nacheinander. Die Prozesse der Worterkennung beginnen nicht erst, nachdem ein ganzes Wort gehört wurde. Sie beginnen ihre Arbeit, sobald ein kleiner Teil des Wortes gehört wurde. Somit ist Worterkennung ein inkrementeller Prozess, bei dem laufend neue akustische Information verarbeitet wird und in die bisherige Interpretation des Gehörten integriert wird. Inkrementalität ermöglicht es dem Hörer, mit der natürlichen Geschwindigkeit gesprochener Sprache mitzuhalten. Wenn Hörer warten würden, bis ein ganzes Wort gehört wurde, bevor sie damit beginnen, es zu verstehen, würde die Verarbeitung bei einer Äußerung mit mehreren Wörtern sehr schnell hinterherhinken und ein reibungsloses Verstehen wäre nicht mehr möglich. Inkrementalität sorgt dafür, dass wir Wörter bereits während sie gehört werden, oder zumindest sehr kurz danach, erkennen können. Inkrementalität bedeutet aber auch, dass Hypothesen über mögliche gehörte Wörter gebildet werden müssen, bevor ein Wort ganz gehört wurde. Ein Mechanismus für den lexikalen Zugriff, von dem alle aktuellen Modelle der Worterkennung ausgehen, ist die parallele Aktivierung von mehreren lexikalen Hypothesen (z. B., Gaskell & Marslen-Wilson 2002; McClelland 1991; Norris & McQueen 2008). Während man das deutsche Wort Strand hört, wird nicht nur Strand als möglicher Wortkandidat in Erwägung gezogen, sondern gleichzeitig auch alle Wörter, die ähnlich klingen, wie stramm, straff und Rand. Wie stark einzelne Kandidaten aktiviert werden, hängt davon ab, wie gut sie lautlich zum Andrea Weber, Eberhard Karls Universität Tübingen Mirjam Broersma, Radboud University Nijmegen DOI 10.1515/9783110456356-003
56
Andrea Weber und Mirjam Broersma
Sprachsignal passen. Die Passung wird ständig überprüft, während sich das Sprachsignal entfaltet. Während stramm und straff zum Beispiel zu Beginn des Sprachsignals noch gut zu Strand passen, ist das nicht mehr der Fall, sobald der Nasal /n/ in Strand dem Hörer zur Verfügung steht. Der gleichzeitigen Aktivierung von mehreren Wortkandidaten folgt ein Wettbewerb zwischen den Kandidaten. Je mehr Kandidaten miteinander im Wettbewerb stehen, desto langsamer geht die Worterkennung voran (Zwitserlood 1989). Im Prinzip kann die richtige Entscheidung zwischen den Kandidaten auch alleine aufgrund der Passung zwischen dem akustischen Sprachsignal und den gespeicherten Repräsentationen in unserem mentalen Lexikon getroffen werden; das Wort, welches am besten mit dem Sprachsignal übereinstimmt, wird ausgewählt, und alle anderen Kandidaten werden abgelehnt. Der Wettbewerb schärft jedoch die Unterschiede in lexikaler Aktivierung und erleichtert somit die Entscheidung für den richtigen Kandidaten. In unserer L1 ist das Verstehen von gesprochenen Wörter in der Regel leicht und erfordert keine merkbare Anstrengung, aber die gleiche Aufgabe kann deutlich schwieriger sein, wenn wir sie in unserer L2 bewältigen müssen. Es ist anzunehmen, dass die Prozesse, die das Erkennen von gesprochenen Wörtern ermöglichen, universal sind. Das heißt, es gibt in unserer L2 genauso parallele Aktivierung und Wettbewerb wie in unserer L1. Im Prinzip könnte die Worterkennung in unserer L2 sogar schneller sein als in unserer L1. Schließlich kennen wir meist weniger Wörter in unserer L2, und je weniger Wörter parallel aktiviert werden können, umso weniger Wettbewerb gibt es, und umso schneller kann die Worterkennung vorangehen (z. B. Norris, McQueen & Cutler 1995). Das entspricht aber nicht der subjektiven Wahrnehmung der meisten L2-Sprecher. Hören und Verstehen in der L1 sind einfach, aber in der L2 können die gleichen Aufgaben mühsam sein. Es gibt inzwischen vielfache Belege dafür, dass ein Teil der Mühe auf einen Zuwachs des Kandidatensets (oft auch als Kohortenset bezeichnet) für L2-Hörer zurückzuführen ist.¹ Im Folgenden wird zunächst der Zuwachs des Kandidatensets durch die L2 und die L1 beschrieben, von Wörtern in Isolation, aber auch im Satzkontext. Anschließend werden Segmentierungsstrategien des Sprachstroms erläutert, um einzelne Wörter in der L2 zu finden. Schließlich werden Einflüsse von Sprachfertigkeit auf die Worterkennung in der L2 dargestellt.
In diesem Kapitel liegt der Schwerpunkt auf der Erkennung von gesprochenen Wortformen, also den phonologischen lexikalen Repräsentationen. Beschreibungen der semantischen Repräsentationen und den lexikalen Zugriff auf sie in einer L2 findet man zum Beispiel in Kroll & Bogulski (2013). Für Beschreibungen der Forschungslage zur visuellen Worterkennung (Lesen) in der L2 verweisen wir auf Bultena & Dijkstra (2013).
Die Erkennung gesprochener Wörter in einer L2
57
1 Kandidatenset in der L2 1.1 Wörter aus dem L1-Lexikon Ein Hauptgrund, wieso das Kandidatenset für L2-Hörer größer ist, ist die Tatsache, dass L2-Hörer nicht in der Lage sind, ihre beiden Lexika während der Worterkennung auseinanderzuhalten. Das heißt, wenn Hörer in ihrer L2 versuchen, Wörter zu erkennen, können sie nicht verhindern, dass auch Wörter aus ihrer L1 aktiviert werden. Wenn zum Beispiel niederländische Hörer das englische Wort brand (‚Marke‘) hören, aktivieren sie nicht nur das englische Wort brand sondern auch niederländische Wörter, die gleich klingen, wie zum Beispiel brand (‚Brand‘, Schulpen et al. 2003). Schulpen und Kollegen machten diesen Befund in einer sogenannten cross-modalen Priming-Studie (siehe Hopp & Schimke in diesem Band). Niederländische Hörer, die gut Englisch konnten, hörten das niederländische Wort brand (das Primewort) und mussten gleich danach entscheiden, ob das auf einem Bildschirm gezeigte englische Wort brand (das Zielwort) ein bestehendes Wort im Englischen ist oder nicht. Reaktionszeiten dieser lexikalen Entscheidung waren schneller, wenn Primewort und Zielwort die gleiche phonologische Struktur hatten, als wenn nur Teile der Worte phonologisch überlappten. Das deutet darauf hin, dass beide Sprachen während der Erkennung des Zielwortes aktiviert wurden. Ähnliches wurde zuvor bereits für die visuelle Worterkennung gezeigt (Dijkstra, van Jaarsveld & ten Brinke 1998).Während in der Schriftsprache der Buchstabe t im Englischen und Deutschen zum Beispiel der gleiche ist und somit keinen Hinweis auf die Sprache gibt, kommt es bei Lauten nur sehr selten vor, dass sie in zwei Sprachen vorkommen und genau gleich ausgesprochen werden (der Laut /t/ wird zum Beispiel im Deutschen in der Regel behaucht und im Englischen nicht). Insofern könnte das akustische Signal genügend Hinweise geben, in welcher Sprache ein Wort gesprochen wurde, und die unnötige Aktivierung von Wörtern aus der anderen Sprache könnte vermieden werden. Tatsächlich konnten die niederländischen Hörer in Schulpen et al. (2003) Unterschiede in der Aussprache des englischen und des niederländischen Wortes brand sehr wohl hören. Dennoch konnten diese sprachspezifischen akustischen Unterschiede nicht verhindern, dass beide Sprachen bei der englischen lexikalen Entscheidung aktiviert wurden. Auch wenn diese Studien nicht konkret zum Deutschen sind (es gibt de facto nur sehr wenige psycholinguistische Studien zur Worterkennung im Deutschen), gibt es keinen Grund zur Annahme, dass Vergleichbares nicht auch im Deutschen stattfindet. Man könnte nun an den oben genannten Studien kritisieren, dass zum einen sowohl die L1 als auch die L2 in den Experimenten präsent waren und dadurch die
58
Andrea Weber und Mirjam Broersma
gleichzeitige Aktivierung beider Lexika gefördert wird. Zum anderen könnte man argumentieren, dass einzelne Wörter (und Nicht-Wörter) hören und entscheiden, ob es sich um ein Wort handelt oder nicht, nicht ist, was wir tun, wenn wir Sprache außerhalb des Labors hören. Beide Punkte können umgangen werden in sogenannten Eyetracking-Studien (siehe Hopp & Schimke in diesem Band). In Eyetracking-Studien werden die Blicke auf visuell gezeigte Objekte aufgenommen, während Versuchsteilnehmer Sprache hören. Das Sprachsignal bezieht sich in der Regel auf eines oder mehrere der gezeigten visuellen Objekte. Man nützt hierbei die Tatsache, dass Hörer automatisch und sehr schnell auf die Objekte blicken, die im Sprachsignal genannt werden (Cooper 1974). Eyetracking eignet sich für Forschung zu gesprochener Worterkennung im Allgemeinen, da keine metalinguistische Aufgabe von den Versuchsteilnehmern zu erfüllen ist und somit die Testsituation natürlicher ist. Im Besonderen eignet sich Eyetracking für Forschung zu Worterkennung in der L2, da es möglich ist, die Aktivierung von Sprachen zu messen, ohne dass diese explizit präsent sind.Weber & Cutler (2004) zeigten so zum Beispiel, dass niederländische Hörer mit guten Englischkenntnissen ihr niederländisches Lexikon zusammen mit ihrem englischen Lexikon beim Erkennen von englischen Wörtern aktivieren. Niederländischen Versuchspersonen wurden auf dem Bildschirm vier Bilder von Objekten gezeigt, und sie wurden über Kopfhörer auf Englisch aufgefordert, auf ein bestimmtes Bild zu klicken. Gezeigt wurden zum Beispiel desk (‚Schreibtisch‘), lid (‚Deckel‘), pillow (‚Kissen‘), und strawberry (‚Erdbeere‘; siehe Abbildung 1): Die vier Objektnamen hatten keinerlei phonologische Ähnlichkeit im Englischen. Auf Niederländisch heißt das englische Wort lid allerdings deksel, und deksel hat einen ähnlichen Wortanfang wie das englische desk. Deksel könnte also ein niederländischer Wettbewerbskandidat sein beim Erkennen des englischen Wortes desk. Und in der Tat, wenn die niederländischen Hörer aufgefordert wurden, auf das Zielobjekt desk zu klicken, blickten sie öfter auf das Bild des Deckels als auf die beiden Distraktoren pillow und strawberry. Wie man in Abbildung 2 sehen kann, gehen eindeutig die meisten Blicke im Lauf der Zeit zum Zielobjekt desk, das heißt, das englische Zielwort wurde richtig erkannt. Gleichzeitig kann man aber auch sehen, dass zumindest für einen gewissen Zeitraum mehr Blicke zu dem Wettbewerber lid gingen als zu den Distraktoren pillow und strawberry. Da es nur im Niederländischen eine phonologische Überlappung des Wettbewerbers mit dem Zielwort gibt, legen diese Ergebnisse nahe, dass das niederländische Lexikon während der Erkennung englischer Wörter aktiviert wurde. Im Gegensatz zu den oben beschriebenen Priming-Studien überlappten das englische Zielwort desk und der niederländische Kompetitor deksel nicht vollständig. Das heißt, für die Aktivierung des L1-Lexikons reicht offensichtlich auch eine teilweise Überlappung (Spivey & Marian 1999). Da in dieser Studie nur Bilder gezeigt wurden und die
Die Erkennung gesprochener Wörter in einer L2
59
Abbildung 1: Beispielbildschirm wie in Weber & Cutler (2004, Experiment 3) mit englischem Zielobjekt „desk“, niederländischem Kompetitor „deksel“, und zwei Distraktoren („pillow“ und „strawberry“).
niederländischen Namen der gezeigten Objekte nie genannt wurden, kann man darüber hinaus davon ausgehen, dass die parallele Aktivierung des erstsprachlichen Lexikons nicht an die offene Präsenz der L1 gebunden ist.
Abbildung 2: Fixationsproportionen im Zeitverlauf ab Zielwortanfang in Weber & Cutler (2004, Experiment 3).
60
Andrea Weber und Mirjam Broersma
Interessanterweise scheint die Aktivierung beider Lexika auch nicht beschränkt zu sein auf die Modalität der Sprache. Das heißt, auch wenn zwei Sprachen in ihrer Inputstruktur nicht überlappen, gibt es parallele Aktivierung. Dies wurde von Shook & Marian (2012) in einer Eyetracking-Studie mit bilingualen Versuchsteilnehmern gezeigt, die sowohl Englisch als auch die amerikanische Gebärdensprache beherrschten. Die beiden Sprachen unterscheiden sich in ihrer Modalität und in ihrem phonologischen System. Bimodale bilinguale Hörer fixierten während der Erkennung englischer Wörter Wettbewerberbilder, die in der Phonologie der Gebärdensprache mit dem Zielwort überlappten, mehr als Distraktorenbilder ohne Überschneidungen (e. g., cheese, ‚Käse‘, und paper, ‚Papier‘, überlappen nicht in der Phonologie gesprochener Sprache, teilen sich aber die phonologischen Merkmale Handform, Ort und Orientierung in der Gebärdensprache). Das bedeutet, dass die parallele Aktivierung beider Lexika nicht modalitätsspezifisch ist. Zusammenfassend kann gesagt werden, dass für L2-Hörer das Set von Kandidaten, die während der Worterkennung aktiviert werden, nicht auf Wörter, die in der L2 phonologisch ähnlich sind, beschränkt ist, sondern es um Wörter aus der L1, die mit dem Sprachinput phonologisch übereinstimmen, erweitert ist. Diese parallele Aktivierung beider Lexika erweitert das Kandidatenset und verlangsamt den Worterkennungsprozess. Noch nicht geklärt ist nun, ob zumindest das L2Kandidatenset das gleiche ist, das Muttersprachler aktivieren würden.
1.2 Wörter aus dem L2-Lexikon L2-Hörer leiden auch unter größerer lexikaler Aktivierung, die aus der L2 selbst kommt. Sie sind weniger effizient als Muttersprachler darin, unbeabsichtigte Wörter zu deaktivieren, sogar wenn das Sprachsignal aus Lauten besteht, die für L2-Hörer nicht besonders schwierig sind. Das zeigt sich indirekt in Forschungsergebnissen, die belegen, dass L2-Hörer stärker als L1-Hörer von Nachbarschaftsdichte (neighborhood density) beeinflusst werden. Die Nachbarschaftsdichte eines Wortes gibt an, wie viele Wörter es im Lexikon gibt, die phonologisch sehr ähnlich sind. Zum Beispiel sind Vase, Hose, und Habe Nachbarn von Hase, da sie sich von Hase in nur einem Laut unterscheiden. Sowohl L1-Hörer als auch L2Hörer finden es schwieriger, Wörter zu erkennen, die eine hohe Nachbarschaftsdichte im Vergleich zu Wörtern haben, die eine niedrige Nachbarschaftsdichte aufweisen. Für L2-Hörer ist dieser Unterschied jedoch deutlich ausgeprägter (Bradlow & Pisoni 1999). Ein weiterer unmittelbarer Nachweis dafür, dass L2-Hörer weniger effizient darin sind unbeabsichtigte Wörter zu deaktivieren, kommt von einer Studie von Rueschemeyer, Nojack & Limbach (2008). Sie beobachteten in
Die Erkennung gesprochener Wörter in einer L2
61
einer cross-modalen Priming-Studie, dass russische Lerner des Deutschen das deutsche Wort Fisch lange genug aktivieren um seine Bedeutung und Wortassoziationen abzurufen, wenn sie das Wort Tisch in dem Satz Der Tisch wurde am Nachmittag geangelt hören. Deutsche Hörer zeigen diese ausgeprägte Aktivierung nicht. Interessanterweise aktivieren russische Hörer das unbeabsichtigte Wort Fisch, obwohl sie problemlos den Unterschied zwischen Fisch und Tisch im Deutschen hören können.
1.3 Wörter mit schwierigen Lauten aus dem L2 Lexikon Unterschiede zwischen ähnlich klingenden Wörtern in der L2 wahrzunehmen ist nicht immer einfach für L2-Hörer. Das liegt daran, dass die Wahrnehmung von Lauten in der L2 oft inakkurat ist (z. B., Bohn & Munro 2007). Besonders die Unterscheidung von L2-Lautkontrasten, die in der L1 keine Rolle spielen, kann dauerhaft erschwert sein und nie den Standard der L1 erreichen. Für japanische Hörer ist es zum Beispiel bekanntermaßen schwierig den Unterschied zwischen einem englischen /r/ und /l/ wahrzunehmen; beide Laute lassen sich (schlecht) auf den am nächsten verwandten japanischen Laut abbilden, der phonetisch zwischen dem englischen /r/ und /l/ liegt. Niederländische und deutsche Hörer haben dagegen Schwierigkeiten, den Unterschied zwischen dem englischen /æ/ (der Vokal in cat, ‚Katze‘) und /ɛ/ (der Vokal in desk, ‚Schreibtisch‘) wahrzunehmen. Diese perzeptuellen Schwierigkeiten mit L2-Lauten beeinträchtigen die Worterkennung in der L2 auf mindestens dreierlei Art und Weise. Erstens kann die Unterscheidung zwischen Minimalpaaren verloren gehen. Niederländische Lerner des Englischen behandeln Minimalpaare wie flash (‚Blitz‘) und flesh (‚Fleisch‘) nicht als zwei Wörter; vielmehr führt das Hören von flash auch zur Aktivierung von flesh (Cutler & Broersma 2005). Den gleichen Effekt zeigen spanisch-katalanische Bilinguale, die beide Sprachen früh gelernt haben, wenn sie katalanische Minimalpaare hören, die sich in einem Laut unterscheiden, der im Spanischen nicht kontrastiv ist (Pallier, Colomé & Sebastián-Gallés 2001). Das ist jedoch kein sehr häufig auftretendes Problem. Die Anzahl von Minimalpaaren ist in den meisten Sprachen relativ klein, vor allem wenn man sie vergleicht mit der Anzahl von Homophonen (z. B. Seite-Saite), mit denen Hörer sowieso zurechtkommen müssen (Cutler 2005). Ein Zuwachs an lexikalem Wettbewerb aufgrund von Fehlinterpretationen in Minimalpaaren kommt demnach nur sehr selten vor. Die zweite Art und Weise der Beeinträchtigung von Worterkennung ist, dass unterschiedliche Wortanfänge als identische Wortanfänge behandelt werden, wenn perzeptuell schwierige Laute involviert sind. Wie eingangs beschrieben, werden zunächst alle Wörter mit überlappenden Anfängen während der Wort-
62
Andrea Weber und Mirjam Broersma
erkennung aktiviert. Das heißt, wenn englische L1-Hörer die erste Silbe des Wortes panda (‚Panda‘) hören, aktivieren sie nicht nur panda, sondern auch panel (‚Panele‘), panic (‚Panik‘), pantry (‚Vorratskammer‘) usw. Sobald jedoch mehr als die erste Silbe gehört wird, nimmt die Aktivierung der nicht mehr passenden Wortkandidaten ab, und zu dem Zeitpunkt, an dem das ganze Wort panda gehört wurde, ist keine Aktivierung der inkorrekten Kandidaten mehr messbar. Für L2Hörer ist das anfängliche Kandidatenset um Wörter erweitert, die sich in ihrem Anfang in einem perzeptuell schwierigen Laut unterscheiden. Der erste Vokal /æ/ in panda ist für niederländische Hörer schwer von dem Vokal /ɛ/, wie er in der ersten Silbe von pencil (‚Bleistift‘) vorkommt, zu unterscheiden. Für niederländische Hörer aktiviert deshalb die erste Silbe des englischen Wortes panda zusätzlich Wörter wie pencil, penny (‚Pfennig‘), und pension (‚Pension‘): Gezeigt wurde dieser Effekt unter anderem von Weber & Cutler (2004) in einer EyetrackingStudie. Niederländische Hörer mit guten Englischkenntnissen sahen auf einem Bildschirm das Bild des Zielwortes panda, das Bild des Kompetitors pencil und zwei weitere Distraktorenbilder, die phonologische keine Ähnlichkeit mit dem Zielwort hatten. Während sie das Zielwort panda hörten, blickten sie relativ lange auf das panda Bild und auf das pencil- Bild, bevor sie sich für panda entschieden. Ihre Blicke waren deutlich länger als die von englischen Hörern in der gleichen Situation und auch deutlich länger als bei Wortpaaren, deren Vokale leicht zu unterscheiden sind, wie etwa in beetle (‚Käfer‘) – bottle (‚Flasche‘): In gleicher Weise führt das Hören von rocket (‚Rakete‘) zur lexikalen Aktivierung von locker (‚Spind‘) für japanische Lerner des Englischen (Cutler,Weber & Otake 2006). Da die phonologische Überlappung in diesen Fällen nur den Wortanfang betrifft (panda und pencil haben distinkte zweite Silben), führt die anfängliche Unsicherheit jedoch nicht zu einer dauerhaften Fehlinterpretation, welches Wort gehört wird. Dennoch verlangsamt die erweiterte Verfügbarkeit von irrtümlichen Interpretationen die Worterkennung in der L2. Analysen des englischen Wortschatzes haben gezeigt, dass diese Art von Verwechslung oft vorkommt und substantiellen Zuwachs an lexikalem Wettbewerb für L2-Hörer bedeutet (Cutler 2005). Interessanterweise konnten Escudero, Hayes-Harb & Mitterer (2008) zeigen, dass diese Schwierigkeiten gemindert werden können, wenn beim Erlernen neuer L2-Wörter auch Informationen über die Schreibweise mitgelernt werden. Die dritte Art und Weise, auf die Worterkennung durch Schwierigkeiten in der Lautwahrnehmung beeinträchtigt wird, ist, dass Teile eines Wortes oder mehrerer Wörter mit einem anderen Wort verwechselt werden, das der Sprecher überhaupt nicht geäußert hat. Wenn englische L1-Hörer das Wort definite (‚bestimmt‘) hören, aktivieren sie temporär auch das eingebettete Wort deaf (‚schwerhörig‘). Für L2Hörer kann dieser Fall auch vorkommen, wenn das Sprachsignal gar kein eingebettetes Wort enthält. Das heißt, niederländische Hörer, die das englische Wort
Die Erkennung gesprochener Wörter in einer L2
63
daffodil (‚Narzisse‘; mit dem ersten Vokal /æ/) hören, aktiveren auch das nicht eingebettete Wort deaf (mit dem Vokal /ɛ/); für englische L1-Hörer ist das nicht der Fall (Broersma & Cutler 2011). Gezeigt wurde dies in einer cross-modalen PrimingStudie, in der das Beinahewort daf (extrahiert aus einer Aufnahme des Wortes daffodil) als Prime gehört wurde und anschließend eine lexikale Entscheidung für das visuell gezeigte Wort deaf getroffen werden musste. Niederländische L2-Hörer, aber nicht englische L1-Hörer, trafen die lexikale Entscheidung für deaf schneller im Vergleich zu einem phonologisch unrelatierten Primewort, wenn das Primewort daf war. In ähnlicher Weise aktivieren niederländische L2-Hörer, die in ihrer Sprache keinen Unterschied machen zwischen einem stimmhaften und einem stimmlosen Konsonanten am Wortende, das englische Wort groove (‚Rinne‘) wenn sie die Sequenz biG ROOFs (‚große Dächer‘) hören (Broersma & Cutler 2008). Auch spanisch-katalanische Bilinguale unterscheiden nicht akkurat zwischen katalanischen Wörtern und Beinahe-Wörtern, die sich nur in einem katalanischen Lautkontrast unterscheiden (Sebastián-Gallés, Echeverria & Bosch 2005). Nicht nur die Wahrnehmung einzelner Laute kann in der L2 schwierig sein, sondern auch die Wahrnehmung von sprachlichen Phänomenen, die über einzelne Segmente hinausgehen (die sogenannten Suprasegmentale). Auch hier konnte gezeigt werden, dass Schwierigkeiten bei der Wahrnehmung die Worterkennung beeinträchtigen. Im Spanischen zum Beispiel gibt es Minimalpaare, die sich nur in der Platzierung der Betonung unterscheiden (ein analoges deutsches Beispiel sind die Verben Übersetzen, ‚durchschiffen‘ und überSEtzen, ‚dolmetschen‘). Im Französischen dagegen wird Akzent nicht kontrastiv verwendet. Französische Lerner des Spanischen haben große Schwierigkeiten Beinahewörter wie gorró als Wort abzulehnen, wenn es ein existierendes spanisches Wort gibt, das sich nur in der Position des Akzentes unterscheidet (górro, ‚Hut‘; Dupoux et al. 2008). L2-Hörer werden schlussendlich das Missverständnis lösen, da bei einer falschen Interpretation des Sprachsignals bedeutungslose Reste übrigbleiben (z. B., eine Person die deaf in daffodil hört wird zurückbleiben mit der bedeutungslosen Sequenz -odil), aber dennoch kostet der Umweg Zeit in der Verarbeitung. Auch hier hat eine Analyse des englischen Wortschatzes gezeigt, dass das Problem der beinahe eingebetteten Wörter sehr häufig vorkommt (Cutler 2005).
2 Wörter in Isolation versus Kontext In allen oben beschriebenen Studien wurden Wörter entweder in Isolation oder in einem minimalen neutralen Satzkontext (z. B., Click on the …, ‚Klicke auf …‘) getestet. Man kann argumentieren, dass die parallele Aktivierung der L1- und L2Lexika in so einer Situation begünstigt wird, da theoretisch die Sprache mit jedem
64
Andrea Weber und Mirjam Broersma
Einzelwort wechseln könnte. Natürlich bietet im Prinzip das akustische Signal eines einzelnen Wortes genügend Hinweise darauf, in welcher Sprache ein Wort gesprochen wurde und könnte somit die unnötige Aktivierung von Wörtern aus der anderen Sprache verhindern, dennoch bleibt die Möglichkeit, dass am Ende von längeren Äußerungen die parallele Aktivierung abnimmt. Die akustischen Hinweise auf die Zielsprache häufen sich, und es wurden bereits mehrere Wörter in der Zielsprache erkannt. Ebenso kann es sein, dass nur ein Kandidat aus der Zielsprache semantisch zum vorangehenden Satzkontext passt. Tatsächlich scheinen L2-Hörer hier von einem längeren Kontext zu profitieren. Mehrere Studien haben belegt, dass die parallele Aktivierung des L1-Lexikons in Satzkontexten abnimmt, in denen ein L1-Kandidat semantisch inkongruent ist (z. B., Chambers & Cooke 2009; FitzPatrick & Indefrey 2010). Chambers & Cooke (2009) ließen etwa in einer Eyetracking-Studie englische Lerner des Französischen französische Sätze hören (z. B., Marie va nourrir la poule, ‚Marie wird das Huhn füttern‘), während sie mehrere Objekte auf dem Bildschirm sahen; darunter war das Zielobjekt poule und ein englischer Kompetitor pool (‚Schwimmbecken‘). Englische L2-Hörer fixierten den Kompetitor pool deutlich weniger in einem inkongruenten Satzkontext wie Marie va nourrir la poule (Schwimmbecken kann man in der Regel nicht füttern) im Vergleich zu einem neutralen Kontext wie Marie va décrire la poule (‚Marie wird das Huhn beschreiben‘). Dennoch wurde auch in einem semantisch inkongruenten Satzkontext der cross-linguale Wettbewerber immer noch mehr fixiert als phonologisch unrelatierte Distraktoren. Vergleichbares wurde auch in Lesestudien gefunden (z. B., Duyck et al. 2007; van Assche, Duyck & Hartsuiker 2012). Das bedeutet, dass die parallele Aktivierung beider Lexika in Satzkontexten zwar reduziert ist, sie aber immer noch messbar ist und die Worterkennung verlangsamt.
3 Segmentierung des Sprachstroms in der L2 Die phonologische Ähnlichkeit von Wörtern innerhalb einer Sprache und auch über Sprachen hinweg wäre vermutlich nicht so ein schwerwiegendes Problem, wenn Anfang und Ende von gesprochenen Wörtern genauso deutlich markiert wären wie in vielen Schriftsprachen. In vielen Schriftsprachen markieren Leerzeichen den Anfang und das Ende eines Wortes. Die gesprochene Sprache hingegen ist ein kontinuierlicher Strom von Lauten, und Hörer müssen selbst den Sprachstrom in erkennbare Einheiten (das heißt, in Wörter) segmentieren. Abbildung 3 zeigt das Spektrogramm und den Schwingungsverlauf des englischen Satzes the sun began to rise (‚Die Sonne begann aufzugehen‘). Wie man in Abbildung 3 sieht, korrespondieren Pausen im Sprachsignal nicht unbedingt mit
Die Erkennung gesprochener Wörter in einer L2
65
Wortgrenzen; zum Beispiel gibt es keine Pause zwischen the sun, wohl aber eine innerhalb des Wortes began. Dies führt dazu, dass Wörter auch über Wortgrenzen hinweg eingebettet sein können (z. B., ant, ‚Ameise‘, ist eingebettet in began to):
Abbildung 3: Spektrogramm und Schwingungsverlauf des englischen Satzes „The sun began to rise“.
Da Pausen in gesprochener Sprache regelmäßig innerhalb von Wörtern vorkommen und zwischen Wörtern oft fehlen, müssen Hörer andere Informationen nützen, um Wortgrenzen in einer gesprochenen Äußerung ausfindig zu machen. Diese Informationsquellen können zum einen die rhythmische Struktur und phonotaktische Regeln sein, zum anderen aber auch lexikales Wissen und phonetische Details. In ihrer L2 sind Hörer oft weniger effizient darin, diese sprachspezifischen Informationsquellen zur Segmentierung zu nutzen, vor allem, weil Segmentierungsstrategien aus der L1 interferieren.
3.1 Rhythmische Struktur Eine Strategie, die Hörern hilft, den kontinuierlichen Sprachstrom zu segmentieren, basiert auf der spezifischen rhythmischen Struktur ihrer L1. Im Englischen und im Niederländischen, zum Beispiel, beginnen die meisten Wörter mit einer betonten Silbe; L1-Hörer dieser Sprachen nutzen Betonung, um Wortgrenzen zu finden. Englische L1-Hörer finden das Wort mint (‚Minze‘) zum Beispiel langsamer, wenn es in zwei betonten Silben (wie in mintayve) eingebettet ist, als wenn das eingebettete Wort gefolgt wird von einer unbetonten Silbe mit einem reduzierten
66
Andrea Weber und Mirjam Broersma
Vokal (wie in mintef; Cutler & Norris 1988). Ähnliche Segmentierungsstrategien von L1-Hörern wurden für silbenzeitliche und morazeitliche Sprachen wie das Französische und das Japanische gefunden (Cutler et al. 1986; Sebastián-Gallés et al. 1992). In ihrer L2 tendieren Hörer dazu, die Segmentierungsstrategien zu benutzen, die sie aus ihrer L1 kennen. Französische Hörer verwenden die silbenzeitliche Segmentierungsstrategie, die für das Französische angemessen ist, auch, wenn sie Englisch hören, und englische Hörer verwenden die silbenzeitliche Segmentierung nicht, wenn Sie Französisch hören (Cutler et al. 1986). Genauso verwenden englische und französische Hörer weiter ihre L1-Segmentierungsstrategien, wenn sie Japanisch hören (Otake et al. 1993).
3.2 Phonotaktische Regeln Einschränkungen von Lautfolgen innerhalb einer Silbe (sogenannten phonotaktische Regeln) sind eine weitere Informationsquelle, die Hörer zur Segmentierung nutzen (für Forschung zu L1-Hörern siehe McQueen 1998). Im Englischen etwa ist die Sequenz /sl/, wie in sleep (‚schlafen‘), ein legaler Silbenanfang, aber /ʃl/ und /ml/ sind nicht legal, da es kein Wort und keine Silbe gibt, die mit schl oder ml beginnt. Während eine Silbengrenze zwischen /s/ und /l/ möglich, aber nicht zwingend ist, markieren die Sequenzen /ʃl/ und /ml/ eindeutig Silbengrenzen zwischen dem ersten und zweiten Laut und möglicherweise auch eine Wortgrenze. Im Deutschen dagegen muss es eine Silbengrenze zwischen /s/ und /l/ und zwischen /m/ und /l/ geben, aber nicht zwischen /ʃ/ und /l/ (es gibt Wörter wie schlafen). Deutsche L2-Hörer mit sehr guten Englischkenntnissen verwenden im Englischen deutsche und englische phonotaktische Regeln, um den Sprachstrom zu segmentieren. Ihre Kennnisse der englischen phonotaktischen Regeln helfen ihnen das englische Wort lunch (‚Mittagessen‘), in glarshlunch zu entdecken (/ʃl/ erfordert im Englischen eine Silbengrenze zwischen den Lauten), aber ihre interferierenden Kenntnisse der deutschen phonotaktischen Regeln führen auch zu einem schnelleren finden von lunch in moycelunch (Weber & Cutler 2006). Gezeigt wurde dies in einer sogenannten Wortentdeckungsaufgabe (word spotting task). Versuchsteilnehmer hören zweisilbige nonsense Sequenzen wie foomlunch und drücken einen Knopf, wenn sie darin ein eingebettetes echtes Wort entdecken. Reaktionszeiten zeigen, dass eingebettete Wörter schneller gefunden werden, wenn ihr Beginn mit einer phonotaktisch eindeutig markierten Silbengrenze zusammenfällt (McQueen, Norris & Cutler 1994).
Die Erkennung gesprochener Wörter in einer L2
67
3.3 Lexikales Wissen Ein Wort zu erkennen, hilft Hörern ein anderes Wort zu finden. Wenn Hörer ein Wort finden, das sie kennen, vor allem bei einem längeren Wort, das vermutlich kein Teil eines anderen Wortes ist, erwarten sie, dass ein neuer Wortanfang direkt folgt. Wenn also englische Hörer anythingcorri hören, erwarten sie, dass corri (wie in corridor, ‚Gang‘) der Anfang eines neuen Wortes ist, das dem Wort anything (‚irgendetwas‘) folgt. Sowohl L1-Hörer als auch L2-Hörer nutzen dieses lexikale Wissen zur Segmentierung (White, Melhorn & Mattys 2010). Die Vorteile sind jedoch für L2-Hörer geringer als für L1-Hörer (Mattys et al. 2010). Das kann damit zusammenhängen, dass L2-Hörer üblicherweise weniger Wörter kennen als L1Hörer und unsicherer sind, welche Teile des Sprachstroms ein Wort sind und welche nicht.
3.4 Phonetische Details Laute werden in der Regel mit feinen phonetischen Unterschieden ausgesprochen, die auch Informationen zu Wortgrenzen liefern können. Im Englischen etwa wird der Laut /t/ mit Behauchung (aspiration) in der Phrase keeps talking (‚redet weiter‘) aber ohne Behauchung in keep stalking (‚weiter anschleichen‘) ausgesprochen. Diese phonetischen Unterschiede in der Aussprache des Lautes /t/ sind sogenannte allophonische Signale. Beide Phrasen bestehen aus den gleichen Lauten; englische L1-Hörer nutzen jedoch die Unterschiede in der Behauchung, um zu entscheiden, ob sie keeps talking oder keep stalking gehört haben (Church 1987). L2-Hörer können diese Informationen nicht effizient nutzen. Ito & Strange (2009) beobachteten zum Beispiel, dass japanische Lerner des Englischen Schwierigkeiten haben, allophonische Signale zur Wortsegmentierung zu nutzen. Ihre Fähigkeit, Behauchung und glottale Stopkonsonanten (die etwa Englisch ice cream, ‚Eis‘, von I scream, ‚ich schreie‘, unterscheiden) wahrzunehmen und zu nutzen, nahm allerdings mit steigender Dauer des Aufenthalts in einer englischsprachigen Umgebung zu. Altenberg (2005) fand ähnliche Schwierigkeiten für spanische Lerner des Englischen.
4 Sprachfertigkeitseffekte Die eben beschriebenen Ergebnisse von Ito & Strange (2009) weisen darauf hin, dass der Kenntnisstand in der L2 einen Einfluss darauf haben kann, wie effizient Hörer die L2 verarbeiten können. Das macht intuitiv Sinn, doch muss man be-
68
Andrea Weber und Mirjam Broersma
denken, dass in allen in diesem Kapitel beschriebenen Studien der Kenntnisstand der Versuchsteilnehmer in der L2 hoch bis sehr hoch war. Die Versuchsteilnehmer hatten in der Regel mindestens fünf bis sieben Jahre formale Instruktionen in der L2 (in der Schule) oder wuchsen bereits als Kind mit beiden Sprachen auf. Die meisten der angewandten psycholinguistischen Methoden erfordern einen hohen Kenntnisstand in der Testsprache (ansonsten wäre etwa die Entscheidung, ob ein Wort in der L2 ein Wort ist oder nicht in einer lexikalen Aufgabe nur eine Zufallsentscheidung). Dennoch ließen sich in allen Fällen Einflüsse der L1 auf die L2Verarbeitung messen. Wie sieht es nun aber mit der L1-Verarbeitung aus? Leidet diese auch unter einer parallelen Aktivierung der L2? Die Forschungslage ist hier nicht eindeutig. Spivey & Marian (1999) beobachteten zum Beispiel, dass russische Lerner des Englischen nicht nur Aktivierung des russischen Lexikons während der Worterkennung im Englischen zeigten, sondern auch Aktivierung des englischen Lexikons, während Wörter in der L1 Russisch gehört wurden. Weber & Cutler (2004) fanden dagegen keinen Einfluss der L2 auf die L1 (das heißt, niederländische Lerner des Englischen aktivierten keine englischen Wortkandidaten, während sie niederländische Wörter hörten): Der Unterschied in den Ergebnissen könnte erklärt werden mit Unterschieden im täglichen Gebrauch der L1. Während die russischen Hörer in Spivey & Marian (1999) seit Jahren in Amerika lebten, wohnten die niederländischen Hörer in Weber & Cutler (2004) zum Zeitpunkt der Studie in den Niederlanden. CansecoGonzalez et al. (2010) fanden in einer Eyetracking-Studie mit englischen Lernern des Spanischen nur schwache Aktivierung der L2 während der Worterkennung in der L1. Der Effekt wurde jedoch stärker, je jünger die Teilnehmer waren, als sie anfingen ihre L2 zu lernen (age of acquisition). Schließlich kann man noch sagen, dass die parallele Aktivierung von Lexika nicht auf zwei Sprachen beschränkt ist. Auch beim Erlernen einer dritten Sprache spielen die L1 und die L2 eine Rolle. So haben Escudero, Broersma & Simon (2013) unter anderem gezeigt, dass der Zusammenhang zwischen Lautwahrnehmung in der Fremdsprache und Worterkennung auch in der L3 mit all seinen Konsequenzen bestehen bleibt. Für das Lesen haben Lemhöfer, Dijkstra & Michel (2004) einen vergleichbaren Vorteil für Kognaten gefunden, wie er bereits für L2-Leser gefunden wurde.
5 Zusammenfassung und Diskussion Wörter in der L1 zu erkennen ist einfacher als Wörter in einer L2 zu erkennen, die man später im Leben gelernt hat. Natürlich ist es besonders schwer und manchmal sogar unmöglich, wenn man nur ein eingeschränktes Vokabular in der L2 hat. Aber
Die Erkennung gesprochener Wörter in einer L2
69
auch wenn ein Hörer alle Wörter kennt und generell sehr gut in der L2 ist, bleibt es dennoch schwerer, Wörter in der L2 als in der L1 zu erkennen. Obwohl L1-Hörern meist die komplexen Prozesse der Worterkennung nicht bewusst sind, merken L2Hörer oft schmerzlich, wie komplex die Aufgabe ist, Sprache zu verstehen. Die Schwierigkeiten in der L2-Worterkennung sind generell noch ausgeprägter in geräuschvollen Hörsituationen, wie wenn zum Beispiel ein L2-Hörer versucht, einer Unterhaltung in einer vollen Kneipe zu folgen (Golestani, Rosen & Scott 2009). Wie oben beschrieben ist ein wichtiger Faktor, der für die Schwierigkeiten des L2-Hörens verantwortlich ist, die Tatsache, dass für L2-Hörer während des Erkennens mehr Wörter im Wettbewerb zueinander stehen als für L1-Hörer. Für L2Hörer ist das Set von möglichen Wortkandidaten vervielfacht durch parallele Aktivierung von Wörtern aus der L1, die L1-Sprecher der Zielsprache nicht berücksichtigen würden, zusätzlich zu Wörtern aus der L2. Die Prozesse der lexikalen Aktivierung und des Wettbewerbs werden bestimmt durch phonologische Überlappungen zwischen dem Sprachinput und den Wörtern im mentalen Lexikon. Aber in der L2 bekommt die Bedeutung der phonologischen Überlappung noch eine ganz andere Bedeutung, da L2-Hörer auch da Überlappungen wahrnehmen, wo gar keine sind. Wichtig ist, dass die Verlangsamung in der L2-Worterkennung durch zusätzliche lexikale Aktivierung nicht auf L2-Lerner mit einem niedrigen oder mittlerem Sprachniveau in der L2 beschränkt ist. In allen oben genannten Studien war das Sprachniveau der Teilnehmer in der L2 hoch bis sehr hoch. Manche Studien haben zwar gezeigt, dass die parallele Aktivierung des erstsprachlichen Lexikons mit steigendem Sprachniveau abnimmt, aber sie bleibt immer messbar. Ebenso ist die parallele Aktivierung nicht nur für Einzelwörter messbar, sondern auch für längere Äußerungen, selbst wenn diese semantisch den L1-Wettbewerber unpassend erscheinen lassen (Chambers & Cooke 2009). Das bedeutet, dass die L1 immer präsent ist und man vor diesem Hintergrund überlegen sollte, ob es sinnvoll ist, beim instruierten Spracherwerb die L1 im Unterricht auszuschließen. Aus der psycholinguistischen Forschung wissen wir, dass auch während der Wortproduktion die L1 mitaktiviert ist und vor allem sogenannte Kognaten (Wörter mit ähnlicher Form und Bedeutung in zwei Sprachen wie englisch house und deutsch Haus) von dieser parallelen Aktivierung profitieren (Gollan et al. 2007). Zumindest für den Aspekt des L2-Lexikonerwerbs scheint es demnach natürlich, die L1 zuzulassen. Ein weiterer Faktor, der dazu beiträgt, dass Worterkennung in der L2 mühsamer ist, ist die Tatsache, dass L2-Hörer weniger effizient darin sind, den kontinuierlichen Sprachstrom in Einzelworte zu segmentieren. Für L1-Hörer wird diese Aufgabe erleichtert durch zahlreiche Hinweise im Signal auf mögliche Wortgrenzen wie etwa rhythmische Signale, phonotaktische Beschränkungen, lexi-
70
Andrea Weber und Mirjam Broersma
kales Wissen und phonetische Details. Obwohl L2-Hörer diese Signale zu einem gewissen Maße auch verwerten können, können sie es oft nicht so erfolgreich wie L1-Hörer. Positiv gesehen könnte man aber schlussfolgern, dass zu wissen, dass L2Hörer überhaupt lernen können, Segmentierungsstrategien der L2 zu nutzen, darauf hinweist, dass diese Prozesse prinzipiell der Instruktion, wie sie im Sprachunterricht stattfinden könnte, zugänglich sind. Auch wenn nur wenige der oben beschriebenen Studien Deutsch als L1 oder L2 verwendeten, gibt es guten Grund zu der Annahme, dass genau die gleichen Schwierigkeiten mit Deutsch als Zielsprache auftauchen. Die grundlegenden Mechanismen. mit denen gesprochene Sprache verarbeitet wird, sind universal, und es gibt keinen Hinweis darauf, dass diese sich prinzipiell zwischen Sprachen unterscheiden würden. Was sich zwischen Sprachen unterscheidet, ist die Sprachstruktur, und L1-Hörer haben gelernt sich auf ihre Sprache und deren informationstragende Elemente einzustellen. Eine Ursache dafür, wieso es Schwierigkeiten im L2-Hören gibt, liegt also darin, dass die Hörer bereits gelernt haben ihre L1 zu sprechen und zu verstehen, und diese Erfahrung mit der L1 interferiert mit dem Erwerb der L2 (Birdsong 1999). Kleine Kinder stellen ihre Wahrnehmung sehr früh auf die Charakteristika ihrer L1 ein, um die Sprachverarbeitung so effizient wie möglich zu machen. Wenn dann später eine L2 gelernt wird,wird das Verstehen der L2 durch die Spezialisierung auf die L1 erschwert. Inwieweit sich die erste und zweite Sprache in ihrer Sprachstruktur ähnlich sind, bestimmt somit auch, wie leicht oder schwer der Erwerb und die Verarbeitung der L2 sein wird. Dennoch kann es für den L2-Erwerb auch Vorteile bringen, bereits eine L1 erlernt zu haben. Erwachsene L2-Lerner besitzen eine Fülle von linguistischem und nicht-linguistischem Wissen, das sie in die Aufgabe des L2-Lernerns einbringen können. Zum Beispiel besitzen sie ein Set von phonemischen Kategorien, die teilweise mit der L2 überlappen werden, ebenso verstehen sie etwas von Wörtern und deren Strukturierung, sie haben konzeptuelle Repräsentationen für konkrete und abstrakte Objekte, und sie können orthographisches Wissen nutzen, um neue Wortformen zu lernen. L2-Lerner können all diese Quellen für die Aufgabe des Lernens nutzen, wie zum Beispiel Forschung zur Nutzung von orthographischen Informationen beim Erlernen neuer L2-Wörter gezeigt hat (Escudero et al. 2008; Kaushanskaya & Marian 2009). Zum Glück scheint auch die Kapazität für implizites Lernen für erwachsenes L2-Lernen größer zu sein, als man früher dachte. Erwachsene Lerner können, nachdem sie wenige Minuten einer fremden Sprache zugehört haben, erfolgreich segmentales, phonotaktisches und lexikales Wissen aus dieser Sprache extrahieren (Gullberg et al. 2010). Des Weiteren profitieren L2-Hörer von ihrem L1-Wissen, wenn sie die L2 mit einem fremdsprachlichen Akzent gesprochen hören. Vor allem, wenn der L2-
Die Erkennung gesprochener Wörter in einer L2
71
Sprecher den gleichen Sprachhintergrund wie der L2-Hörer hat (das heißt, dieselbe L1 spricht), können L2-Hörer die Wörter leichter erkennen. Russische Lerner des Hebräischen erkennen hebräische Wörter mit einem russischen Akzent schneller als hebräische Wörter mit einem arabischen Akzent (Leikin et al. 2009), und niederländische Lerner des Englischen erkennen niederländisch-akzentuiertes Englisch schneller als japanisch-akzentuiertes Englisch (Weber, Broersma & Aoyagi 2010) oder auch als deutsch-akzentuiertes Englisch (Hanulíková & Weber 2012). Diese Ergebnisse werden als langfristige Anpassung an den Akzent, den die L2-Hörer am häufigsten wahrnehmen, interpretiert. Die Flexibilität der lexikalen Verarbeitung von L2-Hörern muss noch weiter untersucht werden. Aus der Forschung mit L1-Hörern gibt es inzwischen vielfache Belege für ein dynamisches Verhalten bei der Erkennung von gesprochenen Wörtern. Die Fähigkeit von L1-Hörern, sich kurzfristig an sprecher- und sprachspezifische Aspekte der Sprache anzupassen (zum Beispiel Anpassung an eine schlechte Telefonverbindung, an einen Sprecher mit einem Sprachfehler, oder an einen regionalen Dialekt) und ihre Fähigkeit zu langfristigem Lernen (für einen Übersichtsartikel siehe zum Beispiel, Cristia et al. 2012), muss nun für L2-Hörer im Detail erforscht werden. Die Ergebnisse dieser Forschung werden uns über individuelle Unterschiede im Sprachlernen Aufschluss geben, und werden uns Einblicke in das Zusammenspiel von Flexibilität und Stabilität im Spracherkennungssystem geben.
Literaturangaben Altenberg, Evelyn (2005): The perception of word boundaries in a second language. Second Language Research 21, 325 – 358. Birdsong, David (1999): Whys and why nots of the critical period hypothesis for second language acquisition. Mahwah, NJ: Erlbaum. Bohn, Ocke-Schwen & Murray Munro (2007): Language Experience in Second Language Speech Learning: In Honor of James Emil Flege. Amsterdam: John Benjamins. Bradlow, Ann & David Pisoni (1999): Recognition of spoken words by native and non-native listeners: Talker-, listener-, and item-related factors. Journal of the Acoustical Society of Amerika 106, 2074 – 2085. Broersma, Mirjam & Anne Cutler (2008): Phantom word activation in L2. System: An International Journal of Educational Technology and Applied Linguistics 36, 22 – 34. Broersma, Mirjam & Anne Cutler (2011): Competition dynamics of second-language listening. The Quarterly Journal of Experimental Psychology 64, 74 – 95. Bultena, Sybrine & Ton Dijkstra (2013): Lexical access in bilingual visual word recognition. In Cari Chapelle (Hrsg.), The Encyclopedia of Applied Linguistics: Blackwell Publishers. Canseco-Gonzalez, Enriqueta, Laurel Brehm, Cameron Brick, Sarah Brown-Schmidt, Kara Fischer & Katie Wagner (2010): Carpet or cárcel: the effect of age of acquisition and
72
Andrea Weber und Mirjam Broersma
language mode on bilingual lexical access. Language and Cognitive Processes 25, 669 – 705. Chambers, Craig & Hilary Cooke (2009): Lexical competition during second-language listening: Sentence context, but not proficiency, constrains interference from the native lexicon. Journal of Experimental Psychology: Learning, Memory, and Cognition 35, 1029 – 1040. Church, Ken (1987): Phonological parsing and lexical retrieval. Cognition 25, 53 – 69. Cooper, Roger (1974): The control of eye fixation by the meaning of spoken language: A new methodology for the real-time investigation of speech perception, memory, and language processing. Cognitive Psychology 6, 84 – 107. Cristia, Alejandrina, Amanda Seidl, Charlotte Vaughn, Rachel Schmale, Ann Bradlow & Caroline Floccia (2012): Linguistic processing of accented speech across the lifespan. Frontiers in Psychology 3, 479. Cutler, Anne (2005): The lexical statistics of word recognition problems caused by L2 phonetic confusion. Proceedings of the 9th European Conference on Speech Communication and Technology, Lisbon. Cutler, Anne & Mirjam Broersma (2005): Phonetic precision in listening. In William Hardcastle & Janet Beck (Hrsg.), A Figure of Speech: A Festschrift for John Laver, 63 – 91 Mahwah, NJ: Erlbaum. Cutler, Anne, Jacques Mehler, Dennis Norris & Juan Seguí (1986): The syllable’s differing role in the segmentation of French and English. Journal of Memory and Language 25, 385 – 400. Cutler, Anne & Dennis Norris (1988): The role of strong syllables in segmentation for lexical access. Journal of Experimental Psychology: Human Perception and Performance 14, 113 – 121. Cutler, Anne, Andrea Weber & Takashi Otake (2006): Asymmetric mapping from phonetic to lexical representations in second-language listening. Journal of Phonetics, Journal of Phonetics 34, 269 – 284. Dijkstra, Ton, Henk van Jaarsveld & Sjoerd ten Brinke (1998): Interlingual homograph recognition: Effects of task demands and language intermixing. Bilingualism: Language & Cognition 1, 51 – 66. Dupoux, Emanuel, Núria Sebastián-Gallés, Eduardo Navarrete & Sharon Peperkamp (2008): Persistent stress ’deafness’: The case of French learners of Spanish. Cognition 106, 682 – 706. Duyck, Wouter, Eva van Assche, Denis Drieghe & Robert Hartsuiker (2007): Visual word recognition by bilinguals in a sentences context: evidence for nonselective lexical access. Journal of Experimental Psychology: Learning, Memory, and Cognition 33, 663 – 679. Escudero, Paola, Mirjam Broersma & Ellen Simon (2013): Learning words in a third language: effects of vowel inventory and language proficiency. Language and Cognitive Processes 28, 746 – 761. Escudero, Paula, Rachel Hayes-Harb & Holger Mitterer (2008): Novel second-language words and asymmetric lexical access. Journal of Phonetics 36, 345 – 360. FitzPatrick, Ian & Peter Indefrey (2010): Lexical competition in nonnative speech comprehension. Journal of Cognitive Neuroscience 22, 1165 – 1178. Gaskell, Gareth & William Marslen-Wilson (2002): Representation and competition in the perception of spoken words. Cognitive Psychology 45, 220 – 266.
Die Erkennung gesprochener Wörter in einer L2
73
Golestani, Narly, Stuart Rosen & Sophie Scott (2009): Native-language benefit for understanding speech-in-noise: The contribution of semantics. Bilingualism: Language and Cognition 12, 385 – 392. Gollan, Tamar, Christine Fennema-Notestine, Rosa Montoya & Terry Jernigan (2007): The bilingual effect on Boston Naming Test performance. Journal of the International Neuropsychological Society 13, 197 – 208. Gullberg, Marianne, Leah Roberts, Christine Dimroth, Kim Veroude & Peter Indefrey (2010): Adult language learning after minimal exposure to an unknown natural language. Language Learning 60, 5 – 24. Hanulíková, Adriana & Andrea Weber (2012): Sink positive: Linguistic experience with th-substitutions influences non-native word recognition. Attention, Perception and Psychophysics 74, 613 – 629. Ito, Kikuyo & Winifred Strange (2009): Perception of allophonic cues to English word boundaries by Japanese second language learners of English. Journal of the Acoustical Society of America 125, 2348 – 2360. Kaushanskaya, Margarita & Viorica Marian (2009): Bilingualism reduces native-language interference during novel-word learning. Journal of Experimental Psychology: Learning, Memory, and Cognition 35, 829 – 835. Kroll, Judith & Cari Bogulski (2013): Organization of the second language lexicon. In Carol Chapelle (Hrsg.), The Encylopedia of Applied Linguistics: Blackwell Publishers. Leikin, Mark, Raphiq Ibrahim, Zohar Eviatar & Shimon Sapir (2009): Listening with an accent: Speech perception in a second language by late bilinguals. Journal of Psycholinguistic Research 38, 447 – 457. Lemhöfer, Kristin, Ton Dijkstra & Marije Michel (2004): Three languages, one ECHO: Cognate effects in trilingual word recognition. Language and Cognitive Processes 19, 585 – 611. Mattys, Sven, Lucy Carroll, Carrie Li & Sonia Chan (2010): Effects of energetic and informational masking on speech segmentation by native and non-native speakers. Speech Communication 52, 887 – 899. McClelland, James (1991): Stochastic interactive processes and the effect of context on perception. Cognitive Psychology 23, 1 – 44. McQueen, James (1998): Segmentation of continuous speech using phonotactics. Journal of Memory and Language 39, 21 – 46. McQueen, James, Dennis Norris & Anne Cutler (1994): Competition in spoken word recognition: spotting words in other words. Journal of Experimental Psychology: Learning, Memory, and Cognition 20, 621 – 638. Norris, Dennis & James McQueen (2008): Shortlist B: A Bayesian model of continuous speech recognition. Psychological Review 115, 357 – 395. Norris, Dennis, James McQueen & Anne Cutler (1995): Competition and segmentation in spoken-word recognition. Journal of Experimental Psychology: Learning, Memory, and Cognition 21, 1209 – 1228. Otake, Takashi, Giyoo Hatano, Anne Cutler & Jaques Mehler (1993): Mora or syllable? Speech segmentation in Japanese. Journal of Memory and Language 32, 258 – 278. Pallier, Christophe, Angels Colomé & Núria Sebastián-Gallés (2001): The influence of native-language phonology on lexical access: Exemplar-based versus abstract lexical entries. Psychological Science 12, 445 – 449.
74
Andrea Weber und Mirjam Broersma
Rueschemeyer, Shirley-Ann, Agnes Nojack & Maxi Limbach (2008): A mouse with a roof? Effects of phonological neighbors on processing of words in sentences in a non-native language. Brain and Language 104, 113 – 121. Schulpen, Béryl, Ton Dijkstra, Herbert Schriefers & Mark Hasper (2003): Recognition of interlingual homophones in bilingual auditory word recognition. Journal of Experimental Psychology: Human Perception and Performance 29, 1155 – 1178. Sebastián-Gallés, Núria, Emanuel Dupoux, Juan Seguí & Jacques Mehler (1992): Contrasting syllabic effects in Catalan and Spanish. Journal of Memory and Language 31, 18 – 32. Sebastián-Gallés, Núria, Sagrario Echeverria & Laura Bosch (2005): The influence of initial exposure on lexical representation: Comparing early and simultaneous bilinguals. Journal of Memory and Language 52, 240 – 255. Shook, Anthony & Viorica Marian (2012): Bimodal bilinguals co-activate both languages during spoken comprehension. Cognition 124, 314 – 324. Spivey, Michael & Viorica Marian (1999): Cross talk between native and second languages: Partial activation of an irrelevant lexicon. Psychological Science 10, 281 – 284. van Assche, Eva, Wouter Duyck & Robert Hartsuiker (2012): Bilingual word recognition in a sentence context. Frontiers in Psychology 3. doi: 10.3389/fpsyg.2012.00174 Weber, Andrea, Mirjam Broersma & Makiko Aoyagi (2010): Spoken-word recognition in foreign-accented speech by L2 listeners. Journal of Phonetics 39, 479 – 491. Weber, Andrea & Anne Cutler (2004): Lexical competition in non-native spoken-word recognition. Journal of Memory and Language 50, 1 – 25. Weber, Andrea & Anne Cutler (2006): First-language phonotactics in second-language listening. Journal of the Acoustical Society of America 119, 597 – 607. White, Laurence, James Melhorn & Sven Mattys (2010): Segmentation by lexical subtraction in Hungarian speakers of second-language English. The Quarterly Journal of Experimental Psychology 63, 544 – 554. Zwitserlood, Pienie. (1989): The locus of the effects of sentential-semantic context in spoken-word processing. Cognition 32, 25 – 64.
Denisa Bordag und Thomas Pechmann
Genuserwerb und -verarbeitung in einer L2 Grammatisches Genus ist eine morphosyntaktische Kategorie, nach der im Deutschen die Substantive in drei Gruppen, Maskulina (m), Feminina (f) und Neutra (n), klassifiziert werden. Im Gegensatz zu etwa Deklinationsklassen oder sogenannten Klassifikatoren in anderen Sprachen wirkt sich das Genus auf die Formen anderer Wörter aus (im Deutschen auf Artikel, Adjektive und einige Pronomen), die mit dem entsprechenden Substantiv in Kongruenz stehen (Corbett 2013). Obwohl das Genus mit dem Sexus, dem biologischen Geschlecht, bei Personen und manchen Tieren in der Regel übereinstimmt, ist die Genuszuweisung in den weitaus meisten Fällen arbiträr. Damit stellt der Erwerb des grammatischen Genus für Deutschlerner eine erhebliche Lernschwierigkeit dar. Obwohl es einige typische semantische oder phonologische Hinweise gibt (vgl. Köpcke 1982; Köpcke & Zubin 1984; Zubin & Köpcke 1981, 1986), die es dem Lerner ermöglichen können, das grammatische Genus des Substantivs von seiner Bedeutung oder seiner morpho-phonologischen Form abzuleiten, sind diese im Deutschen nur begrenzt verlässlich. Mit der Ausnahme der Derivationssuffixe (z. B. -keit, -ling, -ment), die eine eindeutige Genuszuweisung ermöglichen, sind die anderen Genusregeln im Deutschen eher probabilistisch und als solche im DaZ/DaF-Unterricht nur eingeschränkt hilfreich (siehe unten). Eine andere Lernschwierigkeit ergibt sich aus dem Umstand, dass Genus nicht in allen Sprachen vorkommt oder nicht durch dieselbe Anzahl von Kategorien ausgedrückt wird. Neben Sprachen ohne Genussystem (z. B. Ungarisch, Finnisch, Türkisch), gibt es Sprachen mit zwei (z. B. Französisch, Spanisch, Hebräisch), drei (z. B. Deutsch, Russisch, Polnisch, Tschechisch) oder vier und mehr (z. B. Zande und einige andere afrikanische Sprachen) Genuskategorien. Dazu kommt, dass bei Sprachen, die über dieselben Genuskategorien verfügen (beispielsweise Feminin, Maskulin, Neutrum wie im Deutschen), die Genus-Substantiv-Zuweisung in vielen Fällen nicht identisch ist (z. B. Kerze (f) und svíčka (f), vs. Burg (f) und hrad (m) im Deutschen und Tschechischen). Lerner mit unterschiedlichen Muttersprachen beginnen daher den Genuserwerb im Deutschen mit höchst unterschiedlichen Voraussetzungen. In diesem Beitrag beschäftigen wir uns zunächst mit der Frage, wie grammatisches Genus mental repräsentiert ist, wobei wir uns primär auf das Sprachproduktionsmodell von Levelt, Roelofs & Meyer (1999) beziehen. Im Folgenden thematisieren wir die Frage bilingualer Sprachverarbeitung und der Interaktion Denisa Bordag und Thomas Pechmann, Universität Leipzig DOI 10.1515/9783110456356-004
76
Denisa Bordag und Thomas Pechmann
von zwei Sprachen auf den verschiedenen Sprachverarbeitungsebenen. Schließlich gehen wir auf das Problem ein, wie Genus in einer L2 verarbeitet wird. Ein zentraler Aspekt dabei ist, inwieweit es Transfer bzw. Interferenz zwischen den Genera verschiedener Sprachen gibt und welche Rolle die Wortform bei der Genuszuweisung und -verarbeitung spielt.
1 Mentale Repräsentation von Genus Das wohl aktuell einflussreichste Modell der mentalen Repräsentation lexikaler Einheiten in der Sprachproduktion ist das von Levelt, Roelofs & Meyer (1999), das zwei Ebenen der Repräsentation unterscheidet, eine semantisch-syntaktische Ebene und eine Wortformebene. Diese Unterscheidung geht auf Garrett (1975, 1978) zurück und gilt als allgemein anerkannt. Die semantisch-syntaktische Ebene wird auch als Lemma-Ebene bezeichnet. Lemmas stellen syntaktisch-grammatische Information über die lexikalen Einheiten zur Verfügung. Zu diesen Informationen gehören etwa die Wortkategorie, die Valenz von Verben, aber auch das grammatische Genus von Nomen. Für Genus wird in dem Modell angenommen, dass es generische Knoten für die Genuskategorien einer Sprache gibt, im Deutschen also für Feminin, Maskulin und Neutrum. Jedes Lemma eines Nomens ist mit seinem zuständigen generischen Knoten verbunden. Der Genusknoten wird automatisch aktiviert, wenn das entsprechende Lemma aktiviert wird, aber nur dann selegiert, wenn Genus für die weitere Verarbeitung tatsächlich benötigt wird (vgl. Roelofs, Meyer & Levelt 1998), etwa wenn ein Determinierer ausgewählt oder Kongruenz mit einem Adjektiv hergestellt werden muss (vgl. die Befunde von La Heij et al. 1998, auf die unten verwiesen wird). Die Idee generischer Genusknoten wurde vor allem durch den Genuskongruenz-Effekt unterstützt, der von Schriefers (1993) erstmals in Bild-Wort-Interferenz-Experimenten beobachtet wurde. In einem Bild-Wort-Interferenz-Experiment sehen Versuchspersonen Bilder alltäglicher Objekte, die sie so schnell wie möglich benennen sollen. Zusätzlich werden Distraktorwörter präsentiert, die die Versuchspersonen explizit ignorieren sollen, die aber in bestimmten Fällen dennoch die Latenz der Bildbenennung beeinflussen. In den ursprünglichen Experimenten von Glaser & Düngelhoff (1984) zeigte sich, dass semantisch zu dem Bild verwandte Distraktorwörter zu einer Verzögerung der Bildbenennung führten, wenn die Wörter in einem Zeitfenster zwischen 100 ms vor oder 100 ms nach dem Bild gezeigt wurden. In Schriefers Experimenten gehörten die Distraktorwörter entweder derselben Genuskategorie an wie die Bildnamen (kongruente Bedingung) oder einer anderen Kategorie. Seine Ergebnisse zeigten, dass die Benennungslatenzen in den kongruenten Bedingungen systematisch kürzer waren als in
Genuserwerb und -verarbeitung in einer L2
77
den inkongruenten Bedingungen. Das lässt sich mit einem Zwei-Ebenen Modell wie dem von Levelt, Roelofs & Meyer (1999) gut erklären. Im kongruenten Fall wird durch Bild und Distraktorwort derselbe generische Genusknoten aktiviert. Im inkongruenten Fall dagegen werden zwei Genusknoten aktiviert und der inadäquate muss gehemmt werden, was den kognitiven Aufwand erhöht und somit Zeit kostet. Das Modell von Levelt, Roelofs & Meyer (1999) ist ein seriell-modulares Modell, das davon ausgeht, dass die Lemma-Ebene und die Wortformebene nicht miteinander interagieren, bzw. dass es kein Feedback von der Wortformebene zurück zur Lemmaebene gibt. Das ist der wesentliche Unterschied zu einem interaktiven Feedback-Modell wie dem von Dell (1986), das genau diese Interaktion annimmt. Bei Dell kann Wortforminformation Einfluss auf die Lemmaaktivierung haben, nicht aber in dem Modell von Levelt, Roelofs & Meyer (1999). Für die Genusverarbeitung heißt das konkret, dass der Einfluss phonologischer Form auf die Genuszuweisung in einem interaktiven Feedback-Modell leicht zu beschreiben ist. Ein seriell-modulares Modell dagegen nimmt an, dass die Genusinformation nach vollständigem Erwerb einer L1 direkt beim Lemma gespeichert ist, ohne dass auf Wortforminformation zurückgegriffen wird.
2 Zwei Sprachsysteme in einem Kopf Damit der Frage nachgegangen werden kann, wie die Repräsentation und die Verarbeitung von Genus in einer L2 aussieht, muss zunächst kurz erläutert werden, welche Annahmen über die Koexistenz zweier (oder mehrerer) Sprachsysteme bis jetzt gemacht werden. Eine der grundlegenden Fragen zur bilingualen Sprachverarbeitung betrifft den Grad und den Umfang der Interaktion zwischen den Sprachsystemen von L1 und Zweit- oder Fremdsprache sowie jeder weiteren Fremdsprache (L3 etc.). Die meisten Modelle gehen davon aus, dass die L2-Verarbeitung von einem vorher erworbenen L1-System beeinflusst wird. Viele Fragen bleiben indes noch offen, z. B. welche Faktoren den Grad der L2-Aktivierung relativ zur L1 beeinflussen, auf welchen Ebenen die zwei Systeme interagieren oder wie spezielle L2-Merkmale (wie das Genus) repräsentiert sind und wie das die Möglichkeit einer L1-Interferenz bedingt. Es wird weitgehend angenommen, dass L2-Sprecher nicht ein einziges Sprachsystem auswählen, bevor sie z. B. eine lexikalische Suche durchführen, sondern vielmehr, dass sich die Aktivierung in beiden Systemen ausbreitet und beide mentale Lexika simultan aktiviert und durchsucht werden (De Bot 1992; Green 1993; Poulisse & Bongaerts 1994; Hermans et al. 1998; Grosjean 1998, BIA+
78
Denisa Bordag und Thomas Pechmann
Model: Dijkstra & van Heuven 2002). Es wird weiterhin angenommen, dass die Sprachsysteme sich auf unterschiedlichen Stufen der Aktivierung befinden können und dass letztlich die Aktivierung der verwendeten Sprache höher als die Aktivierung der anderen Sprache(n) sein muss (Paradis 1981; Grosjean 1988). Die Faktoren, die den Grad der Aktivierung beeinflussen, sind dabei verschiedene. Grosjean (1997, 1998) nimmt an, dass sich ein mehrsprachiger Sprecher in unterschiedlichen Sprechmodi (language mode) befinden kann abhängig davon, wie stark das L1-System relativ zum L2-System aktiviert ist. Im bilingualen Modus sind beide Sprachen aktiv, aber die Zielsprache ist stärker aktiviert. Sprecher befinden sich beispielsweise in diesem Modus, wenn sie sich mit jemandem unterhalten, mit dem sie Code-Switching durchführen oder mit dem sie zwischen zwei Sprachen frei wechseln können. Während einer solchen Form von Konversation werden Wörter und Phrasen oder Sätze aus beiden Sprachen produziert, obwohl eine stets die Basissprache bleibt. Im Gegensatz dazu ist beim monolingualen Modus auf Grosjeans Kontinuum hauptsächlich eine Sprache aktiv, während die andere zumindest teilweise deaktiviert ist. Für L2-Sprecher wird allerdings angenommen, dass sie nicht umhinkönnen, dass ihre L1 wenigstens zum Teil aktiviert bleibt und damit einen Einfluss auf die L2-Produktion ausübt. Der Grad dieser L1-Aktivierung kann dann die Stärke des L1-Transfers oder der L1-Interferenz bestimmen. Zahlreiche experimentelle Studien belegen die Interaktion zwischen den L1und L2-Systemen auf der semantisch-konzeptuellen und phonologischen Ebene (De Groot 1992; De Groot, Dannenburg & Van Hell 1994; Singleton 1999; Dijkstra, Grainger & van Heuven 1999; Costa, Caramazza & Sebastian-Galles 2000), sodass diese Interaktion allgemein akzeptiert wird. Die Repräsentationen auf der konzeptuellen Ebene sind vorsprachlich und vor allem bei Konkreta wird angenommen, dass ihre Konzepte von den Sprachsystemen geteilt werden, bzw. dass sie in ihren semantischen Merkmalen überlappen (z. B. bei einigen Abstrakta, vgl. Distributed Feature Model, De Groot 1992). Beim Erwerb einer neuen lexikalischen Einheit in der L2 muss also kein neues Konzept erstellt werden, sondern die schon verfügbaren Konzepte werden mit einer neuen Wortform sowie entsprechender sprachspezifischer Information (beispielsweise Genus) auf der Lemmaebene verknüpft. Auf der Ebene der phonologischen Formen sind es dann vor allem Kognate (z. B. calendar und Kalender im Englischen und Deutschen), bzw. deren phonologische Merkmale, die zwischen den Sprachsystemen geteilt werden. Wie für die semantische und phonologische Ebene wird auch für die grammatische Ebene angenommen, dass L1- und L2-Repräsentationen parallel aktiviert werden und dies eine potentielle Quelle interlingualer Interferenz ist. Das grammatische Genus stellt dabei eines der wenigen grammatischen Merkmale dar, bei denen der Einfluss der L1 auf die Verarbeitung in einer L2 systematisch und in mehreren Sprachen untersucht wurde.
Genuserwerb und -verarbeitung in einer L2
79
3 Genusrepräsentation und Verarbeitung in der L2: Einfluss der L1 Die bisherigen Befunde sprechen dafür, dass zumindest in den Fällen, in denen die Anzahl der Genuskategorien in der L1 der Anzahl der Genuskategorien in der Zielsprache entspricht, die muttersprachliche Genusrepräsentation als Basis für die L2-Repräsentation dient. Bordag & Pechmann (2007) führten mehrere Experimente im Deutschen und Tschechischen durch, die diese Annahme belegen (vgl. auch Bordag 2004). In zwei Bildbenennungsexperimenten benannten fortgeschrittene tschechische Lerner des Deutschen Bilder auf Deutsch. Die Bilder wurden entweder nur mit einem Nomen oder mit Adjektiv + Nomen benannt. Während demnach in der ersten Bedingung keine overte genusmarkierte Endung produziert werden musste, hatten die Adjektive eine genusspezifische Endung (mal-ý, ‚kleiner‘, mal-á, ‚kleine‘, mal-é, ‚kleines‘). Die Genera der L1- und der L2-Wörter waren entweder kongruent oder inkongruent. Um optimale Bedingungen für die parallele Aktivierung der L1 zu schaffen, kamen in dem ersten Experiment auch L1-Filler vor, d. h. Bilder, die die tschechischen Versuchspersonen auf Tschechisch benennen sollten. Die Wahl der Sprache wurde durch den Bildhintergrund signalisiert. Damit befanden sich die Versuchspersonen am bilingualen Ende des Kontinuums (Grosjean 1997, 1998) und die Wahrscheinlichkeit interlingualer Interferenz wurde erhöht. Im zweiten Experiment wurden keine L1-Filler verwendet und die Versuchspersonen befanden sich damit am monolingualen Ende des Kontinuums. Mithilfe dieser Manipulation sollte untersucht werden, ob die L2-Genusverarbeitung immer von der L1 beeinflusst wird oder nur in einem Kontext, in dem auch die L1 aktiv verwendet wird. Die Ergebnisse zeigen, dass bei L2-Lernern die interlinguale Interferenz aus der L1 in beiden Fällen nachweisbar war. Die Benennungslatenzen waren signifikant länger in der genus-inkongruenten verglichen mit der genus-kongruenten Bedingung (Genusinterferenzeffekt) unabhängig davon, ob sich die Versuchspersonen in dem bilingualen (Experiment 1), oder in dem monolingualen Modus (Experiment 2) befanden. Darüber hinaus wurde der Genusinterferenzeffekt sowohl bei der Benennung mit Nomen als auch bei der Benennung mit Adjektiv + Nomen beobachtet. Bei der Produktion der Adjektivendungen machten die Probanden in der inkongruenten Bedingung auch mehr Genusfehler. Der Effekt wird wie folgt interpretiert. Wenn beide Nomen dasselbe Genus aufweisen, wie z. B. Kerze (f) und svíčka (f) im Deutschen und Tschechischen, erhält der feminine Genusknoten eine Aktivierung aus zwei Quellen. Wenn in L1 und L2 die Übersetzungsäquivalente allerdings unterschiedliche Genera haben, z. B. Burg (f) und
80
Denisa Bordag und Thomas Pechmann
hrad (m), dann wird durch die L2 (Deutsch) der feminine Genusknoten, durch die L1 (Tschechisch) jedoch der maskuline Genusknoten aktiviert. Der Zielgenusknoten hat dadurch einen hoch aktivierten Konkurrenten, dessen Aktivierung er übertreffen muss, um selegiert zu werden. Dieser längere Selektionsprozess verursacht die längeren Benennungslatenzen. Wenn das Genus aus der L1 stärker aktiviert ist, wird es ausgewählt und der Lerner macht einen Genusfehler. Die Beobachtung, dass das L1-Genus die L2-Genusverarbeitung beeinflusst (vgl. auch Bordag 2006; Lemhöfer, Spalek & Schriefers 2008) ist aus mindestens zwei Gründen wichtig. Erstens zeigt sie, dass die L1- und L2-Systeme auch auf der Ebene der grammatischen Kodierung interagieren. Zweitens unterstützen die Ergebnisse die Annahme einer Genusrepräsentation, bei der (zumindest) Sprachen mit demselben Genussystem (wie Deutsch und Tschechisch) ein Set von generischen Genusknoten teilen. Wenn die zwei Sprachen separate Genusknoten hätten (vgl. Costa et al. 2003), hätte der Umstand, ob ein bestimmtes Wort und sein Übersetzungsäquivalent dasselbe oder ein unterschiedliches Genus haben, keinerlei repräsentationelle oder funktionale Implikationen. Ein Wettbewerb um die Selektion wird nur zwischen Kandidaten erwartet, die einem Merkmalset (bestehend z. B. aus den drei generischen Genusknoten) mit derselben Funktion zugehören. La Heij et al. (1998) haben im L1-Niederländischen keinen GenuskongruenzEffekt gefunden, wenn in einem Bild-Wort-Interferenz-Experiment die Bilder lediglich mit einem Nomen benannt wurden. In der L1 wird die Abwesenheit des Effekts bei bare-noun Benennungen so erklärt, dass in dieser Bedingung das Genus zwar aktiviert, nicht aber selegiert wird, weil es für die weitere Enkodierung nicht gebraucht wird (Roelofs et al. 1998). In den von uns durchgeführten Experimenten mit L1 Tschechisch und L2 Deutsch konnten wir einen GenuskongruenzEffekt jedoch auch bei bare-noun Benennungen beobachten. Das von uns beobachtete abweichende Befundmuster könnte dadurch erklärt werden, dass Übersetzungsäquivalente dasselbe Konzept aktivieren, was zu einer starken Konvergenz der Aktivierung auf dem gemeinsamen Genusknoten (in der kongruenten Bedingung) oder starken Konkurrenz zwischen den entsprechenden Genusknoten (in der inkongruenten Bedingung) auf der Lemmaebene führt. Bei den Bild-WortInterferenz-Experimenten in der L1 dagegen haben die Bilder und die Distraktoren unterschiedliche Repräsentationen, die auch von unterschiedlichen Richtungen aus aktiviert werden (bei Distraktoren anfangend mit den orthographischen Formen, bei Bildern mit Konzepten), was zu einer geringeren Ausprägung von Konvergenz, bzw. Divergenz der Aktivierung an den entsprechenden Genusknoten führen kann. Lerner, deren L1 kein oder kein ausgeprägtes Genussystem aufweist, wie zum Beispiel das Englische, stehen vor einer noch größeren Herausforderung. Einige
Genuserwerb und -verarbeitung in einer L2
81
Autoren nehmen an, dass L2-Lerner nach der sogenannten kritischen Periode (Singleton 2005) keine grammatischen Merkmale mehr erwerben können, die es in ihrer L1 nicht gibt (z. B. Hawkins & Franceschina 2004). Die experimentelle Evidenz ist hier allerdings nicht eindeutig. Tokowicz & MacWhinney (2005) stellten z. B. in einem Experiment, in dem elektrophysiologisch ereigniskorrelierte Potentiale (EKP) gemessen wurden, fest, dass Lerner des Spanischen mit L1 Englisch schon in Anfangsstadien des Spracherwerbs Sensibilität für Genuskongruenzverletzungen zeigen. Die Autoren nehmen an, dass grammatische Eigenschaften, die in der L1 abwesend sind, in der L2 gegebenenfalls sogar schneller erworben werden können als grammatische Eigenschaften, die es in der L1 zwar gibt, die aber im Konflikt mit L2 Parametern stehen. Auch die Studien von Gillon et al. (2010) und Keating (2009) mit L2-Lernern des Spanischen und von Foucart & Frenck-Mestre (2012) mit Lernern des Französischen zeigen eine Sensibilität englischer Muttersprachler für die Genuskongruenz, obwohl auch sie Unterschiede zur muttersprachlichen Performanz festgestellt haben. Zugleich zeigen aber neuere Studien zum prädiktiven Genusgebrauch, dass Lerner mit einer L1 ohne ausgeprägtes Genussystem in Eyetracking (Visual World) Experimenten keine oder nur sehr reduzierte Fähigkeiten zeigen, aufgrund der Genusmarkierung am Determinierer das darauf folgende Nomen zu antizipieren (Grüter, Lew-Williams & Fernald 2012; Dussias et al. 2013). Weiterhin belegen Studien aus jüngerer Zeit, dass cross-linguistische Unterschiede bzw. Ähnlichkeiten in syntaktischen Regeln die Verarbeitung in einer L2 im Allgemeinen und Genuskongruenz im Besonderen beeinflussen. Sabourin & Haverkort (2003) und Sabourin & Stowe (2008) stellten fest, dass die L2-Genusverarbeitung der L1-Genusverarbeitung ähnlicher ist, wenn der Transfer von L1Verarbeitungsroutinen möglich ist und wenn es Regelmäßigkeiten in der Genuszuweisung zwischen L1 und L2 gibt. Ihre Schlussfolgerungen basieren auf EKPDaten von deutschen und romanischen Lernern des Niederländischen. Während es eine (fast perfekte) Eins-zu-eins-Genuskorrespondenz zwischen deutschen und niederländischen Neutra gibt sowie eine Zwei-zu-eins-Korrespondenz zwischen den deutschen Maskulina und Feminina und den Niederländischen Nomen mit de-Artikel, müssen Sprecher des Französischen, Italienischen oder Spanischen eine Eins-zu-viele (bzw. zwei)-Genuszuweisung durchführen. D. h., auch wenn die Anzahl der Genera in den romanischen Sprachen dieselbe wie im Niederländischen ist, ist die Genuszuweisung komplexer als zwischen dem Deutschen und dem Niederländischen. Die Ergebnisse von Sabourin & Stowe (2008) zeigen, dass beide Versuchspersonengruppen für Genuskongruenzverletzungen sensibel waren. Die EKP-Muster der deutschen Muttersprachler waren jedoch denen der niederländischen Muttersprachler ähnlicher. Diese Beobachtung weist darauf hin, dass dieselbe Anzahl von Genera in der L1 und in der L2 allein nicht automatisch
82
Denisa Bordag und Thomas Pechmann
zu einfacherem Genuserwerb führt, verglichen mit der Situation, wenn sowohl die L1 auch als die L2 eine unterschiedliche Anzahl von Genera haben. Weitere Studien zeigen, dass die Ähnlichkeiten bzw. Unterschiede in der morphosyntaktischen Realisierung der Genuskongruenz zwischen der L1 und der L2 ebenfalls eine Rolle spielen. Foucart & Frenck-Mestre (2011) verglichen die Sensibilität französischer Muttersprachler und fortgeschrittener Lerner des Französischen mit L1 Deutsch bei Genusverletzungen in unterschiedlichen morphosyntaktischen Kontexten. Während die EKP-Ergebnismuster bei Singular-Nominalphrasen bestehend aus einem Artikel und Nomen in L1 und L2 Französisch gleich waren, unterschieden sich die L1 und L2 Ergebnismuster bei Plural-Nominalphrasen, die aus einem (genus-unmarkierten) Artikel, einem (genus-markierten) Adjektiv (entweder voran- oder nachgestellt) und einem Nomen bestanden: In den letzteren Kontexten zeigten die Lerner keine Sensibilität für die Genusverletzungen. Die Autoren hypothetisieren, dass der Unterschied in den Ergebnissen zwischen den Kontexten entweder auf generell größeren Erwerbsschwierigkeiten bei Adjektivkongruenz beruht (auch z. B. Sabourin & Haverkort 2003), oder durch die Tatsache bedingt ist, dass die deutschen Nominalphrasen im Plural keine Genuskongruenz aufweisen und dieser Unterschied zu französischen Nominalphrasen im Plural dann zu Genus-Verarbeitungsschwierigkeiten führt. Insgesamt lässt sich zusammenfassen, dass grammatische Strukturen und Merkmale schneller und richtiger erworben und verarbeitet werden, wenn die Merkmale und/oder grammatischen Regeln von L1 und L2 nicht im Konflikt stehen (Foucart & Frenck-Mestre 2012).
4 Genusrepräsentation und -verarbeitung in der L2: Einfluss der Wortform Die Sprachen der Welt unterscheiden sich nicht nur in Bezug auf die Existenz eines Genussystems, bzw. in der Anzahl der Genuskategorien, sondern auch in Bezug auf den Grad der Transparenz ihrer Wortform bezüglich des grammatischen Genus. Während z. B. im Spanischen das grammatische Genus aus der Wortform relativ zuverlässig abgeleitet werden kann (Maskulina enden auf einem Konsonanten oder -o, Feminina auf -a), ist dies im Deutschen nur sehr begrenzt möglich. Wie bereits erwähnt, bilden hier derivierte Substantive eine Ausnahme: Derivationssuffixe sind in der Regel ein eindeutiger Genushinweis, der dank seiner Zuverlässigkeit für die Lerner eine wichtige Hilfe ist.
Genuserwerb und -verarbeitung in einer L2
83
Bei monomorphemischen Substantiven gibt es im Deutschen in den allermeisten Fällen keine eindeutige Beziehung zwischen dem Wortauslaut und dem grammatischen Genus. Allerdings gibt es signifikante Korrelationen, die z. B. Köpcke & Zubin (1983) für die Klasse monomorphemischer, einsilbiger Nomen herausgearbeitet haben (z. B. sind solche Wörter, die mit einem Konsonantencluster anfangen und enden, wie Knopf, tendenziell Maskulina). Für mehrsilbige monomorphemische Nomen ist die wichtigste Regel, für die es dennoch viele Ausnahmen gibt, dass Nomen, die auf -e enden, feminin sind (vgl. aber der Käse, das Auge u. ä.). Eine Untersuchung des Einflusses des Wortauslautes auf den Genusabruf in unterschiedlichen Sprachen kann weitere Einblicke in die L1- und L2-Grammatikverarbeitung liefern. Die Ergebnisse der bisherigen Forschung zu diesem Thema sind nicht eindeutig, besonders in der L1. Studien des tip-of-the-tongue Phänomens im Italienischen haben zuverlässig zeigen können, dass die Fähigkeit, das Genus zu benennen, unabhängig vom partiellen Zugriff auf Wortforminformationen war (Badecker, Miozzo & Zanuttini 1995; Miozzo & Caramazza 1997; Vigliocco, Antonini & Garrett 1997). Auch andere Studien berichten von keinen Wortauslauteffekten (z. B. Taraban & Kempe 1999). Dies gilt besonders für Experimente, in denen die Aufmerksamkeit nicht notwendig auf das Genus gerichtet ist, wie z. B. bei cued shadowing oder bei Grammatikalitätsurteilen (Bates et al. 1995; Andonova et al. 2004; Taft & Meunier 1998). Andererseits liefern Aufgaben, die eine bewusste Genusentscheidung erfordern wie Genus Monitoring (Andonova et al. 2004; Taft & Meunier 1998; MacWhinney et al. 1989), Evidenz dafür, dass morpho-phonologische Information den Zugriff auf das Genus beeinflusst (Taft & Meunier 1998; Gollan & Frost 2001; Holmes & Segui 2004; Spalek et al. 2008). Diese Befunde werden durch neuere EKP-Experimente unterstützt (z. B. Caffarra, Janssen & Barber 2014, Caffarra & Barber 2015). Die Untersuchungen von Caffarra & Barber (2015) zeigten unterschiedliche zentral-frontale Negativität für Nomen mit einem eindeutigen und einem bezüglich des Genus ambigen Wortauslaut beim Lesen in der L1 Spanisch. Die Ergebnisse sprechen dafür, dass das Sprachverarbeitungssystem zuverlässige formale Genushinweise am Nomen schnell entdecken kann. Entsprechende Ergebnisse für diesen Bereich in der L2-Forschung sind spärlich, dafür aber eindeutiger. Die wenigen durchgeführten (hauptsächlich offline) Studien haben ergeben, dass L2-Lerner sensibel für Genusmarkierungen in der L2 sind, insbesondere beim Wortauslaut (Taraban & Roark 1996; Taraban & Kempe 1999; Oliphant 1998; Holmes & De la Batie 1999). In mehreren Experimenten zum Deutschen als L1 oder L2 mit englischen, tschechischen und deutschen Muttersprachlern (Bordag, Opitz & Pechmann 2006; Bordag & Pechmann 2007) haben wir untersucht, ob die phonologische Struktur
84
Denisa Bordag und Thomas Pechmann
eines Wortes die Genusselektion auf der grammatischen Ebene bei der Bildbenennung beeinflusst. Vor dem Hintergrund der probabilistischen Beziehung zwischen Wortform und Genus im Deutschen (vgl. Köpcke & Zubin 1983) wurden drei Gruppen von deutschen Substantiven zusammengestellt: 1) genus-typische Nomen (feminine Nomen, die auf -e enden, z. B. die Blume), 2) genus-atypische Nomen (maskuline und neutrale Nomen, die auf -e enden, z. B. der Käse oder das Auge, sowie Feminina, die auf einem Konsonanten enden, z. B. die Burg) und 3) ambige Nomen (maskuline und neutrale Nomen, die auf einem Konsonanten enden, für die diese Endung gleich wahrscheinlich ist, z. B. der Tisch oder das Buch). Verwendet wurden zwei experimentelle Methoden: Bildbenennung und Grammatikalitätsurteile. Bilder bekannter Objekte wurden entweder lediglich mit einem Nomen oder mit einem Größenadjektiv + Nomen benannt. Grammatikalitätsurteile mussten zu solchen Phrasen gefällt werden, die ein Demonstrativpronomen mit einer falschen Genusendung beinhalteten, die jedoch typisch für den Auslaut des Substantivs war (z. B. *diese Auge) oder ein Demonstrativpronomen mit einer falschen Genusendung, die atypisch für den Auslaut des Substantivs war (z. B. *dieses Blume). Darüber hinaus kamen in dem Experiment auch gleich viele korrekte Phrasen als Filler vor. Die durchgeführten Experimente ergaben eindeutige Ergebnisse. Es gab keinen Effekt des Substantivauslauts im Deutschen als L1, weder bei der Bildbenennung noch bei den Grammatikalitätsurteilen. Andererseits wurde ein robuster Effekt in der L2 beobachtet, sowohl bei tschechischen als auch bei englischen Muttersprachlern, bei der Bildbenennung ebenso wie bei der Grammatikalitätsentscheidung. Die Versuchspersonen waren am schnellsten (und machten die wenigsten Fehler), wenn sie in der L2 genusmarkierte Nominalphrasen produzierten bzw. beurteilten, die aus der genus-typischen Gruppe kamen, und am langsamsten (mit den meisten Fehlern), wenn der Kopf der Nominalphrase ein Substantiv mit einer genus-atypischen Endung war. Die L2-Daten zeigen, dass die phonologische Form der Substantive die Genusselektion auf der grammatischen Ebene beeinflusst. Sie unterstützen daher ein Modell, welches eine Interaktion auf den Ebenen der phonologischen und grammatischen Enkodierung annimmt,wie z. B. das interaktive Aktivationsmodell von Dell (1986) oder in diesem Zusammenhang das Independent Network Model von Caramazza (1997). Im Gegensatz dazu spricht das Fehlen eines Genustransparenz-Effekts in den L1-Ergebnissen für modulare Modelle der Sprachproduktion wie das von Levelt, Roelofs & Meyer (1999), welches annimmt, dass der Selektionsprozess auf der grammatischen Ebene abgeschlossen ist, bevor die phonologische Kodierung stattfindet. Diese modulare Verarbeitung geht davon aus, dass phonologische Merkmale die Selektionsprozesse auf der höheren Ebene der grammatischen Kodierung nicht beeinflussen.
Genuserwerb und -verarbeitung in einer L2
85
Unsere Daten zeigen, dass es einen beträchtlichen Unterschied in der Stärke der Beeinflussung durch die phonologische Form eines Substantivs auf die Genusverarbeitung zwischen L1 und L2 gibt. Während die Zuweisung von Nomen zu ihrem Genus bei L1-Sprechern des Deutschen hochautomatisiert ist und nicht mehr auf phonologische Information zurückgreift, wird diese von L2-Sprechern durchaus genutzt. Unsere tschechischen und englischen Versuchspersonen hatten deutlich weniger Erfahrung mit dem Deutschen als die L1-Sprecher. Daher könnte ihre Performanz einen früheren Zeitpunkt in der Kompetenzentwicklung von Muttersprachlern abbilden. Mit anderen Worten, L1- und L2-Sprecher benutzen möglicherweise dieselben Lernmechanismen, um grammatisches Genus zu erwerben, sie befinden sich jedoch auf unterschiedlichen Stufen der Lernkurve. In jedem Fall ist davon auszugehen, dass die Bedeutung phonologischer Information für die Zuweisung eines Nomens zu einer Genuskategorie sprachspezifisch ist. Falls die Länge der Lernerfahrung der ausschlaggebende Faktor beim Erlernen eines Genussystems ist, sollten die Daten von L2-Lernern den Daten von Kindern im L1-Erwerb ähneln. Und tatsächlich gibt es eine Reihe von Studien, die zeigen, dass Kinder Schwierigkeiten mit opak genusmarkierten Substantiven in verschiedenen Erstsprachen haben (Mills 1986 für Deutsch; Henzel 1975 für Tschechisch; Smoczyńska 1985 für Polnisch; Unsworth et al. 2011 für Griechisch und Niederländisch). Parallele Ergebnisse wurden auch von Studien berichtet, die den Genuserwerb in künstlichen Sprachen untersucht haben (Brooks et al. 1993; Frigo & McDonald 1998; Braine 1987). Sowohl Erwachsene als auch Kinder zeigten bessere Lernergebnisse für Nomen mit transparenter phonologischer Markierung. Die Autoren schlussfolgerten, dass das Lernen eines Genussystems umso einfacher ist, je eindeutiger die Beziehung zwischen den Genuskategorien und phonologischen Merkmalen ist. Experimente mit konnektionistischen Simulationen, die die Entwicklung der Sprachkompetenz im Bereich Genus in Abhängigkeit von der Dauer und Häufigkeit des Kontaktes mit diesbezüglichem Sprachmaterial betrachten (Taraban & Kempe 1999) unterstützen ebenfalls die Hypothese, dass L1- und L2-Genusverarbeitung nicht grundsätzlich unterschiedlich sind. Sowohl Kinder als auch L2-Lerner reagieren sensibel auf die phonologische Form eines Substantivs und diese Information spielt dann eine Rolle beim Genusabruf. Erwachsene L1-Sprecher scheinen eine Erwerbsstufe erreicht zu haben, bei der entweder die phonologische Form normalerweise keine Rolle mehr spielt oder eine so geringe, dass ihr Einfluss mit den hier beschriebenen Methoden nicht messbar war. Die Forschung mit Pseudowörtern, Lehnwörtern und niedrigfrequenten Wörtern hat indes gezeigt, dass hier sogar L1-Sprecher die phonologische Form eines Wortes als Hinweis auf sein Genus benutzen (einen Überblick gibt Corbett 1991). Diese Wörter haben innerhalb der L1 einen ähnlichen Status wie L2-
86
Denisa Bordag und Thomas Pechmann
Wörter im Wortschatz eines L2-Lerners. Sie sind unbekannt oder sehr niedrigfrequent, der Sprecher besitzt keine Erfahrung mit deren Umgang und die Dauer eines vorherigen Kontaktes ist begrenzt oder fehlt.
5 Zusammenfassung: Modellierung In Bezug auf die Modellierung der Genusverarbeitung in L1 und L2 kann man von einem Übergang von einem Mechanismus, der sich an der phonologischen Form orientiert, hin zu einem Mechanismus, bei dem der Wortauslaut kaum oder gar keine Rolle beim Genusabruf mehr spielt, ausgehen. Entsprechend dieser Hypothese benutzt das Sprachsystem eines wenig fortgeschrittenen Lerners phonologische Hinweise während der Genusselektion, und dieser Mechanismus unterstützt gleichzeitig den Erwerb (einiger) grammatischer Merkmale. Zumindest in dieser Phase wird das Genus nicht als feststehendes Merkmal mit jedem Substantiv gemeinsam gespeichert, sondern wird jedes Mal neu berechnet auf der Basis von phonologischen, morphologischen, semantischen oder anderen verfügbaren Informationen, einschließlich der Information über das L1-Genus des passenden L2-Übersetzungsäquivalentes. Die überzeugendsten Belege für diese Behauptung lieferte ein Experiment mit tschechischen L2-Deutschlernern (Bordag & Pechmann 2007). In diesem Experiment wurde sowohl eine Genusinterferenz durch die L1 als auch der intrasprachliche Transparenzeffekt festgestellt. Mit zunehmender Sprachkompetenz, durch mehr Sprachkontakt und wachsende Erfahrung mit der Sprache wird die Verknüpfung mit dem korrekten Genusknoten stärker, während die anderen Verknüpfungen, die zuvor zur Unterstützung bei der Genusknotenselektion nötig waren, schwächer werden oder ganz verschwinden könnten (siehe auch Hall & Ecke 2003). Dies ist möglicherweise charakteristisch für einen Übergang von einem System, das auf einer jeweils neuen Berechnung beruht, hin zu einem System, das auf einer feststehenden Speicherung von grammatischen Merkmalen wie dem Genus basiert. Die verschiedenen Sprachproduktionsmodelle scheinen für unterschiedliche Stufen des Spracherwerbs unterschiedlich gut geeignet zu sein. Während sich mit einem modularen Modell wie dem von Levelt, Roelofs & Meyer (1999) die vollständig erworbene Verarbeitung von Sprache adäquat beschreiben lässt, lassen sich interaktive Feedback-Modelle gut auf frühere Stufen des Erwerbsprozess anwenden. In letzteren Modellen werden nicht nur top-down, sondern auch bottom-up Prozesse zwischen den Stufen der phonologischen Kodierung (hier wird Information über die phonologische Form des Wortes kodiert) und der grammatischen Kodierung (hier wird der passende Genusknoten selegiert) angenommen. So erlaubt der Feedback-Mechanismus dieser Modelle, dass die Information z. B. über den
Genuserwerb und -verarbeitung in einer L2
87
Wortauslaut die Genusselektion auf der grammatischen Ebene beeinflusst, weil deren Prozesse noch nicht abgeschlossen sind, bevor eine phonologische Form aktiviert wird, wie es bei einem modularen Modell der Fall wäre. Die WortauslautTransparenzeffekte könnten daher als Feedback und bidirektionale Verknüpfung zwischen phonologischer und grammatischer Ebene interpretiert werden. Die Daten aus Studien zum L2- und kindlichen L1-Genuserwerb sprechen für einen solchen Mechanismus. EKP-Studien zum L1-Sprachverstehen aus jüngerer Zeit (Caffarra et al. 2014, 2015) unterstützen die früher formulierte Annahme (Gollan & Frost 2001), dass der Genuszugriff sowohl über die lexikalische Route, als auch über die formbasierte Route erfolgt, auch wenn sie keine Evidenz dafür finden, dass Wortformtransparenz die Kongruenzprozesse beeinflusst. Die wahrscheinlichste Interpretation ist deshalb, dass potenzielle Feedback-Verknüpfungen zwischen phonologischen Formen und grammatischen Merkmalen von erfahrenen L1-Sprechern zwar weiterhin aktiv sind, die Genustransparenz aber auf keine wesentliche Weise mehr die Genusselektion in der L1 beeinflusst, da bei erwachsenen Muttersprachlern die lexikalische Route immer die korrekte Information über Genus liefert (Delfitto & Zamparelli 2009; Caffarra et al. 2015). Zusammenfassend weisen die bisherigen Befunde zur Genusrepräsentation und -verarbeitung auf komplexe Beziehungen zwischen mehreren Faktoren hin. Der Grad der Schwierigkeiten, die L2-Lerner haben, scheint einerseits von der Transparenz der Genusmarkierung in der Zielsprache abzuhängen, andererseits von den vielseitigen Beziehungen zwischen den Genussystemen in L1 und L2. Bislang konnte der Einfluss folgender Faktoren gezeigt werden: 1) das Vorhandensein oder Nichtvorhandensein eines L1-Genussystems, 2) die Anzahl der Genuskategorien in L1 vs. L2, 3) die generellen Ähnlichkeiten in der Genuszuweisung zwischen dem L1- und L2-Sprachsystem (z. B. Sabourin & Haverkort 2003; Sabourin & Stowe 2008) und die damit zusammenhängende typologische Ähnlichkeit zwischen den Sprachsystemen, 4) Genuszuweisungsüberlappungen (Genuskongruenz vs. -inkongruenz auf der lexikalischen Ebene) und 5) Überlappungen in den morphosyntaktischen Realisierungen der grammatischen Kategorie Genus (z. B. Foucart & Frenck-Mestre 2011). Darüber hinaus deutet die neuste Forschung darauf hin, dass die drei deutschen Genera unterschiedliches Erwerbspotential haben. Opitz, Regel, Müller & Friederici (2013) sowie Opitz & Pechmann (2016) berichten L1-Daten, die zeigen, dass feminine NP einfacher zu verarbeiten sind als maskuline NP. Bordag, Kirschenbaum, Rogahn, Opitz & Tschirner (eingereicht) liefern dann die erste Evidenz dafür, dass der beiläufige Genuserwerb von Feminina und Neutra in L2 Deutsch einfacher als der von Maskulina ist. In zukünftigen Studien sollte der Beitrag der genannten Faktoren vor allem in weiteren Sprachen bzw. Sprachpaaren untersucht werden, um die bisher gewonnenen Erkenntnisse auf eine noch tragfähigere Basis zu stellen. Weiterhin
88
Denisa Bordag und Thomas Pechmann
wäre es wünschenswert, mögliche Konsequenzen aus der Forschung zum L2-Erwerb im Immersionskontext und im gesteuerten Unterricht für den Erwerb von Genus zu untersuchen. Nicht zuletzt sollten Genuserwerb und -verarbeitung nicht nur innerhalb der Nominalphrase untersucht werden, sondern auch z. B. in Bezug auf genusmarkierte Relativpronomen oder klitische Pronomen (dazu neulich Rossi, Kroll & Dussias 2014) sowie hinsichtlich der Genuskongruenz von Subjekt und Verb (z. B. in den Vergangenheitsformen der slawischen Verben).
Literaturangaben Andonova, Elena, Simona D’Amico, Antonella Devescovi & Elizabeth Bates (2004): Gender and lexical access in Bulgarian. Perception & Psychophysics 66 (3), 496 – 507. Badecker, William, Michele Miozzo & Raffaella Zanuttini (1995): The two-stage model of lexical retrieval: Evidence from a case of anomia with selective preservation of grammatical gender. Cognition 57 (2), 193 – 216. Bates, Elizabeth, Antonella Devescovi, Luigi Pizzamiglio, Simona D’Amico & Arturo Hernandez (1995): Gender and lexical access in Italian. Perception & Psychophysics 57 (6), 847 – 862. Bordag, Denisa (2004): Interaction of L1 and L2 systems at the level of grammatical encoding: Evidence from picture naming. In Susan Foster-Cohen (Hrsg.), EUROSLA Yearbook 4, 203 – 230. Amsterdam: Benjamins. Bordag, Denisa (2006): Psycholinguistische Aspekte der Interferenzerscheinungen in der Flexionsmorphologie des Tschechischen als Fremdsprache. Hildesheim: G. Olms. Bordag, Denisa, Amit Kirschenbaum, Maria Rogahn, Andreas Opitz & Erwin Tschirner (eingereicht): Misbehaved Masculines: Incidental acquisition of grammatical gender in L2 German. Bilingualism: Language and Cognition. Bordag, Denisa, Andreas Opitz & Thomas Pechmann (2006): Gender processing in L1 and L2: The role of noun termination. Journal of Experimental Psychology: Learning, Memory, and Cognition 32 (5), 1090 – 1101. Bordag, Denisa & Thomas Pechmann (2007): Factors influencing L2 gender processing. Bilingualism: Language and Cognition 10 (3), 299 – 314. Bot, Kees de (1992): A bilingual production model: Levelt’s ’Speaking’ model adapted. Applied Linguistics 13 (1), 1 – 24. Braine, Martin D. (1987): What is learned in acquiring word classes: A step toward an acquisition theory. In Brian MacWhinney (Hrsg.), Mechanisms of language acquisition, 65 – 87. Hillsdale, NJ: Erlbaum. Brooks, Patricia. J., Martin D. Braine, Lisa Catalano, Ruth E. Brody & Vicki Sudhalter (1993): Acquisition of gender-like noun subclasses in an artificial language: The contribution of phonological markers to learning. Journal of Memory and Language 32, 76 – 95. Caffarra, Sendy & Horacio Barber (2015): Does the ending matter? The role of gender-to-ending consistency in sentence reading. Brain Research, 1605, 83 – 92. Caffarra, Sendy, Niels Janssen & Horacio Barber (2014): Two sides of gender: ERP evidence for the presence of two routes during gender agreement processing. Neuropsychologia 63, 124 – 134.
Genuserwerb und -verarbeitung in einer L2
89
Caramazza, Alfonso (1997): How many levels of processing are there in lexical access? Cognitive Neuropsychology 14 (1), 177 – 208. Corbett, Greville G. (2013): Number of genders. In Matthew S. Dryer & Martin Haspelmath (Hrsg.), The World Atlas of Language Structures Online. Leipzig: Max Planck Institute for Evolutionary Anthropology. http://wals.info/chapter/30 (04. 03. 2016). Corbett, Greville G. (1991): Gender. Cambridge: Cambridge University Press. Costa, Albert, Alfonso Caramazza & Nuria Sebastian-Galles (2000): The cognate facilitation effect: Implications for models of lexical access. Journal of Experimental Psychology: Learning, Memory, and Cognition 26 (5), 1283 – 1296. Costa, Albert, Damir Kovacic, Evelina Fedorenko & Alfonso Caramazza (2003): The gender congruency effect and the selection of freestanding and bound morphemes: Evidence from Croatian. Journal of Experimental Psychology: Learning, Memory, and Cognition 29 (6), 1270 – 1282. Delfitto, Denis & Roberto Zamparelli (2009): Le strutture del significato. Bologna: Il Mulino. Dell, Gary S. (1986): A spreading-activation model of retrieval in sentence production. Psychological Review 93, 231 – 241. Dijkstra, Ton, Jonathan Grainger & Walter J. B. van Heuven (1999): Recognition of cognates and interlingual homographs: The neglected role of phonology. Journal of Memory and Language 41, 496 – 518. Dijkstra, Ton & Walter J. B. van Heuven (2002). The architecture of the bilingual word recogniton system: From identification to decision. Bilingualism: Language and Cognition 5 (3), 175 – 179. Dussias, Paola E., Jorge R. Valdés Kroff, Rosa E. Guzzardo Tamargo & Chip Gerfen (2013): When gender and looking go hand in hand. Studies in Second Language Acquisition 35 (2), 353 – 387. Foucart, Alice & Cheryl Frenck-Mestre (2011): Grammatical gender processing in L2: Electrophysiological evidence of the effect of L1–L2 syntactic similarity. Bilingualism: Language and Cognition 14 (3), 379 – 399. Foucart, Alice & Cheryl Frenck-Mestre (2012): Can late L2 learners acquire new grammatical features? Evidence from ERPs and eye-tracking. Journal of Memory and Language 66 (1), 226 – 248. Frigo, Lenore & Janet McDonald (1998): Properties of phonological markers that affect the acquisition of gender-like subclasses. Journal of Memory and Language 39, 218 – 245. Garrett, Merrill F. (1978): Word and sentence perception. In Richard Held, Herschel W. Leibowitz & Hans-Lukas Teuber (Hrsg.), Handbook of Sensory Physiology, 611 – 625. Berlin: Springer Garrett, Merrill F. (1975): The analysis of sentence production. Psychology of Learning and Motivation 9, 137 – 177. Gillon Dowens, Margaret, Marta Vergara, Horacio A. Barber & Manuel Carreiras (2010): Morphosyntactic processing in late second-language learners. Journal of Cognitive Neuroscience, 22, 1870 – 1887. Glaser, Wilhelm R. & Franz-Josef Düngelhoff (1984): The time course of picture-word interference. Journal of Experimental Psychology: Human Perception and Performance 10 (5), 640 – 654. Gollan, Tamar & Ram Frost (2001): The syntactic route to grammatical gender. Journal of Psycholinguistic Research 30, 627 – 651.
90
Denisa Bordag und Thomas Pechmann
Green, David W. (1993): Towards a model of L2 comprehension and production. In Robert Schreuder & Bert Weltens (Hrsg.), The Bilingual Lexicon, 249 – 279. Amsterdam: John Benjamins. Groot, Annette M. B. de (1992): Bilingual lexical representation: A closer look at the conceptual representations. In Ram Frost & Leonard Kats (Hrsg.), Orthography, phonology, morphology, and meaning, 389 – 412. Amsterdam: Elsevier. Groot, Annette M. B. de, Lucia Dannenburg & Janet G. Van Hell (1994): Forward and backward word translation by bilinguals. Journal of Memory and Language 33, 600 – 629. Grosjean, Francois (1997): The bilingual individual. Interpreting 2 (1/2), 163 – 187. Grosjean, Francois (1988): Exploring the recognition of guest words in bilingual speech. Language and Cognitive Processes 3 (3), 233 – 274. Grosjean, Francois (1998): Transfer and language mode. Bilingualism: Language and Cognition 1 (3), 175 – 176. Grüter, Theres, Casey Lew-Williams & Anne Fernald (2012): Grammatical Gender in L2: A Production or a real-time processing problem? Second Language Research 28 (2), 191 – 215. Hall, Christopher J. & Peter Ecke (2003): Parasitism as a default mechanism in L3 vocabulary acquisition. In Jasone Cenoz, Britta Hufeisen & Ulrike Jessner (Hrsg.), The multilingual lexicon, 71 – 85. Dordrecht: Kluwer Acadmic Publishers. Hawkins, Roger & Florencina Franceschina (2004): Explaining the acquisition and non-acquisition of determiner-noun gender concord in French and Spanish. In Philippe Prévost & Johanne Paradis (Hrsg.), The acquisition of French in different contexts: Focus on functional categories, 175 – 205. Amsterdam: John Benjamins. Henzel, V. M. (1975): Acquisition of grammatical gender in Czech. Reports on Child Language Development 10, 188 – 200. Hermans, Daan, Theo Bongaerts, Kees de Bot & Robert Schreuder (1998): Producing words in a foreign language: Can speakers prevent interference from their first language? Bilingualism: Language and Cognition 1 (3), 213 – 229. Holmes, Virginia M. & B. Dejean de la Bâtie (1999): Assignment of grammatical gender by native speakers and foreign learners of french. Applied Psycholinguistics 20 (04), 479 – 506. Holmes, Virgina M. & Juan Segui (2004): Sublexical and lexical lnfluences on gender assignment in French. Journal of Psycholinguistic Research 33 (6), 425 – 457. Keating, Gregory D. (2009): Sensitivity to violations of gender agreement in native and nonnative Spanish: An eye-movement investigation. Language Learning 59, 503 – 535. Köpcke, Klaus-Michael (1982): Untersuchungen zum Genussystem der deutschen Gegenwartssprache (Linguistische Arbeiten 122). Tübingen: Niemeyer. Köpcke, Klaus-Michael & David Zubin (1983): Die kognitive Organisation der Genuszuweisung zu den einsilbigen Nomen der deutschen Gegenwartssprache. Zeitschrift für Germanistische Linguistik 11, 166 – 182. Köpcke, Klaus Michael & David Zubin (1984): Sechs Prinzipien für die Genuszuweisung im Deutschen: Ein Beitrag zur natürlichen Klassifikation. In: Peter Hartmann (Hrsg.), Linguistische Berichte 93, 26 – 50. Westdeutscher Verlag. La Heij, Wido, Pim Mak, Jörg Sander & Elsabé Willeboordse (1998): The gender congruency effect in picture-word tasks. Psychological Research 61, 209 – 219.
Genuserwerb und -verarbeitung in einer L2
91
Lemhöfer, Kristin, Katharina Spalek, & Herbert Schriefers (2008): Cross-language effects of grammatical gender in bilingual word recognition and production. Journal of Memory and Language 59 (3), 312 – 330. Levelt, Willem J. M., Ardi Roelofs & Antje S. Meyer (1999): A theory of lexical access in speech production. Behavioral and Brain Sciences 22, 1 – 75. MacWhinney, Brian, Jared Leinbach, Roman Taraban & Janet McDonald (1989): Language learning: Cues or rules? Journal of Memory and Language 28, 255 – 277. Mills, Anne, E. (1986): The acquisition of gender: A study of English and German. Berlin: Springer. Miozzo, Michele & Alfonso Caramazza (1997): Retrieval of lexical-syntactic features in tip-of-the-tongue states. Journal of Experimental Psychology: Learning, Memory, and Cognition 23 (6), 1410 – 1423. Oliphant, Katrina (1998): Acquisition of grammatical gender in Italian as a foreign language. Canadian Modern Language Review 54 (2), 237 – 262. Opitz, Andreas & Thomas Pechmann (2016): Gender features in German – Evidence for underspecification. The Mental Lexicon 11 (2), 216 – 242. Opitz, Andreas, Stefanie Regel, Gereon Müller & Angela D. Friederici (2013): Neurophysiological evidence for morphological underspecification in German strong adjective inflection. Language 89 (2), 234 – 264 Paradis, Michel (1981): Neurolinguistic organization of a bilingualism. LACUS Forum 7, 486 – 494. Poulisse, Nanda & Theo Bongaerts (1994): First language use in second language production. Applied Linguistics 15, 36 – 57. Roelofs, Ardi, Antje S. Meyer & Willem J. M. Levelt (1998): A case for the lemma/lexeme distinction in models of speaking: Comment on Caramazza and Miozzo (1997). Cognition 69 (2), 219 – 230. Rossi, Eleonora, Judith F. Kroll & Paola E. Dussias (2014): Clitic pronouns reveal the time course of processing gender and number in a second language. Neuropsychologia 62, 11 – 25. Sabourin, Laura & Marco Haverkort (2003): Neural substrates of representation and processing of a second language. In Roeland van Hout, Aafke Hulk, Folkert Kuiken & Richard Towell (Hrsg.), The lexicon–syntax interface in second language acquisition, 175 – 195. Amsterdam: John Benjamins. Sabourin, Laura & Laurie A. Stowe (2008): Second language processing: When are first and second languages processed similarly? Second Language Research 24 (3), 397 – 430. Schriefers, Herbert (1993): Syntactic processes in the production of noun phrases. Journal of Experimental Psychology: Learning, Memory, and Cognition 19 (4), 841 – 850. Singleton, David (1999): Exploring the second language mental lexicon. Cambridge University Press. Singleton, David (2005): The critical period hypothesis: A coat of many colours. International Review of Applied Linguistics in Language Teaching 43, 269 – 285. Smoczyńska, Magdalena (1985): The acquisition of Polish. In Dan Isaac Slobin (Hrsg.), The crosslinguistic study of language acquisition, 595 – 686. Hillsdale, NJ: Erlbaum. Spalek, Katharina, Julie Franck, Herbert Schriefers & Ulrich Frauenfelder (2008): Phonological regularities and grammatical gender retrieval in spoken word recognition and word production. Journal of Psycholinguistic Research 37 (6), 419 – 442.
92
Denisa Bordag und Thomas Pechmann
Taft, Marcus & Fanny Meunier (1998): Lexical representation of gender. Journal of Psycholinguistic Research 27, 23 – 45. Taraban, Roman & Vera Kempe (1999): Gender processing in native and non-native Russian speakers. Applied Psycholinguistics 20, 119 – 148. Taraban, Roman & Bret Roark (1996): Competition in learning language-based categories. Applied Psycholinguistics 17, 125 – 148. Tokowicz, Natasha & Brian MacWhinney (2005): Implicit and explicit measures of sensitivity to violations in second language grammar: An event-related potential investigation. Studies in Second Language Aquisition 27, 173 – 204. Unsworth, Sharon, Froso Argyri, Leonie Cornips, Aafke Hulk, Antonella Sorace & Ianthi Tsimpli (2011). Bilingual Acquisition of Greek Voice Morphology and Dutch Gender: What Do They Have in Common? In BUCLD 35 Proceedings of the 35th Annual Boston University Conference on Language Development. http://depot.knaw.nl/13235/1/BUCLD35_FINAL.pdf. Vigliocco, Gabriella, Tiziana Antonini & Merrill F. Garrett (1997): Grammatical gender is on the tip of Italian tongues. Psychological Science 8, 314 – 317. Zubin, David & Klaus-Michael Köpcke (1986): Natural classification in language. A study of the German gender system. Buffalo Cognitive Science Report 2. Zubin, David & Klaus-Michael Köpcke (1981): Gender: A less than arbitrary grammatical category. In: Robert A. Hendrick, Carrie Masek & Mary Frances Miller (Hrsg.), Papers from the Regional Meeting of the Chicago Linguistic Society 17, 439 – 449.
Gunnar Jacob
Morphologische Verarbeitung bei L2-Lernern Schon Mark Twain hatte mit morphologisch komplexen deutschen Wörtern zu kämpfen. Sowohl in seinem berühmt gewordenen Essay The awful German language als auch in seinem Vortrag Die Schrecken der deutschen Sprache im Wiener Concordia Club 1897 diskutierte der Reiseschriftsteller und eifrige Deutschlerner die Tücken deutscher Komposita und Morphosyntax (LeMaster, Wilson & Hamric 1993). Aber was macht komplexe Wörter eigentlich so besonders? Man könnte schließlich behaupten, dass auch Wörter wie Lieferung, machte oder Flaschenfabrik eben Wörter sind, bei denen die Wortverarbeitung ähnlich ablaufen sollte wie bei nicht-komplexen Wörtern wie Hund oder Tisch. Allerdings besitzen morphologisch komplexe Wörter anders als nicht-komplexe Wörter eine interne grammatische Struktur. Das Wort Lieferung etwa besteht aus dem Stamm lieferund dem Nominalisierungsaffix –ung, die Verbform machte aus dem Verbstamm mach- und dem Flexionsaffix –te. Die Frage, ob und in welcher Form diese interne grammatische Struktur auch bei der Verarbeitung solcher Wörter eine Rolle spielt, ist seit langem Gegenstand einer kontroversen Diskussion. Werden komplexe Wörter im Rahmen der Worterkennung in ihre morphologischen Bestandteile zerlegt, d. h. dekomponiert? Und wenn ja, gibt es bei der morphologischen Dekomposition Unterschiede zwischen Muttersprachlern und L2-Lernern? Diesen Fragen ist das folgende Kapitel gewidmet. Für Mark Twain, wie auch für wohl viele L2-Lerner nach ihm, war die Morphologie eine besondere Hürde; dementsprechend häufig sind morphosyntaktische Fehler bei L2-Lernern (z. B. Johnson et al. 1996; Prévost & White 2000). Eine Antwort auf die Frage, warum diese Art von Fehlern so häufig auftritt, erfordert Kenntnisse darüber, wie komplexe Wörter verarbeitet werden, und in welcher Form sie im mentalen Lexikon eines Lerners repräsentiert sind. Allerdings stellt Morphologie zumindest potentiell für L2-Lerner nicht nur ein Problem, sondern vielleicht auch eine Chance dar: Man könnte argumentieren, dass die Kenntnis morphologischer Regeln für den Lerner potentiell eine große Hilfe bedeutet. Beherrscht man etwa als L2-Lerner des Englischen die Verwendung des produktiven Nominalisierungsaffixes -ness, so braucht man die englischen Wörter sad und sadness nicht mehr als getrennte Vokabeln zu erlernen. Stattdessen bekommt man Gunnar Jacob, Potsdam Research Institute for Multilingualism DOI 10.1515/9783110456356-005
94
Gunnar Jacob
beim Erwerb eines Adjektivs wie sad automatisch die entsprechende Nominalisierung „mitgeliefert“, was den Aufwand beim Vokabellernen erheblich reduziert. Auch angewandte Fragestellungen wie diese lassen sich ohne Kenntnisse darüber, wie komplexe Wörter im mentalen Lexikon repräsentiert sind, nur schwer beantworten.
1 „Denn grau, mein Freund, ist alle Theorie“: Wie kann man morphologische Verarbeitung experimentell untersuchen? Worterkennung läuft im Gehirn in der Regel atemberaubend schnell und weitgehend automatisch ab. Sollte ein komplexes Wort wirklich im Rahmen der Worterkennung in seine morphologischen Bestandteile zerlegt werden, so geschieht dies innerhalb von wenigen Millisekunden. Wie kann man solche extrem schnellen Prozesse überhaupt sichtbar machen und empirisch untersuchen? Eine Reihe von Studien basiert dabei auf einem Vergleich zwischen zerlegbaren und nicht zerlegbaren (aber ansonsten ähnlichen) Wortformen. Betrachten wir zum Beispiel die beiden deutschen Präteritumsformen kaufte und lief. In vielerlei Hinsicht besitzen diese beiden Formen ähnliche Eigenschaften: Beide sind Präteritumsformen hochfrequenter deutscher Verben; auch in Bezug auf die Wortbedeutung ist die Beziehung zwischen der Form kaufte und dem Stamm kauf- eine ähnliche wie die zwischen der Form lief und dem Stamm lauf-. Ein entscheidender Unterschied ist allerdings, dass kaufte aus dem Verbstamm kauf- und dem Präteritumsaffix -te zusammengesetzt ist. Bei der Form kaufte könnte man also den Stamm identifizieren, indem man das Wort nach existierenden Affixen absucht, das Affix -te abtrennt, und so den Stamm kauf- isoliert. Die Form lief hingegen lässt sich nicht auf diese Weise morpho-orthographisch zerlegen. Stattdessen muss man schlicht wissen, dass es sich dabei um die Präteritumsform des Verbs laufen handelt.Wir werden noch sehen, dass einem solchen Vergleich zwischen morphoorthographisch zerlegbaren und nicht-zerlegbaren Formen eine besondere Bedeutung zukommt, weil verschiedene theoretische Ansätze zur morphologischen Verarbeitung in Bezug auf diesen Vergleich unterschiedliche Vorhersagen treffen. Wie kann man aber untersuchen, ob sich dieser Unterschied auf die Worterkennung auswirkt? Eine einfache behaviorale Methode dafür basiert auf der Messung von lexikalischen Entscheidungszeiten für beide Gruppen von Wörtern. Hierbei werden Probanden mit Wörtern aus beiden Wortgruppen konfrontiert und müssen per Tastendruck möglichst schnell entscheiden, ob es sich dabei um ein existierendes deutsches Wort oder ein Nicht-Wort handelt (vgl. auch Hopp & Schimke in
Morphologische Verarbeitung bei L2-Lernern
95
diesem Band). Eine besondere Rolle spielt dabei die Frage, ob die gemessenen lexikalischen Entscheidungszeiten für die beiden Gruppen von Wortformen von den Frequenzen der jeweiligen Wortform abhängen. Die Idee ist hierbei: Für nichtkomplexe Wörter wie Hund oder Tisch ist seit langem bekannt, dass die Worterkennung davon beeinflusst wird, wie häufig das jeweilige Wort in der Sprache vorkommt. Wörter, denen man häufig begegnet, werden in der Regel schneller erkannt als seltene Wörter. Falls eine Wortform wie kaufte oder lief in derselben Weise wie solche nicht-komplexen Wörter im mentalen Lexikon abgespeichert ist, dann sollte die Wortformfrequenz des Wortes auch hier die Worterkennung in der gleichen Weise beeinflussen wie bei nicht-komplexen Wörtern. Wird ein komplexes Wort wie kaufte dagegen in seine morphologischen Bestandteile zerlegt, dann besitzen nur der Stamm kauf- und das Affix –te eigene Einträge im mentalen Lexikon, die Wortform kaufte jedoch nicht; die Wortformfrequenz von einer Form wie kaufte sollte in diesem Fall keinerlei Auswirkung auf die Worterkennung haben. Werden also Formen wie kaufte zerlegt und Formen wie lief ähnlich wie nicht-komplexe Wörter aus dem mentalen Lexikon abgerufen, dann sollte man für Wörter wie lief einen Einfluss der Wortformfrequenz finden, für Wörter wir kaufte jedoch nicht. Ein besonderes Problem bei dieser Art von Studien ist allerdings, dass lexikalische Entscheidungszeiten auch wesentlich von grundlegenden Eigenschaften der Form, wie etwa der Wortlänge, beeinflusst werden: So werden kürzere Wörter in der Regel schneller erkannt als längere. Bei einem Vergleich zwischen zwei Wortgruppen könnte es durchaus passieren, dass sich die beiden Gruppen nicht nur in Bezug auf ihre Zerlegbarkeit, sondern zum Beispiel auch in Bezug auf die durchschnittliche Wortlänge unterscheiden. Um einen Unterschied zwischen beiden Wortgruppen also wirklich auf die morphologischen Eigenschaften dieser Wörter zurückführen zu können muss man sicherstellen, dass beide Wortgruppen sich möglichst nur in Bezug auf diese morphologischen Eigenschaften unterscheiden (also eben entweder in Stamm und Affix zerlegbar sind oder nicht), aber in Bezug auf Wortlänge und alle anderen Eigenschaften, die sich potentiell auf die Worterkennung auswirken könnten, vergleichbar sind. Da sich aber sehr viele grundlegende Eigenschaften eines Wortes potentiell darauf auswirken können, wie schnell dieses Wort erkannt wird, müssen all diese Faktoren experimentell kontrolliert werden, was in der Praxis allerdings oft schwierig ist. Eine Methode zur Untersuchung von morphologischen Dekompositionsprozessen, bei der dieses Problem zumindest teilweise umgangen wird, basiert auf einer Variante des Priming-Verfahrens (vgl. Hopp & Schimke in diesem Band). Probanden werden hier mit einem morphologisch komplexen Primewort (etwa Öffnung) konfrontiert und sehen unmittelbar danach ein morphologisch verwandtes Zielwort (etwa öffnen), welches auf demselben Stamm basiert wie das
96
Gunnar Jacob
Primewort. Die Aufgabe der Probanden besteht dabei etwa darin, per Tastendruck so schnell wie möglich zu entscheiden, ob es sich bei dem Zielwort um ein existierendes Wort oder ein Nicht-Wort handelt. Die lexikalische Entscheidungszeit für dieses Zielwort wird dann mit einer Kontrollbedingung verglichen, bei der demselben Zielwort (in diesem Fall öffnen) ein morphologisch nicht verwandtes Primewort, wie etwa Pinsel, vorangeht. Die Idee dabei: Wird ein komplexes Primewort wie Öffnung bei der Worterkennung in seine morphologischen Komponenten Öffn- und –ung zerlegt, dann wird der Stamm öffn- bereits bei der Verarbeitung des Primewortes aktiviert. Diese Voraktivierung des Stamms öffnsollte anschließend die Erkennung des Zielwortes öffnen, das ja schließlich auf demselben Stamm basiert, erleichtern. Die lexikalischen Entscheidungszeiten für das Zielwort öffnen sollten in diesem Fall also schneller sein als in der Kontrollbedingung, bei der vor dem Zielwort öffnen das morphologisch nicht verwandte Primewort Pinsel präsentiert wird. Ein besonderer Vorteil dieser Methode besteht darin, dass hier nicht direkt Entscheidungszeiten für unterschiedliche Wörter miteinander verglichen werden: Stattdessen wird in beiden Bedingungen die lexikalische Entscheidungszeit für dasselbe Zielwort (z. B. öffnen) gemessen; der einzige Unterschied zwischen dem Experimental-Wortpaar Öffnung-öffnen und dem Kontroll-Wortpaar Pinsel-öffnen besteht in den jeweils unterschiedlichen Prime-Wörtern, die vor dem Zielwort präsentiert wurden.
1.1 Exkurs: Eine Beispielstudie zum Deutschen Smolka, Zwitserlood & Rösler (2007) untersuchten in einer solchen Priming-Studie die Verarbeitung deutscher Partizipien bei deutschen Muttersprachlern. Dabei wurden -t Partizipien wie geschmückt, bei denen das Partizip durch Affixierung gebildet wird, und -n Partizipien wie geworfen, die stattdessen auf dem Affix -(e)n basieren und zusätzlich Veränderungen im Wortstamm (z. B. werfen-geworfen) enthalten, verglichen. Um Primingeffekte für beide Arten von Partizipien zu bestimmen wurden lexikalische Entscheidungszeiten für morphologisch verwandte Wortpaare wie geschmückt-schmücken und morphologisch nicht verwandte Wortpaare wie geschwächt-schmücken verglichen. Hierbei zeigten sich signifikante Primingeffekte: Die Reaktionszeiten für das Zielwort schmücken waren deutlich schneller, wenn unmittelbar zuvor das Primewort geschmückt präsentiert worden war. Für Partizipien wie geworfen traten ebenso signifikante Primingeffekte auf: Auch hier waren die Reaktionszeiten für das Zielwort werfen schneller, wenn zuvor das Primewort geworfen präsentiert worden war. Die Autoren schlussfolgern, dass die Verarbeitung von beiden Partizipienarten auf demselben Verarbeitungsmechanismus basiert, der in beiden Fällen jeweils den entsprechenden Wortstamm
Morphologische Verarbeitung bei L2-Lernern
97
(schmück- oder werf‐) identifiziert. Allerdings kamen andere Studien in diesem Bereich zu anderen Ergebnissen; die Frage, ob und in welcher Weise sich die Verarbeitung von Partizipien wie geschmückt und geworfen voneinander unterscheidet, wird nach wie vor kontrovers diskutiert (z. B. Sonnenstuhl, Eisenbeiß & Clahsen 1999; Jacob, Fleischhauer & Clahsen 2013; Smolka et al. 2013; Clahsen & Fleischhauer 2014). In jedem Fall bildet die hier beschriebene Studie jedoch ein gutes Beispiel dafür, wie morphologische Verarbeitungsprozesse mithilfe von Priming-Studien untersucht werden können.
1.2 Wie morphologisch sind morphologische Primingeffekte? Die Rolle von Orthographie und Semantik Zahlreiche Studien zu einer Reihe unterschiedlicher Sprachen zeigen Primingeffekte für morphologisch verwandte Wortpaare: Wie schon in der oben beschriebenen Beispielstudie sind lexikalische Entscheidungszeiten in der Regel kürzer, wenn kurz zuvor ein Prime präsentiert wurde, der auf demselben Stamm basiert wie das Zielwort. Kontrovers diskutiert wird allerdings die Frage, ob diese Effekte wirklich auf morphologische Verarbeitung zurückgeführt werden können: Wörter wie Öffnung und öffnen etwa sind nicht nur morphologisch verwandt (in dem Sinne, dass beide Wörter auf dem Stamm öffn- basieren), sondern besitzen auch eine ähnliche Bedeutung und teilen sich eine Reihe von Buchstaben. Primingeffekte müssen also nicht unbedingt auf morphologischer Dekomposition basieren, sondern könnten auch semantisch oder orthographisch bedingt sein. Mit anderen Worten: Wenn komplexe Wörter dekomponiert werden, dann sollte dies zu Primingeffekten führen, aber Primingeffekte an sich sind noch keine Evidenz für Dekomposition, sondern können auch auf andere Weise entstehen. Ein signifikanter Primingeffekt für ein morphologisch verwandtes Wortpaar wie Öffnungöffnen ist also für sich genommen noch keine Evidenz dafür, dass ein Wort wie Öffnung wirklich im Rahmen der Worterkennung in seine morphologischen Bestandteile zerlegt wird. Stattdessen muss man zusätzlich zeigen, dass dieser Primingeffekt wirklich darauf beruht, dass Öffnung und öffnen beide auf demselben Stamm basieren, und nicht etwa darauf, dass Öffnung und öffnen eine verwandte Bedeutung besitzen oder sich einige Buchstaben teilen. Priming-Experimente enthalten deshalb oft eine Reihe von Kontrollbedingungen mit Wortpaaren, die jeweils nur semantisch (z. B. Tisch und Stuhl) oder nur orthographisch (z. B. Kasten und Kasse) verwandt sind. Ist ein Primingeffekt für morphologisch verwandte Wortpaare in Wirklichkeit nicht morphologischer Natur, sondern stattdessen zum Beispiel auf die rein orthographische Ähnlichkeit zwischen Prime- und Zielwort zurückzuführen, dann sollten sich auch für Wortpaare, die sich
98
Gunnar Jacob
nur auf orthographischer Ebene ähnlich, aber nicht morphologisch verwandt sind, vergleichbare Primingeffekte zeigen. Semantische und orthographische Kontrollbedingungen können also nützlich sein, um alternative, nicht-morphologische Erklärungen für einen Primingeffekt ausschließen zu können. Zusätzlich kann man Primingexperimente so gestalten, dass semantische oder orthographische Effekte reduziert werden: In einem sogenannten masked primingExperiment etwa wird das Primewort nur für eine sehr kurze Zeitspanne (zwischen 30 und 70 Millisekunden) auf dem Bildschirm präsentiert; zusätzlich wird unmittelbar vor dieser sehr kurzen Präsentation eine andere Zeichenfolge (etwa eine Reihe von Rautensymbolen), eine sogenannte Maske, präsentiert, die die bewusste Wahrnehmung des Primewortes zusätzlich erschwert. Der grundlegende Ablauf eines Durchgangs bei einem solchen Experiment ist in Abbildung 1 illustriert.
Abbildung 1: Typischer Ablauf für ein aus Prime und Zielwort bestehendes Wortpaar bei einem masked priming-Experiment
Was ist die Idee dabei, das Primewort auf diese spezielle Weise zu präsentieren? Durch die Kombination aus sehr kurzer Präsentationszeit und Maske ist das Primewort für die meisten Probanden nicht mehr bewusst wahrnehmbar: Das automatische Verarbeitungssystem beginnt zwar durchaus mit der Verarbeitung des Wortes und nimmt im Wort enthaltene Informationen auf, aber den Probanden ist in der Regel nicht bewußt, dass dort überhaupt ein Wort auf dem Bildschirm präsentiert wurde. Dadurch werden semantische Primingeffekte erheblich reduziert. Zusätzlich kann in einem solchen Experiment der genaue Zeitraum, für wie lange ein Primewort auf dem Bildschirm präsentiert wird, systematisch variiert werden; dadurch kann man Erkenntnisse darüber gewinnen, in welcher Phase der Worterkennung auf die in einem Wort enthaltene morphologische, semantische, oder orthographische Information zugegriffen wird. Findet man selbst für eine
Morphologische Verarbeitung bei L2-Lernern
99
sehr kurze Präsentationszeit noch morphologische Primingeffekte, dann ist das ein Indiz dafür, dass morphologische Verarbeitung bereits in einer sehr frühen Phase der Worterkennung einsetzt. Beim cross-modal priming werden Prime- und Zielwort in verschiedenen Modalitäten präsentiert: Der Proband hört zum Beispiel das Primewort in gesprochener Form über einen Kopfhörer und sieht unmittelbar danach das Zielwort in geschriebener Form auf dem Bildschirm. Da das Primewort in diesem Fall gar nicht in geschriebener Form präsentiert wird, reduziert diese Methode orthographische Primingeffekte (d. h. Primingeffekte, die dadurch entstehen, dass Primeund Zielwort sich eine Reihe von Buchstaben teilen). Eine weitere, seit langem bekannte Möglichkeit (Stanners et al., 1979) basiert auf dem Hinzufügen einer identity-Kontrollbedingung: Hierbei wird ein morphologisch verwandtes Wortpaar wie Lieferung-liefern nicht nur mit einem nicht verwandten Kontrollpaar wie Fenster-liefern verglichen, sondern zusätzlich auch mit einem Kontrollpaar wie liefern-liefern, bei dem dasselbe Wort als Prime und als Ziel fungiert. Die Idee dabei ist folgende: Wenn der Primingeffekt für ein Wortpaar wie Lieferung-liefern wirklich darauf zurückzuführen ist, dass beide Wörter denselben Stamm enthalten, der im Rahmen der Worterkennung isoliert wird, dann sollten die Primingeffekte für Lieferung-liefern genauso groß sein wie für das identity-Kontrollpaar liefern-liefern, denn auch hier basieren Prime- und Zielwort schließlich beide auf dem Stamm liefer-. Sind die Primingeffekte aber auf semantische oder orthographische Ähnlichkeiten zwischen Prime und Ziel zurückzuführen, dann sollte ein Wortpaar wie liefern-liefern, bei dem sich Prime- und Zielwort sowohl in Bezug auf die Wortbedeutung als auch in Bezug auf die enthaltenen Buchstaben noch ähnlicher sind als bei Lieferung-liefern, einen noch größeren Primingeffekt zeigen. Die oben beschriebenen Methoden zur Untersuchung morphologischer Verarbeitungsprozesse sind nicht unbedingt auf lexikalische Entscheidungsaufgaben beschränkt, sondern können natürlich auch mit anderen Arten von Messungen und Aufgaben kombiniert werden. So kann man sowohl bei einem lexikalischen Entscheidungsexperiment als auch bei einer Priming-Studie zusätzlich Messungen der Hirnaktivität erheben, etwa Elektroenzephalogramme (EEG) oder funktionale Magnetresonanztomographie (fMRT, vgl. Mueller in diesem Band). Bei Probandengruppen, für die sehr explizite metalinguistische Aufgaben wie lexikalische Entscheidungsurteile nicht gut geeignet sind, kann man statt lexikalischer Entscheidungszeiten Benennungszeiten messen. Dabei wird der Proband gebeten, ein auf dem Bildschirm erscheinendes Wort so schnell wie möglich laut vorzulesen. Gemessen wird in diesem Fall die Zeit zwischen dem Erscheinen des Wortes auf dem Bildschirm und dem Beginn des Sprechens (z. B. Clahsen & Fleischhauer 2014; Coughlin & Tremblay 2015).
100
Gunnar Jacob
2 Von Metzgern, Paragraphenreitern und Bibliothekaren: Modelle der morphologischen Verarbeitung Die Frage, ob und in welcher Weise komplexe Wörter bei der Worterkennung in ihre morphologischen Bestandteile zerlegt werden, ist eng verbunden mit weitreichenden Annahmen über den Aufbau des mentalen Lexikons. Illustriert ist dies in Abbildung 2.
Abbildung 2: Dekomposition vs. Speicherung komplexer Wortformen und Konsequenzen für Modelle des mentalen Lexikons
Besitzen Formen wie lieferte oder Lieferung (ähnlich wie nicht-komplexe Wörter auch) jeweils einen eigenen Eintrag im mentalen Lexikon, oder ist nur der Stamm liefer- dort in Form eines eigenen Eintrags gespeichert? Falls ein komplexes Wort im Rahmen der Worterkennung in Stamm und Affix zerlegt wird, dann müssen nur Wortstämme und Affixe eigene Einträge im mentalen Lexikon besitzen. Eine komplexe Wortform wie lieferte ist in diesem Fall kein eigenes Wort für sich, sondern eine Form des im mentalen Lexikon repräsentierten Stammes liefer-, dem das ebenfalls im mentalen Lexikon repräsentierte Flexionsaffix -te hinzugefügt wurde. Im Rahmen der Worterkennung wird dieser Stamm isoliert und kann aus dem mentalen Lexikon abgerufen werden. Alternativ ist allerdings auch ein Worterkennungsmodell denkbar, das keinen solchen Zerlegungsmechanismus annimmt. In diesem Fall müsste jede morphologisch komplexe Form einen separaten Eintrag im mentalen Lexikon besitzen; statt eines einzelnen Eintrags für den Stamm liefer- enthielte das mentale Lexikon dann jeweils eigene Einträge für liefern, Lieferung, liefere, lieferst, lieferte, lieferten, liefertest, usw. Ein Dekompositionsmechanismus wäre in diesem Fall nicht not-
Morphologische Verarbeitung bei L2-Lernern
101
wendig; allerdings wäre die Zahl der Einträge im mentalen Lexikon erheblich größer, denn für jedes Wort wären dort statt eines einzelnen Wortstamms zahlreiche Wortformen eingetragen. In diesem Sinne enthält ein Modell zur Verarbeitung von komplexen Wörtern notwendigerweise immer auch Annahmen über den Aufbau des mentalen Lexikons. Die Annahme, dass komplexe Wörter bei der Worterkennung dekomponiert werden, bildet für sich allein noch kein vollständiges Modell der morphologischen Verarbeitung. In welcher Phase der Wortverarbeitung läuft dieser Prozess ab, welche Arbeitsschritte beinhaltet er, und an welcher Art von Einheiten oder Repräsentationen setzt er an? Im Folgenden werden wir eine Reihe theoretischer Ansätze besprechen, die konkrete Aussagen zu diesen Fragen enthalten.
2.1 Der kleine Metzger: Die Idee der morpho-orthographischen Dekomposition Eine Reihe von Priming-Studien legt nahe, dass komplexe Wörter bereits in einer sehr frühen Phase der Worterkennung in ihre morphologischen Bestandteile zerlegt werden. In einer wegweisenden masked priming-Studie etwa verglichen Rastle et al. (2000) morphologisch verwandte englische Wortpaare (z. B. agreement-agree) mit semantisch (z. B. battle-fight) und orthographisch verwandten (z. B. aspirin-aspire) Paaren. Zusätzlich wurde der Zeitraum, in dem das Primewort auf dem Bildschirm zu sehen war, systematisch variiert. Für morphologisch verwandte Paare zeigte sich auch dann ein Primingeffekt, wenn die Prime-Wörter nur so kurz auf dem Bildschirm präsentiert wurden, dass sie nicht bewusst wahrnehmbar waren. Primingeffekte für semantisch verwandte Kontroll-Paare traten dagegen erst auf, wenn die Präsentationszeit des Primewortes lang genug war, um das Wort bewusst wahrnehmen zu können, während rein orthographisch verwandte Wortpaare für keine Präsentationszeit Primingeffekte zeigten. Die Autoren interpretieren diese Ergebnisse als Evidenz für frühe morphologische Dekomposition: Ein komplexes Wort wie agreement wird schon in einer sehr frühen Phase der visuellen Worterkennung automatisch in Stamm und Affix zerlegt. Dabei wird der Stamm agree- isoliert und ist deshalb bereits aktiviert, wenn das Zielwort agree auf dem Bildschirm erscheint. Marslen-Wilson (2007) schlug auf der Basis dieser Ergebnisse ein Modell der visuellen Worterkennung vor. Das Modell basiert auf der Idee, dass die Zerlegung eines komplexen Wortes in seine morphologischen Bestandteile bei der Worterkennung eine besonders hohe Priorität besitzt: Schon in einer sehr frühen, automatischen Phase der visuellen Wortkennung isoliert ein morpho-orthographischer Dekompositionsmechanismus den Wortstamm, indem er nach Buchsta-
102
Gunnar Jacob
benkombinationen sucht, die in der jeweiligen Sprache Affixe darstellen, und diese dann vom Wort abtrennt. Der Dekompositionsprozess setzt in diesem Modell also spezifisch an der orthographischen Form des Wortes an. Im Falle des Wortes agreement würde dieser Mechanismus die Buchstabenkombination -ment als ein existierendes englisches Affix identifizieren und vom Rest des Wortes abtrennen. Übrig bliebe dann der Wortstamm agree-. Dieser Zerlegungsprozess würde also zu einer Voraktivierung des Zielwortes agree und so zu einem Primingeffekt führen. Metaphorisch könnte man hier von einem früh aufstehenden morphologischen Metzger sprechen, der schon in einer sehr frühen Phase der Worterkennung ein Wort nach Einheiten absucht, die wie existierende Affixe aussehen, um diese Affixe dann entsprechend abzuhacken. Zusätzliche Evidenz für einen solchen frühen Dekompositionsmechanismus basiert auf Priming-Studien mit sogenannten pseudo-komplexen Wörtern. Nehmen wir etwa das englische Wort corner oder das deutsche Wort Kammer: Oberflächlich betrachtet bestehen beide Wörter aus einem in der jeweiligen Sprache existierenden Wortstamm (corn bzw. Kamm) und einem ebenso in der jeweiligen Sprache existierenden Affix (‐er). In Wirklichkeit sind corner und Kammer aber natürlich keine Formen von corn oder Kamm, sondern stellen eigene Wörter dar, die mit corn oder Kamm weder morphologisch noch semantisch verwandt sind. In einer masked priming-Studie verglichen Rastle, Davis & New (2004) Primingeffekte für Wortpaare mit englischen pseudo-komplexen Prime-Wörtern, wie etwa brotherbroth (‚Bruder‘-‚Brühe‘), mit Primingeffekten für Wortpaare wie brothel-broth (‚Bordell‘-‚Brühe‘). Die Idee dabei war, dass brothel zwar (ebenso wie brother) das existierende englische Wort broth enthält, aber -el anders als -er kein existierendes englisches Affix ist. Ein Dekompositionsmechanismus, der nach Affixen sucht und diese abtrennt, würde also im Fall von brother das -er als englisches Affix erkennen und abtrennen. Da -el aber kein englisches Affix darstellt, würde brothel nicht in broth- und -el zerlegt. Tatsächlich zeigten sich signifikante Primingeffekte für Wortpaare wie brother-broth, aber keine Primingeffekte für brothel-broth. Da in beiden Wortpaaren Prime und Zielwort semantisch nicht miteinander verwandt sind lässt sich dieser Unterschied nicht auf der Basis von semantischen Beziehungen zwischen Prime und Zielwort erklären. Auch rein orthographisch basierte Erklärungen sind problematisch, denn die orthographische Ähnlichkeit zwischen Prime und Zielwort ist im Fall von brother-broth und brothel-broth gleich groß. Dieser sogenannte corner-corn Effekt ist nicht auf das Englische beschränkt, sondern konnten auch für ähnliche pseudo-komplexe Wörter auch im Französischen (Longtin, Segui & Halle 2003) und Spanischen (Dominguez, De Vega & Barber 2004) repliziert werden. Werden komplexe Wörter wie geliefert oder Lieferung und sogar pseudokomplexe Wörter wie corner oder Kammer wirklich morpho-orthographisch de-
Morphologische Verarbeitung bei L2-Lernern
103
komponiert, dann ergibt sich daraus natürlich die Frage, wie das Verarbeitungssystem mit den oben schon angesprochenen, nicht dekomponierbaren Formen wie lief oder starb umgeht. Hier setzen sogenannte dual-route-Modelle an (z. B. Pinker 1999; Pinker & Ullman 2002; Ullman 2004). Diese Klasse von Modellen basiert auf der Annahme unterschiedlicher Verarbeitungsmechanismen für zerlegbare und nicht-zerlegbare Formen: Eine Form wie kaufte wird im Rahmen der Worterkennung morpho-orthographisch dekomponiert, wodurch der Stamm kaufisoliert wird. Nur dieser Stamm ist dann im mentalen Lexikon in Form eines eigenen Eintrags repräsentiert. Nicht morpho-orthographisch dekomponierbare Formen wie lief dagegen besitzen jeweils einen eigenen Eintrag im mentalen Lexikon. Ein solches dual-route Modell sagt also qualitative Unterschiede zwischen der Verarbeitung von zerlegbaren und nicht-zerlegbaren Formen vorher. Dies führt zurück zu den oben bereits erwähnten Studien, die die Verarbeitung von morpho-orthographisch dekomponierbaren und nicht-dekomponierbaren Formen experimentell miteinander vergleichen.
2.2 Der kleine Paragraphenreiter: Alles wird zerlegt Die Idee der morpho-orthographischen Dekomposition von komplexen Wörtern ist keineswegs unumstritten. Stattdessen hat es eine Reihe von Versuchen gegeben, die oben beschriebenen experimentellen Befunde in anderer Form zu erklären. Mehrere Studien (z. B. Giraudo & Grainger 2001; Stockall & Marantz 2006; Marantz 2013) schlagen einen morphologischen Verarbeitungsmechanismus vor, der morphologische Information extrahiert, ohne dabei an der orthographischen Form eines Wortes anzusetzen. Die grundlegende Idee dieses Ansatzes lässt sich gut am bereits erwähnten Beispiel nicht-dekomponierbarer deutscher Präteritumsformen erklären. Verbformen wie lief oder starb etwa lassen sich nicht morpho-orthographisch in Stamm und Affix zerlegen. Auf einer abstrakteren Ebene ist es allerdings durchaus möglich, eine Form wie lief in den Verbstamm lauf- und eine Präteritumsmarkierung zu zerlegen: Man kann sich eine Präteritumsform wie lief als eine verkleidete Version des Stamms lauf- vorstellen, dem einer Art Präteritums-Verkleidung aufgesetzt wurde. Im Rahmen der Wortverarbeitung wird der Form diese Verkleidung gewissermaßen vom Kopf gezogen und dabei der Verbstamm lauf- enttarnt. Dieses Modell nimmt an, dass es durchaus besondere Verarbeitungsmechanismen für komplexe Wörter gibt; allerdings basiert die Identifikation eines Wortstammes hier nicht auf morpho-orthographischer Zerlegung, sondern auf der Anwendung abstrakterer Verarbeitungsregeln, und gleicht metaphorisch gesprochen eher einem Paragraphenreiter als einem Metzger. In Bezug auf den Vergleich zwischen zerlegbaren und nicht-zerlegbaren
104
Gunnar Jacob
Formen nimmt ein solches single-route Modell keinen prinzipiellen, qualitativen Unterschied an: Sowohl bei einer Form wie kaufte als auch bei einer Form wie lief wird anhand morphologischer Verarbeitungsregeln der jeweilige Verbstamm identifiziert. Weil aber die Form lief anders als die Form kaufte eine Stammveränderung enthält, ist dieser Prozess bei solchen Formen aufwendiger, was zu messbaren Unterschieden bei der Verarbeitung führen sollte. Metaphorisch gesprochen sind zwar sowohl die Form kaufte als auch die Form lief gleichermaßen verkleidete Versionen ihrer jeweiligen Verbstämme lauf- und kauf-, aber im Falle von lief ist der zugehörige Verbstamm lauf- vergleichsweise deutlich besser getarnt als bei kaufte. Deshalb ist es bei lief etwas schwieriger, durch die Verkleidung hindurchzusehen und den Verbstamm lauf- zu enttarnen. Allerdings sind diese Unterschiede anders als bei den oben erwähnten dual-route-Ansätzen nur gradueller Natur: Die Verarbeitung von morpho-orthographisch zerlegbaren und nicht-zerlegbaren Formen basiert auf demselben Verarbeitungsmechanismus; lediglich der Aufwand ist unterschiedlich groß. Dies bildete den theoretischen Ausgangspunkt für zahlreiche Vergleiche zwischen dekomponierbaren und nichtdekomponierbaren Formen in einer Reihe von Sprachen (z. B. Marslen-Wilson & Tyler 2004; Stockall & Marantz 2006; Marslen-Wilson, Bozic & Randall 2008; siehe auch Sonnenstuhl, Eisenbeiß & Clahsen 1999; Smolka, Zwitserlood & Rösler 2007, Smolka et al. 2013 für einige Beispiele zum Deutschen).
2.3 Der kleine Bibliothekar: Alles wird gespeichert Ein dritter Ansatz (z. B. Patterson & McLelland 2002; Baayen 2007) lehnt die Idee der morphologischen Verarbeitung gar vollständig ab, sondern nimmt stattdessen an, dass alle komplexen Wortformen, unabhängig davon, ob sie zerlegbar sind oder nicht, wie im rechten Teil von Abbildung 1 gezeigt jeweils eigene Einträge im mentalen Lexikon besitzen, und sich dementsprechend nicht grundsätzlich von nicht-komplexen Wörtern wie Tisch oder Katze unterscheiden. Die verschiedenen flektierten Formen eines Verbs wie liefern (liefere, lieferte, lieferst, geliefert usw.) zum Beispiel besitzen nach diesem Ansatz also alle jeweils einen eigenen Eintrag im mentalen Lexikon, sind aber miteinander vernetzt, weil sie sich eine ähnliche Bedeutung und ähnliche Formeigenschaften teilen. Die jeweiligen lexikalischen Einträge für komplexe Wörter enthalten dabei Informationen über die morphologischen Eigenschaften eines Wortes (Tempus, Numerus, Genus, Kasus). Primingeffekte, die zuvor als Evidenz für die morphologische Dekomposition von komplexen Wörtern interpretiert wurden, werden in diesem Modell stattdessen auf der Basis von äußerer Form und von Bedeutungseigenschaften der jeweiligen Wortpaare erklärt. In Bezug auf die äußere Form eines Wortes kommt
Morphologische Verarbeitung bei L2-Lernern
105
dabei eine besondere Bedeutung sogenannten Bigramm-Frequenzen zu, d. h. der Häufigkeit, mit der bestimmte Buchstaben oder Laute innerhalb von Wörtern direkt aufeinander folgen. Ein besonderes Problem für dieses Modell stellt allerdings der oben beschriebene corner-corn Effekt dar: In den beiden Wortpaaren brother-broth und brothel-broth teilen sich Prime und Zielwort jeweils dieselbe Zahl an Buchstaben, und sind zudem nicht semantisch verwandt. Das Modell würde hier also ähnlich große, durch orthographische Ähnlichkeit hervorgerufene Primingeffekte für beide Wortpaare vorhersagen; mehrere Studien zeigten allerdings signifikante Primingeffekte lediglich für brother-broth, aber nicht für brothel-broth. Baayen (2007) weist allerdings darauf hin, dass die in corner-corn Experimenten verwendeten Wortpaare teilweise eine indirekte semantische Ähnlichkeit aufweisen.
3 „Wenn zwei das Gleiche tun, ist es nicht immer dasselbe“: Morphologische Verarbeitung bei Muttersprachlern versus L2-Lernern Für Experimente mit L2-Lernern sind die oben beschriebenen Ansätze zur Verarbeitung bei Muttersprachlern deshalb wichtig, weil Ergebnisse von L2-Lernern meist nur im Vergleich zu Muttersprachler-Kontrolldaten interpretierbar sind. Nimmt man zum Beispiel an, dass komplexe Wörter morpho-orthographisch zerlegt werden, dann könnten Unterschiede zwischen Muttersprachlern und L2Lernern darauf hindeuten, dass derartige Zerlegungsprozesse bei L2-Lernern mit besonderen Problemen verbunden sind. In diesem Sinne ist es etwa durchaus denkbar, dass eines der oben beschriebenen Modelle die Verarbeitung von komplexen Wörtern bei Muttersprachlern relativ gut erklären kann, bei Daten von L2-Lernern jedoch an seine Grenzen stößt. In experimentellen Studien zur Verarbeitung von komplexen Wörtern bei L2Lernern wird meist dasselbe Experiment sowohl mit einer Gruppe von Muttersprachlern als auch mit einer Gruppe von L2-Lernen durchgeführt; anschließend werden dann die Ergebnisse der beiden Experimente miteinander verglichen. Ein solcher Vergleich zwischen Muttersprachlern und L2-Lernern ist methodisch betrachtet nicht unproblematisch. Lexikalische Entscheidungszeiten etwa sind selbst bei L2-Lernern mit sehr hoher L2-Kompetenz meist länger als bei Muttersprachlern. Direkte Vergleiche von lexikalischen Entscheidungszeiten für Muttersprachler und L2-Lerner sind deshalb meist nicht sinnvoll interpretierbar. Morphologische Priming-Experimente bieten hier allerdings den Vorteil, dass ein direkter Inter-Gruppen-Vergleich von lexikalischen Entscheidungszeiten umgan-
106
Gunnar Jacob
gen werden kann: Stattdessen wird hier zunächst innerhalb einer Probandengruppe die lexikalische Entscheidungszeit für die Experimentalbedingung (etwa für ein morphologisch verwandtes Wortpaar wie Öffnung-öffnen) mit der lexikalischen Entscheidungszeit für die Kontrollbedingung (etwa Pinsel-öffnen) verglichen und so ein Primingeffekt bestimmt. Anschließend kann man dann die Primingeffekte der beiden Probandengruppen miteinander vergleichen. Allerdings ist es immer noch möglich, dass die generellen Unterschiede in der Schnelligkeit zwischen Muttersprachlern und L2-Lernern auch einen Einfluss auf die Größe eines Primingeffekts haben könnten: Es könnte zum Beispiel passieren, dass bei Muttersprachlern die lexikalischen Entscheidungszeiten für ein Zielwort bereits generell (d. h. völlig unabhängig davon, welches Primewort dem Zielwort vorausging) so schnell sind, dass die Beschleunigung durch ein morphologisch verwandtes Primewort nur noch relativ klein ausfallen kann. Um zu vermeiden, dass Unterschiede zwischen beiden Gruppen schlicht dadurch zustande kommen, dass Muttersprachler die jeweilige Sprache ganz allgemein besser beherrschen als L2-Lerner, greifen diese Studien normalerweise auf Lerner mit einer sehr hohen Kompetenz in der L2 zurück. Zusätzlich zum Experiment wird in der Regel die Sprachkompetenz der Lerner gemessen, zum Beispiel mithilfe eines standardisierten Sprachtests; dadurch ist es möglich, Kompetenzunterschiede innerhalb der Lernergruppe statistisch zu kontrollieren.
3.1 Die Kontroverse um qualitative Unterschiede Experimente, die die Verarbeitung von komplexen Wörtern bei Muttersprachlern und L2-Lernern miteinander vergleichen, zeigen sehr unterschiedliche Ergebnisse. Erste Studien in diesem Bereich berichteten substantielle Unterschiede zwischen beiden Gruppen. Silva & Clahsen (2008) etwa untersuchten in einer masked priming-Studie die Verarbeitung von englischen Nominalisierungsformen wie boldness und Vergangenheitsformen wie walked bei Muttersprachlern und L2-Lernern des Englischen. Englische Muttersprachler zeigten sowohl für Nominalisierungen als auch für Vergangenheitsformen signifikante Primingeffekte. Bei L2-Lernern dagegen waren die Primingeffekte für Nominalisierungen deutlich schwächer ausgeprägt; für Vergangenheitsformen zeigten sie sogar überhaupt kein Priming. Einige Priming-Studien zum Deutschen berichten ähnliche Ergebnisse: Clahsen & Neubauer (2010) untersuchten die Verarbeitung von deutschen Nominalisierungen wie Lieferung oder Rettung; deutsche Muttersprachler zeigten auch hier signifikante Primingeffekte, L2-Lerner des Deutschen dagegen nicht. Neubauer & Clahsen (2009) verglichen die Verarbeitung von regulären und irregulären deutschen Partizipien bei Muttersprachlern und L2-Lernern des Deutschen. Auch hier
Morphologische Verarbeitung bei L2-Lernern
107
zeigten sich für reguläre Partizipien wie gewechselt oder gehandelt Unterschiede zwischen beiden Probandengruppen, mit signifikanten Primingeffekten bei Muttersprachlern, aber keinen solchen Effekten bei L2-Lernern. Unterschiede zwischen Muttersprachlern und L2-Lernern sind dabei zumindest nicht vollständig auf masked priming-Experimente beschränkt. In einer cross-modal priming-Studie fanden Jacob, Fleischhauser & Clahsen (2013) für reguläre deutsche Partizipien ebenfalls einen Unterschied zwischen Muttersprachlern und L2-Lernern. Wie lassen sich diese Unterschiede erklären? Clahsen et al. (2010) schlagen vor, dass Worterkennung bei L2-Lernern weniger auf Zerlegungsprozessen basiert als bei Muttersprachlern, und stattdessen stärker auf der Speicherung von einzelnen Wortformen im mentalen Lexikon. Nehmen wir an, dass Muttersprachler (ganz im Sinne des in 2.1 beschriebenen „Metzger-Models“) ein komplexes Wort wie wechselte in seine Bestandteile zerlegen, dabei den Verbstamm wechselisolieren, und dann auf den entsprechenden Eintrag für wechsel- im mentalen Lexikon zugreifen. Bei L2-Lernern dagegen könnten Verbformen wie wechseln, wechselte und gewechselt (ähnlich wie im in 2.3 beschriebenen „BibliothekarModel“) jeweils als separate Einträge im mentalen Lexikon abgespeichert sein. In diesem Fall würden Muttersprachler für Wortpaare wie gewechselt-wechseln signifikante Stamm-Primingeffekte zeigen, denn beide Wörter basieren auf dem Stamm wechsel-, der im Rahmen des Zerlegungsprozesses aktiviert wird. L2-Lerner aktivieren aber für gewechselt und wechseln jeweils einen separaten Eintrag im mentalen Lexikon, und zeigen deshalb keinerlei Stamm-Primingeffekte. In einer Reihe anderer, methodisch sehr ähnlich aufgebauter Studien zeigten sich dagegen keinerlei Unterschiede zwischen Muttersprachlern und L2-Lernern. Zum Beispiel untersuchten Feldman et al. (2010) in einer masked priming-Studie die Verarbeitung regulärer und irregulärer englischer Verbformen bei englischen Muttersprachlern und serbischen L2-Lernern des Englischen. Anders als in den oben beschriebenen Studien zeigte die Lernergruppe hier ähnliche Ergebnisse wie die Mutterprachlergruppe, d. h. signifikante Primingeffekte sowohl für reguläre als auch für irreguläre Formen. In einer Studie mit griechischen Englisch-Lernern verwendeten Voga, Anastassiadis-Symeonidis & Giraudo (2014) dieselben experimentellen Materialien wie in der schon erwähnten Studie von Silva & Clahsen (2008), in der sich substantielle Unterschiede zwischen den Probandengruppen gezeigt hatten. Anders als in der Vorgängerstudie zeigte die Lerner-Gruppe hier allerdings signifikante Primingeffekte sowohl für englische Nominalisierungen als auch für flektierte Formen. In einer ähnlichen Studie verglichen Diependaele et al. (2011) die Verarbeitung von englischen Nominalisierungen (z. B. viewer) bei englischen Muttersprachlern und spanischen und niederländischen Englisch-Lernern. Die Ergebnisse zeigten für beide Gruppen von L2-Lernern ähnliche signifi-
108
Gunnar Jacob
kante Primingeffekte wie bei englischen Muttersprachlern. Auch Coughlin & Tremblay (2015) fanden in einer masked priming-Studie zu französischen Flexionsformen ähnliche Primingeffekte für Muttersprachler und L2-Lerner. De Grauwe et al. (2014) untersuchten in einer Kombination aus Priming- und fMRT-Studie die Verarbeitung niederländischer Präfix-Verben wie wegleggen oder inslapen. Niederländische Muttersprachler und deutsche L2-Lerner des Niederländischen zeigten hier sowohl ähnliche Primingergebnisse als auch ähnliche Effekte in denselben Hirnregion, der linken unteren Hirnwindung (Gyrus frontalis inferior). Insgesamt ist die Datenlage in dieser Frage also alles andere als eindeutig: In einigen der oben beschriebenen Studien zeigten sich deutliche Unterschiede zwischen Muttersprachlern und L2-Lernern, andere Studien fanden dagegen ähnliche Effekte für beide Probandengruppen. Die wissenschaftliche Diskussion über die Frage, warum diese Studien so unterschiedliche Ergebnisse geliefert haben, konzentrierte sich lange auf die spezifischen Eigenschaften der jeweiligen Studien, wie etwa die untersuchte Sprache, spezielle Eigenschaften der jeweils verwendeten Materialien, oder die Sprachkompetenz der Lerner in der getesteten L2. Feldman et al. (2010) etwa berichten eine zusätzliche Analyse, bei der Primingeffekte für fortgeschrittene und weniger fortgeschrittene L2-Lerner miteinander verglichen werden. Die weniger fortgeschrittenen Lerner zeigten hier keinerlei Primingeffekte, die fortgeschrittenen Lerner allerdings ähnliche Primingeffekte wie die Muttersprachler. Die Autoren schlagen vor, dass L2-Lerner zwar prinzipiell die gleichen Verarbeitungsmechanismen für komplexe Wörter entwickeln können wie Muttersprachler, dass diese Mechanismen aber bei weniger fortgeschrittenen Lernern noch nicht entwickelt sind. Allerdings berichten die Studien, in denen sich Unterschiede zwischen Muttersprachlern und L2-Lernern zeigten, durchgehend eine sehr hohe Kompetenz der getesteten Lerner in der L2. Die Sprachkompetenz der Lerner bietet also bestenfalls eine teilweise Erklärung für die unterschiedlichen Ergebnisse. Ähnlich verhält es sich mit der Rolle sprachspezifischer Eigenschaften: So zeigen zum Beispiel die beiden Studien von Silva & Clahsen (2008) und von Voga et al. (2014) unterschiedliche Ergebnisse, obwohl beide Studien dieselbe Sprache untersuchten, und dabei sogar dieselben experimentellen Materialien verwendeten. Allerdings sollte man erwähnen, dass mehrere der Studien, in denen sich substantielle Unterschiede zwischen Muttersprachlern und L2-Lernern zeigten, komplexe Wörter im Deutschen untersucht haben. Es ist also durchaus möglich, dass spezifische Eigenschaften der jeweiligen Sprache eine gewisse Bedeutung besitzen. Ein anderer Versuch, die unterschiedlichen Ergebnisse in Einklang zu bringen, setzt an der Frage an, ob die Primingeffekte in einer bestimmten Studie wirklich als Evidenz für morphologische Dekomposition gelten können, oder ob diese Effekte im konkreten Fall auch anders erklärt werden können. Wie bereits in
Morphologische Verarbeitung bei L2-Lernern
109
Abschnitt 1.2 gesehen haben, können auch durch die orthographische und semantische Ähnlichkeit zwischen Prime und Zielwort unter Umständen Primingeffekte entstehen, die vordergründig wie morphologische Primingeffekte aussehen. Es wäre also möglich, dass in manchen Studien zwar Muttersprachler und L2Lerner die gleichen Effekte zeigen, dass diese Effekte aber nur bei Muttersprachlern auf morphologischer Dekomposition beruhen, und bei L2-Lernern stattdessen auf andere Weise entstehen. Heyer & Clahsen (2015) untersuchten diese Möglichkeit in einer Studie zur Verarbeitung von deutschen und englischen Nominalisierungen bei englischen und deutschen Muttersprachlern. Für beide Sprachen zeigten hier sowohl Muttersprachler als auch L2-Lerner ähnliche morphologische Primingeffekte. Allerdings enthielt die Studie zusätzlich zu morphologisch verwandten Wortpaaren auch Kontrollbedingungen aus Wortpaaren wie Kasten-Kasse oder scandal-scan, in denen Prime- und Zielwort nur auf rein orthographischer Ebene verwandt waren, d. h. sich jeweils eine Reihe von Buchstaben teilten. Für diese Wortpaare zeigten deutsche und englische Muttersprachler keinerlei Primingeffekte, L2-Lerner der jeweiligen Sprache allerdings schon. Es wäre also möglich, dass Muttersprachler und L2-Lerner zwar ähnliche morphologische Primingeffekte zeigen, diese Effekte aber bei den L2-Lernern nicht auf morphologischen Zerlegungsprozessen beruhen, sondern stattdessen auf der orthographischen Ähnlichkeit von Prime- und Zielwort. Heyer & Clahsen (2015) schlagen vor, dass L2-Lerner sich bei der Worterkennung stärker auf die Oberflächenform von Wörtern, in diesem Fall die einzelnen Buchstaben, konzentrieren. Dadurch entstehen bei morphologisch verwandten Wortpaaren wie Lieferungliefern unter Umständen Primingeffekte, die aber nichts mit morphologischer Dekomposition zu tun haben, sondern dadurch bedingt sind, dass sich morphologisch verwandte Wortpaare automatisch immer auch eine Reihe von Buchstaben teilen. Tatsächlich enthielten auch die oben beschriebenen Studien von Feldman et al. (2010) und Diependaele et al. (2011) orthographische Kontrollbedingungen, in denen die L2-Lerner jeweils signifikante orthographische Primingeffekte zeigten, die Muttersprachler jedoch nicht. Insgesamt legen diese Ergebnisse nahe, dass sich Muttersprachler und L2-Lerner tatsächlich in Bezug auf die Verarbeitung komplexer Wörter unterscheiden. Diese Unterschiede treten allerdings in Experimenten nicht immer offen zutage, etwa weil L2-Lerner sich stärker auf die Oberflächenform von Wörtern konzentrieren, was bei morphologisch verwandten Wortpaaren zu ähnlichen Primingeffekten führen kann wie morphologische Dekomposition.
110
Gunnar Jacob
3.2 „Alle komplexen Wörter sind gleich, aber einige sind gleicher“: Unterschiedliche Arten von Morphologie Bisher haben wir uns lediglich mit der Frage beschäftigt, wie Muttersprachler und L2-Lerner ganz allgemein morphologisch komplexe Wörter jeglicher Art verarbeiten. Die beschriebenen Studien basieren dabei auf sehr unterschiedlichen morphologischen Phänomenen, zum Beispiel unterschiedlichen Arten von Nominalisierungen, flektierten Verbformen, oder Präfix-Verben. Viele theoretischlinguistische Ansätze unterscheiden allerdings zwischen verschiedenen Arten von morphologisch komplexen Wörtern. Realisationsbasierte Ansätze etwa (Anderson 1992) unterscheiden zwischen Flexion (z. B. retten-rettete), Derivation (z. B. rettenRettung, graben-vergraben), und Komposition (z. B. Fabrik-Flaschenfabrik). Die linguistischen Unterschiede zwischen diesen morphologischen Phänomenen können sich möglicherweise auch auf die Verarbeitung solcher Formen auswirken. Um diese Möglichkeit zu untersuchen, muss man Effekte für diese unterschiedlichen Phänomene experimentell miteinander vergleichen. Einen ersten Hinweis darauf, dass L2-Lerner möglicherweise derivierte und flektierte Formen unterschiedlich verarbeiten, lieferte bereits die schon erwähnte Studie von Silva & Clahsen (2008). In dieser Studie zeigte die Lernergruppe keinerlei Primingeffekte für flektierte Formen, aber signifikante (wenn auch im Vergleich zu Muttersprachlern schwächere) Effekte für derivierte Formen. Ein ähnliches Datenmuster fanden auch Kırkıcı & Clahsen (2013) in einer masked priming-Studie mit L2-Lernern des Türkischen: Hier zeigten türkische Muttersprachler ähnlich große Primingeffekte für flektierte Aorist-Formen und für Nominalisierungen. L2-Lerner des Türkischen zeigten solche Effekte dagegen nur für Nominalisierungen, für flektierte Formen jedoch keinerlei Priming. Allerdings basieren beide Studien nicht auf einem direkten Vergleich von Derivation und Flexion. Stattdessen werden dort jeweils getrennte Priming-Experimente für Derivationspaare und Flexionspaare berichtet, deren Effekte dann später miteinander verglichen werden. Eine neuere masked priming-Studie mit L2-Lernern des Deutschen (Jacob, Heyer & Verissimo im Druck) verwendete derivierte und flektierte Wortpaare, die beide auf demselben Zielwort basieren, um Primingeffekte für derivierte und flektierte Formen direkt miteinander vergleichen zu können. Deutsche Muttersprachler zeigten hier ähnlich große Primingeffekte für deutsche Nominalisierungen (z. B. Lieferung-liefern) und für Partizipien (z. B. geliefert-liefern). Russische L2-Lerner des Deutschen zeigten dagegen Unterschiede zwischen den beiden Phänomenen, mit signifikanten Primingeffekten lediglich für Nominalisierungen, aber deutlich schwächeren, nicht signifikanten Effekten für Partizipien. Dieser L2-spezifische Unterschied zwischen derivierten und flektierten Formen kann nicht dadurch erklärt werden, dass L2-Lerner sich stärker auf die Oberflächenform eines Wortes kon-
Morphologische Verarbeitung bei L2-Lernern
111
zentrieren: Die Zahl der Buchstaben, die sich Prime- und Zielwort teilen, ist schließlich bei einem derivierten Wortpaar wie Lieferung-liefern genauso groß wie bei einem flektierten Wortpaar wie geliefert-liefern. Eine mögliche Erklärung für diesen L2-spezifischen Unterschied zwischen Derivation und Flexion wäre, dass das Sprachverarbeitungssystem von L2-Lernern zwar prinzipiell in der Lage ist, komplexe Wörter zu zerlegen, dass aber Flexionsaffixe aufgrund ihrer spezifischen linguistischen Eigenschaften besonders schwierig abzutrennen sind. Derivationsaffixe sind für L2-Lerner möglicherweise prominenter, etwa weil sie semantische Information enthalten: Lieferung etwa bedeutet Prozess des Lieferns, Dunkelheit bedeutet Zustand des Dunkel-Seins. Flexionsaffixe dagegen spezifizieren in der Regel grammatische Funktionen; bei einer flektierten Form wie (Du) lieferst etwa verändert das Flexionsaffix -st nicht die Bedeutung des Stammes liefer-, sondern stellt eine grammatische Beziehung zwischen dem Verb und seinem dazugehörigen Subjekt her. In diesem Sinne ist das Affix hier also weniger prominent, was möglicherweise den Dekompositionsprozess erschwert. Unterschiede zwischen verschiedenen Arten von komplexen Wörtern können teilweise erklären, warum die oben erwähnten Studien so unterschiedliche Ergebnisse hervorgebracht haben: Zumindest einige der Studien, die keinerlei Unterschiede zwischen Muttersprachlern und L2-Lernern zeigten (Diependaele et al. 2011; De Grauwe et al. 2014) untersuchten die Verarbeitung von derivierten Formen. Zwar fanden die Studien von Feldman et al. (2010) zum Englischen und Coughlin & Tremblay (2015) zum Französischen auch für flektierte Formen signifikante Primingeffekte bei L2-Lernern. Allerdings könnten diese Effekte, wie Feldman et al. (2010) selbst einräumen, auch orthographisch bedingt sein.
3.3 „Reden ist Silber, Schweigen ist Gold“: Verarbeitung versus Produktion von komplexen Wörtern Für den Bereich der Produktion von komplexen Wörtern kann man prinzipiell ähnliche Fragen stellen wie für die Worterkennung: Analog zu der Frage, ob komplexe Wörter bei der Worterkennung in ihre Bestandteile zerlegt werden, kann man für den Bereich der Wortproduktion die Frage stellen, ob komplexe Wörter in diesem Fall aus ihren Bestandteilen zusammengesetzt werden. Wenn morphologische Verarbeitung bei L2-Lernern weniger auf Dekompositionsprozessen und stattdessen stärker auf der Speicherung einzelner Wortformen im mentalen Lexikon basiert, dann sollten sich auch bei der Produktion Unterschiede zwischen Muttersprachlern und L2-Lernern finden. Allerdings ist die Produktion von komplexen Wörtern bei L2-Lernern bisher kaum experimentell untersucht. Eine Ausnahme bildet hier eine EEG-Studie von Festman & Clahsen (2016), die die
112
Gunnar Jacob
Produktion von regulären (z. B. ask-asked) und irregulären (z. B. hold-held) englischen Präteritumsformen bei deutschen Muttersprachlern untersuchte. Muttersprachlern und L2-Lernern wurden Infinitive englischer Verben vorgegeben, deren Präteritumsformen sie produzieren mussten. Bei beiden Probandengruppen zeigten sich Unterschiede in der Hirnaktivität zwischen regulären und irregulären Präteritumsformen. Mussten stattdessen jedoch komplexe Präsensformen derselben Verben (z. B. asks oder holds) produziert werden, so zeigten sich dagegen bei keiner der beiden Probandengruppen Unterschiede zwischen den beiden Verbgruppen. Die Autoren erklären dieses Datenmuster auf der Basis des oben beschriebenen dual-route Modells: Reguläre Präteritumsformen wie asked werden bei der Produktion zusammengesetzt, indem dem Wortstamm ask das Präteritumsaffix -ed hinzugefügt wird. Irreguläre Formen wie held dagegen besitzen eigene Einträge im mentalen Lexikon, und müssen bei der Produktion von dort abgerufen werden. Der Unterschied zwischen beiden Verbgruppen ist dabei auf die Produktion von Präteritumsformen beschränkt, weil die Präsensformen der entsprechenden Verben keinerlei irreguläre Formen aufweisen, sondern für beide Verbgruppen durch Anhängen des Affixes -s gebildet werden. Interessanterweise zeigten sich in dieser Studie, anders als in einigen ähnlichen Studien zur Worterkennung, keinerlei Unterschiede zwischen Muttersprachlern und L2-Lernern des Englischen. Möglicherweise sind derartige Unterschiede auf die frühe Phase der Worterkennung, wie sie etwa in masked priming-Experimenten untersucht wird, beschränkt, und treten bei der Produktion nicht auf. Allerdings steckt die experimentell-psycholinguistische Forschung zur Produktion von komplexen Wörtern bei L2-Lernern noch in den Kinderschuhen. In diesem Sinne sollte man diese Ergebnisse vor allem als Hinweis verstehen, dass Erkenntnisse über Unterschiede zwischen Muttersprachlern und L2-Lernern nicht ohne weiteres vom Wortverstehen auf die Produktion übertragen werden können.
4 „Wissen wir nur, dass wir nichts wissen?“: Der Versuch eines Fazits Auf den ersten Blick erscheint der aktuelle Stand der Forschung zur Verarbeitung komplexer Wörter bei L2-Lernern mehr als verwirrend: Die vorhandenen experimentellen Studien zeigen nicht nur sehr unterschiedliche Ergebnisse, sondern diskutieren ihre Befunde auch auf der Grundlage sehr unterschiedlicher theoretischer Ansätze. Selbst für die muttersprachliche Verarbeitung ist die Datenlage alles andere als eindeutig. Ein grundlegendes Problem in diesem Feld besteht darin, dass morphologische Effekte von Effekten anderer Eigenschaften eines
Morphologische Verarbeitung bei L2-Lernern
113
komplexen Wortes, wie etwa der Orthographie oder der Wortbedeutung, getrennt werden müssen. Dieses Problem betrifft besonders auch den Vergleich zwischen Muttersprachlern und L2-Lernern: Wie wir gesehen haben, zeigen beide Gruppen unter Umständen in einem Experiment dieselben Effekte, die aber unterschiedliche Ursachen haben können (Feldman et al. 2010; Heyer & Clahsen 2015). In diesem Sinne sollte die zukünftige Forschung versuchen, Effekte von Morphologie, Orthographie, und Semantik noch besser voneinander zu trennen. Immerhin gibt es allerdings eine Reihe von Anzeichen dafür, dass die interne grammatische Struktur von komplexen Wörtern eine Rolle bei der Verarbeitung spielt. Einige Studien legen außerdem nahe, dass es bei der Verarbeitung von komplexen Wörtern Unterschiede zwischen Muttersprachlern und L2-Lerner gibt. Allerdings erwiesen sich frühe Ansätze (Neubauer & Clahsen 2009, Clahsen et al. 2010, Clahsen & Neubauer 2010), die generelle Unterschiede in Bezug auf alle Arten von komplexen Wörtern postulierten, als zu allgemein. Neuere Studien lassen es wahrscheinlicher erscheinen, dass diese Unterschiede weitgehend auf bestimmte morphologische Phänomene, wie etwa flektierte Formen, beschränkt sind. Dies würde bedeuten, dass das Verarbeitungssystem von L2-Lernern zwar prinzipiell in der Lage ist, komplexe Wörter zu zerlegen, dass aber die Zerlegung bestimmter Formen besondere Probleme mit sich bringt. Allerdings haben bisher nur wenige Studien verschiedene morphologische Phänomene systematisch miteinander verglichen; auch hier sollte zukünftige Forschung ansetzen. Ein weiterer Bereich, der bisher nicht ausreichend untersucht wurde, ist die Rolle sprachspezifischer Eigenschaften bei der L2-Verarbeitung von komplexen Wörtern. Bis vor kurzem konzentrierten sich Studien zur morphologischen Verarbeitung bei L2-Lernern stark auf eine überschaubare Zahl von einzelnen besonders verbreiteten Zweit- oder Fremdsprachen. Wie wir gesehen haben wurde dabei oft versucht, aus Ergebnissen für eine spezifische Sprache Schlussfolgerungen für morphologische Verarbeitung ganz allgemein abzuleiten. Es ist allerdings durchaus möglich, dass sich spezifische Eigenschaften einer Sprache auf die L2-Verarbeitung von komplexen Wörtern auswirken. So konnten etwa Aronoff, Berg & Heyer (2016) zeigen, dass sich im Englischen morphologische Eigenschaften der Sprache unmittelbar auf die Orthographie auswirken, wodurch morpho-orthographische Dekomposition spezifisch für das Englische zu einer besonders effektiven Strategie wird. Möglicherweise passen sich die Verarbeitungsmechanismen solchen spezifischen Eigenschaften der jeweiligen Sprache an. Schließlich ist auch die Rolle spezifischer Eigenschaften des Lerners noch nicht ausreichend untersucht: Welche Rolle spielen etwa Erwerbsalter, Sprachstand, unterschiedliche Arten des L2-Erwerbs, und der Grad an Kontakt mit der L2 während des Lernprozesses? Die Rolle dieser Faktoren ist auch in Bezug auf die
114
Gunnar Jacob
Frage relevant, ob die Unterschiede zwischen Muttersprachlern und L2-Lernern, die sich in einigen Studien gezeigt haben, durch entsprechende Veränderungen des Erwerbsprozesses vermieden werden können, oder ob diese Unterschiede unvermeidbar sind.
Literaturangaben Anderson, Stephen R. (1992): A-Morphous morphology. Cambridge: Cambridge University Press. Aronoff, Mark, Kristian Berg & Vera Heyer (2016): Some implications of English spelling for morphological processing. The Mental Lexicon 11, 164 – 185. Baayen, Harald R. (2007): Storage and computation in the mental lexicon. In: Gonia Jarema and Gary Libben (Hrsg.), The Mental Lexicon: Core Perspectives, 81 – 104. Amsterdam: Elsevier. Clahsen, Harald, Claudia Felser, Kathleen Neubauer, Mikako Sato & Renita Silva (2010): Morphological structure in native and non-native language processing. Language Learning 60, 21 – 43. Clahsen, Harald & Elisabeth Fleischhauer (2014): Morphological priming in child German. Journal of Child Language 41, 1305 – 1333. Clahsen, Harald & Kathleen Neubauer (2010): Morphology, frequency, and the processing of derived words in native and nonnative speakers. Lingua 120, 2627 – 2637. Coughlin, Caitlin E. & Annie Tremblay (2015): Morphological decomposition in native and non-native French speakers. Bilingualism: Language & Cognition 18 (3), 524 – 542 De Grauwe, Sophie, Kristin Lemhöfer, Roel M. Willems & Herbert Schriefers (2014): L2 speakers decompose morphologically complex verbs: fMRI evidence from priming of transparent derived verbs. Frontiers in Human Neuroscience 8:802. Diependaele, Kevin, John A. Duñabeitia, Joanna Morris & Emmanuel Keuleers (2011): Fast morphological effects in first and second language word recognition. Journal of Memory and Language 64, 344 – 5358. Dominguez, Alberto, Manuel De Vega & Horacio Barber (2004): Event-related brain potentials elicited by morphological, homographic, orthographic, and semantic priming. Journal of Cognitive Neuroscience 16 (4), 598 – 5608. Feldman, Laurie B., Aleksandar Kostić, Dana M. Basnight-Brown, Đurđević Dušica F. & Matthew J. Pastizzo (2010): Morphological facilitation for regular and irregular verb formations in native and nonnative speakers: Little evidence for two distinct mechanisms. Bilingualism: Language and Cognition 13, 119 – 5135. Festman, Julia & Harald Clahsen (2016): How Germans prepare for the English past tense: Silent production of inflected words during EEG. Applied Psycholinguistics 37, 487 – 5506. Giraudo, Hélène, & Jonathan Grainger (2001): Priming complex words: Evidence for supralexical representation of morphology. Psychonomic Bulletin and Review 8 (1), 127 – 5131. Heyer, Vera & Harald Clahsen (2015): Late bilinguals see a scan in scanner AND in scandal: Dissecting formal overlap from morphological priming in the processing of derived words. Bilingualism: Language and Cognition 18, 543 – 5550.
Morphologische Verarbeitung bei L2-Lernern
115
Jacob, Gunnar, Elisabeth Fleischhauer & Harald Clahsen (2013): Allomorphy and affixation in morphological processing: A cross-modal priming study with late bilinguals. Bilingualism: Language and Cognition 16, 924 – 933. Jacob, Gunnar, Vera Heyer & Joao Veríssimo (im Druck): Aiming at the same target: A masked priming study directly comparing derivation and inflection in the second language. International Journal of Bilingualism. Johnson, Jacqueline S., Kenneth D. Shenkman, Elissa L. Newport & Douglas L. Medin (1996): Indeterminacy in the grammar of adult language learners. Journal of Memory and Language 35, 335 – 352. Kırkıcı, Bilal & Harald Clahsen (2013): Inflection and derivation in native and non-native language processing: Masked priming experiments on Turkish. Bilingualism: Language and Cognition 16, 776 – 794. LeMaster, J. R., James Wilson & Christie G. Hamric (1993): The Mark Twain Encyclopedia. New York: Garland. Longtin, Catherine–Marie, Juan Segui & Pierre A. Hallé (2003): Morphological priming without morphological relationship. Language and Cognitive Processes 18, 313 – 34. Marantz, Alec (2013): No escape from morphemes in morphological processing. Language and Cognitive Processes 28 (7), 905 – 916. Marslen-Wilson, William D. (2007): Morphological processes in language comprehension. In Gareth Gaskel (Hrsg.), The Oxford handbook of psycholinguistics, 175 – 193. Oxford: Oxford University Press. Marslen-Wilson, William D. & Lorraine K. Tyler (2004): The lexicon, grammar, and the past tense: Dissociation revisited. In Michael Tomasello & Dan I. Slobin (Hrsg.), Beyond Nature-Nurture: Essays in Honor of Elizabeth Bates, 263 – 279. Mahwah, NJ, London: Lawrence Earlbaum. Marslen-Wilson, William D., Mirjana Bozic, & Billi Randall (2008): Early decomposition in visual word recognition: Dissociating morphology, form, and meaning. Language and Cognitive Processes 23 (3), 394 – 421. Neubauer, Kathleen & Harald Clahsen (2009): Decomposition of inflected words in a second language: An experimental study of German participles. Studies in Second Language Acquisition 31, 403 – 435. Patterson, Karalyn & James L. McClelland (2002): Rules or connections in past-tense inflections: What does the evidence rule out? Trends in Cognitive Sciences 6, 465 – 472. Pinker, Steven (1999): Words and rules. New York, NY: Basic Books. Pinker, Steven & Michael T. Ullman (2002): The past and the future of the past tense. Trends in Cognitive Sciences 6, 456 – 463. Prévost, Philippe, & Lydia White (2000): Missing surface inflection or impairment in second language acquisition? Evidence from tense and agreement. Second Language Research 16, 103 – 133. Rastle, Kathleen, Matt H. Davis & Boris New (2004): The broth in my brother’s brothel: Morpho-orthographic segmentation in visual word recognition. Psychonomic Bulletin & Review 11, 1090 – 1098. Rastle, Kathleen, Matt H. Davis, William D., Marslen-Wilson & Lorraine K. Tyler (2000): Morphological and semantic effects in visual word recognition: A time-course study. Language and Cognitive Processes 15, 407 – 437.
116
Gunnar Jacob
Silva, Renita & Harald Clahsen (2008): Morphologically complex words in L1 and L2 processing: Evidence from masked priming experiments in English. Bilingualism: Language and Cognition 11, 245 – 260. Smolka, Eva, Patrick Khader, Richard Wiese, Pienie Zwitserlood & Frank Rösler (2013): Electrophysiological Evidence for the Continuous Processing of Linguistic Categories of Regular and Irregular Verb Inflection in German. Journal of Cognitive Neuroscience 25 (8), 1284 – 1304. Smolka, Eva, Pienie Zwitserlood & Frank Rösler (2007): Stem access in regular and irregular inflection: Evidence from German participles. Journal of Memory and Language 57 (3), 325 – 347. Sonnenstuhl, Ingrid, Sonja Eisenbeiss & Harald Clahsen (1999): Morphological priming in the German mental lexicon. Cognition 72 (3), 203 – 236. Stanners, Robert F., James JJ. Neiser, William P. Hernon & Roger Hall (1979): Memory representation for morphologically related words. Journal of Verbal Learning and Verbal Behavior 18 (4), 399 – 412. Stockall, Linnaea & Alec Marantz (2006): A single route, full decomposition model of morphological complexity: MEG evidence. The Mental Lexicon 1:1. Ullman, Michael T. (2004). Contributions of memory circuits to language: The declarative/procedural model. Cognition 92 (1), 231 – 270. Voga, Madeleine, Anna Anastassiadis-Symeonidis & Hélène Giraudo (2014): Does morphology play a role in L2 processing? Two masked priming experiments with Greek speakers of ESL. Lingvisticae Investigationes 37, 338 – 352.
III Sätze
Maren Schmidt-Kassow, M. Paula Roncaglia-Denissen und Sonja A. Kotz
Die Rolle des Trochäus bei der L1- und L2-Satzverarbeitung im Deutschen Eckstein, Eckstein, alles muss versteckt sein!
Abzählreime wie der oben zitierte finden sich in allen Sprachen der Welt und alle haben eines gemeinsam: ihr metrisches Muster ist sehr einfach und wiederholt sich kontinuierlich. Im Deutschen weisen diese Kinderreime meistens ein trochäisches Muster auf, also einen Wechsel von betonten und unbetonten Silben, da der Trochäus das Standardmetrum im Deutschen ist. Im vorliegenden Kapitel wollen wir experimentelle Evidenz zur Bedeutung des Trochäus in der auditiven Satzverarbeitung von Muttersprachlern und L2-Lernern des Deutschen vorstellen. Dabei konzentrieren wir uns auf L2-Sprecher, in deren L1 der Trochäus keine bzw. eine untergeordnete Rolle spielt. Wir werden dabei Daten berichten, die die Bedeutung der metrischen Verarbeitung auf der Satzebene belegen. Unsere Ergebnisse untermauern damit die Relevanz der Prosodie während des L2-Erwerbs, die im Vergleich zur Syntax und zur Semantik im didaktischen Alltag zumeist eine eher untergeordnete Rolle spielt. Die Zuschreibung einer relevanten Rolle des Metrums in der Sprachwahrnehmung ist nicht unbedingt intuitiv. Zunächst klingt Sprache, mit der Ausnahme von Gedichten, eher zeitlich unsystematisch und ein strikt zu Grunde liegendes Metrum, wie es beispielsweise in der Musik häufig der Fall ist, scheint in der Spontansprache zu fehlen. Nichtsdestotrotz gibt es mehr und mehr Evidenz, dass die Sprachen dieser Welt sich in ihren inhärenten Sprachrhythmen und metrischen Strukturen unterscheiden. Bereits vor 50 Jahren schlug Abercrombie (1967) vor, dass alle Sprachen einer von zwei Rhythmusklassen zugeteilt werden könnten, nämlich den akzentzählenden Sprachen oder den silbenzählenden Sprachen. Akzentzählenden Sprachen sei gemeinsam, dass sich betonte Silben in gleichen Zeitabständen wiederholen, während bei silbenzählenden Sprachen alle Silben isochron verteilt wären. Diese so genannte Isochroniehypothese wurde häufig angezweifelt, weil viele Sprachwissenschaftler ihren Untersuchungsgegenstand auf Produktionsdaten richteten und keine messbaren Anhaltspunkte für Isochronie in der gesprochenene Sprache gefunden haben. Unumstritten blieb jedoch, dass Sprachen unterschiedliche Sprachrhythmen aufweisen. Beispielsweise Maren Schmidt-Kassow, Goethe-Universität Frankfurt M. Paula Roncaglia-Denissen und Sonja A. Kotz, Max-Planck-Institut für Kognitions- und Neurowissenschaften, Leipzig DOI 10.1515/9783110456356-006
120
Maren Schmidt-Kassow, M. Paula Roncaglia-Denissen und Sonja A. Kotz
haben Nazzi & Ramus (2003) die Bedeutung des Sprachrhythmus im L1-Erwerb nachgewiesen und berichtet, dass selbst 5 Tage alte Neugeborene dazu in der Lage sind, ihre Muttersprache von anderen Sprachen allein anhand ihres Rhythmus zu unterscheiden. Dies hat dazu geführt, dass Sprachwissenschaftler die Terminologie und Einteilung in akzent- und silbenzählende Sprachen beibehalten haben, obwohl es bislang keine messbares Korrelat für diese Einteilung gibt. Oftmals sind die sprecherspezifischen Unterschiede größer als die sprachspezifischen Unterschiede (Arvaniti & Ross 2011). Offensichtlich haben die genannten Rhythmusklassen einen großen Einfluss darauf, wie wir Sprache wahrnehmen: Wenn wir gesprochene Sprache hören, ist es wichtig, diese zunächst zu segmentieren, d. h. in einzelne Wörter zu zerlegen, um anschliessend auf die Bedeutung der Wörter zuzugreifen und die Äußerung zu sequenzieren. Wir nutzen den Ausdruck sequenzieren in diesem Zusammenhang für das Vorhersagen zukünftiger Ereignisse in einem Sprachsignal (What next?). Dies kann sowohl das Vorhersagen eines bestimmten Phonems, einer betonten Silbe, oder auch einer syntaktischen Phrase sein. Nach dem so genannten rhythmusbasierten Segmentationsansatz variieren die Segmentierungsstrategien in Abhängigkeit von der Sprachryhthmusklasse, was dazu führt, dass Zweitsprachen, die derselben Sprachrhythmusklasse angehören wie die L1, leichter zu segmentieren sind als Sprachen, die anderen Sprachrhythmusklassen angehören. Das Deutsche als akzentzählende Sprache weist einen prominenten Wechsel von betonten und unbetonten Silben auf, die zu einem trochäischen Muster führt. Der Trochäus gilt als das Standardmetrum im Deutschen und spielt eine entscheidende Rolle bei der Gruppierung des Sprachflusses in kleinere Einheiten. Das heisst, dass das Metrum als eine Art Wegweiser in der Sprachsegmentierung dient und damit das auditive Sprachverstehen in akzentzählenden Sprachen beinflusst. In silbenzählenden Sprachen hingegen ist die Silbe der entscheidende Hinweisreiz in der Sprachsegmentierung und metrische Strukturen spielen keine Rolle (Sebastián-Gallés et al. 1992; Goyet, de Schonen & Nazzi 2010). Die Sensibilität gegenüber rhythmischen Hinweisreizen in einer L2 erleichtert stark die Informationsverarbeitung und das Sprachverstehen. Umgekehrt kann die inadäquate Nutzung rhythmischer Hinweisreize die Segmentierung und Worterkennung beinträchtigen und damit die Sprachverarbeitung erschweren. Bevor wir jedoch die Rolle des trochäischen Metrums in der L1- und L2Satzverarbeitung näher betrachten, möchten wir in den folgenden Abschnitten die von uns genutzte Terminologie einführen und Hintergrundinformation zur Relevanz von prosodischen Strukturen in der Satzverarbeitung ausführen.
Die Rolle des Trochäus bei der L1- und L2-Satzverarbeitung im Deutschen
121
1 Rhythmus und Metrum: Definitionen und Begriffsabgrenzung Wenn man sich mit Rhythmus- und Metrumforschung näher beschäftigt, fällt schnell auf, dass viele Autoren die Begriffe Rhythmus und Metrum zur Beschreibung von unterschiedlichen prosodischen Einheiten verwenden. Überwiegend wird der Begriff Sprachrhythmus genutzt, um einen Aspekt der Prosodie zu beschreiben, nämlich das Zusammenspiel von Pausendauern, Übergängen, Vokalreduktionen, Betonungsabfolgen etc., welches dazu führt, dass die Sprachen dieser Welt ganz unterschiedlich klingen. Diese Definition von Sprachrhythmus schafft auch den Ausgangspunkt für unterschiedliche Sprachrythmusklassen. Akzentzählende Sprachen wie das Deutsche oder das Englische scheinen ein anderes Muster von vokalischen und intervokalischen Intervalldauern, sowie eine stärkere Vokalreduktion und komplexere Silben aufzuweisen als silbenzählende Sprachen wie das Französische. Da eine einheitliche Definition fehlt und das Sprachmetrum ebenfalls häufig als Rhythmus bezeichnet wird wollen wir im Folgenden relevante Begriffe, die in diesem Kapitel verwendet werden, genauer definieren.
1.1 Rhythmus, Puls und Metrum Unsere Definitionen von Rhythmus und Metrum in der Sprache haben ihre Wurzeln in der Musiktheorie von Lerdahl & Jackendoff (1983). Sie definieren Rhythmus in der Musik als umfassendes Gefühl von Bewegung in der Zeit, welches einzelne Pulse, Phrasierungen, Harmonien und das Metrum mit einschließt. Der Puls ist dabei der wahrgenommene Schlag, der regelmäßig verteilte Zeitpunkte markiert. Diese Markierung kann entweder durch reale akustische Ereignisse umgesetzt werden, wie beispielsweise betonte Silben, oder es kann sich um rein hypothetische Zeitpunkte handeln, d. h. Akzente, die ohne ein physikalisches Korrelat subjektiv wahrgenommen werden, wenn besonders viel Aufmersamkeit auf diesen Zeitpunkt gerichtet wird (Hyman 1977). Ein Beispiel dafür ist das Geräusch einer tickenden Uhr. Physikalisch gesehen ist jedes Ticken (=Puls) gleich laut. Subjektiv jedoch nehmen wir im Wechsel ein Ticken als lauter bzw. leiser wahr und weisen dem Ticken eine trochäische Struktur zu (Tick-Tock-Tick-Tock). Somit ist das Metrum eine abstrakte Struktur, die sich aus der regelmäßigen Abfolge von starken und schwachen Pulsschlägen ergibt. Wir legen die Annahme zu Grunde, dass Regelmäßigkeiten in der Sprache auf perzeptuellen metrischen Mustern basieren, deren neurophysiologische Basis noch nicht entschlüsselt ist. Dabei definieren wir
122
Maren Schmidt-Kassow, M. Paula Roncaglia-Denissen und Sonja A. Kotz
perzeptuelle Muster als wiederkehrende formale Ereignisse (wie betonte Silben), die mit einer regelmäßigen Zeitstruktur zusammenfallen können, aber nicht müssen. Unsere Alltagssprache weist in der Regel viele dynamische Variationen auf und unterliegt dementsprechend nicht einer solchen zeitlichen Regelmäßigkeit wie klassische westliche Musik. Zusammenfassend definieren wir also Metrum in der Sprache als eine sich regelmäßig wiederholende Sequenz von betonten und unbetonten Silben (d. h. starke und schwache Pulse), während der Begriff Sprachrhythmus den gesamten zeitlichen Eindruck einer sprachlichen Äußerung bestehend aus Phonemen, Silben und prosodischen Phrasen beschreibt.
1.2 Metrum und Syntax Welche Rolle spielt nun aber das Metrum in der auditiven Sprachverarbeitung? Wir nehmen an, dass perzeptuelle metrische Muster zu Vorhersagen und somit zu einer vereinfachten Informationsverarbeitung führen, denn es wurde bereits nachgewiesen, dass ein regelmäßiger Wechsel aus betonten und unbetonten Silben zu einem perzeptuellen Vorteil führt und die Aufmerksamkeit der Hörers auf besonders wichtige Zeitpunkte in einem Satz richtet. Metrische Muster spielen außerdem eine entscheidende Rolle im Spracherwerb, in der Sprachsegmentierung und auch in der lexikalischen Gruppierung. Trotzdem hat die perzeptuelle Regelmäßigkeit in der Sprache – und die damit verbundene Möglichkeit, Vorhersagen über die weitere Entwicklung einer sprachlichen Sequenz zu treffen – bislang sehr viel weniger Aufmerksamkeit erhalten als die perzeptuelle Regelmäßigkeit in der Musik.Während frühere Studien, wie oben erwähnt, sich häufig auf das Messen rhythmischer Eigenschaften produzierter Sprache konzentrierten, liegt der Fokus vieler aktueller Untersuchungen in der Psycholinguistik auf perzeptuellen Aspekten der Rhythmusverarbeitung. Wie wir im folgenden berichten werden, haben wir eine Reihe von Experimenten durchgeführt, in denen wir den Einfluss des Metrums (realisiert über vorhersagbare Silbenbetonung) auf die Syntaxverarbeitung in der gesprochenen Sprache untersucht haben. Warum sollten metrische Strukturen mit syntaktischen Strukturen während der Satzverarbeitung interagieren? Wir argumentieren, dass Metrum und Syntax ähnliche strukturelle Eigenschaften teilen. Obwohl die metrische und die syntaktische Verarbeitungsebenen nicht voneinander abgeleitet werden können, existieren auf beiden Verarbeitungsebenen Vorhersagen über den Ablauf der gesprochenen Sprache. Beispielsweise antizipiert der deutsche L1-Sprecher als nächstes Element eine Nominalphrase, sobald er einen Artikel hört. Das bedeutet,
Die Rolle des Trochäus bei der L1- und L2-Satzverarbeitung im Deutschen
123
dass die Regel Auf einen Artikel folgt eine Nominalphrase syntaktische Vorhersagen auslöst. Mit anderen Worten, syntaktische Strukturen erlauben Vorhersagen auf der Basis von normativen sprachlichen Regeln, die nicht von unserem Weltwissen abhängig sind, wie es beispielsweise für die Semantik der Fall ist. Semantische Vorhersagen werden von interindividuellen Differenzen und sozialen Kontexten beeinflusst, während syntaktische Vorhersagen weniger von diesen Faktoren beeinflusst werden, weil sie durch implizites Lernen während des L1-Erwerbs ermöglicht werden. In Bezug auf Metrumwahrnehmung nehmen wir an, dass metrische Strukturen die Aufmerksamkeit des Hörers auf wichtige Zeitpunkte im Satz lenken, beispielsweise auf Zeitpunkte, zu denen betonte Silben erwartet werden. Das ist im Einklang mit der attentional bounce hypothesis, bei der angenommen wird, dass die Aufmerksamkeit des Hörers von einer betonten Silbe auf die nächste gerichtet wird (auf Grund ihrer Salienz und Relevanz in akzentzählenden Sprachen). Metrische Vorhersagen erlauben dem Rezipienten also die Aufmerksamkeit auf relevante Aspekte in dem kontinuierlichen Sprachfluss zu richten und führen somit zu effizienterer Informationsverarbeitung. Wir schlussfolgern, dass sowohl Metrum als auch Syntax eine Strukturierung des kontinuierlichen Sprachflusses erlauben und dabei Vorhersagen über die zeitliche Abfolge und die Form eines bevorstehenden Ereignisses ermöglichen.Wir stellen uns das metrische Muster somit als eine Art Gerüst vor, welches es dem Hörer erlaubt, die gesprochene Sprache zu strukturieren und innerhalb dieser vorstrukturierten Sprache syntaktische Hierarchien aufzubauen.
2 Methode: Ereigniskorrelierte Potentiale In unseren Studien haben wir mit Hilfe der Methode der ereigniskorrelierten Potentiale (EKPs) untersucht, ob der Trochäus als das Standardmetrum im Deutschen eine signifikante Rolle in der Sprachverarbeitung bei L1- und L2Sprechern des Deutschen spielt, die über die Sprachsegmentierung hinaus geht. Eine detaillierte Einführung in die EKP-Methode sowie eine Übersicht der wichtigsten Korrelate für die Sprachwahrnehmung sind in Kapitel 2 von Jutta Mueller bereits eingeführt worden. Daher skizzieren wir im Folgenden nur kurz die für die nachfolgend beschriebenen Experimente relevanten EKPs.
2.1 Left Anterior Negativity (LAN) Sowohl die early left anterior negativity (ELAN) als auch die LAN werden mit syntaktischen Verletzungen in Verbindung gebracht. Zahlreiche Studien inter-
124
Maren Schmidt-Kassow, M. Paula Roncaglia-Denissen und Sonja A. Kotz
pretieren die ELAN als Antwort auf Phrasenstrukturverletzungen (e. g., Hahne & Friederici 1999; Neville et al. 1991). Die ELAN beginnt circa 100 – 200 ms nach Beginn eines Stimulus und tritt oft zusammen mit einer späten Positivierung (P600) auf, was man auch als biphasisches Muster, also ein aus zwei EKPs bestehendes Muster, beschreibt. Die LAN ist eine Komponente, die etwas später beginnt als die ELAN (300 – 500 ms nach Beginn des Ereignisses) und mit morphosyntaktischen Verletzungen, wie Genus-, Numerus- oder Tempusunstimmigkeiten in Verbindung gebracht wird. Ebenso wie die ELAN ist die LAN meist über frontalen Elektroden sichtbar und links stärker ausgeprägt als rechts. Auch diese Komponente ist Teil eines biphasischen Musters mit der P600.
2.2 P600 Die P600 ist eine späte Positivierung mit zentro-parietaler Verteilung und mit einem Amplitudenmaximum bei circa 600 ms. Diese Positivierung ist nicht nur mit verschiedenen Arten syntaktischer Ungrammatikalität assoziiiert, sondern auch mit syntaktischen Ambiguitäten, Holzwegsätzen und Sätzen mit erhöhter syntaktischer Komplexität. Neben syntaktischen Phänomenen wurde die P600 aber auch als Antwort auf bestimmte Arten von semantischen Anomalien gefunden, sowie als Korrelat unerwarteter Abfolgen in der Musik. Diese Befunde führten dazu, dass manche Autoren die P600 eher als domänenübergreifendes Korrelat für wissensbasierte strukturelle Integration interpretieren, statt als syntaxspezifisches EKP.
3 Experimente 3.1 Die Rolle des Trochäus in der L1-Satzverarbeitung Da Metrumverarbeitung einen Teil der Prosodieverarbeitung darstellt, präsentieren wir zunächst EKP-Studien zur Syntax-Prosodie-Interaktion, bevor wir unsere eigenen Studien vorstellen. In den letzten Jahren gab es zunehmend mehr Evidenz für eine starke Interaktion von Syntax und Prosodie in der L1. So konnten z. B. Steinhauer, Alter & Friederici (1999) zeigen, dass prosodische Grenzen aktiv vom Parser genutzt werden. In ihren Experimenten löste die prosodische Struktur der Sätze einen syntaktischen Holzwegeffekt aus, der zu einer syntaktischen Reanalyse des Satzes führte, die mit einem biphasischen EKP-Muster, d. h. einer N400 und einer P600 einherging. Astésano, Besson & Alter (2004) zeigten, dass eine prosodische An-
Die Rolle des Trochäus bei der L1- und L2-Satzverarbeitung im Deutschen
125
omalie in einem Satz einen positiven EKP-Verlauf nach ca. 800 ms (P800) evozieren kann, der mit einer P600 vergleichbar ist. Dies steht im Einklang mit Daten von Eckstein & Friederici (2005), die einen P600-Effekt für satzfinale prosodisch unpassende Wörter beobachtet haben. In dieser Studie untersuchten die Autoren außerdem, ob Prosodie und Syntax in der akustischen Sprachverarbeitung interagieren. Sie präsentierten Sätze, die entweder prosodische Anomalien, oder Ungrammatikalitäten, oder sowohl eine prosodische Anomalie als auch eine Ungrammatikalität enthielten. Die Autoren berichteten einen überadditiven P600Effekt in der kombinierten prosodisch-syntaktischen Bedingung, verglichen mit der Summe des prosodischen und des syntaktischen P600-Effekts. Wenn zwei neuronale Prozesse (hier Prosodie und Syntax) voneinander unabhängig stattfinden, dann entspricht die Amplitude des EKPs in der Doppelbedingung (Prosodie + Syntax) der Summe der Amplitude in den einzelnen Bedingungen (Prosodie, Syntax; Gondan & Röder 2006; Barth et al. 1995).Wenn auf der anderen Seite Prosodie und Syntax miteinander interagieren, dann sollte die Amplitude der kombinierten Bedingung (Prosodie + Syntax) entweder über- oder unteradditiv, also kleiner oder größer als das hypothetisch errechnete EKP sein. Somit deuten die Ergebnisse darauf hin, dass syntaktische und prosodische Informationsverarbeitung während der Satzverarbeitung interagieren. In einer Folgestudie replizierten Eckstein & Friederici (2006) diese Interaktion. Die Ergebnisse bestärkten die elektrophysiologische Evidenz, dass der L1-Parser direkt durch die prosodische Information beeinflusst wird. Im Folgenden legen wir unseren Fokus auf einen besonderen Teil der prosodischen Verarbeitung, nämlich der Verarbeitung des Satzmetrums, d. h. der Abfolge betonter und unbetonter Silben in einem Satz und dessen Auswirkungen auf den Parser.Wir argumentieren, dass die zu Grunde liegende metrische Struktur einer Sprache ein hilfreiches Instrument ist, um die syntaktische Verarbeitung zu erleichtern. Dies sollte der Fall sein, sofern Sequenzieren, also das Vorhersagen zukünftiger Ereignisse in einem Sprachsignal, mit Segmentieren, d. h. das Zerlegen des Signals in einzelne Wörter, Hand in Hand geht. Um zu untersuchen, ob der Trochäus als das Standardmetrum im Deutschen eine bedeutsame Rolle in der Sprachverarbeitung spielt, die über die Sprachsegmentierung hinaus geht, haben wir ein EEG abgeleitet, während sich 24 gesunde junge Erwachsene metrisch regelmäßige Sätze anhörten und entweder die Grammatikalität der Sätze (Ist der Satz syntaktisch korrekt?) oder die metrische Struktur der Sätze (Sind alle Wörter in dem Satz richtig betont?) beurteilen sollten. Alle Sätze hatten ein trochäisches Betonungsmuster, d. h. einen regelmäßigen Wechsel von betonter und unbetonter Silbe. In der metrischen Bedingung wurde die Betonung im vorletzten Wort von der ersten auf die zweite Silbe verlegt, in der syntaktischen Bedingung enthielt das vorletzte Wort eine morphosyntaktische
126
Maren Schmidt-Kassow, M. Paula Roncaglia-Denissen und Sonja A. Kotz
Verletzung und in der doppelten Bedingung wurden die syntaktische und die metrische Bedingung miteinander kombiniert (siehe Tabelle 1) Tabelle 1: Illustration der vier experimentellen Bedingungen Bedingung
Beispiel
Korrekt Metrum Syntax Metrum + Syntax
’Vera ’hätte ’Christoph ’gestern ’morgen ’schubsen ’können. ’Vera ’hätte ’Christoph ’gestern ’morgen schub’SEN ’können. ’Vera ’hätte ’Christoph ’gestern ’morgen ’schubste ’können. ’Vera ’hätte ’Christoph ’gestern ’morgen schubs’TE ’können.
Durch die drei unterschiedlichen Verletzungsbedingungen konnten wir überprüfen, ob Metrum und Syntax während der Satzverarbeitung interagieren, denn in diesem Fall sollten alle Bedingungen in ähnlichen EKP-Mustern resultieren. Besonders interessant ist hierbei die doppelte Verletzungsbedingung (Metrum + Syntax) um zu überprüfen ob die beiden Prozesse miteinander interagieren (Überoder Unteradditivität). Die Einzelbedingungen geben uns also Aufschluss darüber, ob metrische Anomalien in ähnlichen EKPs resultieren wie Ungrammatikalitäten, während die Doppelbedingung einen zusätzlichen Erkenntnisgewinn hinsichtlich einer möglichen Interaktion von Metrum und Syntax liefert. Die beiden unterschiedlichen Aufgabentypen erlaubten uns zu überprüfen, ob das beobachtete EKP-Muster abhängig oder unabhängig von der gestellten Aufgabe ist. Dies gibt wiederum Aufschluss darüber, ob metrische und syntaktische Strukturen bzw. deren Verletzung nur dann registriert werden, wenn die Aufmerksamkeit darauf gerichtet ist (explizite Verarbeitung), oder ob sie auch verarbeitet werden, wenn die Aufmerksamkeit auf einem anderen Prozess liegt (implizite bzw. automatische Verarbeitung). Wenn Metrum und Syntax während der auditiven Sprachverarbeitung interagieren, dann erwarten wir unter beiden Aufgabentypen ein ähnliches EKP-Muster, d. h. die metrischen Anomalien sollten auch unter der Grammatikalitätsaufgabe vom Gehirn registriert werden und ebenso sollte dies bei Ungrammatikalitäten unter der metrischen Aufgabenstellung der Fall sein. In beiden Aufgaben beantworteten die Probanden über 80 % der Durchläufe richtig.Wie in Abbildung 1 und 2 zu sehen ist, löste das kritische Verb (schubsen) in allen inkorrekten Bedingungen im Vergleich zu der korrekten Bedingung ein ähnliches EKP-Muster aus, nämlich eine frühe Negativierung an frontalen Elektroden und eine späte Positivierung an parietalen Elektroden.
Die Rolle des Trochäus bei der L1- und L2-Satzverarbeitung im Deutschen
127
Abbildung 1: EKPs in der syntaktischen, metrischen und doppelten Bedingung unter der metrischen Aufgabe
128
Maren Schmidt-Kassow, M. Paula Roncaglia-Denissen und Sonja A. Kotz
Abbildung 2: EKPs in der syntaktischen, metrischen und doppelten Bedingung unter der syntaktischen Aufgabe
Die Rolle des Trochäus bei der L1- und L2-Satzverarbeitung im Deutschen
129
3.1.1 Frühe Negativierung Beide EKP-Komponenten, d. h. die frühe Negativierung und die spätere Positivierung, waren in beiden Aufgaben gleichermaßen sichtbar, d. h. sowohl in der metrischen als auch in der syntaktischen Aufgabe. Allerdings fanden wir Differenzen in der Latenz, d. h. in dem zeitlichen Auftreten der Komponenten.Während das kritische Verb immer eine anteriore Negativierung auslöste, variierte deren Latenz in Abhängigkeit von der experimentellen Bedingung (Metrum, Syntax, Metrum+Syntax). Negativierungen in der Metrum-Bedingung begannen circa 250 bis 400 ms früher als syntaktisch evozierte Negativierungen. Dieser Befund deutet darauf hin, dass metrische Abweichungen vor syntaktischen Verletzungen verarbeitet werden und zwar unabhängig von der jeweilig zu bearbeitenden Aufgabe (metrische vs. syntaktische Aufgabe). Durch das frühe Auftreten der metrischen Negativierung bestätigt dieser Befund die wichtige Rolle von metrischen Schlüsselreizen in der auditiven Sprachverarbeitung. Eine ähnliche Negativierung wurde auch in anderen Kontexten gefunden, in denen regelbasierte Strukturen verletzt wurden. Daher argumentieren wir, dass die in unseren Studien gefundene frühe Negativierung die Verletzung der trochäischen Regelmäßigkeit reflektiert. Nichtsdestotrotz könnte diese Komponente auch auf einen erschwerten lexikalischen Zugriff durch das inkorrekte Betonungsmuster zurückzuführen sein. Sie entspräche damit der klassischen N400-Komponente. Dies ist jedoch relativ unwahrscheinlich, da in einem ergänzenden Experiment von Rothermich et al. (2010) sogenannte Jabberwocky Sätze verwendet wurden. Hier wurden Pseudowortsätze kreiert, welche die gleiche Silbenstruktur sowie die gleiche metrische Struktur aufwiesen, wie die bereits vorgestellten Sätze. Auch hier wurden die Probanden gebeten, die metrische Struktur und die syntaktische Struktur der Sätze zu beurteilen. Die EKPs zeigten, dass die Metrum-Bedingung ebenfalls eine frühe Negativierung in beiden Aufgaben auslöste, obwohl kein lexikalischer Zugriff stattfinden konnte (da es sich um keine sinnhaften Sätze handelte). Somit ist es unwahrscheinlich, dass es sich bei der berichteten Negativierung um eine N400 handelt. Wir interpretieren die frühe Negativierung also als Reflexion eines Fehlerdetektionsmechanismus, welcher immer dann zum Tragen kommt, wenn regelbasierte Sequenzen verarbeitet werden.
3.1.2 P600 Besonders interessant sind unsere Befunde in Bezug auf die späte Positivierung (P600). Alle drei Verletzungsbedingungen lösten in beiden Aufgaben eine P600
130
Maren Schmidt-Kassow, M. Paula Roncaglia-Denissen und Sonja A. Kotz
aus, die sich in Morphologie (d. h. ihrem Aussehen) und Verteilung auf der Kopfoberfläche sehr ähneln. Die Doppelbedingung (Metrum + Syntax) ist dabei besonders interessant, denn wenn Metrum und Syntax miteinander interagieren, dann sollte die Amplitude der kombinierten Bedingung im Vergleich zu der hypothetisch errechneten P600 entweder über- oder unteradditiv sein. In unserem Fall wurde die real evozierte P600 in der kombinierten Bedingung durch die vorausberechnete Amplitude überschätzt, die P600 verhielt sich also unteradditiv. Dieser Befund deutet darauf hin, dass Metrum und Syntax in den Prozessen, die der P600 zu Grunde liegen, interagieren.
3.1.3 Patienten Unsere bislang vorgestellten Befunde liefern einen starken Hinweis darauf, dass der Trochäus im Deutschen eine wichtige Rolle in der Satzverabeitung spielt, die eben nicht nur die prosodische Verarbeitungsebene, sondern auch syntaktische Prozesse beeinflusst. Daher haben wir deutsche Muttersprachler getestet, die Probleme bei der Syntaxverarbeitung gezeigt haben, um zu untersuchen, ob diese Probleme durch eine regelmäßige metrische Struktur kompensiert werden könnten. Sollte dies der Fall sein, würde das die Rolle des Trochäus im Deutschen noch weiter stärken und es stellt sich die Frage, welchen Einfluss eine „muttersprachliche“ Metrumverarbeitung auf den L2-Parser nimmt. Patienten mit Läsionen (d. h.Verletzung durch eine Einblutung, eine Minderdurchblutung oder ein Trauma) oder neurodegenerativen Erkrankungen der Basalganglien zeigen oft keine syntaktische P600, wenn sie syntaktisch fehlerhafte Sätze hören. Gleichzeitig zeigen diese Patienten in anderen Studien Probleme mit der Zeitwahrnehmung, bspw. bei der Detektion von Pulsen in rhythmischen Stimuli (Grahn 2009, Grahn & Brett 2009). Daher wäre es plausibel, dass das zu Grunde liegende Defizit der Patienten kein syntaktisches, sondern eher ein rhythmisches Verarbeitungsdefizit ist. Wir haben daher Patienten mit einer Läsion der Basalganglien mit demselben oben beschriebenen Paradigma getestet. Unser Ergebnis zeigte deutlich, dass diese Kohorte tatsächlich kein syntaktisches Verarbeitungsproblem, sondern ein Defizit in der metrischen Verarbeitung aufweist. Das heißt, sie zeigten eine P600 in der syntaktischen Bedingung, nicht aber in der metrischen Bedingung. Aufgrund der Interaktion von Prosodie und Syntax ist es möglich, dass der in früheren Studien berichtete Ausfall der syntaktischen P600 in den Patienten darauf zurückzuführen ist, dass die Sätze nicht metrisch regelmäßig aufgebaut waren. Dadurch konnten die Patienten keine strukturellen Vorhersagen zu der Satzfolge treffen und hatten offensichtlich anschließend Probleme bei der syntaktischen Verarbeitung. Wenn jedoch eine metrisch regelmäßige Struktur vor-
Die Rolle des Trochäus bei der L1- und L2-Satzverarbeitung im Deutschen
131
liegt, ist eine Syntaxverarbeitung wie im vorliegenden Fall ohne Einschränkung möglich. Zusammenfassend legen die Befunde nahe, dass der Trochäus einen entscheidenden Einfluss auf die Syntaxverarbeitung bei Muttersprachlern des Deutschen hat. Daher stellt sich die Frage, welche Relevanz dieser in der Satzverarbeitung von L2-Lernern hat und insbesondere, ob die Bedeutung des Trochäus in Abhängigkeit von der jeweiligen L1 variiert.
3.2 Die Rolle des Trochäus in der L2-Satzverarbeitung Im vergangenen Abschnitt haben wir EKP-Evidenz vorgestellt, die zeigte, wie relevant die Verarbeitung der metrischen Struktur eines Satzes für die Syntaxverarbeitung ist; d. h., dass Erstere deutlich schneller abläuft und gleichzeitig beide Prozesse interagieren. Dies ist insofern für den L2-Erwerb hoch interessant, als dass sich die Frage stellt, ob eine defizitäre bzw. nicht-muttersprachliche Verarbeitung des Satzmetrums ebenfalls eine defizitäre Syntaxverarbeitung nach sich zieht, bzw. umgekehrt eine muttersprachliche Metrumverarbeitung eine Voraussetzung für eine muttersprachliche Syntaxverarbeitung ist. Wie bereits erwähnt, kann eine inadequate Nutzung rhythmischer Hinweisreize in einer L2 die Sprachsegementierung sowie die Verarbeitung stark beeinträchtigen.Wenn sich also auch bei L2-Sprechern die bedeutende Rolle des Metrums bestätigt, könnte dieses Wissen auch didaktisch genutzt werden, d. h. mehr Augenmerk auf die Vermittlung der Prosodie der zu erlernenden Sprache gelegt werden. In einer ersten Studie testeten wir spät Deutsch lernende, französische Muttersprachler mit dem gleichen, oben beschriebenen Paradigma. Französisch unterscheidet sich vom Deutschen zum einen dahingehend, dass beide Sprachen zu unterschiedlichen Sprachrhythmusklassen gehören: Während das Deutsche als akzentzählende Sprache gilt, ist Französisch silbenzählend. Zum anderen weisen Sprecher dieser Sprachen unterschiedliche Segmentationsstrategien auf. Deutsche sowie auch spanische Muttersprachler nutzen überwiegend die Tonhöhe als Hinweisreiz für die Segmentierung gesprochener Sprache, während französische Muttersprachler Tonhöheinformation ignorieren und deswegen auch als betonungstaub (stress deaf) bezeichnet werden. Da in unserem Experiment das trochäische Betonungsmuster primär über Tonhöhe realisiert wurde, haben wir hier also zum einen untersucht, ob L2-Sprecher des Deutschen die Fähigkeit erwerben können, Tonhöheinformation zu nutzen und dadurch trochäische Einheiten zu extrahieren und zum anderen, ob diese Fähigkeit die syntaktische Verarbeitung deutscher Sätze beeinflusst.
132
Maren Schmidt-Kassow, M. Paula Roncaglia-Denissen und Sonja A. Kotz
Alle zwölf Versuchsteilnehmer waren zwischen 21 und 27 Jahre alt und lebten zum Zeitpunkt der Messung seit mindestens 6 Monaten in Deutschland. Nach einem Selbsteinschätzungsfragebogen zur Sprachkompetenz auf einer Skala von 1 (sehr niedrig) bis 10 (sehr hoch) handelte es sich sowohl in der Sprachproduktion (durchschnittlich 7) also auch in der Sprachwahrnehmung (durchschnittlich 8) um sehr fortgeschrittene Sprecher des Deutschen. Diese Selbsteinschätzung fand sich auch in den Verhaltensdaten wieder: Die Probanden konnten die syntaktische Struktur der Sätze ohne Probleme einschätzen (syntaktische Aufgabe > 95 % richtige Antworten). Ebenso zeigten sie unter dieser Aufgabe eine den Muttersprachlern ähnliche P600 als Antwort in der syntaktischen Bedingung. In der metrischen Aufgabe hingegen, d. h. der Beurteilung, ob alle Wörter im Satz richtig betont wurden, kam es zu großen Probleme in der Einschätzung der Richtigkeit der Sätze (im Mittel unter 77 % richtige Antworten). Besonders schwer fiel dabei die Einschätzung der metrisch falschen (im Mittel 62 % richtige Antworten) und der syntaktisch falschen Sätze (im Mittel 65 % richtige Antworten), während die Beurteilung der doppelt verletzten Sätze deskriptiv etwas leichter fiel (im Mittel 77 % richtige Antworten). Ausserdem zeigten die französischen Muttersprachler in der metrischen Aufgabe weder eine P600 in der metrischen noch in der syntaktischen Bedingung. Dieses Ergebnis erlaubt zweierlei Schlüsse: Es zeigt zum einen, dass französische Muttersprachler Schwierigkeiten haben, trochäische Einheiten in einem Satz zu extrahieren, denn sie haben auf der Verhaltensebene große Schwierigkeiten, die metrische Struktur zu beurteilen und zeigen auf der neurophysiologischen Ebene kein entsprechendes Korrelat, wenn die metrische Struktur verletzt wird (weder unter der syntaktischen Aufgabe noch unter der metrischen Aufgabe). Zum anderen zeigt das Ergebnis, dass die Verarbeitung der syntaktischen Struktur erschwert ist, wenn der Fokus auf dem Betonungsmuster eines Satzes liegt. Dies zeigt der Ausfall der syntaktischen P600 in der metrischen Aufgabe. Interessant ist hierbei der aufgabenspezifische Befund: Wenn die L2-Sprecher ihre Aufmerksamkeit und damit ihre kognitiven Ressourcen auf die syntaktische Analyse des Satzes richten (syntaktische Aufgabe), ist eine Verarbeitung der syntaktischen Struktur auf muttersprachlichem Niveau möglich (syntaktische P600). Eine automatische Verarbeitung der syntaktischen Struktur, d. h. eine Verarbeitung ohne gerichtete Aufmerksamkeit, ist jedoch defizitär (Ausfall der P600). Dieses Ergebnis ist im Einklang mit früheren Befunden (Hahne 2001). In einer nachfolgenden Analyse der metrischen Aufgabe haben wir zusätzlich herausgefunden, dass die Hälfte der Versuchsteilnehmer bei der Bearbeitung sehr gut abschnitt (> 80 % korrekte Antworten), während die andere Hälfte große Probleme mit der Aufgabenbewältigung hatte und eher zufällig antwortete (< 40 %
Die Rolle des Trochäus bei der L1- und L2-Satzverarbeitung im Deutschen
133
korrekte Antworten). Interessanterweise spiegelte sich dieses Ergebnis auch in den EKP-Ergebnissen für die metrische Aufgabe wider: Die Probanden mit hoher Antwortgüte zeigten eine P600 als Antwort auf metrisch inkorrekte Sätze,während diese bei der Gruppe mit niedriger Beurteilungsrichtigkeit nicht sichtbar war. Ausserdem unterschieden sich die beiden Gruppen in der Syntaxverarbeitung. Versuchsteilnehmer, die eine metrische P600 in der metrischen Aufgabe aufwiesen, zeigten auch einen P600-Effekt als Antwort auf syntaktisch falsche Sätze, obwohl die Aufmerksamkeit auf die Betonungsstruktur gerichtet war. Auf der anderen Seite fiel die syntaktische P600 bei den Versuchsteilnehmern, die keine metrische P600 zeigten, aus. Zusammenfassend zeigen also französische, als stress deaf geltende L2Sprecher des Deutschen eine L1-ähnliche syntaktische P600, wenn die Aufmerksamkeit auf die syntaktische Struktur gerichtet ist. Wenn allerdings eine Beurteilung der Betonungsstruktur gefordert ist, kommt es zu erhöhten Schwierigkeiten, die sich im Verhalten und in den EKPs widerspiegeln, d. h. keine metrische und syntaktische P600 in der metrischen Aufgabe. Diejenigen Probanden allerdings, die in der Lage sind, trochäische Einheiten zu extrahieren, zeigen ein muttersprachliches EKP-Profil, also sowohl eine metrische als auch syntaktische P600 in der metrischen Aufgabe. Die Nutzung von Tonhöheinformation und somit die Extrahierung des Trochäus scheint also sowohl für die Verarbeitung des Satzmetrums, als auch für die automatische Verarbeitung der syntaktischen Struktur relevant zu sein. Dabei korrelieren die Verhaltensdaten stark mit den EKPs: Die Probanden zeigten durchgehend eine hohe Beurteilungsrichtigkeit in der syntaktischen Aufgabe und wiesen auch eine syntaktische P600 in dieser Aufgabe auf. In der metrischen Aufgabe zeigten nur solche Probanden eine metrische und syntaktische P600, welche auch die Aufgabe gut bewältigen konnten. Besonders interessant war hier aber ein Befund, der nur durch den Einsatz der EKPs sichtbar wurde: Während unter der metrischen Aufgabe die Kompetenz tröchäische Einheiten zu extrahieren (metrische P600) mit automatischer syntaktischer Verarbeitung (syntaktische P600) einhergeht, ist das umgekehrt unter der syntaktischen Aufgabe nicht der Fall. Das bedeutet, dass die Kompetenz zur Grammatikalitätsbeurteilung nicht bedeuten muss, dass auch die Betonungsstruktur automatisch mit analysiert wird, wie an Hand der fehlenden metrischen P600 in der syntaktischen Aufgabe erkennbar ist. Um diesen Befund weiter zu untersuchen, haben wir in einem Folgeexperiment spanische L2-Sprecher des Deutschen mit dem gleichen Paradigma getestet. Wie das Französische gehört auch das Spanische zu den silbenzählenden Sprachen. Ein wesentlicher Unterschied ist jedoch, dass im Spanischen die Tonhöheinformation für die Segmentierung genutzt wird. Dementsprechend stellt sich die Frage, ob spanische L2-Sprecher einen Vorteil bei der Extrahierung der Tro-
134
Maren Schmidt-Kassow, M. Paula Roncaglia-Denissen und Sonja A. Kotz
chäen in deutschen Sätzen haben und auch die syntaktische Struktur auf muttersprachlichem Niveau verarbeiten können. Um dies zu untersuchen, haben wir 13 spanische Muttersprachler im Alter zwischen 19 und 30 Jahren untersucht, die zum Zeitpunkt des Experiments ebenfalls für 6 Monate in Deutschland gelebt hatten. Genau wie bei den französischen L2-Sprechern handelte es sich nach dem Selbsteinschätzungsfragebogen auf einer Skala von 1 (sehr niedrig) bis 10 (sehr hoch) um sehr fortgeschrittene Sprecher des Deutschen. Auch hier wurde bei der Produktion eine durchschnittliche Einschätzung von 7 und bei der Wahrnehmung eine durchschnittliche Einschätzung von 8 angegeben. Auch in dieser Gruppe konnten die Probanden die syntaktische Struktur der Sätze ohne Probleme einschätzen (syntaktische Aufgabe > 98 % richtige Antworten) und auch hier zeigten sie unter dieser Aufgabe eine den Muttersprachlern ähnliche P600 als Antwort auf die syntaktische Bedingung. Im Gegensatz zu den französischen Muttersprachlern fiel den spanischen L2Sprechern auch die Beurteilung der Betonungsstruktur des Satzes nicht schwer. Hier konnten sie über 86 % der metrisch falschen Sätze richtig identifizieren, bei den syntaktisch falschen gaben sie sogar über 94 % richtige Antworten, obwohl hier nicht die Grammatik, sondern nur die Betonung beurteilt werden sollte. Am schwersten fiel den Probanden, wie den L1-Sprechern, die Beurteilung der doppelt verletzten Sätze, aber auch hier lag die Antwortrichtigkeit bei über 77 %. Diese gute Performanz spiegelte sich auch in den EKP-Antworten in der metrischen Aufgabe wider. Die spanischen L2-Sprecher des Deutschen zeigten sowohl in der metrischen als auch in der syntaktischen Bedingung eine P600, wenn auch mit einer deutlich verzögerten Latenz. Somit bestätigen die Ergebnisse von den spanischen Muttersprachlern ebenfalls die Relevanz der Nutzung von trochäischen Einheiten für die syntaktische Verarbeitung der deutschen Sätze. Spanische Muttersprachler zeigen eine den L1-Sprechern vergleichbare Sensitivität für syntaktische Verletzungen und Betonungsverletzungen. Lediglich in der syntaktischen Aufgabe fanden wir keine P600 für die metrische Verletzung. Doch sogar hier zeigten die Probanden eine anteriore Negativierung, welche wir als erstes Indiz für eine beginnende automatische Verarbeitung metrischer Strukturen werten. Was die Latenzverzögerung anbelangt, so zeigten Snijders et al. (2007), dass englische Muttersprachler im Niederländischen ähnliche, aber deutlich verlangsamte Segmentierungsstrategien anwenden wie niederländische Muttersprachler, obwohl Englisch und Niederländisch sehr ähnliche Sprachen sind. Somit reflektieren unsere EKPs mutmaßlich die verlangsamte Wortsegmentierung unter spanischen L2-Lernern des Deutschen, denn wenn die Segmentierung weniger effizient abläuft, müssen auch nachfolgende Prozesse langsamer ablaufen. Dies
Die Rolle des Trochäus bei der L1- und L2-Satzverarbeitung im Deutschen
135
ist im Einklang mit anderer Evidenz zu längeren Latenzen in der L2-EKP-Forschung. Zusammenfassend zeigt also unsere L2-Evidenz, wie relevant der Trochäus bei der Satzverarbeitung im Deutschen ist. Wir konnten nachweisen, dass die Extraktion von trochäischen Einheiten eine Voraussetzung für eine Syntaxverarbeitung auf muttersprachlichem Niveau in der L2 ist. Französische im Gegensatz zu spanischen Muttersprachlern haben Probleme bei der automatischen Syntaxverarbeitung (unter der metrischen Aufgabe), es sei denn, sie können die metrische Aufgabe gut bewältigen. Diese Befunde bestärken die Bedeutung einer erfolgreichen Metrumverarbeitung für eine ungestörte auditive Sprachverarbeitung auf der syntaktischen Ebene. In weiteren Studien wäre es nun zum einen interessant, L2-Sprecher anderer Sprachen zu untersuchen, bspw. von aktzentzählenden Sprachen, und zum anderen Studien mit anderen Aufgabenstellungen durchzuführen, um der Frage nachzugehen, ob die berichteten EKP-Muster auch unter einer inhaltlichen Aufgabe evoziert werden.
4 Ein neurofunktionales Modell für die auditorische Syntaxverarbeitung Alle unsere oben beschriebenen Daten von gesunden L1- und L2-Sprechern sowie Patienten mit Basalganglienläsionen weisen auf die Bedeutung metrischer Strukturen in der Satzverarbeitung hin. Die Daten der L1-Sprecher zeigen, dass die metrische Struktur zeitlich vor der syntaktischen Struktur verarbeitet wird (siehe kürzere Latenz der metrischen Negativierung), und dass Metrum und Syntax zu einem späteren Zeitpunkt während der auditiven Sprachverarbeitung interagieren (P600). Unsere L2-Daten von Sprechern silbenzählender Sprachen unterstützen die These, dass die erfolgreiche Verarbeitung des Trochäus eine Voraussetzung für eine syntaktische Verarbeitung auf muttersprachlichem Niveau (d. h. unabhängig von der Aufgabenstellung) ist. In dem letzten Teil unseres Kapitels versuchen wir ein funktionales und neuroanatomisches Konzept für die auditive Sprachverarbeitung zu skizzieren, wobei der primäre Fokus auf der Syntaxverarbeitung liegt. Bislang wurde noch kein spezifisches L2-Sprachverarbeitungsmodell entwickelt, sondern monolinguale Modelle wurden genutzt, um L2-Sprachverarbeitungsdaten zu interpretieren. Dies geschieht unter der Annahme, dass ähnliche Faktoren in die L1- und L2-Satzverarbeitung involviert sind. Daher können L2Daten zur Satzverarbeitung einen wichtigen Beitrag zum Verstehen von neurolinguistischen Prozessen liefern. Wie bereits dargelegt, nehmen wir an, dass
136
Maren Schmidt-Kassow, M. Paula Roncaglia-Denissen und Sonja A. Kotz
syntaktische Verarbeitung eine Form der Sequenzierung ist, welche auf regelbasierten Vorhersagen in Bezug auf die Anordnung zukünftiger Ereignisse beruht (What next?). Syntaktische Antizipationen sollten somit Hand in Hand mit metrischen Strukturen gehen, welche darauf hinweisen, wann ein Ereignis in einer Sequenz auftritt. Neuroanatomisch spielen die Basalganglien hier eine Schlüsselrolle. Die Basalganglien werden primär mit motorischem Verhalten in Zusammenhang gebracht (z. B. Mink 1996). Patienten mit Morbus Parkinson (eine neurodegenerative Erkrankung der Basalganglien) leiden an Defiziten in der motorischen Sequenzierung, die jedoch interessanterweise mit externen metrischen Hinweisreizen kompensiert werden können. Es konnte gezeigt werden, dass bei Parkinsonpatienten die Bewegung wieder angestoßen werden kann, wenn sie sensorische vorhersagbare Reize als Hilfestellung bekommen haben. Diese Befunden bilden die Basis für eine Hypothese, die bereits von Alm (2004) vorgeschlagen wurde. Er nimmt an, das mindestens zwei motorische Zeitverarbeitungssysteme in die Sprachproduktion involviert sind:1.) ein mediales System, das aus den Basalganglien und der SMA (supplementary motor area) besteht und welches während der spontanen Sprachproduktion aktiv ist. Dieses System ist nicht auf externes Feedback angewiesen. 2.) ein laterales System, das aus dem lateralen prämotorischen Kortex und dem Cerebellum besteht und welches aktiv ist, wenn die Sprachproduktion von einem externen Taktgeber, wie einem Metronom, kontrolliert wird. Diese Hypothese wird durch Daten von Stotterern mit strukturellen Veränderungen der Basalganglien bestärkt. Bei dieser Form des Stotterns ist das mediale System defizitär, jedoch können die Patienten wieder flüssig sprechen, wenn ihnen ein konstanter externer Puls (Metronom) zur Verfügung gestellt wird. Kompensatorische Mechanismen scheinen also eine relevante Rolle sowohl in der motorischen (z. B. Marsden & Obeso 1994), als auch in der Sprachdomäne (siehe Kotz, Schwartze & Schmidt-Kassow 2009) zu spielen. Es wurde vorgeschlagen, dass die Basalganglien vorhersagbare Hinweisreize (Pulse) senden, um das nächste Ereignis in einer Sequenz anzustoßen (für motorische Evidenz siehe Mink 1996). Daten von Grahn & Brett (2007) unterstützen diese Idee und liefern Evidenz für eine Beteiligung der Basalganglien in der Pulswahrnehmung. In der Sprachdomäne wurde berichtet, dass die Basalganglien an der syntaktischen Verarbeitung beteiligt sind, da gezeigt wurde, dass sowohl Parkinsonpatienten als auch Patienten mit Läsionen der Basalganglien eine reduzierte syntaktische P600-Komponente aufweisen. Ausserdem berichten bildgebende Studien (Moro et al. 2001, Friederici et al. 2003) bei gesunden Probanden die Beteiligung des linken striatalen Komplexes an der Syntaxverarbeitung. Jedoch zeigen andere Daten, dass die Präsentation eines externen Metrums bei Patienten mit Basalganglienläsionen zu einer Re-Initiierung der P600 als Antwort auf
Die Rolle des Trochäus bei der L1- und L2-Satzverarbeitung im Deutschen
137
syntaktische Fehler in einem Satz führt. Dieser Befund eines kompensatorischen Mechanismus ist vergleichbar mit den oben diskutierten Ergebnissen aus der motorischen Domäne. Wir führen die Ergebnisse der motorischen und sensorischen Domäne zusammen und schlagen ein – die Basalganglien beinhaltendes – mediales System vor, welches für die zeitliche Kohärenz in der syntaktischen Sequenzierung verantwortlich ist. Wenn dieses System, wie im Fall von Parkinsonpatienten oder Patienten mit Basalganglienläsionen, nicht funktioniert, führt das zu einem Verlust der Fähigkeit, interne vorhersagbare Hinweisreize oder Pulse zu generieren, was wiederum die syntaktische Verarbeitung negativ beeinflusst. Dementsprechend sind externe Hinweisreize wichtig, um das defizitäre mediale System über ein sekundäres System zu kompensieren, nämlich das laterale cerebellareprämotorische System (siehe Alm 2004). Sofern diese vorhanden sind, wird das syntaktische Sequenzieren re-initiert. Wir nehmen an, dass die Basalganglien, im Zusammenspiel mit kortikalen Strukturen, als eine Art Taktgeber funktionieren, welcher die Synchronisation von internen und externen Hinweisreizen unterstützt. Natürliche Sprache ist gekennzeichnet durch zeitliche Variation (wie Wortdauern oder Pausen, etc.) und durch vorhersagbare Hinweisreize (wie linguistisches Metrum). In diesem Kontext scheint der mediale prä-SMA-Basalganglien-Kreislauf in die Extraktion von regelmäßigen Mustern im Sprachsignal involviert zu sein. Dies wiederum ist eine Voraussetzung für das syntaktische Sequenzieren, wie die Daten von L1-, aber gerade auch von L2-Sprechern des Deutschen nahe legen. Dieser Prozess wird unterbrochen, wenn es strukturelle Veränderungen in dem medialen System gibt, die jedoch durch sprachinhärente metrische Reize kompensiert werden können. Interessanterweise wird auch in der L2-Sprachverarbeitung die Beteiligung der Basalganglien immer wieder diskutiert (Clahsen & Felser 2006). Ein weit verbreitetes Sprachverarbeitungsmodell (Ullman 2004) unterscheidet zwei Verarbeitungsysteme, ein deklaratives und ein prozedurales System. Während das deklarative System hauptsächlich in das Abspeichern von memorierten Wörtern oder Phrasen involviert ist, soll das prozedurale System verantwortlich für die Verarbeitung kombinatorischer sprachlicher Regeln sein (Ullman 2004). Das deklarative System wird auf neuronaler Ebene durch medio-temporale und präfrontale Regionen repräsentiert, während das prozedurale System u. a. die Basalganglien umfasst. Die Dominanz des deklarativen Systems bei den L2-Sprechern mit niedriger Antwortgüte in der metrischen Aufgabe könnte somit auf eine unzureichende Beteiligung der Basalganglien zurückzuführen sein. Wenn jedoch die L2-Sprecher kompetent genug sind, die trochäischen Strukturen der Sätze zu extrahieren (wie bei den Probanden mit hoher Antwortgüte), wird das prozedurale System aktiviert und dadurch ist auch eine automatische Syntaxverarbeitung möglich. Damit würden L2-Lerner des Deut-
138
Maren Schmidt-Kassow, M. Paula Roncaglia-Denissen und Sonja A. Kotz
schen, deren L1 keinem trochäischen Muster folgt, ähnliche Ausfallserscheinungen zeigen, wie Patienten mit strukturellen oder neurodegenerativen Erkrankungen der Basalganglien. Ebenso ähnlich sollte das Erlernen von trochäischen Mustern durch externe Stimulation (z. B. das Mitklopfen des Pulses) das Erlernen von syntaktischen Strukturen in Sprachen wie dem Deutschen erleichtern. Interessant wäre es daher, in weiteren neurofunktionellen Untersuchungen herauszufinden, inwiefern L2-Sprecher des Deutschen oder anderer trochäischer Sprachen, während des Erlernens einer trochäischen Sprache von externen Hinweisreizen profitieren (z. B. das Klopfen des Pulses mit der eigenen Hand oder einem zeitlich vorhersagbaren Hinweisreiz, der mit der Akzentiuerung der starken Silbe Hand in Hand geht). Auf Basis unseres L1-Modells würden wir vorhersagen, dass ein solches Verstärken der metrischen Wahrnnehmung durch das laterale cerebellare-prämotorische System erfolgen kann, welches das mediale prä-SMABasalgangliensystem beim Erlernen von syntaktischen Strukturen unterstützt. Mit zunehmender Automatisierung der syntaktischen Strukturen sollten Aktivierungen des lateralen cerbellar-prämotorischen Systems abnehmen und die des medialen prä-SMA-Basalgangliensystem zunehmen. Anzunehmen ist jedoch, dass eine vollständige Automatisierung von strukturellem und metrischem Wissen einer Sprache letztendlich auch zu einer reduzierten Aktivierung im medialen Basalganliensystem führen sollte. Inwiefern ein solcher Ablauf des Lernverhaltens einer trochäischen L2 auch von individuellen Unterschieden abhängt und gegebenenfalls auch von nicht-sprachlichen Kompetenzen wie der musikalischen Prägung oder aber auch kognitiven Kapazitäten wie der Aufmerksamkeit und des Arbeitsgedächtnisses (siehe z. B. Roncaglia-Denissen et al. 2013), muss in weiteren Studien genauer untersucht werden.
Literaturangaben Abercrombie, David (1967): Elements of general phonetics. Chigaco: Aldine. Alm, Per A. (2004): Stuttering and the basal ganglia circuits: a critical review of possible relations. Journal of communication disorders 37 (4), 325 – 369. Arvaniti, Amalia, & Tristie Ross (2011): Rhythm classes and speech perception. Proceedings of Speech Prosody (100887), 1 – 4. Astésano, Corine, Mireille Besson & Kai Alter (2004): Brain potentials during semantic and prosodic processing in French. Cognitive Brain Research 18 (2), 172 – 184. Barth, Daniel S., Niel Goldberg, Barbara Brett & Shi Di (1995): The spatiotemporal organization of auditory, visual, and auditory-visual evoked potentials in rat cortex. Brain research 678 (1 – 2), 177 – 190. Clahsen, Harald & Claudia Felser (2006): How native-like is non-native language processing? Trends in cognitive sciences 10 (12), 564 – 570.
Die Rolle des Trochäus bei der L1- und L2-Satzverarbeitung im Deutschen
139
Eckstein, Korinna & Angela D. Friederici (2005): Late interaction of syntactic and prosodic processes in sentence comprehension as revealed by ERPs. Cognitive Brain Research 25 (1), 130 – 143. Eckstein, Korinna & Angela D. Friederici (2006): It’s early: Event-related potential evidence for initial interaction of syntax and prosody in speech comprehension. Journal of Cognitive Neuroscience 18 (10), 1696 – 1711. Friederici, Angela D. & Sonja A. Kotz (2003): The brain basis of syntactic processes: functional imaging and lesion studies. Neuroimage 20, 8 – 17. Friederici, Angela D., Shirley-Ann Rüschemeyer, Anja Hahne & Christian J. Fiebach (2003): The role of left inferior frontal and superior temporal cortex in sentence comprehension: localizing syntactic and semantic processes. Cerebral cortex 13 (2), 170 – 177. Goyet, Louise, Scania de Schonen & Thierry Nazzi (2010): Words and syllables in fluent speech segmentation by French-learning infants: An ERP study. Brain Research 1332, 75 – 89. Grahn, Jessica A. (2009): The role of the basal ganglia in beat perception. Annals of the New York Academy of Sciences 1169 (1), 35 – 45. Grahn, Jessica A. & Matthew Brett (2007): Rhythm and beat perception in motor areas of the brain. Cognitive Neuroscience, Journal of 19 (5), 893 – 906. Grahn, Jessica A. & Matthew Brett (2009): Impairment of beat-based rhythm discrimination in Parkinson’s disease. Cortex 45 (1), 54 – 61. Hahne, Anja (2001): What’s different in second-language processing? Evidence from event-related brain potentials. Journal of psycholinguistic research 30 (3), 251 – 266. Hahne, Anja & Angela D. Friederici (1999): Electrophysiological Evidence for Two Steps in Syntactic Analysis: Early Automatic and Late Controlled Processes. Journal of Cognitive Neuroscience 11 (2), 194 – 205. Hyman, Larry M. (1977): On the nature of linguistic stress. Studies in stress and accent 4. Kotz, Sonja A., Michael Schwartze & Maren Schmidt-Kassow (2009): Non-motor basal ganglia functions: A review and proposal for a model of sensory predictability in auditory language perception. Cortex 45 (8), 982 – 990. Lerdahl, Fred & Ray Jackendoff (1983): A Generative Theory of Tonal Music. Cambridge: MIT Press. Marsden, C. David & Jose A. Obeso (1994): The functions of the basal ganglia and the paradox of stereotaxic surgery in Parkinson’s disease. Brain 117 (4), 877 – 897. Mink, Jonathan W. (1996): The basal ganglia: focused selection and inhibition of competing motor programs. Progress in neurobiology 50 (4), 381 – 425. Moro, Andrea, Marco Tettamanti, Daniela Perani, Caterina Donati, Stefano F. Cappa & Ferruccio Fazio (2001): Syntax and the brain: disentangling grammar by selective anomalies. Neuroimage 13 (1), 110 – 118. Nazzi, Thierry & Frank Ramus (2003): Perception and acquisition of linguistic rhythm by infants. Speech Communication 41 (1), 233 – 243. Neville, Helen J., Janet L. Nicol, Andrew Barss, Kenneth I. Forster & Merril F. Garrett (1991): Syntactically Based Sentence Processing Classes: Evidence from Event-Related Brain Potentials. Journal of Cognitive Neuroscience 3 (2), 151 – 165. Roncaglia-Denissen, M. Paula, Maren Schmidt-Kassow, Angela Heine, Peter Vuust & Sonja A. Kotz (2013): Enhanced musical rhythmic perception in Turkish early and late learners of German. Frontiers in Psychology 4, 645. DOI: 10.3389/fpsyg.2013.00645
140
Maren Schmidt-Kassow, M. Paula Roncaglia-Denissen und Sonja A. Kotz
Rothermich, Kathrin, Maren Schmidt-Kassow, Michael Schwartze & Sonja A. Kotz (2010): Event-related potential responses to metric violations: rules versus meaning: NeuroReport 21 (8), 580 – 584. Sebastián-Gallés, Núria, Emmanuel Dupoux, Juan Seguí & Jacques Mehler (1992): Contrasting syllabic effects in Catalan and Spanish. Journal of Memory and Language 31 (1), 18 – 32. Snijders, Tineke M., Valesca Kooijman, Anne Cutler & Peter Hagoort (2007): Neurophysiological evidence of delayed segmentation in a foreign language. Brain Research 1178, 106 – 113. Steinhauer, Karsten, Kai Alter & Angela D. Friederici (1999): Brain potentials indicate immediate use of prosodic cues in natural speech processing. Nature Neuroscience 2 (2), 191 – 196. Ullman, Michael T. (2004): Contributions of memory circuits to language: the declarative/procedural model. Cognition 92 (1 – 2), 231 – 270.
Holger Hopp
Kasus- und Genusverarbeitung des Deutschen im Satzkontext Anders als in der traditionellen Spracherwerbsforschung wird in der Forschung zur L2-Satzverarbeitung nicht untersucht, ob und wann bestimmte morphosyntaktische Eigenschaften der L2 erworben werden, sondern inwiefern erworbenes Wissen auch in Echtzeit im Sprachverständnis genutzt wird, um zielsprachliche grammatische Strukturen aufzubauen. In der Satzverarbeitung werden folglich die Prozesse des Satzverarbeitungsmechanismus (Parser) untersucht, d. h. wie Sätze in Echtzeit verstanden und welche grammatischen Strukturen Sätzen zugewiesen werden. Ein zentrales Merkmal der Satzverarbeitung ist die Inkrementalität. Inkrementalität bedeutet, dass der Parser nicht wartet, bis vollständige Informationen über die Struktur und die Interpretation eines Satzes vorliegen, sondern dass der Input sofort interpretiert wird und auch partiellen Inputstrings fortlaufend eine Struktur bzw. Interpretation zugewiesen wird. Um inkrementell Strukturen aufbauen zu können, muss der Parser fortwährend neue Informationen in seine partielle Repräsentation integrieren. So werden der Repräsentation neue Wörter und Phrasen hinzugefügt, die semantische, pragmatische oder morphosyntaktische Informationen liefern, die relevant für den Strukturaufbau sind. Diese Informationen können die bisher inkrementell aufgebaute Struktur bestätigen oder aber auch zu einer Revision der bisherigen Repräsentation führen, der sogenannten Reanalyse. Zum Beispiel führt die Integration des Wortes fell in dem klassischen Beispiel The horse raced past the barn fell zu einer Reanalyse, da die bisherige inkrementelle Analyse des Satzes mit raced als Hauptverb durch das Wort fell unmöglich gemacht wird (Townsend & Bever 2001). Vielmehr muss das erste Verb zum Partizip eines reduzierten Relativsatzes (The horse [that was] raced past the barn fell) reanalysiert werden, um dem Satz eine grammatische Struktur zuzuweisen. Es liegt hier also eine temporäre syntaktische Funktionsambiguität vor, d. h. bis zur Integration des Wortes fell ist der Teilsatz ambig zwischen einem Hauptsatz und einem reduzierten Relativsatz. Durch das Wort fell wird die Struktur zu einer Relativsatzkonstruktion disambiguiert. Im Deutschen bietet die relativ umfangreiche Nominalflexion des Deutschen in Verbindung mit der relativ freien Wortstellung Möglichkeiten, syntaktische Funktionsambiguitäten zu untersuchen, die sich so in anderen Sprachen nicht finden. So werden etwa in der bedeutend umfangreicheren Forschung zur L1- und Holger Hopp, Technische Universität Braunschweig DOI 10.1515/9783110456356-007
142
Holger Hopp
L2-Sprachverarbeitung im Englischen syntaktische Funktionsambiguitäten von Nominalphrasen weitgehend mittels Verbambiguitäten z. B. zwischen Vollverb und Partizip in reduzierten Relativsätze wie im obigen Beispiel (siehe auch Trueswell et al. 1994) oder zwischen intransitiver und transitiver Lesart des Verbes bei Adjunktsätzen (When Anna bathed the baby spit up on the bed; z. B. Ferreira 2003) untersucht (siehe Roberts 2013; Juffs & Rodríguez 2015 für einen allgemeinen Überblick über die L2-Satzverarbeitung im Englischen). Die syntaktische Funktion der Argumente des Verbs ergibt sich im Englischen aus deren Position. Im Deutschen hingegen kann die syntaktische Funktion zusätzlich auf Nominalphrasen morphologisch markiert bzw. disambiguiert werden, wie in den Beispielen in (1) gezeigt wird. (1) a. Die Schwester sieht die Frau. b. Die Schwester sieht der Mann. c. Den Bruder sieht der Mann. Im Beispiel (1a) kann dem Satz sowohl eine SVO wie auch eine OVS Wortfolge zugewiesen werden, da die Kasusmarkierung bei femininen Nomen zwischen Nominativ und Akkusativ ambig ist. In (1b) wird die temporär ambige Wortabfolge durch den nominativmarkierten Determinierer der zweiten Nominalphrase der Mann zu OVS disambiguiert, und in (1c) liegt qua eindeutiger Kasusmarkierung auf beiden Nominalphrasen bei maskulinen Nomen keine Ambiguität vor. In diesem Kapitel wird besprochen, wie L2-Lerner des Deutschen Kasus und Genus inkrementell integrieren, um zum Teil temporär ambige Satzstrukturen aufzubauen bzw. zu reanalysieren. Zum einen werden Studien diskutiert, die untersuchen,wie L2-Lerner die grammatische Funktion von Argumenten des Verbs als Subjekt oder Objekt qua Kasusmarkierung auf Nominalphrasen zuweisen. Zum anderen liegt der Fokus auf der Verarbeitung des grammatischen Geschlechts im Deutschen in Satzkontexten. Im Mittelpunkt stehen erwachsene Zweit- bzw. Fremdsprachlerner, wohingegen im Kapitel von Cristante & Schimke (in diesem Band) der Schwerpunkt auf kindlichen Lernern liegt. In der Forschung zur Sprachverarbeitung von erwachsenen L2-Lernern ist die zentrale Frage, inwiefern sich die Sprachverarbeitung von L2-Lernern und Muttersprachlern unterscheidet. In den letzten Jahren haben sich zwei grundlegende Ansätze zur L2 Satzverarbeitung herausgebildet. Zum einen gehen mehrere Ansätze davon aus, dass die Prozesse in der L1- und L2-Satzverarbeitung qualitativ identisch sind, sich aber quantitativ durch eine geringere Geschwindigkeit und weniger automatisierte Prozesse z. B. im Zugriff auf lexikalische oder extragrammatische Informationen in der L2, von muttersprachlichem Parsing unterscheiden (z. B. Dekydtspotter, Schwartz & Sprouse 2006; McDonald 2006; Hopp 2007). Zum
Kasus- und Genusverarbeitung des Deutschen im Satzkontext
143
anderen gehen einige Ansätze davon aus, dass qualitative Unterschiede zwischen der L1- und L2-Satzverarbeitung dahingehend bestehen, dass im L2-Satzverständnis in Echtzeit weniger auf abstraktes grammatisches Wissen zurückgegriffen werden kann als in der L1 (Shallow Structure Hypothesis; Clahsen & Felser 2006) oder dass prozedurales Wissen, das in der Verarbeitung von grammatischen Strukturen nötig ist, nicht bzw. nur bei sehr fortgeschrittener Sprachfertigkeit in der L2 zugänglich ist (Declarativ-Procedural Model; Ullman 2005). Auch behaupten manche Ansätze, dass Flexionsmorphologie, die nicht auch in der L1 existiert, in der L2-Satzverarbeitung nicht inkrementell integriert werden kann (Jiang 2007). Vor dem Hintergrund dieser unterschiedlichen Modelle bietet Deutsch als morphologisch relativ stark flektierende Sprache mit flexibler Wortstellung vielfältige Möglichkeiten, um zu untersuchen, (a) welche Unterschiede zwischen L1Sprechern und L2-Lernern in der Satzverarbeitung bestehen und (b) welche Faktoren Einfluss auf die zielsprachliche Verarbeitung von Flexionsmorphologie in der L2 haben. Im Folgenden werden in Abschnitt 1 Grundlagen der Wortstellung und Nominalflexion des Deutschen skizziert und dann auf zentrale Verarbeitungsmuster bei deutschen Muttersprachlern eingegangen. In Abschnitt 2 werden wichtige Befunde zur Integration von Kasus besprochen, und in Abschnitt 3 Studien zu Genus im Deutschen als L2 vorgestellt.
1 Wortstellung im Deutschen 1.1 Wortstellung und Nominalflexion im Deutschen Das Deutsche besitzt eine freie Wortstellung von Argumenten des Verbs, während die Stellung des finiten Verbes fest ist. In Nebensätzen steht das finite Verb in satzfinaler Position (2). Im topologischen Satzgliedmodell wird diese Position als rechte Satzklammer bezeichnet (z. B. Wöllstein 2014). (2) Ich glaube, dass der Mann den Sohn ruft. Auch wenn die unmarkierte Wortfolge in Nebensätzen SOV ist, ist grundsätzlich die Reihenfolge der verbalen Argumente im sogenannten Mittelfeld frei. So sind zum Beispiel für ditransitive Verben mit drei Argumenten alle Abfolgen syntaktisch prinzipiell möglich (3).
144
(3) a. b. c. d. e. f.
Holger Hopp
Ich glaube, dass der Mann den Eimer dem Sohn gab. Ich glaube, dass der Mann dem Sohn den Eimer gab. Ich glaube, dass den Eimer der Mann dem Sohn gab. Ich glaube, dass den Eimer dem Sohn der Mann gab. Ich glaube, dass dem Sohn der Mann den Eimer gab. Ich glaube, dass dem Sohn den Eimer der Mann gab.
Jedoch sind alle Wortstellungen außer den subjektinitialen Beispielen in (3a&b) auf bestimmte diskurspragmatische bzw. informationsstrukturelle Kontexte beschränkt, ohne die sie markiert wirken (z. B. Lenerz 1977; Höhle 1982). In Hauptsätzen hingegen zeigt Deutsch eine Verb-Zweitstellung (Eisenberg 2006), so dass das finite Verb als zweites Satzglied, d. h. in der linken Satzklammer, realisiert wird. In der ersten Satzgliedposition, dem sogenannten Vorfeld, können unterschiedliche Satzglieder, z. B. Subjekte, Objekte, Adverbialphrasen etc. stehen (4). (4) a. Der Mann kaufte gestern den Eimer. b. Den Eimer kaufte gestern der Mann. c. Gestern kaufte der Mann den Eimer. Auch in Hauptsätzen sind nicht-subjektinitiale Wortfolgen markiert, unterliegen aber geringeren diskurspragmatischen Restriktionen und werden häufiger als in Nebensätzen verwandt, wie Korpusstudien zeigen (Bader & Häussler 2010). Die Flexibilität in der Wortstellung im Deutschen führt zu Unterschieden zwischen der syntaktischen Position und der thematischen Funktion von Argumenten des Verbes. Wie bereits eingangs illustriert, kommt der Flexionsmorphologie im Deutschen aufgrund der flexiblen Wortstellung für die Satzverarbeitung die wichtige Rolle der grammatischen Funktionsdisambiguierung zu. So wird etwa über die Kasusmarkierung auf Determinierern in Nominalphrasen (1) angezeigt, welche grammatische Funktion nominale Argumente des Verbes haben (z. B. Subjekt, Objekt). Diese Funktion tritt auch in Relativsätzen und W-Fragen zu Tage, in denen Kasusmarkierung auf dem Relativpronomen (5a) bzw. der W-Phrase (5b) die syntaktische Funktion signalisiert. (5) a. Er sieht den Mann der/den die Frau bestahl. b. Welcher/n Mann bestahl die Frau? Aufgrund des Synkretismus im deutschen Artikelsystem, in dem die gleiche Form unterschiedliche Kasus ausdrücken kann, können Nominalphrasen hinsichtlich ihrer grammatischen Funktion oftmals ambig bleiben. In diesen Fällen kann die
Kasus- und Genusverarbeitung des Deutschen im Satzkontext
145
grammatische Funktion von Nominalphrasen aus der Numerusflexion am Verb abgeleitet werden (6). (6) a. Die Frauen rufen die Tochter. (Subjekt-Objekt) b. Die Frauen ruft die Tochter. (Objekt-Subjekt) Auch finden sich im Deutschen zahlreiche Genusambiguitäten, da die gleiche Form des Determinierers unterschiedliche Genera markieren (ein ist maskulin oder Neutrum), bzw. unterschiedliche Genera in verschiedenen Kasus ausdrücken kann (z. B. der ist nominativ maskulin, aber zugleich auch dativ feminin). Diese unterschiedlichen Arten und Ambiguitäten in der grammatischen Funktionsmarkierung von Nominalphrasen im Deutschen erlauben es, den Einfluss verschiedener flexionsmorphologischer Markierungen wie Kasus, Genus aber auch Verbflexion im Parsing zu untersuchen.
1.2 Fragestellungen in der L1-Satzverarbeitung des Deutschen Mit Blick auf diese morphosyntaktischen Eigenschaften des Deutschen wurden zahlreiche Untersuchungen zur Verarbeitung unterschiedlicher Satzstellungen im Deutschen durchgeführt (für einen Überblick, Bader et al. 2000; Gorrell 2000; Hemforth & Konieczny 2000). Im Wesentlichen wurden hierbei die folgenden Fragen untersucht: – Zeigt der Parser eine Präferenz für unmarkierte (subjektinitiale) Wortabfolgen? – Wenn ja, kommt es zu einer inkrementellen Revision (Reanalyse) von einer Subjekt-Objekt Abfolge zu einer Objekt-Subjekt Abfolge aufgrund von flexionsmorphologischer Markierung? – Gibt es Unterschiede in der Reanalyse abhängig von der Art der flexionsmorpholgischen Markierung (Kasus vs Numerus)? – Wie beeinflussen z. B. Argumentstruktur oder diskurspragmatische Kontexte die Satzverarbeitung von objektinitialen Abfolgen? In Akzeptabilitätsurteilen von unter Zeitdruck präsentierten Sätzen (Hemforth 1993) bzw. Blickbewegungsexperimenten (Scheepers, Hemforth & Konieczny 2000) zeigen deutsche Muttersprachler schnellere Reaktions- bzw. Lesezeiten für subjektinitiale Wortstellungen in Haupt- und Nebensätzen als für objektinitiale Sätze. Auch in neurophysiologischen EKP-Studien zeigt sich, dass Sprecher subjektinitiale Wortstellungen bevorzugen (z. B. Frisch et al. 2002). Diese Ergebnisse entsprechen denen von Studien zu anderen Sprachen mit teils flexibler
146
Holger Hopp
Wortstellung, wie dem Russischen (Sekerina 2003) und dem Niederländischen (Kaan 1997), und weisen auf eine allgemeine Subjektpräferenz des Parsers hin. In unterschiedlichen theoretischen Ansätzen wird diese Präferenz aus strukturellen (z. B. DeVincenzi 1991; Fodor & Inoue 1998) oder thematischen Ökonomieprinzipien (z. B. Bornkessel-Schlesewsky & Schlesewsky 2009) des Parsers abgeleitet oder als Resultat der höheren Frequenz von subjektinitialen Sätzen im Input betrachtet (z. B. MacDonald, Pearlmutter & Seidenberg 1994). Die Subjektpräferenz zeigt sich u. a. in Leseverzögerungen, sobald Leser ein Wort lesen, das eine subjektinitiale Interpretation des Satzes unmöglich macht. Zum Beispiel waren Leser in einer Studie von Scheepers (1996) signifikant langsamer im Lesen der Nominalphrase der Junge in (7b) im Vergleich zu den Jungen in (7a). In (7b) disambiguiert die Nominativmarkierung auf dem Determinierer die Wortabfolge des Satzes zu OVS, während in (7a) die Akkusativmarkierung eine SVO-Abfolge markiert. (7) a. Die Tante besuchte den Jungen. b. Die Tante besuchte der Junge. Diese Effekte weisen darauf hin, dass der Parser Flexionsmorphologie inkrementell integriert, um seine Subjektpräferenz zu reanalysieren und eine objektinitiale Repräsentation des Satzes aufzubauen. In mehreren Studien zu temporär ambigen W-Fragen zeigte sich, dass die Disambiguierung durch Kasusmarkierung (8a) zu einer robusteren Reanalyse führt als die Disambiguierung mittels Numerusflexion auf dem Verb (8b) (Meng & Bader 2000). (8) a. Welche Frau sah der Mann am Freitag? b. Welche Frau sahen die Männer am Freitag? Kasus scheint somit einen anderen Status als Subjekt-Verb Kongruenz zu haben und ein stärkeres Reanalysesignal zu bieten (Bayer & Bader 2006). Demgegenüber beeinflussen semantische Aspekte, z. B. Belebtheit der Nomen (Schlesewsky et al. 2000) oder die Plausibilität des Satzes (Das ist die Managerin, die die Arbeiterinnen gesehen/entlassen haben; Schriefers, Friederici & Kühn 1995) die Schwierigkeit der nötigen Revision nicht: So ist die Reanalyse bei unbelebten Subjekten oder implausiblen OS-Wortfolgen nicht einfacher. Zwei Faktoren, die einen deutlichen Einfluss auf die Verarbeitung von objektinitialen Wortstellungen haben, sind die Argumentstruktur des Verbes und der Diskurskontext. Die Argumentstruktur von Verben beeinflusst die Wortstellungspräferenzen im Deutschen (für einen Überblick, Primus 2012). So ist etwa bei
Kasus- und Genusverarbeitung des Deutschen im Satzkontext
147
sogenannten Experiencerverben die objektinitiale Wortabfolge unmarkiert (Dem Mann gefällt das Buch) und weist auch geringere bzw. keine Verarbeitungsnachteile gegenüber einer subjektinitialen Abfolge auf (z. B. Schlesewsky & Bornkessel 2004). Ein weiterer Faktor, der die Reanalyseschwierigkeit vermindert, ist ein Diskurskontext, der eine nicht-subjektinitiale Wortabfolge informationsstrukturell akzeptabel macht. Am deutlichsten sind diese Effekte, wenn nicht-subjektinitiale Wortfolgen als Antwort auf eine W-Frage gelesen werden (Meng, Bader & Bayer 1999). In einem Kontext wie (9b) erzwingt die W-Frage Fokus auf dem Subjekt und die bereits in der Frage genannte Phrase die Oma wird als Topik markiert und dementsprechend defokussiert (Höhle 1982). Als Antwort auf (9b) sind die Reanalyseeffekte bei (9c) deutlich geringer als in neutralen Kontexten wie (9a). (9) a. Was hat Fritz erzählt? b. Wer hat die Oma besucht? c. Fritz hat erzählt, dass die Oma einige der Kinder besucht haben. Auch in elektrophysiologischen Studien zeigen Leser bei kontrastiven (Bornkessel & Schlesewsky 2006) bzw. fokussierenden Fragen (Burmester, Spalek & Wartenburger 2014) geringere Reanalyseeffekte für OS-Abfolgen als in neutralen Kontexten. Eine Studie von Weskott et al. (2011) belegt zudem, dass spezielle Diskurskontexte, die semantische Teil-Ganz Beziehungen implizieren, sogar zu einer einfacheren Verarbeitung von OS- gegenüber SO-Wortfolgen in Hauptsätzen führen. Um den Einfluss des Diskurskontexts auf die Verarbeitung von objektinitialen Wortfolgen in Nebensätzen wie (9c) zu erklären, argumentieren Bader & Meng (1999), dass die Stärke des Reanalyseeffekts abhängig von der Anzahl der Reanalyseprozesse ist: Zusätzlich zu der syntaktischen Struktur des Satzes muss auch noch die Informationsstruktur reanalysiert werden, d. h. das Objekt, das in subjektinitalen Sätzen normalerweise Fokus trägt, muss in objektinitalen Sätzen defokussiert werden. So ergeben sich stärkere Reanalyseeffekte. Durch einen Kontext wie (9b) wird bereits eine Informationsstruktur vorgegeben, die zu objektinitialen Wortabfolgen passt. Unter einer solchen Annahme lässt sich auch erklären, dass die Verarbeitungsschwierigkeiten von objektinitialen W-Fragen und Relativsätzen insgesamt geringer sind als bei Deklarativsätzen, insb. Nebensätzen, denn bei Fragen und Relativsätzen gehen objektinitiale Wortfolgen nicht mit einer zusätzlichen informationsstrukturellen Reanalyse einher. Zusammenfassend ist zu konstatieren, dass Muttersprachler des Deutschen eine klare Subjektpräferenz in der Satzverarbeitung haben, die zu einer inkrementelle Reanalyse führt, sobald flexionsmorphologische Markierung eine an-
148
Holger Hopp
dere Wortfolge signalisiert. Die Stärke der Renalyseeffekte unterscheidet sich abhängig von der Art der flexionsmorphologischen Disambiguierung, der Argumentstruktur von Verben und der Einbettung von Sätzen in Diskurskontexte.
2 Kasus in der L2 Satzverarbeitung des Deutschen 2.1 Fragestellungen und Lesestudien In Bezug auf L2-Lerner des Deutschen wird nun untersucht, ob diese ebenso wie deutsche Muttersprachler eine strukturelle Subjektpräferenz zeigen und Flexionsmorphologie integrieren, um Sätze inkrementell zu reanalysieren. Im Einzelnen wurden bislang die folgenden Forschungsfragen untersucht. – Zeigen L2-Lerner eine Präferenz für unmarkierte (subjektinitiale) Wortabfolgen in der L2? – Integrieren L2-Lerner Kasus- und Numerusflexion inkrementell in der Reanalyse? – Zeigen auch L2-Lerner Unterschiede zwischen Kasus- und Numerusmarkierung hinsichtlich der Reanalyse? – Beeinflussen individuelle Unterschiede zwischen Lernern, d. h. L1, Sprachfertigkeit und Erwerbsalter, bzw. Eigenschaften der Stimuli, d. h. Verbtypus oder diskurspragmatische Kontexte, die L2-Satzverarbeitung? In frühen Studien im Kontext des funktionalistischen Wettbewerbmodells (Competition Model, MacWhinney 2005) beurteilten Probanden in einem Fragebogen, welches Nomen in Sätzen wie Die Blumen sucht die Mutter das Agens ist (Kempe & MacWhinney 1998). Wenn mehrere Merkmale, die die Entscheidung beeinflussen können und damit in einen Wettbewerb eintreten, dargeboten werden (z. B. Wortstellung, Belebtheit, Kasusmarkierung, Subjekt-Verb Kongruenz), ordnen deutsche Muttersprachler die thematischen Rollen eines Satzes vornehmlich nach Kasusmarkierung zu, wohingegen z. B. englische L2-Lerner des Deutschen zunächst Merkmale wie Wortstellung und Belebtheit favorisieren (siehe auch Jackson 2005, 2007). Nach den Annahmen des Wettbewerbmodells transferieren Lerner so zunächst Merkmale, die sie in ihrer L1 nutzen und erwerben dann durch assoziatives Lernen die Merkmale, die in der L2 valide und reliable Indikatoren für die Satzinterpretation sind. Während diese Studien suggerieren, dass L2-Lerner andere Strategien als Muttersprachler im Satzverständnis anwenden, lassen sie jedoch keine direkten Aufschlüsse über inkrementelle Prozesse und Reanalyse in
Kasus- und Genusverarbeitung des Deutschen im Satzkontext
149
der Satzverarbeitung zu, da in diesen Studien nur Sätze als Ganzes beurteilt (Kempe & MacWhinney 1998) oder gelesen (Jackson 2005, 2007) wurden. Mittels selbstgesteuertem Lesen und Akzeptabilitätsurteilen unter Zeitdruck (speeded acceptability judgments) untersuchte Hopp (2006, 2007, 2010), ob fortgeschrittene L2-Lerner des Deutschen mit English, Niederländisch oder Russisch als L1 Lese- und Bewertungsmuster zeigen, die auf eine inkrementelle Reanalyse nach flexionsmorphologischer Markierung hindeuten. Während Russisch ebenfalls Kasusmarkierung zur Disambiguierung der Wortstellung nutzt, markieren Englisch und Niederländisch Kasus nur auf Pronomina, nicht jedoch auf Nominalphrasen. Die Probanden lasen und beurteilten Sätze, in denen eingebettete Sätze entweder SOV- (10/11a) oder OSV-Abfolgen (10/11b) aufwiesen. Diese wurden entweder über Kasusmarkierung auf den Nominalphrasen (10) oder durch Numerusmarkierung auf dem finiten Verb (11) desambiguiert. (10) a. b. (11) a. b.
Er denkt, dass der Physiker am Freitag den Chemiker gegrüsst hat. Er denkt, dass den Physiker am Freitag der Chemiker gegrüsst hat. Sie sagt, dass die Baronin am Freitag die Bankiers eingeladen hat. Sie sagt, dass die Baronin am Freitag die Bankiers eingeladen haben.
Deutsche Muttersprachler zeigten deutliche Lesezeitverzögerungen für OSV- gegenüber SOV-Abfolgen auf der ersten kasusmarkierten Nominalphrase in (10) bzw. auf dem satzfinalen Verb in (11), die (a) auf eine Subjektpräferenz und (b) auf eine inkrementelle Reanalyse hindeuten. In den Lesedaten aller L2-Gruppen fand sich eine klare Subjektpräferenz, da alle L2-Gruppen ein besseres Verständnis und schnellere Gesamtlesezeiten von SOV- gegenüber OSV-Abfolgen hatten. Jedoch zeigten nur die L1 Russischsprecher inkrementelle Reanalyseeffekte auf der ersten Nominalphrase im Nebensatz in (10b). Die L1 Englisch- bzw. L1 Niederländischsprecher wiesen zwar Leseverzögerungen für objektinitiale Abfolgen am Ende des Satzes auf, konnten aber Kasusmarkierung nicht unmittelbar zu einer inkrementellen Revision der Satzstruktur nutzen. Einzig eine Untergruppe der L1 Englisch- und L1 Niederländischsprecher mit sehr hoher, muttersprachlicher Sprachfertigkeit im Deutschen (sogenannte near-native Sprecher, Sorace 2003) zeigte unmittelbare Leseverzögerungen in (10b) aufgrund der Kasusmarkierung. Diese Studien legen nahe, dass die inkrementelle Nutzung von Flexionsmorphologie im L2 Deutschen von L1-Transfer beeinflusst ist. Sofern die L1 keine vergleichbaren Felxionsmarkierungen aufweist, tritt sie erst bei sehr fortgeschrittenen Lernern auf. Außerdem zeigten diese sehr fortgeschrittenen Lerner auch Unterschiede in den Verarbeitungsmustern, je nachdem, ob eine Reanalyse durch Kasusmarkierungen oder durch der Numerusmarkierung auf dem Verb ausgelöst wurde. Da ein vergleichbarer Unterschied auch bei Muttersprachlern
150
Holger Hopp
beobachtet wurde, spricht dies dafür, dass sehr fortgeschrittene L2-Lerner qualitativ ähnliche Verarbeitungsstrategien anwenden wie Muttersprachler (aber siehe Gerth et al. 2015). Jedoch basieren diese Ergebnisse auf objektinitialer Wortstellung in eingebetteten Sätzen (10 – 11), die im Deutschen wenig frequent und diskurspragmatisch markiert ist. Im Gegensatz dazu sind objektinitiale W-Fragen wesentlich häufiger und informationsstrukturell unmarkiert. In einer Reihe von Studien haben Jackson und Kollegen daher untersucht, ob in W-Fragen auch Lerner mit Englisch als L1, die eine geringere Sprachfertigkeit haben, Kasusflexion inkrementell zur Reanalyse nutzen können. In einem selbstgesteuerten Leseexperiment (Jackson 2008) lasen Lerner mit mittlerer bis fortgeschrittender Sprachfertigkeit im Deutschen WFragen wie in (12). In (12) ist der Determinierer der satzinitialen W-Phrase ambig, und erst die Kasusmarkierung auf der zweiten Nominalphrase disambiguiert die Satzstruktur. (12) a. Welche Ingenieurin traf den Chemiker gestern Nachmittag im Café? b. Welche Ingenieurin traf der Chemiker gestern Nachmittag im Café? Auch in dieser Studie zeigten sich Sprachfertigkeitseffekte: Die Gruppe der fortgeschrittenen Lerner wiesen Leseverzögerungen auf der zweiten Nominalphrase in (12b) gegenüber (12a) auf, die weniger fortgeschrittenen Lerner zeigten jedoch nur zum Ende des Satzes längere Lesezeiten. Jedoch fanden sich inkrementelle Reanalyseeffekte nur in Sätzen im Präteritum, in denen das thematische Verb an zweiter Stelle stand. Bei Fragen im Perfekt, in denen die lexikalisch-thematische Information des Hauptverbs erst zum Satzende hin verfügbar wurde (Welche Ingenieurin hat der Chemiker gestern getroffen), zeigten sich keine Reanalyseeffekte auf der zweiten Nominalphrase. Jackson argumentiert, dass Lerner neben der Kasusmarkierung noch zusätzliche lexikalische Informationen zur Reanalyse verbaler Argumente benötigen. Auch profitieren L2-Lerner davon, wenn ihre Aufmerksamkeit auf die grammatische Struktur von Sätzen gelenkt wird. In einem direkten Vergleich zweier Gruppen von US-amerikanischen Deutschlernern mit fortgeschrittenen Deutschkenntnissen berichten Jackson & Bobb (2009) und Jackson & Dussias (2009), dass nur die Gruppe, die nach jedem Satz ein Grammatikalitätsurteil zu Sätzen wie in (13) abgab, Reanalyseeffekte auf der Nominalphrase der Sportler in (13b) aufwies (siehe auch Mitsugi & MacWhinney 2010 für L2 Japanisch). Eine andere Gruppe, die die gleichen Sätze las, jedoch einfache Verständnisfragen zu den Sätzen beantwortete, die nicht auf die Satzstruktur abstellten, zeigte keine Unterschiede in den Lesezeiten zwischen (13a) und (13b).
Kasus- und Genusverarbeitung des Deutschen im Satzkontext
151
(13) a. Wer denkst du, bewunderte den Sportler nach dem Spiel? b. Wen denkst du, bewunderte der Sportler nach dem Spiel? Ein weiterer Faktor, der die Kasusverarbeitung für L2-LernerInnen erleichtert, sind informationsstrukturelle Informationen, die zusätzlich zur Kasusmorphologie die grammatische Funktion von Argumenten verdeutlichen. Wie in Abschnitt 1 besprochen, führen W-Fragen bzw. Diskurskontexte, die das Objekt defokussieren, zu einer deutlichen Verarbeitungserleichterung von objektinitialen Wortabfolgen bei deutschen Muttersprachlern. In einer Studie von Hopp (2009) zeigte sich, dass englische, niederländische und russische L2-Lerner des Deutschen ebenfalls Unterschiede in der inkrementellen Reanalyse abhängig von der Informationsstruktur eines Diskurskontextes und einer W-Frage machten. Im selbstgesteuerten Lesen lasen die Probanden zunächst einen der Kontextsätze in (14) und anschließend einen der Experimentalsätze in (15). (14) a. ALL-Fokus: In der Fabrikhalle standen am Dienstag einige Zeit die Maschinen still. Was ist passiert? b. SUBJEKT-Fokus: In der Fabrikhalle wurde der Arbeiter am Dienstag von jemandem abgelenkt. Wer hat den Arbeiter abgelenkt? c. OBJEKT-Fokus: In der Fabrikhalle lenkte der Lehrling am Dienstag jemanden ab. Wen hat der Lehrling abgelenkt? (15) a. Ich glaube, dass der Lehrling am Dienstag den Arbeiter abgelenkt hat. b. Ich glaube, dass den Lehrling am Dienstag der Arbeiter abgelenkt hat. In allen Gruppen fanden sich Unterschiede in den Lesezeiten auf der ersten Nominalphrase in den eingebetteten Sätzen in (15). Die Lesezeiten für objektinitiale Sätze (15b) waren in SUBJEKT-Fokus Kontexten, in denen das Objekt defokussiert wurde, signifikant geringer als in ALL- oder OBJEKT-Fokus Kontexten. Selbst die Lernergruppen, die beim Lesen von einzelnen Sätzen außerhalb von Kontexten keine inkrementelle Reanalyseeffekte zeigten (Hopp 2006, 2010), wiesen beim Lesen von Sätzen innerhalb von Diskurskontexten differentielle Leseverzögerungen für objektinitiale Wortfolgen auf. Kontextinformationen scheinen so zu einer erhöhten Sensibilität für Wortstellungsvariation im L2 Deutschen zu führen, bzw. sie vereinfachen die syntaktische Reanalyse, da keine zusätzliche informationsstrukturelle Reanalyse mehr nötig ist (Bader & Meng 1999). Im Allgemeinen stützen diese Befunde die Beobachtung in anderen Studien, dass L2-Lerner Kontextinformationen im Sprachverständnis nutzen (z. B. Pan, Schimke & Felser 2014) Zusammengefasst legen diese Studien nahe, dass Lerner, deren L1 keine äquivalente Kasusmarkierung zur L2 hat, zusätzliche Informationen durch ein
152
Holger Hopp
thematisches Verb, Grammatikalitätsurteile oder geeignete Diskurskontexte benötigen, die ihre Aufmerksamkeit auf die grammatische Funktionszuordnung von Nominalphrasen lenken (siehe auch Roberts 2012). Unter diesen Umständen können selbst Lerner mit geringerer Sprachfertigkeit im Deutschen Kasusinformationen inkrementell nutzen, um Nominalphrasen grammatische Funktionen zuzuordnen. In gewisser Hinsicht problematisch ist jedoch, dass in allen Lesestudien ein indirektes Maß für die Reanalyse mittels Kasusmarkierung genutzt wird, nämlich längere relative Lesezeiten auf einer Nominalphrase, die zu einer nicht-subjektinitialen Wortabfolge disambiguiert. Allein eine Verzögerung im Lesen ist aber kein eindeutiges Maß dafür, dass Leser die Kasusinformation tatsächlich zur grammatischen Reanalyse eines Satzes nutzen. In einer Replikation der Studie von Jackson (2008) mit der Methode des Eyetrackings beobachteten Jackson, Dussias & Hristova (2012), dass englischsprachige Lerner des Deutschen von mittlerer Sprachfertigkeit längere Lesezeiten auf der Nominalphrase den Chemiker in (12a) hatten, obwohl die Akkusativmarkierung auf dem Determinierer zu einer (präferierten) subjektinitialen Interpretation der Frage führt. Diese Befunde lassen sich dahingehend interpretieren, dass die längeren Lesezeiten von L2-Lernern auf akkusativmarkierten Determinierern womöglich der Form des Determinierers und nicht dessen grammatischer Funktion geschuldet sind. So bemerken L2-Leser zwar, dass eine akkusativmarkierte Phrase in die Satzinterpretation integriert werden muss, aber die damit einhergehende Leseverzögerung ist nicht zugleich auch Zeichen für eine erfolgreiche Reanalyse. In Lesestudien muss diese Frage zwangsläufig offen bleiben, da sie keinen unmittelbaren Einblick in die Interpretation der inkrementell gebildeten Strukturen bieten.
2.2 Prädiktion durch Kasus Um direkte Einsichten in die inkrementelle Interpretation von Sätzen und die Integration unterschiedlicher Informationen zur Reanalyse von grammatischen Funktionen zu erlangen, wurde deshalb in jüngerer Zeit vermehrt die Methode des Eyetrackings im Visual World-Paradigma eingesetzt (siehe Hopp & Schimke in diesem Band). In einer Studie von Hopp (2015b) wurden 45 L1 englischsprechende erwachsene Lerner des Deutschen, die unterschiedliche Sprachfertigkeitsniveaus im Deutschen hatten, untersucht. Wie in einer Vorläuferstudie mit deutschen Muttersprachlern von Kamide, Scheepers & Altmann (2003) betrachteten die Probanden Bilder wie in Abbildung 1 und hörten Sätze wie in (16).
Kasus- und Genusverarbeitung des Deutschen im Satzkontext
153
Abbildung 1: Display aus Hopp (2015a)
(16) a. Der Wolf tötet gleich den Hirsch. b. Den Wolf tötet gleich der Jäger. In (16) erlaubt die Kasusmarkierung auf der ersten Nominalphrase in Kombination mit dem transitiven Verb töten die Vorhersage, dass die zweite Nominalphrase entweder die grammatische Funktion des Objekts, bzw. die thematische Rolle des Patiens in (16a) oder die Funktion des Subjekts, bzw. Agens in (16b) erfüllen wird. Anhand der Fixierungshäufigkeiten auf den jeweiligen Objekten wird analysiert, ob Probanden bereits vor der Nennung der zweiten Nominalphrase auf die Bilder, die den jeweiligen grammatischen bzw. thematischen Rollen entsprechen, blicken. Deutsche Muttersprachler zeigten bereits während sie das Adverb gleich hörten, antizipatorische Blicke auf das Patiens (z. B. den Hirschen) in (16a) bzw. das Agens (z. B. den Jäger) in (16b). Dieses differenzierte Blickmuster legt nahe, dass die Kasusinformationen auf der ersten Nominalphrase und semantische Informationen des Verbes integriert werden, um eine grammatische Prädiktion zu bilden. Im Gegensatz dazu zeigte die L2-Gruppe keinen Unterschied zwischen (16a) und (16b); vielmehr fanden sich antizipatorische Blicke auf das Patiens (den Hirschen) in beiden Bedingungen. Auch mit steigender Sprachfertigkeit änderte sich das Verhalten der L2-Lerner nicht. In der Sprachverarbeitung nutzen L2Lerner demnach Verbinformationen zu einer semantischen Prädiktion, integrieren aber morphosyntaktische Kasusinformationen nicht, um ihre Vorhersagen zu modulieren (siehe auch Mitsugi & MacWhinney 2016). Derzeit ist offen, wie die unterschiedlichen Befunde aus Lesestudien und aus Visual World-Studien zu interpretieren sind (dazu Hopp 2015b; Kaan 2014). Weiterhin bestehen offene Fragen dahingehend, inwiefern die Schwierigkeiten, Kasusmarkierung inkrementell für eine Prädiktion zu nutzen, spezifisch für erwachsene L2-Lerner sind. So weisen etwa aktuelle Visual World-Studien zu kindlichen Lernern des Deutschen als L1 und L2 darauf hin (Cristante & Schimke in diesem Band; Rösch & Chondrogianni 2016), dass auch kindliche Lerner
154
Holger Hopp
Schwierigkeiten haben, Kasusinformation inkrementell zur Reanalyse zu nutzen. Diese Parallelen zu erwachsenen L2-Lerner deuten an, dass nicht alleine das Fehlen von Kasusinformation in der L1 oder das fortgeschrittene Erwerbsalter Probleme in der inkrementellen Integration von Kasus in der Satzverarbeitung bedingen, sondern dass Sprachenlerner, die geringere Erfahrung mit Kasusmarkierung in der Zielsprache haben und deren Verarbeitung von Flexionsmorphologie weniger automatisiert ist, allgemein Schwierigkeiten bei der Reanalyse haben. Gerade für die Klärung der eingangs skizzierten Fragen, ob quantitative oder qualitative Unterschiede zwischen erwachsenen L2-Lernern und Muttersprachlern in der Sprachverarbeitung bestehen, sind weitere komparative Studien vonnöten, die direkte Vergleiche in der Nutzung von Kasus zwischen kindlichen L1- und L2Lernern auf der einen Seite und erwachsenen L2-Lernern auf der anderen Seite unternehmen.
3 Genus in der L2-Satzverarbeitung des Deutschen 3.1 Fragestellungen zu Genus und Lesestudien Zusätzlich zu Kasus sind Nominalphrasen im Deutschen für Genus markiert. Wie viele andere Sprachen (Corbett 1991) klassifiziert das Deutsche alle Nomen in lexikalische Genuskategorien, im Falle des Deutschen, Maskulin, Feminin und Neutrum. Die Zuweisung eines Nomens zu einer bestimmten Genuskategorie ist weitgehend arbiträr, und es lassen sich jenseits des Sexus bei Nomen mit natürlichem Geschlecht (Mann, Frau) im Deutschen nur wenige probabilistische Regeln für Wörter mit grammatischem Genus (Käse, Milch) formulieren, die von der Wortform bzw. Bedeutung auf ein bestimmtes Genus schließen lassen (Köpcke & Zubin 1996). Demgegenüber ist die morphosyntakische Genuskongruenzmarkierung regelhaft, indem z. B. innerhalb einer Nominalphrase alle Konstituenten das Genus des Kopfnomens erben (eine kleine blaue Kiste). Im Kapitel von Bordag & Pechmann (in diesem Band) wird grammatisches Genus in der Sprachproduktion besprochen, und Jackson et al. (in diesem Band) diskutieren grammatisches Genus bei beginnenden L2-Lernern des Deutschen. In diesem Abschnitt liegt der Fokus auf grammatischem Genus im Satzverständnis. Anders als Kasus, durch den syntaktische Funktionen und thematische Rollen markiert werden, hat die Genuskongruenz keine eigene grammatische Funktion im Satzverständnis außerhalb der Pronomenresolution, wo sie der Identifikation von Referenten bzw. Antezedenten dient (vgl. Felser in diesem Band; Schimke et
Kasus- und Genusverarbeitung des Deutschen im Satzkontext
155
al. in diesem Band). Aus psycholinguistischer Sicht kommt der Genuskongruenz im Parsing die Funktion der referentiellen Eingrenzung zu (Dahan et al. 2000), d. h. mittels der Genuskongruenz innerhalb von Nominalphrasen kann zum Beispiel bei Auftreten des genusmarkierten Determinierers der der Hörer schlussfolgern, dass das folgende Nomen zur Klasse der Maskulina gehört. In diesem Sinne kann Genus disambiguierend wirken, da die Menge der möglichen Referenten durch die vorangehende Genusmarkierung eingegrenzt wird. In der Forschung zur L2-Sprachverarbeitung wurden daher die folgenden Fragen gestellt. – Integrieren L2-Lerner Genusflexion inkrementell im Sprachverständnis? – Nutzen L2-Lerner Genus prädiktiv zur Referenzeingrenzung? Der Erwerb des grammatischen Genus durch erwachsene L2-Lerner des Deutschen ist langwierig und bleibt oft unvollständig, während kindliche L1- und L2-Lerner Genus nach wenigen Jahren erfolgreich erworben haben (Szagun et al. 2007; Tracy 1986; Hopp 2011). Im erwachsenen Spracherwerb haben Lerner, deren L1 grammatisches Genus hat, geringere Schwierigkeiten im Erwerb von L2-Genuskongruenz als Lerner, deren L1, wie z. B. das Englische, nicht über grammatisches Genus verfügt. Letztere produzieren und akzeptieren häufiger nicht-zielsprachliche Genera und Genuskongruenz (*das blaues Tisch, z. B. Franceschina 2005; White et al. 2004). Zahlreiche elektrophysiologische und reaktionszeitgestützte Experimente haben in der Folge untersucht, inwieweit L2-Lerner Genuskongruenz im Sprachverständnis online nutzen und Kongruenzverletzungen zwischen Determinierer und Nomen (*der Telefon), bzw. zwischen Determinierer, Adjektiv und Nomen (ein *grauer Telefon) wahrnehmen. Auch hier finden sich L1-Effekte, insbesondere bei inkongruenter Genusmarkierung zwischen Adjektiv und Nomen (Sabourin & Stowe 2008). Gleichwohl zeigen auch Lerner mit einer L1 ohne grammatisches Genus Leseverzögerungen bzw. EKP-Komponenten bei Kongruenzverletzungen (Foucart & Frenck-Mestre 2011; Gillon-Dowens et al. 2010; Tokowicz & MacWhinney 2005). Die Realisierung von grammatischem Genus in der L1 stellt somit keine notwendige Voraussetzung für die zielsprachliche Verarbeitung von L2Genus dar. Vielmehr belegen zahlreiche Studien, dass Lernerfaktoren wie Sprachfertigkeit (z. B. Gabriele, Fiorentino & Alemán Bañón 2013; Gillon-Dowens et al. 2010) und Arbeitsgedächtnis (z. B. Keating 2010; Sagarra & Herschensohn 2010), aber auch Faktoren, die mit dem Experiment zusammenhängen wie z. B. Satzlänge und Distanz zwischen Nomen und genusmarkiertem Adjektiv (Alemán Bañón, Fiorentino & Gabriele 2014) die Sensibilität von L2-Sprechern unterschiedlicher Erstsprachen auf Genuskongruenzverletzungen beeinflussen. Auch zum L2 Deutschen findet etwa Hopp (2010) bei sehr fortgeschrittenen niederländischen und englischsprachigen L2-Lernern des Deutschen L1-Effekte.
156
Holger Hopp
Anders als deutsche Muttersprachler erkannten in einem speeded acceptability judgment task die L2-Sprecher Genuskongruenzverletzungen zwischen Determinierer und Nomen (das tote Hund) nicht und bewerteten diese Sätze überwiegend als grammatisch. Hierbei schnitt die niederländischsprachige Gruppe zwar besser ab als die englischsprachige Gruppe, aber das Vorhandensein von Genusmarkierung auf Determinierern in der L1 im Niederländischen alleine führte nicht zu zielsprachlicher Verarbeitung von Genus in der L2 (siehe auch Sabourin & Stowe 2008; zum L2 Deutschen auch Davidson & Indefrey 2009). Interessanterweise zeigten deutsche Muttersprachler vergleichbare Defizite in dem Erkennen von Genuskongruenzverletzungen, wenn sie die Aufgabe unter noch größerem Zeitdruck durchführten. Diese Parallelen zwischen Muttersprachlern und L2-Lernern deuten darauf hin, dass Probleme mit Genuskongruenz in der L2 nicht notwendigerweise aus fehlendem grammatischen Wissen rühren, sondern auch daher, vorhandenes grammatisches Wissen unter Echtzeitbedingungen abzurufen (siehe hierzu McDonald 2006; Prévost & White 2000). Vor diesem Hintergrund wird gegenwärtig untersucht, ab welchem Kompetenzniveau in der L2 Lerner Genuskongruenzverletzungen zielsprachlich verarbeiten (Alemán Bañón, Fiorentino & Gabriele 2014) und ob nicht-zielsprachliche Genuskongruenz in der L2 systematisch ist, d. h. ob sie auf fehlende grammatische Repräsentationen oder auf Schwierigkeiten im Zugriff auf grammatisches Wissen zurückzuführen ist (z. B. Lopéz-Prego & Gabriele 2014).
3.2 Prädiktion durch Genus Jenseits der Wahrnehmung von ungrammatischer Genuskongruenz hat sich die neuere Forschung der Frage zugewandt, inwieweit L2-Lerner grammatisches Genus zur Disambiguierung bzw. Präaktivierung von Nomen inkrementell nutzen können. In einer Studie von Scherag et al. (2004) wurde ein semantisches und morphosyntaktisches Primingparadigma genutzt, um die Präaktivierung von Nomen durch grammatisches Genus in der Sprachproduktion zu untersuchen (zur Methode des Primings, siehe Hopp & Schimke; Jackson et al. in diesem Band). Auf einem Bildschirm sahen die Probanden zunächst ein genusflektiertes Adjektiv (z. B. faltiges) für 1100 ms und mussten anschließend eine lexikalische Entscheidung treffen, ob ein daraufhin präsentiertes Nomen ein echtes oder ein Pseudowort im Deutschen ist. Das Nomen war entweder semantisch und qua Genusflexion morphosyntaktisch mit dem Adjektiv kongruent (GesichtNEUT), nur semantisch, aber nicht morphosyntaktisch kongruent (HautFEM), nur morphosyntaktisch (GerüchtNEUT) oder weder morphosyntaktisch noch semantisch (LohnMASK) kongruent. Aufgrund der Kongruenz zwischen Adjektiv und Nomen
Kasus- und Genusverarbeitung des Deutschen im Satzkontext
157
können so morphosyntaktische bzw. semantische Eigenschaften des Nomens voraktiviert werden, so dass der lexikalische Zugriff auf die Wortform des Nomens erleichtert wird. Scherag et al. (2004) untersuchten deutsche Muttersprachler, die entweder in Deutschland oder seit einiger oder längerer Zeit in den USA lebten, und fortgeschrittene L2-Lernerinnen des Deutschen mit Englisch als L1, die seit längerem in Deutschland lebten. In der Reaktionsgenauigkeit und den gemessenen Reaktionszeiten zeigten alle Gruppen deutscher Muttersprachler gradierte Kongruenzeffekte. Das heißt, die Reaktionszeiten waren kürzer, wenn das Adjektiv semantisch (Haut) oder morphosyntaktisch (Gerücht) kongruent war, und es zeigten sich die schnellsten Reaktionszeiten, wenn sowohl semantische als auch morphosyntaktische Kongruenz vorlag. Demgegenüber wiesen die L2-Lerner schnellere Reaktionszeiten einzig für semantisch (Haut) oder semantisch und morphosyntaktisch (Gesicht) kongruente Nomen auf, nicht aber, wenn nur morphosyntaktische Kongruenz gegeben war (Gerücht). Selbst fortgeschrittene L2Lerner profitieren also scheinbar nicht durch eine Präaktivierung qua Genuskongruenz, bzw. können diese nur nutzen, wenn zusätzliche, semantische Informationen unterstützend vorliegen. Vergleichbare Schwierigkeiten bei der Nutzung von Genus treten auch für die prädiktive Nutzung von Genuskongruenz im Satzverständnis auf. Eine Reihe von Blickbewegungsstudien zum L2 Spanischen von englischsprachigen Lernern zeigt, dass selbst fortgeschrittene Lerner keine prädiktive Genuskongruenzrelation zwischen Determinierer und Nomen herstellen (Lew-Williams & Fernald 2010; Grüter, Lew-Williams & Fernald 2012; siehe aber Dussias et al. 2013). Die Probanden sahen ein Display mit zwei Objekten und hörten einfache Instruktionen (Encuentra el zapato – ‚Finde den Schuh‘). Bei zwei Objekten, die unterschiedliche Genera haben (z. B. el zapato, ‚der Schuh‘, vs la pelota, ‚der Ball‘; sogenannte Unterschiedsbedingung) disambiguiert Genus auf dem Determinierer zwischen den beiden Objekten und erlaubt somit eine schnellere Identifikation des Zielobjekts, wohingegen bei zwei Objekten mit gleichem Genus in der Äquivalenzbedingung (el zapato vs el libro, ‚das Buch‘) erst das Nomen zwischen den beiden Objekten diskriminiert. Anders als Muttersprachler und auch dreijährige L1-Lerner des Spanischen (Lew-Williams & Fernald 2007) zeigten die L2-Lerner keine früheren Blicke auf ein Zielobjekt in der Unterschiedsbedingung. Ähnlich wie bei Studien zu Kasus (Hopp 2015a; Mitsugi & MacWhinney 2016) scheint so besonders die prädiktive Nutzung von Genus herausfordernd für L2-Lerner zu sein, zumindest dann, wenn die L1 nicht über analoge flexionsmorphologische Markierungen verfügen (Morales et al. 2015). Zum Deutschen als L2 findet Hopp (2013) ebenfalls, dass selbst L1 Englischsprecher mit hoher Sprachfertigkeit im Deutschen Genus nicht zielsprachlich zur Prädiktion bzw. Disambiguierung nutzen. In dem Versuchsaufbau der Studie
158
Holger Hopp
wurden den Probanden Displays mit vier Objekten gezeigt, unter denen drei gleichfarbige Zielobjekte waren, deren grammatische Genera entweder unterschiedlich (Abbildung 2) oder identisch waren.
Abbildung2: Display für Unterschiedsbedingung aus Hopp (2013).
Zunächst benannten die Probanden die Objekte, so dass notiert werden konnte, ob die Probanden die Nomen kannten und den Nomen das zielsprachliche Genus zuwiesen. Unmittelbar danach hörten die Probanden eine Frage (Wo ist der gelbe Eimer?) und blickten auf das Zielobjekt. Ausgewertet wurden nur die Versuche, in denen die Probanden bei der Benennung der Nomen das zielsprachliche Genus zugewiesen hatten und so im Prinzip die Genusmarkierung auf dem Determinierer zur Prädiktion nutzen konnten. In der Gesamtgruppe fanden sich nur schwache prädiktive Genuskongruenzeffekte, d. h. frühere Blicke auf das Zielobjekt bei unterschiedlichen Genera der drei in Frage kommenden Objekte. So bestätigt die Studie, dass L2-Lerner, deren L1 kein grammatisches Genus hat, Genuskongruenz in der L2 in der online Sprachverarbeitung nicht prädiktiv nutzen, selbst wenn sie Genuskongruenz in ihrer eigenen Sprachproduktion zielsprachlich verwenden (hierzu siehe Lemhöfer, Schriefers & Indefrey 2014). Eine tiefergehende Analyse wies darauf hin, dass nur die sehr fortgeschrittenen Lerner, die fast alle Nomen in dem Experiment mit dem zielsprachlichen Genus benannt haben, prädiktive Genuskongruenzrelationen realisierten. Im Gegensatz dazu nutzten Lerner, deren Genuszuweisung in der L2 oftmals fehlerhaft war (z. B. *EimerFEM) selbst dann Genus nicht prädiktiv, wenn eine zielsprachliche Zuweisung zu einer korrekten Vorhersage über das folgende Nomen führen könnte. Hopp argumentiert, dass die zielsprachliche Zuweisung von lexikalischem Genus eine Voraussetzung ist, um Genuskongruenz prädiktiv nutzen zu können. Solange die Genuszuweisung im Lexikon vielfach nicht der der Zielsprache entspricht, würde die prädiktive Nutzung dieser Genuszuweisung zu oftmals fehlerhaften Vorhersagen im Sprachverständnis führen (z. B. eine Repräsentation *EimerFEM würde zu einer Prädiktion von die zu EIMER führen). Daher nutzt der Parser Genus erst zur Prädiktion, wenn die lexikalische Genuszuweisung
Kasus- und Genusverarbeitung des Deutschen im Satzkontext
159
zielsprachlich ist. Diese Hypothese wurde in Hopp (2016) in einer Interventionsstudie weiter untersucht, in der englischsprachige Lerner von mittlerer Sprachkompetenz eine kurze Lerneinheit zur Genuszuweisung von deutschen Nomen erhielten. Anschließend konnten die Lerner, die zielsprachliche Genuszuweisungen erfolgreich gelernt hatten, Genus prädiktiv nutzen, während Lerner, die weiterhin variable lexikalische Genuszuweisung zeigten, Genus nicht prädiktiv nutzten. Diese Ergebnisse stützen die Annahme, dass die zielsprachliche Zuweisung von Genus im Lexikon Voraussetzung für die prädiktive Nutzung von Genuskongruenz ist. Zugleich legen diese Studien nahe, dass eine zielsprachliche prädiktive Genuskongruenzverarbeitung auch für englischsprechende Lerner des Deutschen möglich ist. Die Realisierung von grammatischem Genus in der L1 ist also keine notwendige Voraussetzung für die zielsprachliche prädiktive Verarbeitung von Genuskongruenz in einer spät erlernten L2. Umgekehrt zeigen Hopp & Lemmerth (2017), dass Genus in der L1 auch keine hinreichende Voraussetzung für zielsprachliche Genusprädiktion in der L2 darstellt. In einer Visual World-Studie wurden 24 erwachsene L1 russische Lerner des Deutschen untersucht. Wie das Deutsche besitzt das Russische drei Genera (Maskulin, Feminin, Neutrum), unterscheidet sich aber in der morphosyntaktischen Markierung von Genus. Anders als das Deutsche besitzt Russisch keine Artikel, und grammatisches Genus wird durch Endungen auf Nomen realisiert (17a). Wie im Deutschen sind attributive Adjektive pränominal und werden genusflektiert (17b). (17) a. ø (der/die/das) b. ø krasn-ijMASK/-oeNEUT (ein) roterMASK/-esNEUT
stol/lampa/platje TischMASK/LampeFEM/KleidNEUT stol/platje TischMASK/KleidNEUT
Wie die Beispiele in (17) belegen, ist die Genusmarkierung innerhalb von Nominalphrasen hinsichtlich Adjektiven zwischen Deutsch und Russisch kongruent, jedoch inkongruent in Bezug auf die Realisierung auf Determinierern. Hopp & Lemmerth untersuchten, inwieweit syntaktische Kongruenz zwischen L1 und L2 einen Einfluss auf die Genusverarbeitung im L2 Deutschen hat. Zusätzlich manipulierten sie lexikalische Kongruenz, d. h. ob ein Nomen bzw. dessen Übersetzungsäquivalent in die gleiche Genusklasse im Deutschen und Russischen fällt (z. B. TischMASK – stolMASK) oder unterschiedlichen Genuskategorien zugeordnet ist (z. B. HausNEUT – domMASK; zum Konzept der lexikalischen Kongruenz, siehe Bordag & Pechmann in diesem Band). Der Versuchsaufbau war ähnlich wie in Hopp (2013, 2016), indem Probanden zunächst die Objekte benannten und dann ein genanntes Objekt identifizieren mussten, während sie Instruktionen mit Genusmarkierung
160
Holger Hopp
auf dem Determinierer (Wo ist der gelbe Tisch?) oder auf dem Adjektiv (Wo ist ein großer gelber Tisch?) hörten. Die Ergebnisse zeigten Interaktionen mit dem Faktor Sprachfertigkeit. Die fortgeschrittenen Lerner konnten Genus in allen Bedingungen, d. h. unabhängig von lexikalischer und syntaktischer Kongruenz, prädiktiv nutzen. Die weniger fortgeschrittenen Lerner vermochten Objekte qua Genusmarkierung auf dem Adjektiv antizipieren, jedoch die Genusmarkierung auf dem Determinierer nur in der lexikalisch kongruenten Bedingung prädiktiv nutzen, d. h. wenn ein Nomen der gleichen Genuskategorie im Russischen und Deutschen angehörte. Wie die oben besprochenen Studien zu englischsprachigen Lernern des Deutschen belegen die Daten zu russischen Lernern somit, dass lexikalische und syntaktische Faktoren in der Genusverarbeitung interagieren. Zusammenfassend zeigt die bisherige Forschung, dass die zielsprachliche Integration von Genus im L2-Satzverständnis nicht einfach nur von Faktoren wie dem prinzipiellen Vorhandensein von grammatischem Genus als Kategorie in der L1 oder hoher L2-Sprachfertigkeit bedingt ist, sondern auch von Ähnlichkeit in der lexikalischen und morphosyntaktischen Realisierung von Genus in der L1 abhängig ist (Foucart & Frenck-Mestre 2011; Sabourin & Stowe 2008). Gegenwärtig wird in der Forschung untersucht, ob sich ähnliche Verarbeitungsmuster auch bei kindlichen L2-Lernern des Deutschen finden, bzw. wie sich unterschiedliche Lernbedingungen (z. B. Arnon & Ramscar 2012) oder Lehr- und Lernmethoden (z. B. Henry 2015; Morgan-Short et al. 2010) auf die Produktion und Verarbeitung von Genuskongruenz in der L2 auswirken (siehe Jackson et al. in diesem Band).
4 Zusammenfassung und Ausblick In diesem Kapitel wurde der Forschungsstand zur L2-Sprachverarbeitung des Deutschen zusammengefasst und Studien besprochen, die untersuchen, inwieweit erwachsene L2- Lerner Kasus und Genus in der Echtzeitverarbeitung integrieren. Während deutsche Muttersprachler Flexionsmorphologie zur Referenzeingrenzung prädiktiv verwenden und als inkrementelles Signal zur Reanalyse nutzen, zeigen die bisherigen Ergebnisse in Visual World-Studien und im Lesen, dass erwachsene L2-Lerner Schwierigkeiten haben, Kasus und Genus in der Echtzeitverarbeitung zu nutzen. Jedoch sind diese Schwierigkeiten nicht monolithisch, sondern werden etwa durch L1, Sprachfertigkeit und die Verfügbarkeit zusätzlicher lexikalischer oder kontextueller Informationen bedingt. Daher lässt sich auf die eingangs erhobene zentrale Frage, ob quantitative oder qualitative Unterschiede zwischen erwachsenen L2-Lernern und Muttersprachlern in der L2Sprachverarbeitung bestehen, keine klare Antwort geben. Die Befunde der bisherigen Forschung legen nahe, dass zumindest bei hoher Sprachfertigkeit mut-
Kasus- und Genusverarbeitung des Deutschen im Satzkontext
161
tersprachliche Verarbeitung auch bei Lernern, deren L1 keine ähnliche Kasus- bzw. Genussysteme aufweist, zu beobachten ist. Hier entsprechen die Ergebnisse zum Deutschen als L2 weitgehend den Resultaten etwa zum L2 Spanischen oder L2 Französischen (Foucart & Frenck-Mestre 2011; Gillon-Dowens et al. 2010, Jegerski 2015; Hopp & Arriaga León 2016). Jedoch ist jenseits der Frage, inwiefern grundsätzliche Unterschiede zwischen L1- und L2-Sprechern existieren, in der zukünftigen Forschung zu klären, welche individuellen Unterschiede unter L2Lernern bei der Satzverarbeitung bestehen (Hopp 2015a). Hierzu sind zum einen weitere cross-linguistische Vergleiche notwendig. Bisherige Studien haben vornehmlich englischsprachige Lerner untersucht, deren L1 kaum Kasus- oder Genusmarkierung aufweist. Demgegenüber liegen nur wenige Studien zu anderen Erstsprachen vor, die zeigen können, wie spezifische Unterschiede zwischen L1 und L2 in der Art und Position der Kasus- und Genusmarkierung die L2-Satzverarbeitung beeinflussen (z. B. Klassen 2016). Zum anderen haben die in Abschnitt 3.1 besprochenen Lesestudien gezeigt, dass L2Leser Kasus und Genus früher bzw. stärker inkrementell verarbeiten können, wenn zusätzliche kontxtuelle bzw. semantische Informationen vorliegen. In Bezug auf die größeren Schwierigkeiten von L2-Lernern, Kasus und Genus prädiktiv zu nutzen, ist es daher von Interesse zu erforschen, inwiefern zusätzliche kontextuelle Informationen auch die prädiktive Nutzung von Kasus oder Genus bei L2Lernern des Deutschen vereinfachen (siehe Henry 2015). Ein weiteres wichtiges zukünftiges Forschungsfeld betrifft die Interaktion zwischen Kasus und Genus in der L2-Satzverarbeitung des Deutschen. In der bisherigen Forschung wurden Kasus und Genus weitgehend unabhängig voneinander untersucht. In Studien zur Kasusverarbeitung wurden meist maskuline Nomen, die eindeutig kasusmarkierte Determinierer besitzen (der, den), bzw. feminine Nomen mit kasusambigen Determinierern (die) verwandt. Umgekehrt verwenden Studien zur Genusverarbeitung meist definite Nomen im Nominativ, deren Determinierer die Genera unterschiedlich markieren (der, die, das). Zwar isoliert die Verwendung eindeutiger Formen jeweils Kasus bzw. Genus, sie entspricht aber nicht dem typischen Lernerinput. Aufgrund des Synkretismus im deutschen Artikelsystem ist der Input oft ambig und die Form des Determinierers lässt keine eindeutige Ableitung der grammatischen Funktion bzw. der Genuskategorie der Nominalphrase zu. Es ist zu erforschen, inwieweit L2-Lerner grammatische Funktionen und Genuskategorien aus ambigen Input extrahieren bzw. ob und wie sie ambigen Input in der Sprachverarbeitung nutzen. Nicht zuletzt bedarf es mehr direkter Vergleiche zwischen kindlichen und erwachsenen L2-Lernern und zwischen L2- und L3-Lernern des Deutschen (Jaensch 2009) hinsichtlich der L2-Verarbeitung von Genus und Kasus. Komparative Studien dieser Art können Evidenz liefern, wie die L2-Satzverarbeitung von Alter,
162
Holger Hopp
Transfer und Erwerbssequenz beeinflusst wird, und somit zu einem besseren Verständnis und zu einer Weiterentwicklung von theoretischen Annahmen und Modellen der L2-Satzverarbeitung führen.
Literaturangaben Alemán-Bañon, José, Robert Fiorentino & Alison Gabriele (2014): Morphosyntactic processing in advanced second language (L2) learners: An event-related potential investigation of the effects of L1-L2 similarity and structural distance. Second Language Research 30, 275 – 306. Arnon, Inbal & Micheal Ramscar (2012): Granularity and the acquisition of grammatical gender: How order-of-acquisition affects what gets learned. Cognition 122, 292 – 305. Bader, Markus & Josef Bayer (2006): Case and Linking in Language Comprehension – Evidence from German. New York: Springer. Bader, Markus & Jana Häussler (2010): Word order in German: A corpus study. Lingua 120, 717 – 762. Bader, Markus & Michael Meng (1999): Subject-object ambiguities in German embedded clauses: An across-the-board comparison. Journal of Psycholinguistic Research 28, 121 – 143. Bader, Markus, Michael Meng, Josef Bayer & Jens-Max Hopf (2000): Syntaktische Funktions-Ambiguitäten im Deutschen – ein Überblick. Zeitschrift für Sprachwissenschaft 20, 34 – 102. Bornkessel, Ina & Matthias Schlesewsky (2006): The role of contrast in the local licensing of scrambling in German: Evidence from online comprehension. Journal of Germanic Linguistics 18, 1 – 43. Bornkessel-Schlesewsky, Ina & Mathias Schlesewsky (2009): Minimality as vacuous distinctness: Evidence from cross-linguistic sentence comprehension. Lingua 119, 1541 – 1559. Burmester, Juliane, Katharina Spalek & Isabell Wartenburger (2014): Context updating during sentence comprehension: The effect of aboutness topic. Brain & Language 137, 62 – 76. Clahsen, Harald, & Claudia Felser (2006): Grammatical processing in language learners. Applied Psycholinguistics 27, 3 – 42. Corbett, Greville C. (1991): Gender. Cambridge: Cambridge University Press. Dahan, Delphine, Daniel Swingley, Michael K. Tanenhaus & James S. Magnuson (2000): Linguistic gender and spoken word-recognition in French. Journal of Memory and Language 42, 465 – 480. Davidson, Doug J. & Peter Indefrey (2009): An event-related potential study on changes of violation and error responses during morphosyntactic learning. Journal of Cognitive Neuroscience 21, 433 – 46. Dekydtspotter, Laurent, Bonnie D. Schwartz & Rex A. Sprouse (2006): The comparative fallacy in L2 processing research. In Mary Grantham O’Brien, Christine Shea, & John Archibald (Hrsg.), Proceedings of the 8th Generative Approaches to Second Language Acquisition Conference, 33 – 40. Somerville, MA: Cascadilla Press. DeVincenzi, Maria (1991): Syntactic Parsing Strategies in Italian. Dordrecht: Kluwer.
Kasus- und Genusverarbeitung des Deutschen im Satzkontext
163
Dussias, Paola E., Jorge E. Valdés Kroff, Rosa E. Guzzardo Tamargo & Chip Gerfen (2013): When gender and looking go hand in hand: Grammatical gender processing in L2 Spanish. Studies in Second Language Acquisition 35, 353 – 387. Eisenberg, Peter (2006): Grundriss der deutschen Grammatik: Band 2: Der Satz. Stuttgart/Weimar: Metzler. Ferreira, Fernanda (2003): The misinterpretation of noncanonical sentences. Cognitive Psychology 47, 164 – 203. Fodor, Janet Dean, & Atsu Inoue (1998): Attach anyway. In Janet Dean Fodor & Fernanda Ferreira (Hrsg.), Reanalysis in Sentence Processing, 101 – 141. Dordrecht: Kluwer. Foucart, Alice & Cheryl A. Frenck-Mestre (2011): Grammatical gender processing in L2: Electrophysiological evidence of the effect of L1–L2 syntactic similarity. Bilingualism: Language and Cognition 14, 379 – 99. Franceschina, Florencia (2005): Fossilized Second Language Grammars: The Acquisition of Grammatical Gender. Amsterdam: John Benjamins. Frisch, Stefan, Matthias Schlesewsky, Douglas. Saddy & Anke Alpermann (2002): The P600 as an indicator of syntactic ambiguity. Cognition 85, B82–B93. Gabriele, Alison, Robert Fiorentino & José Alemán Bañón (2013): Examining second language development using event-related potentials: a cross-sectional study on the processing of gender and number agreement. Linguistic Approaches to Bilingualism 3, 213 – 232. Gerth, Sabrina, Constanze Otto, Yunyu Nam & Claudia Felser (2015): Strength of garden-path effects in native and non-native speakers’ processing of subject-object ambiguities. International Journal of Bilingualism. Doi:10.1177/1367006915604401. Gillon Dowens, Margaret, Marta Vergara, Horacio A. Barber & Manuel Carreiras (2010): Morphosyntactic processing in late second-language learners. Journal of Cognitive Neuroscience 22, 1870 – 87. Gorrell, Paul (2000): The subject-before-object preference in German clauses. In Barbara Hemforth & Lars Konieczny (Hrsg.), German Sentence Processing, 25 – 63. Dordrecht: Kluwer. Grüter, Theres, Casey Lew-Williams & Anne Fernald (2012): Grammatical gender in L2: A production or a real-time processing problem? Second Language Research 28 (2), 191 – 215. Hemforth, Barbara (1993): Kognitives Parsing. Repräsentation und Verarbeitung sprachlichen Wissens. Sankt-Augustin: Infix-Verlag. Hemforth, Barbara & Lars Konieczny (2000): German Sentence Processing. Dordrecht: Kluwer Academic. Henry, Nicholas (2015): Morphosyntactic processing, cue interaction, and the effects of instruction: An investigation of Processing Instruction and the acquisition of case markings in L2 German. Ph.D. Dissertation. Pennsylvania State University. Höhle, Tilman (1982): Explikation für ’normale Betonung’ und ’normale Wortstellung’. In Werner Abraham (Hrsg), Satzglieder im Deutschen, 75 – 153. Tübingen: Gunter Narr. Hopp, Holger (2006): Syntactic features and reanalysis in near-native processing. Second Language Research 22, 369 – 397. Hopp, Holger (2007): Ultimate Attainment at the Interfaces in Second Language Acquisition: Grammar and Processing. Groningen: Grodil. Hopp, Holger (2009): The syntax-discourse interface in near-native L2 acquisition: Off-line and online performance. Bilingualism: Language and Cognition 12 (4), 463 – 483.
164
Holger Hopp
Hopp, Holger (2010): Ultimate attainment in L2 inflection: Performance similarities between non-native and native speakers. Lingua 120, 901 – 931. Hopp, Holger (2011): Internal and external factors in the child L2 development of the German determiner phrase. Linguistic Approaches to Bilingualism 1 (3), 238 – 264. Hopp, Holger (2013): Grammatical gender in adult L2 acquisition: Relations between lexical and syntactic variability. Second Language Research 29 (1), 33 – 56. Hopp, Holger (2015a): Individual differences in the L2 processing of object-subject ambiguities. Applied Psycholinguistics 36, 129 – 173. Hopp, Holger (2015b): Semantics and morphosyntax in L2 predictive sentence processing. International Review of Applied Linguistics 53, 277 – 306. Hopp, Holger & Mayra León (2016): Structural and inherent case in the non-native processing of Spanish: Constraints on inflectional variability. Second Language Research 32 (1), 75 – 108. Hopp, Holger & Natalia Lemmerth (2017): Lexical and syntactic congruency in L2 predictive gender processing. Studies in Second Language Acquisition. DOI: 10.1017/S0272263116000437. Jackson, Carrie N. (2005): The Sentence-Level Processing of Case Markings and Word Order by Native and Non-Native Speakers of German. Ph.D. dissertation, University of Wisconsin-Madison. Jackson, Carrie N. (2007): The use and non-use of semantic information, word order, and case markings during comprehension by L2 learners of German. Modern Language Journal 91, 418 – 432. Jackson, Carrie N. (2008): Proficiency level and the interaction of lexical and morphosyntactic information during L2 sentence processing. Language Learning 58 (4), 875 – 909. Jackson, Carrie N. & Susan C. Bobb (2009): The processing and comprehension of wh-questions among second language speakers of German. Applied Psycholinguistics 30, 630 – 636. Jackson, Carrie N. & Paola E. Dussias (2009): Cross-linguistic differences and their impact on L2 sentence processing. Bilingualism: Language and Cognition 12 (1), 65 – 82. Jackson, Carrie N., Paola E. Dussias & Adelina Hristova (2012): Using eye-tracking to study on-line processing among intermediate L2 learners of German. International Review of Applied Linguistics and Language Teaching 50, 101 – 33. Jaensch, Carol (2009): L3 acquisition of the German determiner phrase: The role of L1 Japanese and L2 English. Saarbrücken: VDM. Jegerski, Jill (2015): The processing of case in near-native Spanish. Second Language Research 31 (3), 281 – 307. Jiang, Nan (2007): Selective integration of linguistic knowledge in adult second language learning. Language Learning 57 (1), 1 – 33. Juffs, Alan & Guillermo A. Rodríguez (2015): Second Language Sentence Processing. New York: Routledge. Kaan, Edith (1997): Processing Subject-Object Ambiguities in Dutch. Groningen: Grodil. Kaan, Edith (2014): Predictive sentence processing in L2 and L1: What is different? Linguistic Approaches to Bilingualism 4, 257 – 282. Kamide, Yuki, Christoph Scheepers & Gerry T. M. Altmann (2003): Integration of syntactic and semantic information in predictive processing: Cross-linguistic evidence from German and English. Journal of Psycholinguistic Research 32 (1), 37 – 55.
Kasus- und Genusverarbeitung des Deutschen im Satzkontext
165
Keating, Gregory D. (2010): The effects of linear distance and working memory on the processing of gender agreement in Spanish. In Bill VanPatten & Jill Jegerski (Hrsg.), Research in second language processing and parsing, 113 – 34. Amsterdam: Benjamins. Kempe, Vera & Brian MacWhinney (1998): The acquisition of case marking by adult learners of Russian and German. Studies in Second Language Acquisition 20, 543 – 587. Klassen, Rachel (2016): The representation of asymmetric grammatical gender systems in the bilingual mental lexicon. Probus 28, 9 – 28. DOI: 10.1515/probus-2016 – 0002. Köpcke, Klaus-Michael & David Zubin (1996): Prinzipien für die Genuszuweisung im Deutschen. In Ewald Lang & Gisela Zifonun (Hrsg.), Deutsch typologisch. Jahrbuch des Instituts für Deutsche Sprache 1995, 473 – 491. Berlin: de Gruyter. Lenerz, Jürgen (1977): Zur Abfolge nominaler Satzglieder im Deutschen. Tübingen: Gunter Narr. Lemhöfer, Kristin, Herbert Schriefers & Peter Indefrey (2014): Idiosyncratic grammars: Syntactic processing in second language comprehension uses subjective feature representations. Journal of Cognitive Neuroscience 26 (7), 1428 – 1444. Lew-Williams, Casey & Anne Fernald (2007): Young children learning Spanish make rapid use of grammatical gender in spoken word recognition. Psychological Science 18 (2), 193 – 198. Lew-Williams, Casey & Anne Fernald (2010): Real-time processing of gender-marked articles by native and non-native Spanish speakers. Journal of Memory and Language 63 (4), 447 – 464. Lopez-Prego, Beatriz & Gabriele Alison (2014): Examining the nature of morphological variability in native and non-native Spanish. Linguistic Approaches to Bilingualism 4, 192 – 221. MacWhinney, Brian (2005): A unified model of language acquisition. In Judith F. Kroll & Annette M. B. De Groot (Hrsg.), Handbook of Bilingualism: Psycholinguistic Approaches, 49 – 67. Oxford: Oxford University Press. MacDonald, Mary Ellen, Neal Pearlmutter & Marc Seidenberg (1994): Lexical nature of syntactic ambiguity resolution. Psychological Review 101, 676 – 703. Meng, Michael & Markus Bader (2000): Ungrammaticality detection and garden-path strength: Evidence for serial parsing. Language and Cognitive Processes 6, 615 – 666. Meng, Michael, Markus Bader & Josef Bayer (1999): Die Verarbeitung von Subjekt-Objekt Ambiguitäten im Kontext. In Ipke Wachsmuth & Bernhard Jung (Hrsg.), Proceedings der 4. Fachtagung der Gesellschaft fuer Kognitionswissenschaft, 244 – 249. St. Augustin: Infix. Mitsugi, Sanako & Brian MacWhinney (2010): The use of case-marking information during second language processing: Evidence from ditransitive scrambling in Japanese. In Bill VanPatten & Jill Jegerski (Hrsg.), Second Language Processing and Parsing: Theory and Research, 159 – 175. Amsterdam: John Benjamins. Mitsugi, Sanako & Brian MacWhinney (2016): The use of case marking for predictive processing in second language Japanese. Bilingualism: Language and Cognition 19, 19 – 35. Morales, Luis, Daniele Paolieri, Paola E. Dussias, Jorge R. Valdés Kroff, Chip Gerfen & María Teresa Bajo (2015): The gender congruency effect during bilingual spoken-word recognition. Bilingualism: Language and Cognition 9, 294 – 310. Morgan-Short, Kara, Cristina Sanz, Karsten Steinhauer & Michael T. Ullmann (2010): Second language acquisition of gender agreement in explicit and implicit training conditions: An event-related potential study. Language Learning 60, 154 – 193.
166
Holger Hopp
Pan, Hui-Yun, Sarah Schimke & Claudia Felser (2015): Referential context effects in non-native relative clause ambiguity resolution. International Journal of Bilingualism 19, 298 – 313. Prévost, Phillippe & Lydia White (2000): Missing surface inflection or impairment in second anguage acquisition? Evidence from tense and agreement. Second Language Research 16 (2), 103 – 133. Primus, Beatrice (2012): Semantische Rollen. Heidelberg: Winter. Roberts, Leah (2012): Individual differences in L2 sentence processing. Language Learning 62 (2), 172 – 188. Roberts, Leah (2013): Sentence processing in bilinguals. In Roger R. G. van Gompel (Hrsg.), Sentence processing, 221 – 246 London: Psychology Press. Rösch, Anne-Dorothe & Vicky Chondrogianni (im Erscheinen): „Which mouse kissed the frog?“: Effects of age of onset, length of exposure and knowledge of case-marking on the comprehension of wh-questions in German-speaking simultaneous and early sequential bilingual children. Journal of Child Language. Sabourin, Laura & Laurie A. Stowe (2008): Second language processing: When are first and second languages processed similarly? Second Language Research 24, 397 – 430. Sagarra, Nuira & Julia Herschensohn (2010): The role of proficiency and working memory in gender and number agreement processing in L1 and L2 Spanish. Lingua 120, 2022 – 2039. Scheepers, Christoph (1996): Menschliche Satzverarbeitung: Syntaktische und thematische Aspekte der Wortstellung im Deutschen. Doktorarbeit, Universität Freiburg. Scheepers, Christoph, Barbara Hemfort & Lars Konienczny (2000): Linking syntactic functions with thematic roles: Psych-verbs and the resolution of subject-object ambiguity. In Barbara Hemforth & Lars Konieczny (Hrsg.), German Sentence Processing, 95 – 136. Dordrecht: Kluwer. Scherag, André, Lisa Demuth, Frank Rösler, Helen J. Neville & Brigitte Röder (2004): The effects of late acquisition of L2 and the consequences of immigration on L1 for semantic and morpho-syntactic language aspects. Cognition 93, B97–B108. Schlesewsky, Matthias & Ina Bornkessel (2004): On incremental interpretation: Degrees of meaning accessed during sentence comprehension. Lingua 114, 1213 – 1234. Schlesewsky, Matthias, Gisbert Fanselow, Reinhold Kliegl & Josef Krems (2000): The subject preference in the processing of locally ambiguous wh-questions in German. In Barbara Hemforth & Lars Konieczny (Hrsg.), German Sentence Processing, 65 – 94. Dordrecht: Kluwer. Schriefers, Herbert, Angela D. Friederici & Katja Kühn (1995): The processing of locally ambiguous relative clauses in German. Journal of Memory and Language 34, 499 – 520. Sekerina, Irina A. (2003): Scrambling and processing: Complexity, dependencies, and constraints. In Simin Karimi (Hrsg.), Word Order and Scrambling, 301 – 324. Oxford: Blackwell. Sorace, Antonella (2003): Near-nativeness. In Micheal H. Long & Catherine J. Doughty (Hrsg.), Handbook of Second Language Acquisition, 130 – 151. Oxford: Blackwell. Szagun, Gisela, Barbara Stumper, Nina Sondag & Melanie Franik, M. (2007). The acquisition of gender marking by young German-speaking children: Evidence for learning guided by phonological regularities. Journal of Child Language 34, 445 – 471. Tokowicz, Natasha & Brian MacWhinney (2005): Implicit and explicit measures of sensitivity to violations in second language grammar: An event-related potential investigation. Studies in Second Language Acquisition 27, 173 – 204.
Kasus- und Genusverarbeitung des Deutschen im Satzkontext
167
Townsend, David J. & Thomas G. Bever (2001): Sentence Comprehension: The Integration of Habits and Rules. Cambridge, MA: MIT Press. Tracy, Rosemarie (1986): The acquisition of case morphology in German. Linguistics 24, 47 – 78. Ullmann, Michael T. (2005): A cognitive neuroscience perspective on second language acquisition: The declarative/procedural model. In Cristina Sanz (Hrsg.), Mind and Context in Adult Second Language Acquisition: Methods, Theory, and Practice, 141 – 178. Washington, D.C.: Georgetown University Press. Trueswell, John C., Michael K. Tanenhaus & Susan Garnsey (1994): Semantic influences on parsing: Use of thematic role information in syntactic ambiguity resolution. Journal of Memory and Language 33, 285 – 318. Weskott, Thomas, Robin Hörnig, Gisbert Fanselow & Reinhold Kliegl (2011): Contextual licensing of marked OVS word order in German. Linguistische Berichte 225, 3 – 18. White, Lydia, Elena Valenzuela, Martyna Kozlowska-MacGregor & Yan-Kit Ingrid Leung (2004): Gender and number agreement in nonnative Spanish. Applied Psycholinguistics 25, 105 – 33. Wöllstein, Angelika (2014): Topologisches Satzmodell. Heidelberg: Winter.
Valentina Cristante und Sarah Schimke
Die Verarbeitung von Passivsätzen und OVS-Sätzen im kindlichen L2-Erwerb Das vorliegende Kapitel beschäftigt sich mit der Satzverarbeitung bei Kindern, die ab einem frühen Alter (drei-vier Jahre) beginnen, eine Sprache zu erwerben, die nicht ihre L1 ist (im Folgenden auch L2-Kinder). Studien zum Endzustand des L2Erwerbs, d. h. das im Erwachsenenalter erreichte Sprachniveau, zeigen häufig keine oder wenige Unterschiede zwischen kindlichen L1- und L2-Lernern (s. z. B. DeKeyser 2000; Johnson & Newport 1989). Studien, die das sprachliche Wissen im Kindesalter untersuchen, haben dagegen durchaus Unterschiede zwischen L2Kindern und gleichaltrigen monolingualen Kindern (im Folgenden auch L1-Kinder) beobachtet, insbesondere im morphosyntaktischen Bereich (siehe z. B. Blom, Polišenská & Weerman 2008; Meisel 2009; Paradis 2005; Unsworth 2005). Diese Beobachtungen lassen zunächst offen, ob sich die untersuchten L2-Kinder in einem früheren Erwerbsstadium befinden als gleich alte L1-Kinder, oder ob es auch qualitative Unterschiede im Erwerbsprozess gibt. Qualitative Unterschiede wurden dabei von Schwartz (2004) und Meisel (2009) vermutet. Nach dem Modell von Schwartz (2004) gibt es transferbedingte Unterschiede insbesondere in der syntaktischen Entwicklung, da sich hier auch bei jungen L2-Kindern Einflüsse der L1 zeigten (Haznedar 2003; Unsworth 2005). Meisel (2009) beobachtete dagegen Unterschiede zwischen L1- und L2-Kindern im Bereich der Syntax und der Flexionsmorphologie und schlägt vor, dass es für diese Domänen frühe kritische Perioden gibt. Nach diesem Vorschlag verläuft der Erwerb der Morphosyntax schon ab einem Alter bei Erwerbsbeginn von etwa drei Jahren im L2-Erwerb qualitativ anders als im L1-Erwerb und ähnelt eher dem Erwerbsprozess von erwachsenen L2-Lernern (L2-Erwachsene). Insgesamt gibt es also unterschiedliche Befunde und Annahmen zu der Frage, in welcher Hinsicht sich L2-Kinder in ihrem sprachlichen Wissen von L1-Kindern unterscheiden, und ob eventuelle Unterschiede vorübergehender oder dauerhafter Natur sind. Der Vergleich von L1- und L2-Kindern in den oben zitierten Studien wurde auf der Basis von Sprachproduktionsdaten gezogen. Das vorliegende Kapitel beschäftigt sich mit der Frage, welche zusätzlichen Erkenntnisse durch eine Untersuchung der Satzverarbeitung gewonnen werden können. Wir konzentrieren uns dabei auf die Verarbeitung von Sätzen mit nicht-kanonischer Wortstellung (Passivsätze und OVS-Sätze). Diese Satztypen eignen sich gut, um die online Valentina Cristante, Universität Osnabrück Sarah Schimke, Westfälische Wilhelms-Universität Münster DOI 10.1515/9783110456356-008
170
Valentina Cristante und Sarah Schimke
Nutzung morphosyntaktischen Wissens zu untersuchen, denn nur bei einer erfolgreichen Verarbeitung flexionsmorphologischer Markierungen können sie in zielsprachlicher Weise interpretiert werden. Das Kapitel ist wie folgt strukturiert. Im Folgenden gehen wir zunächst darauf ein, wie Satzverarbeitungsdaten unser Bild über das sprachliche Wissen von Sprachenlernern ergänzen können und welche charakteristischen Unterschiede dabei zwischen verschiedenen Typen von Sprachlernern (L1-Kinder, L2-Erwachsene, L2-Kinder) beobachtet wurden. Anschließend werden Passivsätze und OVSSätze vorgestellt. Schließlich fassen wir Studien zusammen, die die offline Interpretation und online Verarbeitung dieser Satztypen bei L1-Kindern oder bei L2Kindern untersucht haben. In der abschließenden Diskussion werden Schlussfolgerungen gezogen und Forschungsperspektiven skizziert.
1 Satzverarbeitung bei verschiedenen Lernertypen Satzverarbeitungsstudien erlauben Einblicke in die Frage, wie morphosyntaktisches Wissen genutzt wird, um inkrementell eine Interpretation aufzubauen, während ein Satz gelesen oder gehört wird. Aus einer Spracherwerbsperspektive hat es sich als aufschlussreich erwiesen, diesen Prozess zu untersuchen. Einerseits zeigt sich in online Studien manchmal Evidenz für sprachliches Wissen, das in offline Daten nicht sichtbar ist. Andererseits können Verarbeitungsstudien Schwierigkeiten bei der Anwendung sprachlichen Wissens offenlegen, die in offline Experimenten nicht oder nicht so detailliert untersucht werden können. Für verschiedene Typen von Lernern wurden dabei unterschiedliche Verhältnisse von online beobachtbarem Wissen zu offline beobachtbarem Wissen festgestellt. Für L1-Kinder im Vorschulalter zeigen Satzverarbeitungsdaten, dass Kinder manchmal Zugang zu Interpretationen haben, die in ihrem Verhalten in offline Aufgaben wie Bildauswahl oder -beurteilungsaufgaben nicht sichtbar werden. Zum Beispiel zeigen Studien mit dem Visual World-Paradigma (s. Hopp & Schimke in diesem Band), dass Kinder Subjekt-Verb-Kongruenzmarkierungen (BrandtKobele & Höhle 2010) und die Position von Fokuspartikeln (Höhle, Fritzsche & Müller 2016) für die Interpretation eines Satzes online nutzen, auch wenn sie dieses Wissen in einer offline Aufgabe nicht zeigen konnten. Dies wurde damit erklärt, dass Kinder in offline Aufgaben nicht nur den Satz verstehen müssen, sondern ein zusätzliches explizites Urteil über den Satz fällen und diesen in vielen Studien auch mit einem Bild vergleichen müssen. Unabhängig von ihren sprachlichen Fähigkeiten können diese Aufgaben die kognitiven Fähigkeiten
Die Verarbeitung von Passivsätzen und OVS-Sätzen im kindlichen L2-Erwerb
171
junger Kinder überfordern und so zu einer Unterschätzung der sprachlichen Kompetenz führen. Im Einklang damit stehen Befunde von Höhle, Fritzsche & Müller (2016), nach denen die Arbeitsgedächtniskapazität von Vorschulkindern mit ihrem Abschneiden in Satz-Bild-Beurteilungsaufgaben korreliert. Dies kann damit erklärt werden, dass diese Aufgaben es erfordern, das Bild und den gehörten Satz gleichzeitig im Arbeitsgedächtnis zu halten und miteinander zu vergleichen. Speziell in Bezug auf die Interpretation nicht-kanonischer Strukturen beobachteten Höhle, Fritzsche & Müller (2016) außerdem einen Einfluss der inhibitorischen Kontrolle auf die offline Antwortkorrektheit. Inhibitorische Kontrolle ist notwendig, um irrelevante Stimuli oder Handlungsimpluse zu unterdrücken. Höhle, Fritzsche & Müller (2016) erklären das beobachtete Muster dementsprechend damit, dass bei einem Urteil über einen nicht-kanonischen Satz die alternative kanonische Interpretation des Satzes inhibiert werden muss. Zusammenfassend zeigen diese Befunde, dass Kinder manchmal sprachliches Wissen in offline Aufgaben nicht zeigen, weil diese Aufgaben zu hohe kognitive Anforderungen mit sich bringen. Studien zu L2-Erwachsenen zeichnen ein anderes Bild des Verhältnisses von online zu offline Verhalten (s. Hopp in diesem Band, für einen Überblick). L2-Lerner haben nicht nur voll entwickelte kognitive Funktionen, sondern häufig auch explizites Metawissen über die Zielsprache, was in die Bildung von offline Urteilen einfließen kann. Allerdings zeigen online Daten, dass dies nicht immer mit einer effizienten Nutzung morphosyntaktischer Hinweisreize während der Verarbeitung einhergeht. So wurde beispielsweise beobachtet, dass L2-Lerner online gar nicht auf morphosyntaktische Informationen reagieren, die Muttersprachler nutzen (Clahsen & Felser 2006), dass sie nur unter bestimmten Umständen reagieren, zum Beispiel, wenn sie Sätze mit einer bestimmten Aufgabe lesen (Jackson 2008) oder dass Lerner zwar grundsätzlich auf solche Information reagieren, sie aber nicht im gleichen Maße wie Muttersprachler zur Vorhersage des weiteren Verlaufs des Satzes nutzen (Hopp 2015). Diese Ergebnisse wurden so interpretiert, dass für L2Erwachsene die schnelle Anwendung sprachlichen Wissens während des Satzverstehens eine besondere Herausforderung darstellt. Allerdings ist dabei auch bei erwachsenen Lernern umstritten, ob dies auf ein fundamental unterschiedliches morphosyntaktisches Wissen zurückgeht (Clahsen & Felser 2006), oder ob solche Unterschiede eher gradueller Natur sind und von Faktoren wie dem Ausmaß der Erfahrung mit der Zielsprache, Einflüssen der L1 oder der Arbeitsgedächtnisbelastung während der Verarbeitung einer L2 abhängen (Hopp 2010; Hopp in diesem Band). Festhalten kann man auf jeden Fall, dass das Verhältnis von offline zu online Verhalten in der Tendenz bei L1-Kindern anders ist als bei L2-Erwachsenen. Vergleicht man L2-Kinder mit gleichaltrigen L1-Kindern, so haben Erstere insgesamt weniger Erfahrung mit der Zielsprache. Es ist also möglich, dass sie im
172
Valentina Cristante und Sarah Schimke
gleichen Alter weniger sprachliches Wissen in dieser Sprache haben. Was kognitive Funktionen wie das Arbeitsgedächtnis und die inhibitorische Kontrolle angeht, so sind verschiedene Vorhersagen möglich. Einerseits wird häufig angenommen, dass die Verarbeitung einer L2 mit einer größeren Belastung des Arbeitsgedächtnisses einhergeht (McDonald 2006). Auf der anderen Seite gibt es eine Reihe von Studien, die einen vorteilhaften Einfluss von Mehrsprachigkeit auf die Entwicklung kognitiver Funktionen insbesondere im Kindesalter nachweisen (Blom et al. 2014; Poarch & van Hell 2012;Verhagen, Mulder & Leseman 2016). Dies scheint insbesondere die inhibitorische Kontrolle zu betreffen. Es ist also möglich, dass L2-Kinder sich von L1-Kindern in ihren kognitiven Funktionen systematisch unterscheiden. Dennoch kann auch bei L2-Kindern davon ausgegangen werden, dass offline Aufgaben für ihre kognitiven Fähigkeiten eine größere Belastung mit sich bringen, als es bei Erwachsenen der Fall ist. Bisherige Verarbeitungsstudien mit L2-Kindern haben in der Tat bestätigt, dass sich in der Satzverarbeitung häufig mehr Wissen offenbart, als aus dem sonstigen Verhalten der Kinder ersichtlich ist. Dabei wurden bisher hauptsächlich Sprachproduktionsdaten mit online Daten zum Sprachverstehen verglichen.Während L2-Kinder z. B. Fehler in der Produktion von Artikeln und Tempusmorphemen machten, die bei L1-Kindern nicht oder sehr viel seltener vorkamen, zeigten sie während des online Sprachverstehens ebenso wie L1-Kinder eine langsamere Verarbeitung von Sätzen mit fehlerhaften Artikeln und Tempusmorphemen als von korrekten Sätzen (Blom & Vasic 2011; Chondrogianni & Marinis 2012; Chondrogianni et al. 2015). Dies wurde so interpretiert, dass sich das sprachliche Wissen von L2-Kindern im morphosyntaktischen Bereich nicht qualitativ von dem Wissen von L1-Kindern unterscheiden würde, und dass die höhere Fehlerrate in der Produktion auf die höhere Beanspruchung während der aktiven Produktion im Vergleich zur rezeptiven Verarbeitung von Sprache zurückzuführen sei. Allerdings gibt es bisher nur wenige Verarbeitungsstudien mit L2-Kindern, die auf wenige sprachliche Phänomene begrenzt sind. Zusammengefasst weisen die bisherigen Studien darauf hin, dass erwachsene L2-Lerner morphosyntaktische Markierungen nicht immer so schnell und effizient verarbeiten wie Muttersprachler. Die Ergebnisse bei L1- und L2-Kindern zeigen dagegen, dass beide Gruppen in der Verarbeitung erfolgreicher sind, als ihr Verhalten in offline Verstehens- oder Produktionsaufgaben vermuten lässt. Es gibt bisher insbesondere keine Hinweise darauf, dass L2-Kinder spezifische Probleme in der online Anwendung morphosyntaktischen Wissens haben. Im Folgenden soll dargestellt werden, ob sich ein ähnliches Bild auch bei der Verarbeitung nichtkanonischer Strukturen zeigt.
Die Verarbeitung von Passivsätzen und OVS-Sätzen im kindlichen L2-Erwerb
173
2 Passiv- und OVS-Sätze im Deutschen Offline Verständnisstudien mit kindlichen Lernern haben gezeigt, dass sowohl L1als auch L2-Kinder in frühen Stadien des Erwerbs Sätze der Form NP-Verb-NP anhand des kanonischen semantischen Musters Agens-Aktion-Patiens interpretieren (u. a. Aschermann, Gülzow & Wendt 2004; Dittmar et al. 2008, 2014; Grimm 1975; Mills 1977). Der ersten Nominalphrase im Satz wird also per Default die thematische Rolle Agens zugeordnet, und der zweiten die Rolle Patiens. Auch muttersprachliche Erwachsene sowie erwachsene L2-Lerner wenden eine solche Strategie manchmal an, so dass Sätze mit nicht-kanonischer Wortstellung gelegentlich falsch interpretiert werden, insbesondere unter Zeitdruck (Muttersprachler des Englischen: Ferreira & Patson 2007; L2-Lerner des Englischen: Dabrowska & Street 2006). Nach einer Phase, in der nahezu alle Sätze nach diesem Muster interpretiert werden, verlassen sich L1-Kinder in einer späteren Phase zunehmend auf die Semantik. Das bedeutet, dass irreversible Sätze, wie z. B. Die Karotte wird von dem Hasen gegessen oder Die Karotte hat der Hase gegessen, die die kanonische Abfolge der semantischen Rollen verletzen, aber dem Hörer semantische Informationen, wie Belebtheit, zur Verfügung stellen, häufig erfolgreich verstanden werden (Grimm 1975). In reversiblen semantisch plausiblen Sätzen, bei denen beide Protagonisten plausibler Weise sowohl die Rolle des Agens als auch des Patiens übernehmen können, wie z. B. Die Frau wird von dem Mann gekitzelt oder Den Mann küsst die Frau, kann eine zielsprachliche Interpretation dagegen nur dann erzielt werden, wenn Sprachnutzer morphosyntaktische Hinweisreize verwenden, die die Erwartung einer kanonischen Abfolge (Agens – Patiens) überschreiben. Solche Sätze werden später erworben und sind auch für Erwachsene nicht leicht zu verarbeiten (Knoeferle et al. 2005; Weber, Grice & Crocker 2006; Wendt, Brand & Kollmeier 2014). Im Deutschen gibt es zwei Strukturen, die diesen Konflikt beinhalten: Passivsätze und OVS- Sätze. Bei Passivsätzen wie in (1) ist die Wortstellung insofern kanonisch, als die erste NP auch das Subjekt des Satzes ist; nicht kanonisch ist hingegen die Zuordnung der semantischen Rolle des Patiens zur syntaktischen Funktion des Subjekts. Das Agens wird in Passivsätzen herabgestuft und fakultativ durch eine von-Phrase realisiert: (1) Der Opa wurde von der Oma geküsst. Abfolge der syntaktischen Funktionen: Subjekt – Objekt Abfolge der semantischen Rollen: Patiens – Agens
174
Valentina Cristante und Sarah Schimke
OVS-Sätze hingegen behalten zwar die kanonische Zuordnung Subjekt/Agens und Objekt/Patiens bei; nicht kanonisch ist hingegen die Wortstellung, da die erste NP nicht Subjekt/Agens ist, sondern Objekt/Patiens. Die Markierung des Kasus erfolgt im Deutschen zumeist nur am Artikel. Aufgrund von Synkretismen im Kasussystem kann dabei lediglich bei Maskulina eindeutig zwischen Nominativ (Subjekt) und Akkusativ (Objekt) unterschieden werden (für den definiten Artikel: Nom. der, Akk. den). Für Feminina und Neutra sind die Kasusmarkierungen ambig (Nom. die/das; Akk. die/das). In Beispiel (2) wird die Zuordnung der syntaktischen Funktionen also nur durch die Markierung an der ersten Nominalphrase eindeutig: (2) Den Opa hat die Oma geküsst. Abfolge der syntaktischen Funktionen: Objekt – Subjekt Abfolge der semantischen Rollen: Patiens – Agens Beide Satztypen haben gemeinsam, dass Hörer oder Leser morphosyntaktische Hinweisreize (das Auxiliar werden sowie die von-Phrase bei Passivsätzen, Kasusmarkierungen bei OVS-Sätzen) nutzen müssen, um eine Default-Interpretation des Satzes nach der Abfolge Agens-Patiens (im Folgenden auch: agent first-Strategie) zu überschreiben. Sowohl bei L1- als auch bei L2-Kindern kann vermutet werden, dass dieser Konflikt zwischen morphosyntaktischen Markierungen und der agent first-Strategie zu einem gewissen Ausmaß an Fehlinterpretationen der Sätze führt. Basierend auf den Beobachtungen von Höhle, Fritzsche & Müller (2016) zu einer möglichen Diskrepanz von online und offline Verhalten, würde man annehmen, dass sich der Konflikt zwischen kanonischer und nicht-kanonischer Interpretation bei L1-Kindern insbesondere in einem schlechten Abschneiden in offline Aufgaben zeigen sollte, weniger jedoch während der Satzverarbeitung.Was gleich alte L2-Kinder betrifft, so könnten sie online einerseits ebenfalls mehr Wissen über Morphosyntax zeigen als offline (Blom & Vasic 2011; Chondrogianni & Marinis 2012; Chondrogianni et al. 2015). Andererseits ist es aber auch möglich, dass sie spezifische Schwierigkeiten mit der online Verarbeitung morphosyntaktischer Markierungen haben, wie sie bei L2-Erwachsenen beobachtet wurden. In diesem Fall könnte eine mögliche Diskrepanz zwischen online und offline Verhalten bei L1-Kindern größer sein als bei L2-Kindern. Ein solches Muster würde die Annahme unterstützen, dass es schon bei jungen L2-Lernern im Vergleich zu L1Lernern fundamentale Unterschiede im sprachlichen Wissen gibt (Meisel 2009). Auf der Grundlage dieser Überlegungen fassen wir im Folgenden die empirische Evidenz zu online Verarbeitung und offline Interpretation von Passiv- und OVS-Sätzen bei L1- und L2-Kindern zusammen.Wir legen dabei einen Schwerpunkt auf das Verhältnis zwischen online und offline Ergebnissen.
Die Verarbeitung von Passivsätzen und OVS-Sätzen im kindlichen L2-Erwerb
175
3 Verarbeitung und Interpretation von Passivsätzen bei L1- und L2-Kindern Wir beginnen mit einem kurzen Überblick über offline-Ergebnisse zur Produktion und Interpretation von Passivsätzen im Deutschen, und gehen dann ausführlicher auf vier online Untersuchungen ein, die sich mit der Verarbeitung von englischen und deutschen Passivsätzen durch L1- und L2-Kinder beschäftigt haben.
3.1 Offline Studien Offline Studien zum Deutschen haben gezeigt, dass monolinguale Kinder bereits früh, im Alter von etwa zwei Jahren, erste Passivkonstruktionen verwenden (Wittek & Tomasello 2005). Aschermann, Gülzow & Wendt (2004) und Dittmar et al. (2014) beobachteten aber in einer Nachspiel-Aufgabe, dass erst Fünfjährige beim Nachspielen des Inhaltes von reversiblen Passivsätzen den ersten genannten Referenten nicht als Agens auswählen und Passivsätze korrekt nachspielen (siehe auch Grimm 1975). In einer Studie mit siebenjährigen türkisch-deutschen Kindern, deren Erwerbsbeginn des Deutschen zwischen drei und vier Jahren lag, beobachtete Becker (2006) in einer Bildauswahl-Aufgabe, dass die offline Leistung beim Verstehen reversibler Sätze nahezu zufällig ist. Im Alter von zehn Jahren verstehen (Root 2014) und produzieren (Schneitz 2014) L2-Kinder mit einem Erwerbsbeginn im Alter von drei bis vier Jahren derartige Strukturen dagegen ohne Probleme. Zusammengefasst sprechen diese offline Ergebnisse dafür, dass ein vollständiges Verständnis reversibler Passivsätze erst einige Jahre nach der Produktion erster Passivstrukturen erreicht wird, und dass L2-Kinder dieses Verständnis später erwerben (zwischen sechs und zehn Jahren) als L1-Kinder (ab ca. fünf Jahren).
3.2 Online Studien Stromswold et al. (2002) untersuchten die Verarbeitung von Aktiv- und Passivsätzen bei fünf- und sechsjährigen englischsprachigen Kindern in einer Kombination aus Visual World-Paradigma (siehe Hopp & Schimke in diesem Band) und Bildauswahlaufgabe. Die Kinder hörten Sätze vom Typ (3) oder (4). (3) The girl was pushing the boy. ‚Das Mädchen schubste den Jungen.‘
176
Valentina Cristante und Sarah Schimke
(4) The girl was pushed by the boy. ‚Das Mädchen wurde von dem Jungen geschubst.‘ Da im Englischen das gleiche Auxiliar, be, für die Bildung der Verlaufsform und für die Bildung von Passivsätzen verwendet wird, werden die Sätze erst durch die Form des lexikalischen Verbs (pushing/pushed) disambiguiert. Während die Kinder diese Sätze hörten, betrachteten sie zwei Bilder, die die beschriebene Handlung mit spiegelbildlicher Verteilung der thematischen Rollen darstellten. Für die Sätze (3) und (4) zeigte also ein Bild ein einen Jungen schubsendes Mädchen und das andere Bild einen ein Mädchen schubsenden Jungen. Stromswold et al. (2002) beobachteten, dass die Kinder während des Hörens sowohl von Aktiv- als auch von Passivsätzen vor allem das Bild betrachteten, das mit dem Aktivsatz, nicht aber mit dem Passivsatz kompatibel ist, also das Bild, auf dem der erstgenannte Referent die Rolle des Agens einnimmt. Dieses Muster spricht dafür, dass die Kinder einer agent first-Strategie folgten. Nach einer gewissen Verarbeitungszeit zeigte sich jedoch in den Blickbewegungen für die Passivsätze, dass die Kinder die agent first-Strategie revidierten und im zunehmenden Maße auf das korrekte Bild schauten. Der Zeitpunkt, zu dem dies geschah, lag jedoch nach dem Ende des Satzes, das heißt, den Kindern gelang es erst, auf die Passivmarkierung zu reagieren, nachdem der Satz bereits beendet war. Die offline Korrektheit bei der Auswahl des richtigen Bildes lag bei 78 % für Passivsätze und bei 94 % für Aktivsätze, wobei fünfjährige Kinder Passivsätze seltener korrekt beurteilten als sechsjährige (71 % vs. 84 %). Insgesamt bestätigt diese Studie zunächst, dass Kinder bei der Verarbeitung von Sätzen eine agent first-Strategie anwenden, und dass dies die Interpretation von Passivsätzen im Vergleich zu Aktivsätzen erschwert. Sie zeigt außerdem, dass fünf bis sechs Jahre alte englische Kinder genug Wissen über die morphosyntaktischen Hinweisreize für Passivsätze haben, um die aus der agent first-Strategie resultierende Interpretation zu revidieren und die Sätze in der Mehrzahl der Fälle korrekt zu interpretieren. Interessanterweise zeigen die online Daten in dieser Studie keinerlei Evidenz für mehr Wissen, als auch in den offline Daten zu erkennen ist. Die online Daten erlauben im Gegenteil eher einen Einblick in Schwierigkeiten der Kinder, denn die Kinder verfolgen relativ lange eine nicht zielführende Interpretation, die sie erst nach Abschluss des Satzes revidieren. Stromswold et al. (2002) schlussfolgern, dass englischsprachige Kinder in diesem Alter Passivsätze offline (nach Abschluss des Satzes), aber nicht online (während des Hörens des Satzes) erfolgreich verarbeiten können. In einer Studie von Marinis (2007) wird diese Interpretation allerdings in Frage gestellt. Marinis (2007) argumentiert, dass der Aufbau der Studie von Stromswold et al. (2002) die Untersuchung von Effekten, die während der Verarbeitung auftreten, erschwert. Die Disambiguierung erst auf dem lexikalischen Verb lässt den Kindern
Die Verarbeitung von Passivsätzen und OVS-Sätzen im kindlichen L2-Erwerb
177
wenig Zeit, noch während des Hörens des Satzes die agent first-Strategie zu revidieren. Außerdem konnten die Kinder das Tempo der Sätze nicht selbst bestimmen. Um herauszufinden, ob Kinder prinzipiell unter geeigneten Umständen online auf die Markierung des Passivs im Englischen reagieren können, wandte Marinis (2007) das Paradigma des selbstgesteuerten Hörens an, bei dem Kinder in einem selbstgewählten Tempo abschnittweise auditive Stimuli hören (vgl. den Abschnitt zu selbstgesteuertem Lesen in Hopp & Schimke in diesem Band). Marinis (2007) untersuchte sieben und acht Jahre alte monolingual englische und türkisch-englische Kinder. Die Kinder hörten die Sätze vom Typ (5) und (6) jeweils Abschnitt für Abschnitt (im Beispiel durch Striche angedeutet). (5) I think / that / the zebra / was kissing / the camel / at the zoo / last Monday. ‚Ich denke, dass das Zebra das Kamel letzten Montag im Zoo geküsst hat.‘ (6) I think / that / the camel / was kissed / by the zebra / at the zoo / last Monday. ‚Ich denke, dass das Kamel letzten Montag im Zoo von dem Zebra geküsst wurde.‘ Die Kinder mussten auf eine Taste drücken, um den jeweils nächsten Abschnitt zu hören. Gleichzeitig betrachteten sie ein Bild, das entweder die dem Satz entsprechende Verteilung der thematischen Rollen abbildete (Zebra küsst Kamel) oder nicht (Kamel küsst Zebra). Marinis (2007) beobachtete, dass die Kinder mehr Zeit für das disambiguierende Segment (was kissing/was kissed) brauchten, wenn das Bild nicht zu dem Satz passte, als wenn das Bild zu dem Satz passte. Dies zeigt, dass die Kinder die morphosyntaktische Markierung dieses Segments unmittelbar verarbeiten und zur Zuweisung thematischer Rollen nutzen konnten. Die L2Kinder zeigten dabei zwar insgesamt auf allen Segmenten und für beide Satztypen längere Verarbeitungszeiten als die L1-Kinder, jedoch trat die spezifische Verzögerung bei einer mangelnden Passung zwischen Bild und Satz bei ihnen im gleichen Umfang auf wie bei L1-Kindern, sowohl für Aktiv-, als auch für Passivsätze. Nach dem Hören des Satzes mussten die Kinder explizit beurteilen, ob das Bild zu dem Satz passte. Dabei beurteilten beide Gruppen alle Satztypen überwiegend korrekt, allerdings wurden Aktivsätze insgesamt häufiger korrekt beurteilt als Passivsätze, und dieser Unterschied war bei den L2-Kindern größer als bei den L1-Kindern. Zusammengefasst zeigen diese Ergebnisse also, dass sieben und acht Jahre alte L1- und L2-Kinder englische Passivsätze erfolgreich verstehen können. Was das Verhältnis zwischen offline und online Daten betrifft, so zeigten die L2-Kinder online keine größeren Schwierigkeiten als die L1-Kinder, denn beide Gruppen reagierten am gleichen Punkt des Satzes auf die morphosyntaktische Markierung. Im Gegenteil scheinen die L2-Kinder eher bei den offline Urteilen größere Schwierigkeiten zu haben als die L1-Kinder. Es ist möglich, dass das Lesen
178
Valentina Cristante und Sarah Schimke
der Sätze in einer L2 insgesamt größere Anforderungen an das Arbeitsgedächtnis stellt, und sich diese besonders in der offline Aufgabe niederschlagen. Basierend auf den Ergebnissen von Stromswold et al. (2002) und Marinis (2007) führte Cristante (2016) eine weitere Online-Studie zur Verarbeitung von Aktiv- und Passivsätzen durch. Sie verwendete wie Stromswold et al. (2002) eine Kombination aus Visual World-Paradigma und Bildauswahlaufgabe. Es wurden Sätze vom Typ (7) oder (8) verwendet. (7) Der Opa hat am Sonntag die Oma liebevoll geküsst. (8) Der Opa wurde am Sonntag von der Oma liebevoll geküsst. Im Gegensatz zum Englischen werden Passivsätze im Deutschen bereits durch das Auxiliar disambiguiert, was eine Untersuchung von online auftretenden Effekten mit dem Visual World-Paradigma erleichtert. Die eingefügten Adverbiale dienten dabei dazu, den Kindern genug Zeit zu lassen, auf Hinweisreize zu reagieren, so dass die Effekte einzelner Hinweisreize erfasst werden konnten. Wie in der Studie von Stromswold et al. (2002) betrachteten die Kinder zwei Bilder, auf denen die Verteilung der thematischen Rollen dem Satz entsprach oder nicht. Untersucht wurden sieben Jahre alte monolinguale Kinder, sieben Jahre alte L2-Kinder mit L1 Türkisch und einem Erwerbsbeginn des Deutschen bei drei oder vier Jahren und eine Kontrollgruppe erwachsener Muttersprachler. Aktivsätze vom Typ (7) wurden durch beide Kindergruppen nahezu immer korrekt verstanden, und auch in den online Daten zeigte sich eine erfolgreiche Verarbeitung und keine signifikanten Unterschiede zwischen den Gruppen. Die online und offline Ergebnisse für die Passivsätze sind in Abbildung 1 dargestellt. Die offline Ergebnisse (Abbildung 1– B) zeigen, dass die L2-Kinder seltener das korrekte Bild wählten als die L1-Kinder, und diese wiederum seltener das korrekte Bild wählten als die Erwachsenen. Diese Unterschiede waren jedoch nicht statistisch signifikant. Es kann also festgehalten werden, dass sich entgegen der Ergebnisse mit etwas jüngeren Kindern von Becker (2006) bei siebenjährigen L2und L1-Kindern kein signifikanter Unterschied mehr in der offline Interpretation von Passivsätzen zeigte. Online dagegen zeigten sich signifikante Unterschiede zwischen den Gruppen. In Abbildung 1 (Teil A) wird dargestellt, in wieviel Prozent der Durchgänge das zum Satz passende Bild betrachtet wurde. Die X-Achse stellt dabei den Zeitverlauf dar und ermöglicht es, abzulesen, wieviel Zeit seit Beginn des Satzes vergangen ist und welchem Wort des Satzes dieser Zeitpunkt ungefähr entspricht. Die Längsstriche deuten Zeitfenster an, die jeweils relevanten Abschnitten des Satzes entsprechen, und für die jeweils eine getrennte statistische Analyse durchgeführt wurde (s. Cristante 2016, für Details). Wie in der Abbildung ersichtlich, zeigten beide Kindergruppen nach Beginn des Satzes zunächst eine
Die Verarbeitung von Passivsätzen und OVS-Sätzen im kindlichen L2-Erwerb
179
Abbildung 1: Online Verarbeitung (Teil A) und offline Interpretation (Teil B) von Passivsätzen bei siebenjährigen Kindern mit Deutsch als L1 oder L2 und Erwachsenen. Die online Daten zeigen den Anteil (%) der Blicke auf das korrekte Bild, die offline Daten den Anteil (%) der korrekt ausgewählten Bilder.
Tendenz, auf das falsche Bild zu schauen, also eine agent first-Strategie. Interessanterwiese ist diese Strategie bei L1-Kindern stärker ausgeprägt als bei Erwachsenen und bei L2-Kindern stärker als bei L1-Kindern. Alle Gruppen revidieren diese Strategie im zweiten Zeitfenster, das heißt, nach Beginn des disambiguierenden Auxiliars wurde. Diese Revision zeigt sich in der Abbildung in einem Anstieg des Prozentsatzes an Blicken auf das korrekte Bild. Dieser Anstieg beginnt bei allen Gruppen, noch bevor die von-Phrase gehört wurde, und deutet demnach auf eine erfolgreiche Verarbeitung des Auxiliars hin. Der Anstieg beginnt jedoch bei den Erwachsenen früher als bei den L1-Kindern, und bei den L1-Kindern früher als bei den L2-Kindern. Anscheinend fällt es diesen Gruppen jeweils schwerer, die agent first-Strategie aufzugeben, und die zielsprachliche Interpretation aufzubauen. Im Gegensatz zu der Studie von Marinis (2007) zeigt sich also in dieser Studie, dass L2-Kinder länger für die Revision der agent first-Strategie brauchen als L1-Kinder, und dass der Anteil an Blicken auf das korrekte Bild bei ihnen auch insgesamt auf einem niedrigeren Niveau verbleibt. Der Unterschied zwischen diesen beiden Ergebnissen könnte mit dem unterschiedlichen experimentellen Paradigma zusammenhängen. Die Tatsache, dass es in der Studie von Cristante (2016) einen Unterschied zwischen L1- und L2-Kindern gibt, ist dabei prinzipiell mit mindestens zwei Erklärungen vereinbar. Auf der einen Seite ist es möglich, dass die geringere Erfahrung mit Passivstrukturen dazu führt, dass die L2-Kinder weniger geübt darin
180
Valentina Cristante und Sarah Schimke
sind, die agent first-Strategie zu revidieren, und dieser Prozess deswegen weniger schnell und erfolgreich verläuft. Mit dem gleichen Argument ließe sich auch der Unterschied zwischen L1-Kindern und Erwachsenen erklären. Auf der anderen Seite ist es auch möglich, dass der Unterschied auf L2-spezifische Verarbeitungsstrategien zurückgeht, die eine prinzipiell und dauerhaft geringere Gewichtung morphosyntaktischer Markierungen beinhalten könnten (Clahsen & Felser 2006; Meisel 2009). Um diese beiden Erklärungen voneinander zu trennen, erscheint es sinnvoll, ältere L2-Kinder zu untersuchen. Wenn die langsamere und schwächere Reaktion auf das Auxiliar L2-spezifisch ist, also mit dem späteren Erwerbsbeginn im Vergleich zu Muttersprachlern zusammenhängt, dann sollte sich dieser Unterschied auch bei älteren Kindern zeigen. Geht diese Reaktion auf weniger Erfahrung mit der Struktur zurück, könnte er sich dagegen bei einer längeren Expositionszeit aufheben. Um dieser Frage nachzugehen, untersuchte Cristante (2016) in einer weiteren Studie, wie zehnjährige L1- und L2-Kinder Aktiv- und Passivsätze verarbeiten. Wie in der soeben beschriebenen Studie hatten die L2-Kinder ein Alter bei Erwerbsbeginn von drei bis vier Jahren, und sprachen Türkisch als L1. Die Materialien waren in beiden Experimenten identisch. Für Aktivsätze zeigten sich erneut sehr hohe Raten korrekter Interpretation sowohl bei L1- als auch bei L2-Kindern, sowie keine Unterschiede zwischen den beiden Gruppen in der online Verarbeitung. Die online und offline Ergebnisse für die Passivsätze sind in Abbildung 2 dargestellt.
Abbildung 2: Online Verarbeitung (Teil A) und offline Interpretation (Teil B) von Passivsätzen bei zehnjährigen Kindern mit Deutsch als L1 oder L2. Die online Daten zeigen den Anteil (%) der Blicke auf das korrekte Bild, die offline Daten den Anteil (%) der korrekt ausgewählten Bilder.
Die Verarbeitung von Passivsätzen und OVS-Sätzen im kindlichen L2-Erwerb
181
Wie in der Abbildung ersichtlich, zeigten sich keinerlei Unterschiede zwischen L1-Kindern und L2-Kindern, weder in den offline Urteilen, noch während der online Verarbeitung. Beide Gruppen zeigten Evidenz für eine agent first-Strategie, die sie nach Beginn des Auxiliars erfolgreich revidierten. Dies spricht dafür, dass die L2-Kinder sich nicht dauerhaft von den L1-Kindern unterscheiden, jedenfalls nicht in Bezug auf ihr Wissen über Passivsätze und die online Nutzung dieses Wissens. Der Unterschied, der sich bei den siebenjährigen Kindern zeigte, geht vermutlich auf die geringere Erfahrung mit dieser Struktur zurück. Insgesamt ergeben die hier vorgestellten online Studien (Stromswold et al. 2002; Marinis 2007; Cristante 2016) ein sehr homogenes Bild zur Verarbeitung und Interpretation von Passivsätzen. Alle Studien zeigen, dass die Kinder in dem hier betrachteten Alter (L1-Kinder ab fünf Jahren, L2-Kinder ab sieben Jahren) deutsche und englische Passivsätze meist korrekt verstehen. Die zusätzliche Betrachtung von online Daten erlaubt es, festzustellen, dass für das erfolgreiche Verstehen von Passivsätzen die kanonische Interpretation nach einer agent firstStrategie überwunden werden muss, und dass dies Zeit kostet. Dabei brauchen jüngere L2-Kinder etwas länger als gleich alte L1-Kinder. Es gibt keine Evidenz dafür, dass dieser Unterschied auf L2-spezifische Verarbeitungsmechanismen zurückgeht, denn er ist bei älteren Kindern nicht mehr festzustellen. Bevor wir diese Ergebnisse weiter diskutieren, ergänzen wir sie im Folgenden zunächst durch Ergebnisse zur Verarbeitung und Interpretation von OVS-Sätzen.
4 Verarbeitung und Interpretation von OVS-Sätzen Auch für diese Struktur geben wir im Folgenden zunächst einen kurzen Überblick über offline Ergebnisse zu ihrem Erwerb bei L1- und L2-Kindern. Anschließend stellen wir zwei Studien zur online Verarbeitung von OVS-Sätzen vor.
4.1 Offline Studien Produktionsstudien mit L1-Kindern zeigen, dass das deutsche Kasussystem schrittweise erworben wird. Von einem ersten Kasussystem kann typischerweise im zweiten Lebensjahr gesprochen werden, in dem meist die Form den erworben wird (u. a. Mills 1985; Tracy 1984). Die Nutzung von Kasusmarkierungen zur Zuweisung von thematischen Rollen, wenn sie im Konflikt mit der kanonischen Wortstellung stehen, bleibt allerdings über eine längere Entwicklungsphase
182
Valentina Cristante und Sarah Schimke
hinweg problematisch. In einer Nachspiel-Aufgabe, in der Kindern künstliche Verben beigebracht wurden, beobachteten Dittmar et al. (2008), dass Kinder erst ab sieben Jahren OVS-Sätze vom Typ Den Tiger wieft der Bär überwiegend korrekt ausagieren konnten. Andere Studien finden einen früheren Gebrauch der Kasusmarkierung in Konfliktsituationen beim Satzverstehen bei etwa fünf Jahren (Lindner 2003; Rösch & Chondrogianni 2014; Schaner-Wolles 1989). Im kindlichen L2-Erwerb wird die Form den ebenfalls nach einer relativ kurzen Expositionszeit erworben (Kaltenbacher & Klages 2006; Wegener 1998). In Studien zur Interpretation fanden Rösch & Chondrogianni (2014) bei fünfjährigen L2-Kindern wesentlich niedrigere zielsprachliche Interpretationen objektinitialer Fragen (z. B. Welchen Igel malt die Maus an?) als bei L1-Kindern. Gamper (2016) beobachtete ebenfalls mehr Fehlinterpretationen von objektinitialen Sätzen bei zehnjährigen L2-Kindern als bei gleich alten L1-Kindern. Es ist also unklar, ob und wann sich das Wissen über Kasusmarkierungen bei L2-Kindern an das Wissen gleichaltriger L1Kinder angleicht.
4.2 Online Studien Es liegen zwei Studien vor, die das Visual World-Paradigma angewandt haben, um die Verarbeitung objektinitialer Strukturen bei kindlichen Lernern des Deutschen zu untersuchen. Adani und Fritzsche (2015) verglichen die Verarbeitung von Objektrelativsätzen mit der von Subjektrelativsätzen bei L1-Kindern, und Cristante (2016) verglich die Verarbeitung kanonischer und objektinitialer Hauptsätze bei L1-Kindern und L2-Kindern. Adani & Fritzsche (2015) untersuchten Sätze vom Typ (9) und (10) (9) Wo ist die Kuh, die den Hund jagt? (10) Wo ist die Kuh, die der Hund jagt? In diesen Sätzen disambiguiert die Kasusmarkierung an der eingebetteten Nominalphrase (der/den Hund) den Relativsatz in (9) als Subjektrelativsatz, und den in (10) als Objektrelativsatz. Dem Referenten des ambigen Relativpronomens die kann also in (9) die Agensrolle zugewiesen werden, während ihm in Satz (10) die Patiensrolle zugewiesen werden muss. Wird der Relativsatz nach einer agent firstStrategie verarbeitet, sollte also Satz (9) korrekt verstanden werden. In Satz (10) ist dagegen eine Reanalyse nötig, die erst beginnen kann, wenn die zweite Nominalphrase verarbeitet wird. Adani & Fritzsche (2015) präsentierten den Probanden Bilder, auf denen der Zielreferent (die Kuh) in beiden thematischen Rollen vorkam, für die Sätze in (9) und (10) also zum Beispiel ein Bild, auf dem eine Kuh einen
Die Verarbeitung von Passivsätzen und OVS-Sätzen im kindlichen L2-Erwerb
183
Hund jagte, der wiederum eine andere Kuh jagte. Vierjährige Kinder und Erwachsene mussten auf diesen Bildern auf den korrekten durch den Relativsatz beschriebenen Referenten zeigen. Die vier Jahre alten Kinder zeigten bei Subjektrelativsätzen in 82 % der Fälle auf den richtigen Referenten, bei Objektrelativsätzen dagegen nur in 36 % der Fälle. Wären beide Satztypen ausschließlich nach einer agent first-Strategie verarbeitet worden, hätte die Korrektheit für Objektrelativsätze noch etwas niedriger liegen müssen. Ein gewisses Ausmaß an Wissen über Kasusmarkierungen scheint also bei den Kindern vorhanden zu sein. In der Mehrzahl der Objektrelativsätze konnten sie dieses Wissen jedoch nicht ausreichend nutzen, um offline zu einem korrekten Urteil zu kommen. Erwachsene dagegen interpretierten beide Typen von Relativsätzen in allen Fällen korrekt. In den Blickbewegungen zeigte sich dagegen für beide Gruppen sowohl für Subjektals auch für Objektrelativsätze ein Anstieg des Anteils der Blicke auf das korrekte Bild, nachdem die eingebettete Nominalphrase gehört wurde. Dieser Anstieg erfolgte bei den Erwachsenen schneller und ausgeprägter. Die Kinder erreichten also auch online nie das gleiche Niveau an Blicken auf das korrekte Bild wie die Erwachsenen, die Diskrepanz zwischen dem Verhalten der Kinder und der Erwachsenen war jedoch online deutlich geringer als offline. Im Gegensatz zu den Daten für Passivsätze zeigt sich hier also das von Höhle, Fritzsche & Müller (2016) beschriebene Muster, nachdem online Daten Einblicke in Wissen erlauben, das sich im offline Verhalten von Kindern nicht zeigt. Cristante (2016) untersuchte SVO- und OVS-Hauptsätze vom Typ (11) und (12). (11) Der Opa hat am Sonntag die Oma liebevoll geküsst. (12) Den Opa hat am Sonntag die Oma liebevoll geküsst. Im Gegensatz zu der Studie von Adani & Fritzsche (2015) erfolgt die Disambiguierung dieser Sätze bereits an der ersten vorkommenden Nominalphrase. Wenn diese Markierung unmittelbar genutzt werden kann, ist es möglich, dass eine agent first-Strategie gar nicht angewandt wird. Allerdings kommen Hauptsätze mit OVS-Stellung relativ seltener vor als Objektrelativsätze, so dass Sprachnutzer weniger Erfahrung mit dieser Struktur haben. Wie in der oben beschriebenen Studie zum Passiv waren die Probanden siebenjährige L1-Kinder, siebenjährige L2Kinder mit Türkisch als L1 und einem Erwerbsbeginn des Deutschen bei drei bis vier Jahren, sowie eine erwachsene Kontrollgruppe. Die Aktivsätze wurden auch hier von allen Probanden gleichermaßen erfolgreich verarbeitet und interpretiert. Abbildung 3 stellt die offline und online Ergebnisse für die OVS-Sätze dar. In Bezug auf die offline Interpretation zeigen diese Ergebnisse, dass die L1Kinder die Sätze nur in gut der Hälfte der Fälle korrekt interpretierten, und die L2Kinder nur in etwa 30 % der Fälle. Damit entsprechen die Befunde für die L1-
184
Valentina Cristante und Sarah Schimke
Abbildung 3: Online Verarbeitung (Teil A) und offline Interpretation (Teil B) von OVS-Sätzen bei siebenjährigen Kindern mit Deutsch als L1 oder L2 und Erwachsenen. Die online Daten zeigen den Anteil (%) der Blicke auf das korrekte Bild, die offline Daten den Anteil (%) der korrekt ausgewählten Bilder.
Kinder eher denen von Dittmar et al. (2008) als denen anderer Studien (Lindner 2003; Rösch & Chondrogianni 2014; Schaner-Wolles 1989). Allerdings sind die Studien von Lindner (2003) und Rösch & Chondrogianni (2014) nicht direkt mit der Studie von Cristante (2016) vergleichbar, da entweder auch Belebtheit manipuliert wurde (Lindner 2003) oder objektinitiale Fragesätze untersucht wurden (Rösch & Chondrogianni 2014). Bei den L2-Kindern bestätigen die offline Ergebnisse die Ergebnisse vorheriger Studien (Gamper 2016; Rösch & Chondrogianni 2014). In den online Daten zeigt sich bei allen drei Gruppen ein unterschiedliches Muster. Die Erwachsenen reagieren unmittelbar auf die Akkusativmarkierung der ersten Nominalphrase und betrachten während des gesamten Satzes mehr das korrekte Bild als das falsche Bild. Die Daten der L1-Kinder lassen sich so interpretieren, dass sie ebenfalls sofort auf die Kasusmarkierung reagieren, denn im Gegensatz zu den Daten für Passivsätze, bei denen der disambiguierende Hinweisreiz etwas später kommt, betrachten sie zu keinem Zeitpunkt häufiger das falsche Bild als das korrekte Bild. Allerdings zeigt sich ein deutlicher Anstieg der Blicke auf das korrekte Bild erst im dritten Zeitfenster, nach Beginn der zweiten Nominalphrase. Es ist möglich, dass die geringere Erfahrung der L1-Kinder mit OVS-Sätzen dazu führt, dass sie im Vergleich zu den Erwachsenen weniger stark auf den ersten Hinweisreiz reagieren. Dies führt zu einem Verhalten, bei dem anscheinend beide Interpretationen, die der agent first-Strategie entsprechende und die zielsprachliche Interpretation, relativ lange parallel verfolgt werden, je-
Die Verarbeitung von Passivsätzen und OVS-Sätzen im kindlichen L2-Erwerb
185
denfalls werden beide Bilder zu ungefähr gleichen Anteilen betrachtet. Die Daten suggerieren weiterhin, dass die Nominativmarkierung der zweiten Nominalphrase als ein weiterer Hinweisreiz für die zielsprachliche Interpretation wirkt. Nach Beginn dieser zweiten Nominalphrase zeigt sich nämlich ein Anstieg der Blicke auf das korrekte Bild, die in diesem Zeitfenster das gleiche Niveau erreichen wie bei den Erwachsenen. Gegen Ende des Satzes betrachten die Kinder allerdings wieder mehr auch das andere Bild, was ihrem offline Urteil entspricht. Dieser Verlauf ist gut vereinbar mit dem Vorschlag, dass L1-Kinder im Prinzip Wissen über Kasusmarkierungen haben, dass es ihnen aber insbesondere in offline Aufgaben schwer fällt, die kanonische alternative Interpretation zu inhibieren (Adani & Fritzsche 2015; Höhle, Fritzsche & Müller 2016). Die L2-Kinder schließlich zeigen nicht nur offline, sondern auch online wesentlich weniger Wissen über Kasus als die L1-Kinder. Im zweiten Zeitfenster, nach Beginn des Auxiliars hat, zeigt sich deutlich eine Verarbeitung der Sätze nach dem kanonischen Muster, also eine agent first-Strategie. Diese Strategie wird nie so weit revidiert, dass das korrekte Bild häufiger betrachtet oder ausgewählt würde als das falsche Bild. Allerdings ähnelt der Verlauf der Blickbewegungen qualitativ dem Verlauf bei den L1-Kindern, wenn auch auf insgesamt niedrigerem Niveau. Insbesondere zeigt sich auch bei den L2-Kindern nach dem Hören der zweiten Nominalphrase eine leichte Zunahme der Blicke auf das korrekte Bild. Außerdem ist das Verhältnis des online und offline jeweils sichtbaren Wissens bei den L2-Kindern nicht anders als bei den L1-Kindern. Beide Gruppen wählen in der offline Aufgabe das korrekte Bild in einem geringeren Prozentsatz der Fälle, als sie es während der Verarbeitung, insbesondere im dritten Zeitfenster, betrachten. Insgesamt gibt es also auch in diesen Daten keine eindeutige Evidenz für L2-spezifische Verarbeitungsstrategien bei den L2-Kindern. Stattdessen stehen sowohl die online als auch die offline Daten im Einklang mit der Annahme, dass die L2-Kinder sich in einem früheren Stadium des Erwerbs der Kasusmorphologie befinden als die L1-Kinder. Insgesamt zeigen die Ergebnisse der beiden hier vorgestellten Studien zur Verarbeitung von OVS-Sätzen, dass diese Sätze andere Anforderungen mit sich bringen als Passivsätze. Sowohl online als auch offline zeigt sich ein Konflikt zwischen der kanonischen Interpretation und der Nutzung der Kasusmorphologie. In den offline Entscheidungen zeigt sich, dass vierjährige L1-Kinder sich letztlich häufiger auf eine Interpretation nach der agent first-Strategie verlassen, während siebenjährige L1-Kinder etwa gleich häufig zu der korrekten und der falschen Interpretation kommen. Bei gleich alten L2-Kindern überwiegt eine Interpretation nach der agent first-Strategie. Die online Daten zeigen dagegen in der Tendenz eine stärkere Gewichtung der Kasusinformation als in den offline Daten ersichtlich. Dabei befinden sich die L2-Kinder zwar insgesamt auf einem niedrigeren Niveau als die L1-Kinder, zeigen aber kein anderes Verhältnis von offline zu online Daten.
186
Valentina Cristante und Sarah Schimke
Es wäre interessant, die Verarbeitung und Interpretation von OVS-Sätzen auch bei älteren L1- und L2-Kindern zu untersuchen, um herauszufinden, ob und wann sich das sprachliche Wissen in diesem Bereich an das Wissen erwachsener Muttersprachler annähert.
5 Schlussfolgerungen und Forschungsperspektiven In diesem Kapitel ist der Frage nachgegangen worden, welche Einblicke die Betrachtung der Verarbeitung und Interpretation nicht-kanonischer Sätze in das sprachliche Wissen von L1- und L2-Kindern erlaubt. Die Ergebnisse zeigen, dass alle untersuchten Kinder eine Tendenz haben, Sätze nach einer kanonischen agent first-Strategie zu interpretieren. Allerdings zeigen auch alle untersuchten Gruppen prinzipiell die Fähigkeit, morphosyntaktische Hinweisreize zu nutzen, um diese Interpretation aufzugeben. Dabei unterscheiden sich die Ergebnisse für Passivsätze allerdings frappierend von denen für OVS-Sätze. Passivsätze werden von allen untersuchten Gruppen insgesamt erfolgreicher verstanden als OVS-Sätze, und auch in offline Aufgaben scheint die Inhibierung der alternativen kanonischen Struktur keine große Herausforderung darzustellen, jedenfalls nicht in den untersuchten Altersbereichen. Dies ist jedoch nicht darauf zurückzuführen, dass die alternative kanonische Interpretation gar nicht verfolgt würde. Die online Daten zeigen deutlich, dass Kinder zunächst eine agent firstStrategie anwenden. Dieser Befund lässt sich so interpretieren, dass die morphosyntaktischen Hinweisreize in Passivsätzen besser dazu genutzt werden können, die alternative kanonische Interpretation des Satzes auszuschließen, als dies bei OVS-Sätzen der Fall ist. Mehrere Unterschiede zwischen Passiv- und OVSSätzen könnten zu diesem Phänomen beitragen. Erstens ist die Reanalyse, die bei OVS-Sätzen erforderlich ist, insofern umfassender und deswegen eventuell auch schwieriger, als die erste Nominalphrase weder in syntaktischer noch in thematischer Hinsicht der Default-Präferenz entspricht. Bei Passivsätzen kann dagegen die Default-Annahme, dass die erste Nominalphrase das Subjekt des Satzes ist, aufrecht erhalten werden, und es muss nur die thematische Rolle reanalysiert werden. Ein weiterer Unterschied zwischen den beiden Satztypen besteht in der Rolle der zweiten Nominalphrase. Während die von-Phrase nicht obligatorisch ist und Der Opa wurde geküsst also ein grammatischer Satz, ist Den Opa küsst nicht grammatisch. Dies könnte einer der Gründe dafür sein, dass die zweite Nominalphrase in OVS-Sätzen eine stärkere Rolle als Hinweisreiz zu haben scheint als in Passivsätzen. Dies zeigt sich in den
Die Verarbeitung von Passivsätzen und OVS-Sätzen im kindlichen L2-Erwerb
187
Daten von Cristante (2016) darin, dass der Beginn der zweiten Nominalphrase in allen Gruppen zu einem erneuten Anstieg des Anteils an Blicken auf das korrekte Bild führt. Eventuell ist eine Verarbeitungsstrategie, bei der nach dem Hören der ersten Nominalphrase im Akkusativ eine Erwartung für eine weitere Nominalphrase im Nominativ aufgebaut und diese zur Bestätigung abgewartet werden muss, besonders belastend für das Arbeitsgedächtnis, und dies könnte zu dem relativ schlechteren Abschneiden der Kinder in der offline Bildauswahlaufgabe beitragen. Neben diesen strukturellen Faktoren könnten auch morphologische Unterschiede zwischen Passiv- und OVS-Sätzen zu den unterschiedlichen Ergebnissen beitragen. Die Kasusmarkierung am Artikel ist sicherlich weniger salient als die Markierung des Passivs durch ein freies Morphem. Darüber hinaus gab es jedenfalls in den von Adani & Fritzsche (2015) und Cristante (2016) untersuchten OVS-Sätzen jeweils nur einen Hinweisreiz, der die Struktur des Satzes disambiguierte, während Passiv in den hier zusammengefassten Untersuchungen immer durch zwei Hinweisreize markiert war. Bei den OVS-Sätzen konnten die Probanden den Satz also im weiteren Verlauf nicht mehr als solchen identifizieren, falls sie den ersten Hinweisreiz nicht wahrgenommen hatten. Weiterhin stellt die Nominalmorphologie des Deutschen insgesamt einen komplexeren Erwerbsgegenstand dar als die Verbalmorphologie, denn die Form-Funktionszusammenhänge sind durch Synkretismen und die Markierung dreier verschiedener Flexionskategorien (Kasus, Numerus und Genus) an jeweils einem einzelnen Morphem besonders schwierig zu entschlüsseln. Dies könnte dazu führen, dass Kinder länger brauchen, bevor sie Kasusmarkierungen in zielsprachlicher Weise gewichten. Schließlich kommen insbesondere die von Cristante (2016) untersuchten Sätze in dieser Form in authentischen Situationen sicherlich sehr selten vor. OVS-Sätze sind im Allgemeinen wesentlich weniger häufig als SVO-Sätze. Wenn sie vorkommen, dann ist häufig der durch das Objekt bezeichnete Diskursreferent im vorherigen Kontext bereits eingeführt worden und erscheint dementsprechend im OVS-Satz häufig in pronominaler Form. Wird ein initiales Objekt dagegen als volle Nominalphrase realisiert, so steht der Referent häufig in einem Kontrast zu einer kontextuell salienten Alternative, und dies wird häufig durch eine entsprechende Intonation gekennzeichnet (Weber, Grice & Crocker 2006). Diese typischen Vorkommensbedingungen von OVS-Sätzen waren in der Studie von Cristante (2016) nicht gegeben, was die Verarbeitung zusätzlich erschwert haben könnte. Zukünftige Studien könnten untersuchen, ob Kinder OVS-Sätze erfolgreicher verarbeiten können, wenn einige dieser Bedingungen gegeben sind. Bei L1- und L2Erwachsenen scheint das der Fall zu sein (Hopp 2009; Weskott 2003). Die zentrale Frage dieses Kapitels betrifft allerdings nicht den Vergleich von Passiv- und OVS-Sätzen, sondern den Vergleich des sprachlichen Wissens von L1und L2-Kindern. In Bezug auf Passivsätze haben siebenjährige L2-Kinder nach den
188
Valentina Cristante und Sarah Schimke
hier vorgestellten Ergebnissen einen ähnlichen Erwerbsstand wie gleich alte L1Kinder. Ihre geringere Erfahrung mit der Zielsprache scheint zu leichten Unterschieden in der online Verarbeitung (Cristante 2016) sowie in der offline Interpretation (Marinis 2007) führen zu können. Diese Unterschiede weisen aber nicht auf ein fundamental anderes sprachliches Wissen hin, als es L1-Kinder haben. Insbesondere sind sie bei älteren L2-Kindern nicht mehr feststellbar (Cristante 2016). In Bezug auf OVS-Sätze haben L2-Kinder dagegen einen deutlich geringeren Wissensstand als gleich alte L1-Kinder (Cristante 2016). Das beobachtete Muster aus offline und online Daten deutet aber auch in diesem Bereich nicht auf eine fundamental andere Nutzung der Morphosyntax hin, sondern eher auf einen insgesamt weniger fortgeschrittenen Erwerbsstand. Die Frage, ob und wie L2Kinder sich in ihrem morphosyntaktischen Wissen und seiner online Nutzung von L1-Kindern unterscheiden, ist damit aber natürlich noch nicht umfassend beantwortet, und sollte in zukünftigen Studien weiter untersucht werden. In der Forschung zur Satzverarbeitung bei L2-Erwachsenen zeigen sich Unterschiede zu Muttersprachlern insbesondere dann, wenn verschiedene Informationsquellen gegeneinander gewichtet werden müssen, wie zum Beispiel Informationen aus dem Diskurskontext auf der einen Seite, und morphosyntaktische Hinweisreize auf der anderen Seite (Pan, Schimke & Felser 2015). Studien, in denen verschiedene Informationsquellen in der kindlichen L2-Verarbeitung systematisch miteinander verglichen würden, stehen noch aus, so dass wir nicht wissen, ob sich L2- und L1-Kinder hier unterscheiden. Ein weiterer wichtiger Einflussfaktor in der Sprachverarbeitung bei L2-Erwachsenen ist die jeweilige L1. In den oben zusammengefassten online Studien war die L1 in allen Fällen die agglutinierende Sprache Türkisch, in der Passiv- und OVS-Sätze vorkommen und durch gebundene Morpheme markiert werden. Im Vergleich zu anderen Erstsprachen könnte das Türkische also gute Bedingungen für die Verarbeitung nichtkanonischer Sätze im Englischen und Deutschen bieten, und es wäre interessant, zu untersuchen, ob L2-Kinder mit anderen Erstsprachen ein anderes Verhalten zeigen. Schließlich gibt es unseres Wissens keine Studien, die identische Verarbeitungsexperimente mit L2-Kindern und L2-Erwachsenen durchgeführt haben. So sind die in Hopp (in diesem Band) zusammengefassten Studien in ihrem Aufbau den hier vorgestellten Studien nicht direkt vergleichbar, denn keine dieser Studien untersucht direkt die Zuweisung thematischer Rollen anhand der Blicke auf zwei verschiedene Bilder. Die Durchführung direkt vergleichbarer Studien mit verschiedenen Populationen (L1-Kinder und -Erwachsene und L2-Kinder und -Erwachsene) würde wertvolle Erkenntnisse über Gemeinsamkeiten und Unterschiede dieser verschiedenen Gruppen in ihrem sprachlichen Wissen und seiner Anwendung liefern.
Die Verarbeitung von Passivsätzen und OVS-Sätzen im kindlichen L2-Erwerb
189
Literaturangaben Adani, Flavia & Tom Fritzsche (2005): On the Relation between Implicit and Explicit Measures of Child Language Development : Evidence from Relative Clause Processing in 4-Year-Olds and Adults. In Elizabeth Grillo, Kile Jepson & Maria LaMendola (Hrsg.), Proceedings of the 39th annual Boston University Conference on Language Development, 1, 14 – 26. Somerville, MA: Cascadilla Press. Aschermann, Ellen, Insa Gülzow & Dirk Wendt (2004): Differences in the comprehension of passive voice in German- and English-speaking children. Swiss Journal of Psychology 63 (4), 235 – 245. Becker, Tabea (2006): Erwerb und Verarbeitung komplexer grammatischer Strukturen bei Grundschulkindern. In Tabea Becker & Corinna Peschel (Hrsg.), Gesteuerter und ungesteuerter Grammatikerwerb, 156 – 173. Baltmannsweiler: Schneider Verlag Hohengehren. Blom, Elma, Daniela Polišenská & Fred Weerman (2008): Articles, adjectives and age of onset: the acquisition of Dutch grammatical gender. Second Language Research 24 (3), 297 – 331. Blom, Elma & Nada Vasić (2011): The production and processing of determiner-noun agreement in child L2 Dutch. Linguistic Approaches to Bilingualism 1 (3), 265 – 290. Blom, Elma, Aylin C. Kuntay, Marielle Messer, Josje Verhagen & Paul Leseman (2014): The benefits of being bilingual: working memory in bilingual Turkish-Dutch children. Journal of Experimental Child Psychology 128, 105 – 119. Brandt-Kobele, Oda C. & Barbara Höhle (2010): What asymmetries within comprehension reveal about asymmetries between comprehension and production. The case of verb inflection in language acquisition. Lingua 120 (8), 1910 – 1925. Clahsen, Harald & Claudia Felser (2006): Grammatical Processing in Language Learners. Applied Psycholinguistics 27, 3 – 42. Chondrogianni, Vicky & Theodoros Marinis (2012): Production and Processing Asymmetries in the Acquisition of Tense Morphology by Sequential Bilingual Children. Bilingualism: Language and Cognition 15 (1), 5 – 21. Chondrogianni, Vicky, Theodoros Marinis, Susan Edwards & Elma Blom (2015): Production and on-line comprehension of definite articles and clitic pronouns by Greek sequential bilingual children and monolingual children with specific language impairment. Applied Psycholinguistics 36 (5), 1155 – 1191. Cristante, Valentina (2016): The processing of non-canonical sentences in children with German as a first or second language and German adults. Evidence from an eye-tracking study. Doktorarbeit. Münster: Westfälische Wilhelms-Universität. Dabrowska, Ewa & James Street (2006): Individual differences in language attainment. Comprehension of passive sentences by native and non-native English speakers. Language Sciences 28 (6), 604 – 615. DeKeyser, Robert M. (2000): The Robustness of Critical Period Effects in Second Language Acquisition. Studies in Second Language Acquisition 22 (4), 499 – 533. Dittmar, Miriam, Kirsten Abbot-Smith, Elena Lieven & Michael Tomasello (2008): Young German Children’s Early Syntactic Competence: A Preferential Looking Study. Developmental Science 11 (4), 575 – 82.
190
Valentina Cristante und Sarah Schimke
Dittmar, Miriam, Kirsten Abbot-Smith, Elena Lieven & Michael Tomasello (2014): Familiar Verbs Are Not Always Easier than Novel Verbs: How German Pre-School Children Comprehend Active and Passive Sentences. Cognitive Science 38 (1), 128 – 51. Ferreira, Fernanda, & Nikole D. Patson (2007): The ’Good Enough’ Approach to Language Comprehension. Language and Linguistics Compass 1 (1 – 2), 71 – 83. Gamper, Jana (2016): Satzinterpretationsstrategien mehr- und einsprachiger Kinder im Deutschen. Tübingen: Narr. Grimm, Hannelore (1975): Verstehen, Imitation und Produktion von Passivsätzen. In Hannelore Grimm, Hermann Schöler & Margret Wintermantel (Hrsg.), Zur Entwicklung sprachlicher Strukturformen bei Kindern. Empirische Untersuchungen zum Erwerb und zur Erfassung sprachlicher Wahrnehmungs- und Produktionsstrategien bei Drei bis Achtjährigen, 73 – 99. Weinheim: Beltz. Haznedar, Belma (2003): Missing Surface Inflection in Adult and Child L2 Acquisition. In Juana M. Liceras, Helmut Zobl & Helen Goodluck (Hrsg.), Proceedings of the 6th Generative Approaches to Second Language Acquisition Conference: L2 Links, 140 – 149. Somerville, MA: Cascadilla Press. Höhle, Barbara, Tom Fritzsche & Anja Müller (2016): Children’s comprehension of sentences with focus particles and the role of cognitive control: An eye tracking study with German-learning 4-year-olds. PLoS ONE 11 (3), e0149870. Hopp, Holger (2009): The syntax-discourse interface in near-native L2 acquisition: Off-line and on-line performance. Bilingualism: Language and Cognition 12, 463 – 483. Hopp, Holger (2010): Ultimate Attainment in L2 Inflection : Performance Similarities between Non-Native and Native Speakers. Lingua 120, 901 – 931. Hopp, Holger (2015): Semantics and morphosyntax in L2 predictive sentence processing. International Review of Applied Linguistics, 53 (3), 277 – 306. Jackson, Carrie N. (2008): Proficiency level and the interaction of lexical and morphosyntactic information during L2 sentence processing. Language Learning 58 (4), 875 – 909. Johnson, Jacqueline S. & Elissa L. Newport (1989): Critical period effects in second language learning: The influence of maturational state on the acquisition of English as a second language. Cognitive Psychology 21 (1), 60 – 99. Kaltenbacher, Erika & Hana Klages (2006): Sprachprofil und Sprachförderung bei Vorschulkindern mit Migrationshintergrund. In Bernt Ahrenholz (Hrsg.), Kinder mit Migrationshintergrund. Spracherwerb und Fördermöglichkeiten, 80 – 97. Freiburg i.Br.: Fillibach. Knoeferle, Pia, Matthew W. Crocker, Christoph Scheepers & Martin J. Pickering (2005): The Influence of the Immediate Visual Context on Incremental Thematic Role-Assignment: Evidence from Eye-Movements in Depicted Events. Cognition 95 (1), 95 – 127. Lindner, Katrin (2003): The Development of Sentence-Interpretation Strategies in Monolingual German-Learning Children with and without Specific Language Impairment. Linguistics 41 (2), 213 – 54. Marinis, Theodoros (2007): On-line processing of sentences involving reflexive and non-reflexive pronouns in L1 and L2 children. In Anna Gavarró Algueró & M. João Freitas (Hrsg.), Language acquisition and development. Proceedings of GALA 2007, 348 – 358. Cambridge: Cambridge Scholars Publishing.
Die Verarbeitung von Passivsätzen und OVS-Sätzen im kindlichen L2-Erwerb
191
McDonald, Janet L. (2006): Beyond the Critical Period: Processing-Based Explanations for Poor Grammaticality Judgment Performance by Late Second Language Learners. Journal of Memory and Language 55 (3), 381 – 401. Meisel, Jürgen M. (2009): Second Language Acquisition in Early Childhood. Zeitschrift für Sprachwissenschaft 28 (1), 5 – 34. Mills, Anne E. (1977): First and Second Language Acquisition in German. Reinhard Strauch Publikationen (Hrsg.), Ludwigsburg Studies in Language and Linguistics. Ludwigsburg. Mills, Anne E. (1985): The acquisition of German. In Dan Slobin (Hrsg), The Crosslinguistic Study of Language Acquisition 1, 141 – 254. Hillsdale, NJ: Lawrence Erlbaum. Pan, Hui-Yu, Sarah Schimke & Claudia Felser (2015): Referential context effects in non-native relative clause ambiguity resolution. International Journal of Bilingualism 19 (3), 298 – 313. Paradis, Johanne (2005): Grammatical Morphology in Children Learning English as a Second Language. Lang Speech Hear Serv Sch 36 (3), 172 – 187. Poarch, Gregory J. & Janet G. van Hell (2012): Executive functions and inhibitory control in multilingual children: evidence from second-language learners, bilinguals, and trilinguals. Journal of Experimental Child Psychology 113 (4), 535 – 551. Roesch, Anne-Dorothée & Vasiliki Chondrogianni (2014): Morphological Cues in the Comprehension of Wh-Questions in German-Speaking Simultaneous and Early Sequential Bilingual Children. Proceedings of BULCD 38, 1 – 13. Somerville, MA: Cascadilla Press. Root, Marina (2014): Lesen als Herausforderung für Zweitspracherwerb. Eine empirische Untersuchung zum Passivverstehen von Viertklässlern. In Christian Dawidowski (Hrsg.), Literatur, Lesen und Migration, 139 – 150. Osnabrück: Steinbacher. Schaner-Wolles, Chris (1989): Strategies in acquiring grammatical relations in German: Word order or case marking? Folia Linguistica 23 (1), 131 – 156. Schneitz, Sarah (2014): Passiv im kindlichen Zweitspracherwreb – Diagnostik und Förderimplikationen. In Giulio Pagonis & Hana Klages (Hrsg.), Linguistisch fundierte Sprachförderung und Sprachdidaktik: Grundlagen, Konzepte, Desiderate, 193 – 214. Berlin: de Gruyter. Schwartz, Bonnie D. (2004): On child L2 development of syntax and morphology. Lingue e Linguaggio 3, 97 – 132. Stromswold, Karin, Janet Eisenband, Edward Norland & Jill Ratzan (2002): Tracking the acquisition and processing of English passives: Using acoustic cues to disambiguate actives and passives. Vortrag bei der 15th annual CUNY Conference on Human Sentence Processing, New York, NY. Tracy, Rosemarie (1986): The acquisition of case morphology in German. Linguistics 24 (1), 47 – 78. Unsworth, Sharon (2005): Child L2, Adult L2, Child L1: Differences and Similarities. A study on the acquisition of direct object scrambling in Dutch. Doktorarbeit, Utrecht University. Verhagen, Josje, Hanna Mulder & Paul P.M. Leseman (2016): Effects of home language environment on inhibitory control in bilingual three-year-old children. Bilingualism: Language and Cognition 20 (01), 114 – 127. Weber, Andrea, Martine Grice & Matthew W. Crocker (2006): The Role of Prosody in the Interpretation of Structural Ambiguities: A Study of Anticipatory Eye Movements. Cognition 99 (2), 63 – 72.
192
Valentina Cristante und Sarah Schimke
Wegener, Heide (1998): Das Passiv im DaZ-Erwerb von Grundschulkindern. In Heide Wegener (Hrsg.), Eine zweite Sprache lernen. Empirische Untersuchungen zum Zweitspracherwerb, 143 – 172. Wendt, Dorothea, Thomas Brand & Birger Kollmeier (2014): An Eye-Tracking Paradigm for Analyzing the Processing Time of Sentences with Different Linguistic Complexities. PLoS ONE 9 (6), e100186. Weskott, Thomas (2003). Information Structure as a Processing Guide: The Left Periphery of German V2 Sentences and its Interpretation in Context. Doktorarbeit, Universität Leipzig. Wittek, Angelika & Michael Tomasello (2005): German-speaking children’s productivity with syntactic constructions and case morphology: Local cues act locally. First Language, 25 (1), 103 – 125.
IV Kontexte: Pronomen
Claudia Felser
Verarbeitung von Pronomen bei erwachsenen L2-Lernern Pronominale Elemente existieren offenbar in allen menschlichen Sprachen (Greenberg 1963). Ihre Verwendung dient sowohl der Sprachökonomie, indem sie die unnötige Wiederholung von komplexeren Satzkonstituenten zu vermeiden helfen, als auch zur Herstellung von Text- bzw. Diskurskohärenz. Aus Sprachverarbeitungssicht stellen Pronomen jedoch eine spezielle Herausforderung dadurch dar, dass sie referentiell abhängige Elemente sind. Das bedeutet, dass sie aufgrund ihrer reduzierten semantischen Spezifizierung nur in Bezug auf einen sogenannten Antezedenten bzw. Diskursreferenten interpretiert werden können. Hierbei kann es sich beispielsweise um eine referentielle Nominalphrase im selben (1a) oder in einem vorhergehenden Satz (1b) handeln, oder auch um einen nicht explizit erwähnten (d. h. gedachten) Referenten im aktuellen Diskursmodell. (1) a. Maria bat Susanne sich zu beeilen. b. Susanne schickte Maria eine SMS. Sie würde sich etwas verspäten. In Beispiel (1a) kann sich das Reflexivpronomen sich nur auf Susanne, nicht aber auf Maria beziehen. Das Personalpronomen sie in (1b) dagegen ist ambig, auch wenn der Kontext hier nahelegt, dass es Susanne ist, die sich verspäten wird, und nicht Maria oder gar die SMS. Die experimentelle Sprachverarbeitungsforschung beschäftigt sich nicht ohne Grund seit mehreren Jahrzehnten mit der Frage, wie Leser oder Hörer es bewerkstelligen, den korrekten bzw. vom Verfasser oder Sprecher intendierten Antezedenten während der Echtzeitverarbeitung innerhalb kürzester Zeit zu identifizieren. Da der intendierte Antezedent sich häufig nicht im gleichen Satz bzw. Teilsatz wie das Pronomen selbst befindet, kann seine Identifizierung nicht unerhebliche Anforderungen an das Arbeitsgedächtnis stellen. Psycholinguisten untersuchen, welche linguistischen und nichtlinguistischen Faktoren die Auflösung pronominaler Elemente während der Sprachverarbeitung beeinflussen bzw. erleichtern (Nicol & Swinney 2003; Sturt 2013). Der mit der Interpretation von Pronomen verbundene Verarbeitungsaufwand ist sicherlich keineswegs geringer beim Lesen oder Hören in einer L2 als in einer L1. Hier kommt noch erschwerend hinzu, dass typologische Unterschiede bezüglich Claudia Felser, Potsdam Research Institute for Multilingualism DOI 10.1515/9783110456356-009
196
Claudia Felser
der Form, Positionierung und Interpretation pronominaler Elemente (vgl. z. B. Bhat 2004) für L2-Lerner ein potentielles Erwerbsproblem darstellen können. Während beispielsweise in Sprachen wie dem Deutschen und Englischen die Interpretation von Reflexivpronomen relativ strengen Beschränkungen unterliegt, sind Reflexiva in vielen anderen Sprachen (wie z. B. das chinesische Reflexivum ziji oder das japanische zibun) ambig, d. h. sie können sich prinzipiell auf verschiedene mögliche Antezedenten beziehen. Pronominale Elemente unterschieden sich auch hinsichtlich ihrer semantischen und morphosyntaktischen Spezifizierung. Im Englischen z. B. wird die Form des Reflexivpronomens (himself, herself etc.) von Geschlecht und Numerus seines Bezugsworts bestimmt, wohingegen das Deutsche nur die invariante Form sich verwendet. Personalpronomen dagegen zeigen im Deutschen ein relativ komplexes Paradigma, da sie sowohl nach Genus und Numerus als auch nach Kasus flektieren. Sprachen unterschieden sich weiterhin hinsichtlich des Umfangs ihres Pronomeninventars. Das Deutsche besitzt beispielsweise ein deutlich größeres Inventar an Demonstrativpronomen (z. B. der, dieser, jener) als das Englische. Viele Sprachen erlauben zudem die Auslassung von Pronomen unter bestimmten Bedingungen; siehe die Beispiele in (2a,b) (adaptiert von Philippi 2008: 68 f.). (2) a. Dorme. (Italienisch) ‚Er/sie/es schläft.‘ b. Janós szereti. (Ungarisch) ‚Janós liebt ihn/sie/es.‘ Auch die Positionierung pronominaler Elemente im Satz unterliegt typologischer Variation. In vielen Sprachen beispielsweise werden unbetonte (nicht hingegen betonte) Pronomen klitisiert (3). (3) La veo. (Spanisch) sie sehe ‚Ich sehe sie.‘ Die Interpretationsmöglichkeiten und -präferenzen von Pronomen zeigen ebenfalls eine große typologische Variationsbreite. So wird in Nullsubjekt-Sprachen wie z. B. dem Italienischen ein Nullpronomen wie in (4a) zumeist mit dem Matrixsubjekt (Marta) gleichgesetzt, während die Verwendung eines overten Pronomens wie in (4b) einen Topikwechsel anzeigt, d. h. das Pronomen wird vorzugsweise als auf eine andere Person als Marta (wie hier z. B. Piera) bezogen interpretiert (Beispiele adaptiert von Carminati 2002).
Verarbeitung von Pronomen bei erwachsenen L2-Lernern
197
(4) a. Marta scriveva spesso a Piera quando Ø era negli Stati Uniti. b. Marta scriveva spesso a Piera quando lei era negli Stati Uniti. ‚Marta schrieb Piera oft, als sie in den Vereinigten Staaten war.‘ Im Deutschen dagegen würde man ein Personalpronomen in einem vergleichbaren Satz eher auf das Matrixsubjekt beziehen, wohingegen ein Topikwechsel durch die Verwendung eines Demonstrativpronomens signalisiert würde (vgl. Marta schrieb Piera oft, als diese in den Vereinigten Staaten war, s. auch Schimke et al. in diesem Band). Angesichts der Natur und Vielzahl der typologischen Unterschiede in diesem Bereich der Sprache ist es nicht verwunderlich, dass die korrekte Verwendung und Interpretation von Pronomen L2-Lernern oft Schwierigkeiten bereiten (z. B. Bryant & Noschka 2015; Gundel, Stenson & Tarone 1984; Sorace & Filiaci 2006;Valenzuela 2006). Man kann sich leicht vorstellen, dass ein unvollständiger Erwerb des L2Pronominalsystems oder L2-spezifischer Interpretationsbeschränkungen das Lese- und Hörverstehen in der L2 erschweren und zu Missverständnissen führen kann, indem beispielsweise Ambiguitäten nicht der Präferenz der Zielsprache entsprechend aufgelöst werden. Eine bisher vergleichsweise wenig erforschte Frage ist die, ob der erfolgreiche Erwerb von Regeln und Beschränkungen, welche die Interpretation von Pronomen betreffen, Nichtmuttersprachler dann tatsächlich auch in die Lage versetzt, diese Beschränkungen genauso schnell und effizient wie Muttersprachler während der Echtzeitverarbeitung anzuwenden. Im folgenden Forschungsüberblick werde ich mich vorrangig mit der Rolle syntaktisch basierter Beschränkungen bei der Interpretation pronominaler Elemente auf Satzebene befassen (vgl. Sturt 2013).¹
1 Hintergrund 1.1 Syntaktisch basierte Beschränkungen der Interpretation pronominaler Elemente In der formalen Linguistik werden syntaktisch basierte Beschränkungen für die Interpretation pronominaler Elemente oft unter der sogenannten Bindungstheorie zusammengefasst (Chomsky 1981; Büring 2005; Sportiche 2013). Diese umfasst traditionell drei Prinzipien, welche generelle Interpretationsbeschränkungen für
Was die Auflösung von Pronomen im Diskurskontext betrifft, siehe Schimke et al. in diesem Band.
198
Claudia Felser
reflexive und reziproke Pronomen (= Prinzip A), nicht-reflexive Pronomen (= Prinzip B) und referentielle Ausdrücke (= Prinzip C) beschreiben. Diese Prinzipien sind in vereinfachter Form unter (5a-c) aufgelistet. (5) Prinzipien der Bindungstheorie Prinzip A Reflexive Pronomen müssen von einem lokalen Antezedenten gebunden werden. Prinzip B Nicht-reflexive Pronomen dürfen nicht von einem lokalen Antezedenten gebunden werden. Prinzip C Referentielle Ausdrücke dürfen nicht gebunden werden. Gebunden bedeutet in diesem Zusammenhang, dass Antezedent und Pronomen in einer bestimmten hierarchisch-strukturellen Beziehung (C-Kommando) zueinander stehen und ihre morphosyntaktischen bzw. semantischen Merkmale kompatibel sein müssen. Laut Reinharts (1983) traditioneller Definition c-kommandiert eine syntaktische Konstituente ihre Schwesterkonstituente(n) sowie alle deren Subkonstituenten. Dies sei kurz am Beispiel von Diagramm (6) illustriert.² (6)
Hier c-kommandiert Konstituente A alle anderen Konstituenten mit Ausnahme der sie dominierenden Konstituente B. Die Konstituenten A und C c-kommandieren sich gegenseitig, ebenso wie die Konstituenten D und E. C-Kommando und die oben erwähnte Lokalitätsbedingung sind prinzipiell voneinander unabhängig: Während C-Kommando als universelle Voraussetzung für syntaktisch basierte Bindung gilt (vgl. aber hierzu die Kritik von Bruening 2014), unterscheiden sich
Eine einfachere Faustregel ist die, dass Subjekte i. d. R. ihr Prädikat sowie alle darin enthaltenen Konstituenten c-kommandieren.
Verarbeitung von Pronomen bei erwachsenen L2-Lernern
199
Sprachen in Bezug darauf, wie genau bzw. wie eng der Begriff der Lokalität jeweils definiert ist. Die Bindungsprinzipien A-C in (5a-c) lassen sich anhand folgender Beispiele (7a-c) illustrieren, wobei mögliche referentielle Beziehungen durch Koindizierung gekennzeichnet sind. (7) a. Peter sagt, dass Hansi sichi verletzt hat. b. Peteri sagt, dass Hans ihni verletzt hat. c. Er sagt, dass Peter Hans verletzt hat. In (7a) und (7b) c-kommandieren sowohl das Matrixsubjekt Peter als auch das eingebettete Subjekt Hans das Pronomen (sich bzw. ihn), da die Phrasenstrukturrepräsentation beider Sätze das Pronomen als eine Subkonstituente einer Schwesterkategorie sowohl von Peter als auch von Hans ausweist. Gemäß Prinzip A der Bindungstheorie muss sich das Reflexivum in (7a) auf Hans beziehen, da dieser sich im selben Gliedsatz wie das Reflexivum selbst befindet und somit die für das Deutsche geltende relativ eng definierte Lokalitätsbedingung erfüllt. Obwohl Peter und Hans mit dem Personalpronomen ihn in (7b) gleichermaßen merkmalskompatibel sind, kann sich das Pronomen gemäß Bindingsprinzip B nicht auf Hans beziehen, da es nicht lokal gebunden werden darf. Der Bindung des Pronomens durch das hierarchisch höher stehende Subjekt Peter und einer daraus resultierenden Koreferenzinterpretation steht hingegen nichts im Weg. In Beispiel (7c) ist nicht nur die lineare Abfolge von Pronomen und potentiellen Referenten eine andere als in (7a,b) sondern auch die C-Kommando-Verhältnisse. In (7c) c-kommandiert das Subjektpronomen er sowohl Peter als auch Hans. Da referentielle Ausdrücke wie z. B. Eigennamen laut Prinzip C nicht gebunden werden dürfen, ist eine Bindungsbeziehung zwischen dem Pronomen und beiden potentiellen Referenten hier ausgeschlossen. Als Konsequenz davon können weder Peter noch Hans als koreferent mit dem Pronomen er interpretiert werden, so dass das Pronomen satzintern nicht aufgelöst werden kann. In diesem Fall muss ein geeigneter Antezedent für das Subjektpronomen außerhalb des Satzes gesucht werden. Alternativen bzw. neueren Versionen der Bindungstheorie zufolge (vgl. insbesondere die von Reinhart und Reuland entwickelte Primitives of Binding Version; siehe Reuland 2001, 2011) ist lediglich Prinzip A ein rein syntaktisch basiertes Prinzip, während die Prinzipien B und C semantischer bzw. pragmatischer Natur sind (vgl. hierzu auch z. B. Levinson 1987, 1991). Ohne die theoretische Diskussion hier unnötig vertiefen zu wollen, bleibt dennoch festzuhalten, dass Phrasenstrukturinformation nicht nur für die Interpretation von Reflexivprono-
200
Claudia Felser
men sondern auch für die Interpretation nicht-reflexiver Pronomen auf Satzebene relevant ist. Aus den oben diskutierten Beispielen ist bereits deutlich geworden, dass es grundsätzlich (mindestens) zwei qualitativ unterschiedliche Wege gibt, einen geeigneten Referenten für ein Pronomen ausfindig zu machen. Diese Unterscheidung hat zwar ihren Ursprung in der linguistischen Theorie, lässt sich aber ebenso gut aus der Perspektive der Sprachverarbeitung betrachten. Die eine Möglichkeit ist der syntaktische Weg, welcher prinzipiell nur bei der satzinternen Pronomenauflösung überhaupt in Frage kommt: Begegnet man z. B. einem Reflexivpronomen wie in (7a), wird die Phrasenstrukturrepräsentation des aktuellen Satzes rückblickend nach einem merkmalskompatiblen lokalen Binder durchsucht. Um einen geeigneten Binder zu identifizieren, müssen u. a. auch die vorliegenden C-Kommando-Verhältnisse überprüft werden. Alternativ können Pronomen auf diskursbasiertem Weg aufgelöst werden, was beispielsweise bei der Herstellung satzübergreifender referentieller Beziehungen notwendigerweise der Fall ist. Hier wird die Phrasenstrukturposition möglicher Antezedenten ganz oder weitgehend außer Acht gelassen und stattdessen die aktuelle Diskursrepräsentation nach möglichen Referenten durchsucht. Merkmalskompatibilität ist laut vieler Modelle (z. B. Lewis & Vasishth 2005; McElree 2000; McElree, Foraker & Dyer 2003) hierbei das entscheidende Suchkriterium, aber auch pragmatische Faktoren wie beispielsweise die relative Diskursprominenz verschiedener Kandidaten können eine wichtige Rolle spielen (Garnham 2001; Grosz, Joshi & Weinstein 1995). Auf Diskursebene hergestellte Koreferenzbeziehungen setzen keinerlei spezielle strukturellen Beziehungen zwischen Pronomen und Antezedent voraus, weshalb dieser Weg ein Pronomen aufzulösen der einzig mögliche ist, wenn kein geeigneter satzinterner Antezedent vorhanden ist (wie beispielsweise in 7c). Bei satzinterner Pronomenauflösung hingegen sind beide o.g. Wege oft nicht empirisch unterscheidbar. Das Matrixsubjekt Peter in (7b) beispielsweise befindet sich mit dem Pronomen ihn zwar in einer Bindungskonfiguration, aber eine Koreferenzbeziehung zwischen beiden könnte im Prinzip auch über den Diskursweg hergestellt werden, z. B. aufgrund der relativ hohen Diskursprominenz des Matrixsubjekts (erstgenannte NP und Satztopik) und ohne Beachtung der bestehenden C-Kommando-Verhältnisse. Es ist sehr gut denkbar, dass das Verarbeitungssystem beide Wege mehr oder weniger parallel verfolgt und syntaktische und diskursbasierte Information konstruktiv zu integrieren versucht, zumal syntaktische Information allein meist nicht ausreicht, um einen Antezedenten positiv zu identifizieren. Die gilt vor allem für die Bindungsprinzipien B und C, welche (im Unterschied zu Prinzip A) in dem Sinne negativ definiert sind, dass sie lediglich
Verarbeitung von Pronomen bei erwachsenen L2-Lernern
201
bestimmte potentielle Antezedenten aufgrund der vorliegenden syntaktischen Konfiguration ausschließen. Laut Koornneef & Reuland (2016) ist allerdings die Auflösung von Pronomen über den syntaktischen Weg generell mit geringerem Verarbeitungsaufwand verbunden als der Versuch einer diskursbasierten Interpretation, weshalb dem syntaktischen Weg normalerweise Vorrang gegeben werden sollte. Empirisch lässt sich diese Vorhersage beispielsweise anhand von ambigen Pronomen in solche Kontexten testen, in denen sowohl Diskurs- als auch Bindungsantezedenten vorhanden sind. Eine Ambiguität bezüglich der Art und Weise der Pronomenauflösung liegt z. B. in Beispiel (8) vor. (8) Kein Student des Professors glaubte, dass er die Vorlesung durchhalten würde. Das Pronomen er kann sich entweder auf kein Student oder auf Professor beziehen. Da kein Student eine quantifizierte Nominalphrase ist, die auf keinen konkret identifizierbaren Diskursreferenten verweist, kann eine referentielle Anhängigkeit zwischen kein Student und er nur über eine (syntaktisch basierte) Bindungsbeziehung hergestellt werden. In Anlehnung an Sportiche (2013) wird diese Beschränkung im Folgenden als Prinzip D (9) bezeichnet (vgl. jedoch hierzu die Kritik von Barker 2012). (9) Prinzip D Ein quantifizierter Ausdruck kann ein Pronomen nur dann binden, wenn er das Pronomen c-kommandiert. Der zweite mögliche Antezedent in Beispiel (8), die Nominalphrase des Professors, c-kommandiert das Pronomen hingegen nicht und kann daher ausschließlich über den Diskursweg mit dem Pronomen in Beziehung gebracht werden. Auch wenn die Bindungsprinzipien in der theoretischen Fachliteratur kritisch diskutiert und im Hinblick auf augenscheinliche Gegenbeispiele hinterfragt worden sind, stellen sie dennoch nützliche Arbeitshypothesen dar, auf die meine Diskussion auch im Folgenden Bezug nehmen wird. Neben den Bindungsprinzipien spielen natürlich noch eine Reihe weiterer Faktoren, wie z. B. der satzexterne Kontext, Topik- und Fokusinformation oder die Reihenfolge der Erwähnung möglicher Referenten, eine potentielle Rolle bei der Interpretation pronominaler Elemente, auf die ich aber an dieser Stelle nicht weiter eingehen werde (Nicol & Swinney 2003).
202
Claudia Felser
1.2 Pronomenbindung im L2-Erwerb Hier und im Folgenden werden als L2-Lerner Menschen bezeichnet, die eine weitere Sprache nach dem abgeschlossenen Erwerb ihrer Erstsprache(n) erlernt haben. Die an der formalen Linguistik orientierte L2-Forschung hat sich im Bereich der Pronomeninterpretation hauptsächlich auf Prinzip A der Bindungstheorie konzentriert. Dies liegt vor allem daran, dass es interessante sprachspezifische Unterschiede in Bezug auf die Natur und den möglichen Umfang der relevanten Bindungsdomänen gibt (siehe Abschnitt 1). Vor dem Hintergrund der in den 80er und 90er Jahren des vergangenen Jahrhunderts populären Prinzipien-und-Parameter-Theorie (Chomsky 1981) hat die Mehrzahl dieser Studien untersucht, ob Sprecher, in deren L1 Reflexiva weniger engen Beschränkungen unterliegen als z. B. im Englischen, dennoch in der Lage sind, die vergleichsweise restriktiveren Beschränkungen der L2 zu erlernen. Anders als im Englischen oder Deutschen kann sich in vielen Sprachen wie z. B. dem Japanischen ein Reflexivum sowohl auf einen lokalen als auch auf einen nicht-lokalen Antezedenten beziehen, wie folgendes Beispiel (10) illustriert: (10) Tarooi-wa Zirook-ga zibuni/k-o kiratteiru-to omotteiru. Taro-TOP Ziro-NOM sich-ACC hasst-COMP denkt ‚Taro denkt, dass Ziro sich/ihn hasst.‘ Während die Ergebnisse mehrerer L2-Erwerbsstudien nahelegen, dass der Erwerb sprachspezifischer Lokalitätsbeschränkungen in der Tat möglich ist (z. B. Eckman 1994; Thomas 1991), lassen andere Zweifel daran aufkommen (z. B. Dominguez, Hicks & Song 2012; Yuan 1994). Gelegentlich wurde vermutet, dass neben möglichen L1-Transfereffekten auch Sprachverarbeitungsfaktoren oder die Art der Aufgabenstellung bei der Anwendung der Bindungsbeschränkungen in der L2 eine Rolle spielen könnten (z. B. Hawkins 2001: 312). Mit nachlassender Popularität des klassischen Prinzipien-und-Parameter-Modells im Verlauf der 90er Jahre ebbte jedoch das Interesse am L2-Erwerb von Reflexiva merklich ab. Mit der Anwendung von Prinzip B und C in einer L2 haben sich vergleichsweise wenige Erwerbsstudien beschäftigt (z. B. Diaconescu & Goodluck 2003; Tomiyama 1990; White 1998), da diese Prinzipien gemeinhin als invariant gelten und daher kein konkreter Grund zu der Annahme besteht, dass sie für (erwachsene) L2Lerner ein Erwerbsproblem darstellen könnten. Erst vor relativ kurzer Zeit haben verschiedene internationale Forscherteams begonnen, die Fähigkeit von L2-Lernern, sowohl sprachspezifische als auch universelle syntaktisch basierte Beschränkungen während der Verarbeitung pronominaler Elemente zu berücksichtigen, zu untersuchen (siehe Abschnitt 2).
Verarbeitung von Pronomen bei erwachsenen L2-Lernern
203
In der jüngeren Vergangenheit haben sich L2-Erwerbsforscher zunehmend der Interpretation nichtreflexiver Pronomen zugewandt. Hier geht es zumeist nicht um Bindungsprinzipien sondern um die Frage, wie Diskursfaktoren wie z. B. Topikalität oder Fokus die Herstellung von Koreferenzbeziehungen beeinflussen (z. B. Bryant & Noschka 2015; Ellert 2013). Ebenso wurde untersucht, ob Nichtmuttersprachler diskursbasierte Beschränkungen für die Interpretation von Null- vs. overten Pronomen in der gleichen Weise anwenden wie Mutterprachler (z. B. Sorace & Filiaci 2006). Die Ergebnisse dieser Arbeiten werden im Detail von Schimke et al. in diesem Band diskutiert.
1.3 Psycholinguistischer Hintergrund Die traditionelle L2-Erwerbsforschung arbeitet zumeist mit offline Methoden wie beispielsweise Fragebögen oder der Analyse von Spontansprachdaten. Diese Methoden können in der Tat recht guten Aufschluss darüber geben, ob Beschränkungen der Pronomeninterpretation einem Lerner bekannt sind und ob er pronominale Elemente in der gleichen Weise wie Muttersprachler zu verwenden imstande ist. Selbst relativ subtile Interpretationspräferenzen lassen sich mit Hilfe entsprechend konzipierter Fragebögen feststellen. Offline Methoden können allerdings keinen Aufschluss geben über die Fähigkeit von Sprachlernern, pronominale Elemente auch während der Echtzeit-Sprachverarbeitung so schnell und so treffsicher wie Muttersprachler aufzulösen. Ohne die Anwendung geeigneter online Methoden wissen wir nicht, auf welche Weise oder über welche Umwege Sprachlerner möglicherweise zu ihrer Interpretation eines Pronomen gekommen sind. Werden z. B. zunächst auch syntaktisch nicht lizensierte Antezedenten in Erwägung gezogen und dann später verworfen, oder wird der korrekte Antezedent direkt identifiziert, sobald im aktuellen Satz ein Pronomen auftaucht? Was mögliche Annahmen über die L2-Verarbeitung von Pronomen angeht, so wäre die Nullhypothese, dass das der Verarbeitung zugrundeliegende sprachliche Wissen, die verwendeten Beschränkungen sowie deren Timing und relative Gewichtung sich in der L1 und L2 nicht unterscheiden. Allerdings mag es sein, dass Nichtmuttersprachler generell mehr Zeit und mentale Energie für die L2-Verarbeitung benötigen als Muttersprachler (vgl. z. B. McDonald 2006). Darüber hinaus wäre es jedoch auch denkbar, dass es weitere, tiefgreifendere Unterschiede zwischen der L1 und L2-Verarbeitung pronominaler Elemente gibt. Ohne hier auf einzelne Modelle zur L2-Verarbeitung im Detail eingehen zu wollen, ist beispielsweise verschiedentlich spekuliert worden, dass L2-Lerner während der Echtzeit-Verarbeitung Schwierigkeiten mit der Integration unterschiedlicher Informationsquellen haben könnten. Dies könnte sich z. B. in einer reduzierten
204
Claudia Felser
Fähigkeit zeigen, diskursbasierte Beschränkungen zu berücksichtigen (Sorace 2011; Sorace & Filiaci 2006), oder aber in einer gegenüber Muttersprachlern verminderten Fähigkeit, abstrakte grammatische Informationen mit der erforderlichen Schnelligkeit und Detailgenauigkeit zu verarbeiten (Clahsen & Felser 2006). Prinzipiell könnten L1/L2-Unterschiede sowohl in der relativen Gewichtung verschiedener Informationsquellen als auch in ihrem relativen Timing auftreten. Eine weitere mögliche Quelle für L1/L2-Unterschiede während der Sprachverarbeitung sind typologische Unterschiede zwischen beiden Sprachen, die ungewollte Interferenzen während der L2-Verarbeitung verursachen könnten. Um herauszufinden, wie unterschiedliche Informationsquellen während des Sprachverarbeitungsverlaufs interagieren, eignen sich besonders gut experimentelle Methoden, die eine hohe zeitliche Auflösung haben wie z. B. die EEGAbleitung oder die Blickbewegungsmessung während des Lesens oder Hörens. Beide Methoden werden seit längerer Zeit erfolgreich auch bei L2-Lernern angewendet (Morgan-Short 2014; Roberts & Siyanova-Chanturia 2013; Steinhauer 2014). In diesem Kapitel werden wir uns vorrangig auf die Augenbewegungmessung (engl. eye-movement monitoring) beim Lesen konzentrieren (Rayner 1998; vgl. auch Hopp & Schimke in diesem Band). Aus Augenbewegungsdaten können wir beispielsweise ersehen, an welchem Wort oder Satzglied ein Leser „hängengeblieben“ ist, was auf eine erhöhte Verarbeitungsschwierigkeit an dieser Stelle hinweist, und ob und wann er vielleicht im Satz zurückgesprungen ist, um vorhergehende Wörter oder Satzteile noch einmal zu lesen. So wäre beispielsweise zu erwarten, dass das Pronomen seine in (11a) schneller gelesen wird als in (11b), obwohl beide Sätze strukturell parallel und grammatisch sind. (11) a. Thomas wollte mal wieder seine Tante besuchen. b. Martina wollte mal wieder seine Tante besuchen. In (11a) bietet sich für das Pronomen seine ein geeigneter merkmalskompatibler Antezedent im selben Satz, nämlich das Satzsubjekt Thomas. Eine Koreferenzbeziehung zwischen Thomas und seine sollte daher relativ schnell und problemlos herzustellen sein, zumal wenn dieser Satz nicht Teil eines komplexeren Diskursgefüges ist, in welchem weitere merkmalskompatible Referenten erwähnt werden. In (11b) hingegen fehlt ein merkmalskompatibler Antezedent, da Martina üblicherweise als Frauenname verwendet wird. Die Suche nach einem geeigneten Antezedenten für seine dürfte daher einen im Vergleich zu (11a) größeren Verarbeitungsaufwand benötigen und somit länger dauern. Eventuell steigt hier auch die Wahrscheinlichkeit, dass Leser im Satz zurückspringen, um noch einmal zu überprüfen, ob es sich beim Satzsubjekt wirklich um Martina handelt und nicht etwa doch um Martin.
Verarbeitung von Pronomen bei erwachsenen L2-Lernern
205
2 Studien zur Pronomenverarbeitung beim Lesen in einer Nichtmuttersprache 2.1 Einleitung Die erfolgreiche Anwendung syntaktisch basierter Beschränkungen während des Lesens oder Hörens setzt voraus, dass entsprechend detaillierte Phrasenstrukturrepräsentationen schnell genug und der Grammatik der Zielsprache entsprechend aufgebaut werden, um nach der Identifizierung eines Pronomens im Input beispielsweise das Überprüfen bestehender C-Kommando-Verhältnisse zu ermöglichen. Im Folgenden stelle ich eine Reihe von Augenbewegungsstudien vor, in denen wir die Echtzeitanwendung verschiedener Beschränkungen für die satzinterne Pronomeninterpretation in einer L2 untersucht haben. Folgende Forschungsfragen waren für uns hierbei von primärem Interesse: – Welche Rolle spielen die Bindungsprinzipien während der Echtzeit-Verarbeitung pronominaler Elemente, und wie interagieren diese mit anderen Beschränkungen? – Können Nichtmuttersprachler syntaktisch basierte Interpretationsbeschränkungen genauso schnell und effizient anwenden wie Muttersprachler? Wie in vielen anderen experimentellen Studien zur Pronomenverarbeitung haben auch wir zumeist die Merkmalskompatabilität zwischen Pronomen und potentiellen Antezedenten manipuliert (vgl. z. B. Sturt 2003; Van Gompel & Liversedge 2003). Wie anhand von Beispiel (11) bereits illustriert wurde, kann eine fehlende Merkmalskompatibilität zu längeren Lesezeiten führen, wenn Probanden versuchen, eine referentielle Beziehung zwischen einem Pronomen und einem merkmalsinkompatiblen Antezedenten herzustellen. Die systematische Manipulation der morphosyntaktischen oder semantischen Kompatibilität mehrerer potentieller Antezedenten ist daher ein gutes Diagnostikum dafür, welcher Antezedent zu welchem Zeitpunkt während der Sprachverarbeitung in Betracht gezogen wird.
2.2 Reflexivpronomen Untersuchungen zur Verarbeitung von Reflexivpronomen haben normalerweise das Ziel, die Rolle bzw. den Zeitpunkt der Anwendung von Bindungsprinzip A, hier wiederholt als (12), während des Lesens oder Hörens zu bestimmen.
206
Claudia Felser
(12) Prinzip A Reflexive Pronomen müssen von einem lokalen Antezedenten gebunden werden. Hier gibt es folgende logische Möglichkeiten: (i) Die sofortige Anwendung von Prinzip A führt zu einer schnellen und umweglosen Identifizierung des korrekten Antezedenten; (ii) Prinzip A aktiviert zunächst den korrekten Antezedenten, aber andere potentielle Antezedenten werden in späteren Verarbeitungsphasen ebenfalls in Betracht gezogen; (iii) Prinzip A greift erst in späteren Verarbeitungsphasen, nachdem auch andere potentielle Antezedenten in Betracht gezogen wurden; oder (iv) Prinzip A spielt während der Echtzeitverarbeitung von Reflexivpronomen überhaupt keine Rolle. Zumindest was die monolinguale Sprachverarbeitung betrifft, kann Möglichkeit (iv) mit ziemlicher Sicherheit ausgeschlossen werden. Noch nicht ganz geklärt ist aber die Frage, ob und wann auch grammatisch unzulässige Antezedenten (Distraktoren) in Betracht gezogen werden. Studien, welche diese Frage untersuchen, verwenden zumeist ein Interferenzparadigma, d. h. es werden zwei (oder mehr) mögliche Antezedent präsentiert, von denen jedoch nur einer laut Prinzip A zulässig ist (vgl. z. B. Sturt 2003). Mit Hilfe z. B. von Augenbewegungsmessungen kann dann ermittelt werden, ob – und wenn ja, zu welchem Zeitpunkt – ein unzulässiger Antezedent in Erwägung gezogen wird. Die Ergebnisse mehrere Studien weisen darauf hin, dass die Antezedenssuche bei Muttersprachlern bereits in einem sehr frühen Verarbeitungsstadium durch Prinzip A beschränkt wird (Harris, Wexler & Holcomb 2000; Nicol & Swinney 1989; Sturt 2003; Xiang, Dillon & Phillips 2009). Angesichts der oben erwähnten Vielzahl der logischen Möglichkeiten stellt sich die Frage, ob die Gewichtung bzw. das Timing von Prinzip A bei der Verarbeitung einer Nichtmuttersprache dasselbe ist wie bei der Verarbeitung einer Muttersprache. Denkbar wäre auch, dass von der Zielsprache abweichende Interpretationsbeschänkungen oder -präferenzen in der L1 die Verarbeitung der Zielsprache beeinflussen. Leider sind bisher nur wenige publizierte Studien über die Echtzeitverarbeitung von Reflexiva in einer Nichtmuttersprache verfügbar. Im Folgenden fasse ich kurz die Ergebnisse zweier unserer lesebasierten Studien zum Englischen zusammen. Das Englische hat gegenüber dem Deutschen den Vorteil, dass für das Experiment- und Stimulusdesign ein Inkongruenz-Paradigma verwendet werden kann, da englische Reflexiva genusmarkiert sind. Felser, Sato & Bertenshaw (2009) untersuchten die Frage, ob japanischsprachige Lerner des Englischen sich bei der Auflösung von Reflexivpronomen von einem laut Prinzip A unzulässigen Antezedenten ablenken lassen würden. Anders als im Englischen kann sich das häufig verwendete japanische Reflexivum zibun
Verarbeitung von Pronomen bei erwachsenen L2-Lernern
207
auch problemlos auf nichtlokale Antezedenten beziehen (vgl. Beispiel 10). Wenn japanische Muttersprachler sich durch diesen sprachspezifischen Unterschied verwirren lassen, dann sollten sie zumindest kurzzeitig auch bei der Verarbeitung englischer Reflexiva einen nichtlokalen Distraktor in Erwägung ziehen. Als experimentelle Stimuli verwendeten Felser, Sato & Bertenshaw (2009) kurze Texte wie in (13). (13) Mary/Mark and Jenny spent a long afternoon looking through the family album. a. Mary thought that Jenny had recognised herself in one photo. b. Mark thought that Jenny had recognised herself in one photo. However, it turned out to be someone else. ‚Mary/Mark und Jenny verbrachten einen langen Nachmittag damit, das Familienalbum durchzusehen. Mary/Mark dachte, dass Jenny sich auf einem Foto erkannt hatte. Es stellte sich jedoch heraus, dass es jemand anders war.‘ Der kritische zweite Satz enthielt jeweils zwei potentielle Antezedenten,von denen aber laut Prinzip A nur einer, nämlich Jenny, tatsächlich in Frage kam. Der zweite, syntaktisch nicht zulässige Antezedent war entweder merkmalskompatibel mit dem Reflexivum herself (13a) oder nicht (13b). Felser, Sato & Bertenshaw (2009) fanden Evidenz dafür, dass die L2-Sprecher sich durch einen merkmalskompatiblen Distraktor wie Mary in (13a) verunsichern ließen, und zwar in Form von längeren first-pass Lesezeiten auf dem Reflexivum in Bedingung (13a) als in (13b). Die Lesezeiten englischer Muttersprachler hingegen wurden nicht vom Genus des Distraktors beeinflußt. Dass die japanischsprachigen Probanden lediglich kurzzeitig verunsichert waren, zeigte sich einerseits an der Kurzlebigkeit des beobachteten Genuseffekts als auch daran, dass dieselben Probanden in einer komplementären Fragebogenstudie genauso zuverlässig wie englische Muttersprachler in der Lage waren, den korrekten Antezedenten zu identifizieren. Da der Distraktor in (13a,b) das Reflexivum c-kommandiert, kann man allerdings nicht mit Sicherheit sagen, ob die japanischen Probanden zunächst versucht haben, eine nichtlokale aber dennoch syntaktisch basierte Bindungsbeziehung oder aber eine pragmatisch basierte Koreferenzbeziehung zwischen Reflexivum und Distraktor herzustellen. Auch gibt das von Felser, Sato & Bertenshaw (2009) angewandte Experimentdesign keinen Aufschluss darüber, in welcher Reihenfolge beide potentielle Antezedenten in Betracht gezogen wurden. Zudem ist es ohne eine oder mehrere L2-Vergleichsgruppen nicht möglich zu verifizieren, ob der beobachtete Effekt tatsächlich auf den Einfluss des Japanischen zurückzuführen ist. Diese Fragen haben Felser & Cunnings (2012) in einer Folgestudie versucht zu klären. Im ersten von zwei Leseexperimenten manipulierten die Autoren die Ge-
208
Claudia Felser
nuskongruenz sowohl zwischen dem korrekten als auch dem inkorrekten Antezedenten für ein Reflexivum in Objektposition. Die experimentellen Stimuli bestanden wiederum aus kurzen Texten wie in (14). (14) John/Jane looked on as the building burnt down. He/she realised that the firefighter had injured himself/herself on some sharp pieces of glass. Luckily nobody else was seriously injured. ‚John/Jane sah dabei zu, wie das Gebäude niederbrannte. Er/sie bemerkte, dass ein Feuerwehrmann sichmasc/fem an einigen scharfen Glasscherben verletzt hatte. Zum Glück wurde sonst niemand ernsthaft verletzt.‘ Um die Präsentation ungrammatischer Sätze zu vermeiden, folgten die Autoren Sturt (2003) und anderen, indem sie stereotyp männliche oder weibliche Berufsbezeichnungen verwendeten, so dass die Genus-Inkongruenz zwischen Reflexivum und korrektem Antezedenten (z. B. the firefighter in 14) lediglich pragmatischer Natur war. Für die Distraktoren wurden jeweils typisch männliche bzw. weibliche Vornamen verwendet. Die Gruppe der Nichtmuttersprachler bestand diesmal aus deutschsprachigen Probanden. Das deutsche Reflexivum sich verhält sich insofern wie englische Reflexiva, als es (anders als z. B. das japanische zibun) ebenfalls einen lokalen, c-kommandierenden Antezedenten benötigt. Wie in der Studie von Felser, Sato & Bertenshaw (2009) wurde auch hier mit Hilfe eines Fragebogenexperiments sichergestellt, dass die L2-Probanden ebenso gut wie englische Muttersprachler in der Lage waren, den korrekten Antezedenten für Reflexiva zu identifizieren. Die Analyse der Augenbewegungsdaten zeigte, dass englische Muttersprachler bereits beim ersten Lesen größere Schwierigkeiten bei der Verarbeitung des Reflexivums hatten, wenn dieses nicht mit dem stereotypen Genus des korrekten Antezedenten übereinstimmte (z. B. the firefighter…herself). Das Genus des Distraktors (John/he vs. Jane/she) spielte dagegen keine Rolle. Das Lesemuster der Muttersprachler deutet also auf eine unmittelbare Anwendung von Prinzip A hin. Überraschenderweise zeigten die Daten der L2-Probanden ein völlig anderes Muster: Sie benötigten länger zum ersten Lesen des Reflexivums, wenn dieses nicht genus-kompatibel mit dem Distraktor war. Das Genus des korrekten Antezedenten begann dagegen erst in späteren Verarbeitungsstadien eine Rolle zu spielen. Es scheint also, als hätten die deutschsprachigen Probanden im Gegensatz zu den Muttersprachlern zunächst versucht, das Reflexivum auf den Distraktor zu beziehen. Um herauszufinden, ob die L2-Sprecher zunächst nach einem nichtlokalen Binder oder nach einem Koreferenz-Antezedenten gesucht haben, führten Felser & Cunnings (2012) ein weiteres Experiment durch, in welchem der satzinterne Dis-
Verarbeitung von Pronomen bei erwachsenen L2-Lernern
209
traktor (das Pronomen he/she ‘er/sie‘ in Beispiel (15) das Reflexivum diesmal nicht c-kommandierte, da er in einem Relativsatz eingebettet war. (15) John/Jane looked on as the building burnt down. The firefighter that he/she watched enter the shop injured himself/herself on some sharp pieces of glass. Luckily nobody else was seriously injured. ‚John/Jane sah dabei zu, wie das Gebäude niederbrannte. Der Feuerwehrmann, den er/sie beim Betreten des Ladens beobachtete, verletzte sichmasc/fem an einigen scharfen Glasscherben. Zum Glück wurde sonst niemand ernsthaft verletzt.‘ Wieder zeigten die L1 and L2-Sprecher unterschiedliche Lesemuster. Genau wie in Experiment 1 zeigten die deutschsprachigen Probanden beim ersten Lesen des Reflexivums nur dann längere Lesezeiten, wenn der Distraktor nicht genuskompatibel mit dem Reflexivum war. Eine Merkmalsinkompatibilität zwischen Reflexivum und dem korrekten Antezedenten wurde offensichtlich zunächst nicht bemerkt und führte erst später (beim erneuten Lesen des Reflexivums) zu längeren Lesezeiten. Aus den Ergebnissen dieses Experiments lässt sich schließen, dass die L2-Sprecher zunächst versuchten, eine Koreferenzbeziehung auf Diskursebene herzustellen anstelle einer Bindungsbeziehung, da Letzteres nur dann möglich ist, wenn der Antezedent das Reflexivum c-kommandiert, was hier aber nicht der Fall war. Die Attraktivität des aktuellen Diskurstopiks John bzw. Jane als Referent für das Reflexivum schien also für die L2-Gruppe anfangs größer als die des durch Prinzip A eindeutig als korrekt designierten lokalen Antezedenten the firefighter. Die englischen Muttersprachler zeigten sich in Experiment 2 zwar ebenfalls kurzzeitig durch einen genus-inkompatiblen Distraktor irritiert, bemerkten aber, anders als die L2-Gruppe, trotzdem sofort, wenn der korrekte Antezedent nicht kompatibel mit dem Genus des Reflexivums war. Unser vorläufiges Fazit an dieser Stelle lautet also, dass die Verarbeitung von Reflexivpronomen in einer L2 sich selbst dann von der L1-Verarbeitung unterscheiden kann, wenn L2-Probanden ihr Wissen um die relevante syntaktische Beschränkung (Prinzip A) demonstrieren können und wenn diese Beschränkung in gleicher Form auch in ihrer L1 existiert. Anders als bei Muttersprachlern scheint die relative Prominenz möglicher Referenten im aktuellen Diskursmodell den ersten Versuch, ein Reflexivum aufzulösen, zu bestimmen, während die Anwendung von Prinzip A während der L2-Verarbeitung verzögert ist. Da im Deutschen nur die invariante Form sich verwendet wird, kann hier kein morphosyntaktisches Inkongruenzparadigma wie in den oben vorgestellten Studien verwendet werden. Eine Möglichkeit, die Echtzeitanwendung von Prinzip A dennoch zu untersuchen, bietet aber die Blickbewegungsmessung beim Hören,
210
Claudia Felser
die sogenannte Visual World Methode (vgl. z. B. Clackson, Felser & Clahsen 2011; Kim, Montrul & Yoon 2014; siehe auch Hopp & Schimke, in diesem Band).
2.3 Anaphorische Personalpronomen Die Möglichkeit, nicht-reflexive Pronomen auf einen satzinternen Antezedenten zu beziehen, wird durch Bindungsprinzip B beschränkt, hier wiederholt als (16). (16) Prinzip B Nicht-reflexive Pronomen dürfen nicht von einem lokalen Antezedenten gebunden werden. Die Ergebnisse jüngerer Lesezeitstudien mit englischen Muttersprachlern legen nahe, dass Prinzip B, ähnlich wie Prinzip A, die Suche nach einem Antezedenten auch während der Echtzeitverarbeitung von Pronomen in einer L1 einschränkt (Chow, Lewis & Phillips 2014; Patterson, Trompelt & Felser 2014 – vgl. jedoch Badecker & Straub 2002). Die Anwendung von Prinzip B während der L2-Verarbeitung wurde von Patterson, Trompelt & Felser (2014) bei Lernern des Englischen untersucht. Auch hier bestand die L2-Gruppe aus deutschen Muttersprachlern. Die experimentellen Sätze waren in kurzen, neutralen Diskurskontexten eingebettet und erwähnten jeweils zwei mögliche Referenten für das Pronomen him ’ihn/ihm’, wobei wiederum die Genuskongruenz zwischen Pronomen und möglichen Referenten manipuliert wurde; vgl. die Beispiele in (17a-c). (17) a. John remembered that Mark had taught him a new song on the guitar. b. John remembered that Jane had taught him a new song on the guitar. c. Jane remembered that John had taught him a new song on the guitar. ‚John/Jane erinnerte sich, dass Mark/Jane/John ihm ein neues Lied auf der Gitarre beigebracht hatte.‘ Laut Prinzip B kommt hier nur das Matrixsubjekt (z. B. John in 17a), nicht aber das Subjekt des eingebetteten Satzes (Mark) als Antezedent für das Pronomen him ‚ihn/ihm‘ in Frage. Die Lesezeitdaten sowohl der L1- als auch der L2-Probanden waren mit der Anwendung von Prinzip B konform insofern, als beide Gruppen länger zur Verarbeitung des Pronomens benötigten, wenn der einzig zulässige satzinterne Antezedent (d. h. das Matrixsubjekt) nicht genus-kompatibel mit dem Pronomen war, wie in Bedingung (17c).
Verarbeitung von Pronomen bei erwachsenen L2-Lernern
211
Die Ergebnisse eines weiteren von Patterson, Trompelt & Felser (2014) durchgeführten Leseexperiments ließen allerdings Zweifel daran aufkommen, dass der von den L2-Probanden gezeigten Online-Präferenz für das Matrixsubjekt wirklich die Anwendung von Prinzip B zugrunde lag. Konfrontiert mit Sätzen wie in (18), in denen Prinzip B nicht greift und auch der lokale Antezedent (Gavin) für eine Koreferenzbeziehung in Frage kommt (Hestvik 1991), zeigte die L2-Gruppe hier wiederum nur dann längere Lesezeiten, wenn das Matrixsubjekt (Barry) nicht mit dem Pronomen genus-kompatibel war, also durch einen weiblichen Vornamen (Megan) ersetzt worden war. (18) Barryi saw Gavink place a gun near himi/k on the ground with great care. ‚Barry sah Gavin mit großer Vorsicht ein Gewehr neben ihm abstellen.‘ Das lässt den Verdacht aufkommen, dass L2-Lerner in dieser Studie eine generelle Präferenz für Antezedenten in Subjektposition gehabt haben könnten anstatt tatsächlich Prinzip B anzuwenden. Die englischen Muttersprachler dagegen schienen in dem zweiten von Patterson, Trompelt & Felser (2014) berichteten Experiment bevorzugt den lokalen Antezedenten Gavin in Erwägung zu ziehen, was sich darin zeigte, dass sie nur dann längere Lesezeiten hatten, wenn der lokale Antezedent nicht genus-kompatibel war, nicht aber dann, wenn das Matrixsubjekt nicht passte. Das Lesemuster der englischen Muttersprachler legt nahe, dass sie sich des Ausnahmestatus der syntaktischen Konfiguration in (18) bezüglich Prinzip B gewahr waren und ihre Echtzeit-Interpretation des ambigen Pronomens davon beeinflusst war. In einer weiteren Lesestudie haben wir die Echtzeit-Interpretation ambiger Pronomen im Deutschen untersucht (Trompelt & Felser 2014). Die Ergebnisse dieser Studie sprechen dagegen, dass L2-Lerner – wie die Ergebnisse von Patterson, Trompelt & Felser (2014) vermuten lassen könnten –eine grundsätzliche Präferenz für Matrixsubjekte haben. Trompelt & Felsers experimentelle Stimuli bestanden aus in kurze Diskurskontexte eingebetteten Sätzen wie in (19), in denen jeweils zwei gleichermaßen legitime Antezedenten für ein Personalpronomen vorkamen. (19) Auf der Baustelle ging es hektisch zu. Jeder Maurer, der sah, dass Georg/Sarah auf der Baustelle war, ahnte, dass er/sie heute fleißig arbeiten muss. Es gab keine Gelegenheit für eine Pause.
212
Claudia Felser
Das Matrixsubjekt (z. B. jeder Maurer) war stets ein quantifizierter Ausdruck, zu welchem ein Pronomen eine referentielle Beziehung nur auf dem Weg der Bindung herstellen kann, unter Beachtung von Prinzip D (hier wiederholt als 20). (20) Prinzip D Ein quantifizierter Ausdruck kann ein Pronomen nur dann binden, wenn er das Pronomen c-kommandiert. Der zweite mögliche Antezedent war ein Eigennname (z. B. Georg/Sarah), der das Pronomen nicht c-kommandierte und daher ausschließlich als Koreferenzantezedent in Frage kam. Die Augenbewegungsdaten der Probanden sollten Aufschluss darüber geben, ob und in welcher Reihenfolge beide Antezedenten in Erwägung gezogen werden. Koornneef & Reuland (2016) zufolge sollte die Herstellung einer Bindungsbeziehung in solchen Fällen Vorrang vor einer Koreferenzbeziehung haben, da der Verarbeitungsaufwand für Bindung vergleichsweise geringer ist. Dies bedeutet konkret, dass Leser in Sätzen wie (19) das quantifizierte und das Pronomen er/sie c-kommandierende Matrixsubjekt jeder Maurer als Antezedenten favorisieren sollten. Wie in den meisten der oben vorgestellten Experimente wurde auch hier ein Genuskongruenzparadigma verwendet. Weder die von Trompelt & Felser (2014) getesteten russischsprachigen Lerner des Deutschen noch die deutschen Muttersprachler zeigten jedoch das erwartete Muster. Während die Augenbewegungsdaten der Muttersprachler keine statistisch robuste Präferenz für irgendeinen der beiden möglichen Antezedenten zeigten, bevorzugten die L2-Probanden klar den Koreferenzantezedenten. Dies spiegelte sich in erhöhten Lesezeiten nach dem Lesen des Pronomens wider, wenn der vorhergehende Eigenname genus-inkompatibel war (z. B. Sarah…er) im Vergleich zu einem kompatible Eigennamen (Georg…er). Eine ähnliche Präferenz für einen Koreferenzantezedenten war zuvor auch bei englischen Muttersprachlern in ihrer L1 beobachtet worden (Cunnings, Patterson & Felser 2015). Zusammengenommen zeigen diese Studien, (i) dass Bindungsbeziehungen während der Echtzeitverarbeitung von Pronomen nicht notwendig Priorität gegenüber diskursbasierten Koreferenzbeziehungen genießen, und (ii) dass L2-Lerner bei der Pronomenauflösung nicht immer eine Präferenz für Antezedenten in Matrixsubjektposition haben.
2.4 Kataphorische Pronomen Die Echtzeit-Interpretation kataphorischer Pronomen ist bisher vergleichsweise selten untersucht worden. Kataphorische Pronomen beziehen sich auf einen
Verarbeitung von Pronomen bei erwachsenen L2-Lernern
213
Antezedenten bzw. Referenten, der erst nach dem Pronomen selbst im Satz oder Diskurskontext eingeführt wird. Zur Illustration vgl. Beispiel (21). (21) Obwohl er keinen Hunger hatte, aß Peter mit Michael zu Abend. Aus Sicht der Sprachverarbeitung bedeutet dies, dass das Lesen oder Hören eines solchen Pronomens keine rückwärts gerichtete (wie im Fall von anaphorischen Pronomen), sondern eine vorwärts gerichtete, also prädiktive, Suche nach einem geeigneten Referenten bedingt. Mit anderen Worten löst ein Pronomen, welches offensichtlich nicht anaphorisch verwendet wird, die Erwartung aus, dass ein passender Antezedent im weiteren Satz- oder Diskursverlauf erwähnt werden wird. Da das Pronomen erst dann interpretiert werden kann, wenn dieser identifiziert ist, scheint unser Verarbeitungssystem dazu prädisponiert zu sein, bereits den ersten möglichen Kandidaten im folgenden Input für den gesuchten Antezedenten zu halten. In einer Eyetracking-Studie zum Englischen zeigten Van Gompel & Liversedge (2003), dass englische Muttersprachler beim Lesen von Sätzen ähnlich dem deutschen Beispiel in (21) längere Lesezeiten auf dem Matrixsubjekt zeigten, wenn dieses nicht merkmalskompatibel war. Daraus lässt sich schließen, dass das kataphorische Pronomen im Nebensatz die Leser zu der konkreten Erwartung veranlasste, dass die erste Nominalphrase im Hauptsatz (d. h. das Subjekt Peter) der benötigte Antezedent sein würde. Wurde diese Erwartung enttäuscht, indem stattdessen ein genus-inkompatibles Subjekt präsentiert wurde, erhöhte sich die lokale Verarbeitungsschwierigkeit. In bestimmten syntaktischen Konfigurationen steht allerdings einer Pronomenauflösung auf dem kürzest möglichen Weg eine andere Beschränkung entgegen, nämlich das Bindungsprinzip C, hier wiederholt als (22). (22) Prinzip C Referentielle Ausdrücke dürfen nicht gebunden werden. Zur Illustration mag Beispiel (23) dienen. Dieser Satz enthält ein kataphorisches Pronomen in Matrixsubjektposition, welches den gesamten Rest des Satzes ckommandiert. (23) Er wollte, dass Peter mit Michael zu Abend aß. Hier ist es in der Regel nicht möglich, eine Koreferenzbeziehung zwischen dem Pronomen er und einem der beiden namentlich genannten Referenten herzustellen – d. h. er muss sich auf eine dritte, nicht im Satz selbst erwähnte Person beziehen. Die traditionelle Erklärung formaler Linguisten ist die, dass er und die
214
Claudia Felser
beiden Namen sich in (23) in einer Bindungskonfiguration befinden, Prinzip C es referentiellen Ausdrücken aber verbietet, eine Bindungsbeziehung einzugehen. Das Pronomen auf einen alternativen Diskursreferenten zu beziehen ist somit hier der einzige Weg, eine Verletzung von Prinzip C zu vermeiden. Wiederum scheinen also C-Kommando-Verhältnisse eine entscheidende Rolle für die Pronomeninterpretation zu spielen. Eine interessante Frage ist nun, ob die Suche nach einem Antezedenten auch während der Echtzeit-Sprachverarbeitung durch Prinzip C beschränkt wird oder ob das Bestreben, möglichst schnell einen passenden Antezedenten für ein kataphorisches Pronomen zu finden, zunächst überwiegt. Die Ergebnisse einer Reihe von Lesezeitexperimenten mit englischen und russischen Muttersprachlern (Kazanina et al. 2007; Kazanina & Phillips 2010; Kush 2013) deuten darauf hin, dass Prinzip C die Suche nach einem Antezedenten während der L1-Verarbeitung in der Tat einschränkt, dass also nicht-legitime Antezedenten nicht in Erwägung gezogen werden. Ob dies auch für die L2-Verarbeitung gilt, ist allerdings bisher noch unklar. Die vorläufigen Ergebnisse einer Eyetracking-Studie von Patterson, Drummer & Felser (2015) legen nahe, dass sie Antezendenssuche während der L2-Verarbeitung kataphorischer Pronomen nicht zwingend durch Prinzip C beschränkt wird. Die experimentellen Materialien bestanden hier aus kurzen Texten wie in (24a,b), wobei der kritische zweite Satz immer mit einem kataphorischen Pronomen begann. (24) Im Krankenhaus ging es sehr hektisch zu. a. Er wusste, dass mit Sebastian/Alexandra heute etwas nicht stimmte, daher versprach der Pfleger sofort, Hilfe zu holen. b. Sein Bruder wusste, dass mit Sebastian/Alexandra heute etwas nicht stimmte, daher versprach der Pfleger sofort, Hilfe zu holen. Der entscheidende Unterschied zwischen den Bedingungen (24a) und (24b) ist der, dass das Pronomen er in (24a) sich in einer Bindungskonfiguration mit dem Eigennamen (Sebastian bzw. Alexandra) im eingebetteten dass-Satz befindet, das possessive Pronomen sein in (24b) jedoch nicht. Während Prinzip C daher die Herstellung einer Koreferenzbeziehung zwischen dem Pronomen und dem Eigennamen in (24a) verbietet, steht einer solchen in (24b) prinzipiell nichts im Weg. In Sätzen wie (24b), wo keine Prinzip-C-Verletzung zu befürchten ist, sollte ein mit dem Pronomen genus-inkompatibler Eigenname (Alexandra) im Komplementsatz die Verarbeitungsschwierigkeit im Vergleich zu einem kompatiblen (Sebastian) erhöhen, d. h. Alexandra sollte längere Lesezeiten auslösen als Sebastian. Wenn Prinzip C die Suche nach einem Antezedenten für er in (24a) einschränkt, dann
Verarbeitung von Pronomen bei erwachsenen L2-Lernern
215
sollte das (typische) Genus des Eigennamens die Verarbeitung hier nicht beeinflussen, da der Eigenname ohnehin nicht als Antezedent in Erwägung gezogen wird. Die von Patterson, Drummer & Felser (2015) getesteten russischsprachigen L2Lerner des Deutschen zeigten generell längere Lesezeiten für genus-inkompatible Namen, unabhängig davon, ob eine Koreferenzbeziehung durch Prinzip C ausgeschlossen war oder nicht. Das heißt, dass ihre Lesezeiten für Alexandra vs. Sebastian auch dann anstiegen, wenn der Eigenname eigentlich gar nicht als Referent für das Pronomen in Frage kam, wie in (24a). Solche generelle Effekte von Genus-Kompatibilität würde man erwarten, wenn die Suche nach einem passenden Antezedenten die hier als Prinzip C bezeichnete Beschränkung zunächst „überschreibt“. In einem zusätzlich durchgeführten Fragenbogenexperiment zeigten sich die von Patterson, Drummer & Felser (2015) getesteten Lerner allerdings durchaus in der Lage, Prinzip C bei der Interpretation deutscher Pronomen verlässlich anzuwenden. Weitere Analysen und Experimente sind nötig um zu klären, wie genau sich L1 und L2-Sprecher in Bezug auf die Echtzeitanwendung von Prinzip C tatsächlich unterscheiden.
3 Fazit und Schlussbemerkungen Wie wir in Abschnitt 1 gesehen haben, gibt es grundsätzlich zwei Möglichkeiten, ein pronominales Element im Satzkontext aufzulösen: die eine orientiert sich an der syntaktischen Struktur (unter Beachtung z. B. der C-Kommando-Verhältnisse) und die andere ist rein merkmalsorientiert. Wie oben erläutert sind strukturelle Kriterien vor allem für die Interpretation von Reflexiva von entscheidender Bedeutung, da diese gebunden werden müssen; Personalpronomen dagegen sind prinzipiell ambig und daher frei, mit anderen Diskursreferenten innerhalb oder außerhalb des aktuellen Satzes eine Koreferenzbeziehung einzugehen. Was die Rolle syntaktisch basierter Beschränkungen während der L2-Verarbeitung von Pronomen betrifft, so geben die oben vorgestellten Studien Hinweise darauf, dass selbst fortgeschrittene Lerner Probleme mit deren Anwendung in Echtzeit haben können. Häufig beobachtet man eine Diskrepanz zwischen den Ergebnissen aus offline Experimenten, die das Wissen um relevante syntaktisch basierte Beschränkungen auf oder nahe Muttersprachler-Niveau demonstrieren, und der Fähigkeit von L2-Lernern, diese Beschränkungen auch während der Sprachverarbeitung anzuwenden. Dies wird besonders deutlich im Fall von Bindungsprinzip A (Felser & Cunnings 2012), für dessen korrekte Anwendung die Berücksichtigung von hierarchischer Phrasenstrukturinformation unerlässlich ist.
216
Claudia Felser
Die oben genannten Studien zeigen aber andererseits, dass L2-Lerner keine offensichtlichen Probleme mit der Herstellung satzinterner Koreferenzbeziehungen haben, welche nicht unbedingt eine Bindungskonfiguration voraussetzen. Im Fall von ambigen Personalpronomen wird ein nicht c-kommandierender Koreferenzantezedent gegenüber einem Bindungsantezedenten offenbar sogar bevorzugt (Trompelt & Felser 2014). Die beobachteten L1/L2-Unterschiede sind jedoch häufig relativ subtil bzw. auf frühe Verarbeitungsphasen beschränkt, weshalb sie, wie im Fall der hier diskutierten Studien, oft nur bei der Verwendung von hochgradig zeitauflösenden experimentellen Methoden überhaupt sichtbar werden. L2-Lerner scheinen diskursbasierte Koreferenzbeziehungen allerdings mitunter auch in solchen Satzkontexten herstellen zu wollen, in denen Muttersprachler primär von strukturell basierten Beschränkungen geleitet werden – und dies, obwohl sie ihr Wissen um die relevanten Beschränkungen unabhängig in offline Experimenten demonstrieren konnten.Wie erklärt sich die augenscheinlich verzögerte Anwendung syntaktisch basierter Beschränkungen während der L2Pronomeninterpretation? Eine Möglichkeit ist, dass L2-Lerner die für die erfolgreiche Anwendung notwendigen grammatischen Repräsentationen nicht vollständig oder schnell genug aufbauen können, oder dass diese unter EchtzeitVerarbeitungsdruck nicht lange genug stabil bleiben, um z. B. eine rückwärtsgerichtete Antezedenssuche zu tragen (vgl. auch Felser 2015). Das alternative Durchsuchen der aktuellen Diskursrepräsentation nach einem merkmalskompatiblen Referenten ermöglicht es in diesem Fall dennoch, dem Pronomen zumindest eine vorläufige Interpretation zu geben. Die beobachteten L1/L2-Unterschiede in den Augenbewegungsmustern zeigen, dass die L2-Verarbeitung pronominaler Elemente nicht einfach nur generell langsamer ist als bei Muttersprachlern. Vielmehr scheint es Unterschiede im relativen Timing verschiedener Arten von Beschränkungen zu geben. Während es in den oben erwähnten Studien keine Hinweise darauf gibt, dass die merkmalsgeleitete Suche nach einem geeigneten Diskursreferenten in einer L2 schwierig oder verlangsamt ist, so scheint die Anwendung syntaktisch basierter Interpretationsbeschränkungen verzögert. Dies passt zu der gelegentlich bereits früher beobachteten Tendenz von Nichtmuttersprachlern, sich während der L2-Verarbeitung stärker von satzexterner Kontextinformation leiten zu lassen als Muttersprachler (Pan & Felser 2011; Pan, Schimke & Felser 2015; Roberts, Gullberg & Indefrey 2008). Inwieweit satzinterne oder externe Diskursinformation mit den in diesem Betrag diskutierten syntaktischen Beschränkungen für die Pronomenauflösung interagiert ist allerdings bisher noch nicht wirklich systematisch erforscht worden. Eine weitere offene Frage ist, ob und wie die beobachteten L1/L2 Unterschiede in Bezug auf die Pronomenverarbeitung möglicherweise von individuellen Variablen
Verarbeitung von Pronomen bei erwachsenen L2-Lernern
217
wie etwa dem L2-Erwerbsalter beeinflusst werden. Auch die Untersuchung anderer L1/L2 Kombinationen wäre wünschenswert, um die sprachübergreifende Gültigkeit der vorliegenden Befunde zu überprüfen. Sollte sich die augenscheinliche Prioritisierung von nicht-grammatischer Information während der L2-Verabeitung in weiteren Studien bestätigen, so würde dies auch die Allgemeingültigkeit solcher Modelle der Satzverarbeitung in Frage stellen, die grammatischer Information eine grundsätzlich privilegierte Rolle gegenüber nicht-grammatischer Information einräumen (Frazier 1987; Friederici 2002).
Literaturangaben Badecker, William & Kathleen Straub (2002): The processing role of structural constraints on the interpretation of pronouns and anaphors. Journal of Experimental Psychology: Learning, Memory, and Cognition 28, 748 – 769. Barker, Chris (2012): Quantificational binding does not require c-command. Linguistic Inquiry 43, 614 – 633. Bhat, Dharbhe N. S. (2004): Pronouns. Oxford: Oxford University Press. Bruening, Benjamin (2014): Precede-and-command revisited. Language 90, 342 – 388. Bryant, Doreen & Nadine Noschka (2015): Personal- und Demonstrativpronomen im Sprachverstehensprozess: Untersuchungen zum Erwerb funktionaler Anapherndistribution bei DaM, DaF und DaZ. In Giulio Pagonis & Hana Klages (Hrsg.), Linguistisch fundierte Sprachförderung und Sprachdidaktik. Grundlagen, Konzepte, Desiderate, 17 – 46. Berlin/München/Boston: de Gruyter. Büring, Daniel (2005): Binding theory. Cambridge: Cambridge University Press. Carminati, Maria Nella (2002): The Processing of Italian Subject Pronouns. Ph.D. Dissertation, University of Massachusetts, Amherst. Chomsky, Noam (1981): Lectures on government and binding. Dordrecht: Foris. Chow, Wing Yee, Shevaun Lewis & Colin Phillips (2014): Immediate structural constraints on antecedent retrieval in pronoun resolution. Frontiers in Psychology 5:630. doi: 10.3389/fpsyg.2014.00630 Clackson, Kaili, Claudia Felser & Harald Clahsen (2011): Children’s processing of reflexives and pronouns in English: Evidence from eye movements during listening. Journal of Memory and Language 65, 128 – 144. Clahsen, Harald & Claudia Felser (2006): Grammatical processing in language learners. Applied Psycholinguistics 27, 3 – 42. Cunnings, Ian, Clare Patterson & Claudia Felser (2015): Structural constraints on pronoun binding and coreference: Evidence from eye movements during reading. Frontiers in Psychology 6:840. doi:10.3389/fpsyg.2015.00840. Diaconescu, Rodica & Helen Goodluck (2003): Structural and discourse factors in Romanian L2 English learners’ interpretation of pronouns. In Juana M. Liceras, Helmut Zobl & Helen Goodluck (Hrsg.), Proceedings of the 6th Generative Approaches to Second Language Acquisition Conference (GASLA 2002), 71 – 75. Somerville, MA: Cascadilla Proceedings Project.
218
Claudia Felser
Dominguez, Laura, Glyn Hicks & Hee-Jeong Song (2012): Untangling locality and orientation constraints in the L2 acquisition of anaphoric binding: a feature-based approach. Language Acquisition 19, 266 – 300. Eckman, Fred (1994): Local and long-distance anaphora in second-language acquisition. In Elaine Tarone, Susan Gass & Andrew Cohen (Hrsg.), Research methodology in second-language acquisition, 207 – 225. Hillsdale, NJ: Lawrence Erlbaum Associates. Ellert, Miriam (2013): Information structure affects the resolution of the subject pronouns er and der in spoken German. Discours 12, doi: 10.4000/discours.8756 Felser, Claudia (2015): Native vs. non-native processing of discontinuous dependencies. Second Language 14, 5 – 19. Felser, Claudia, Mikako Sato & Nicholas Bertenshaw (2009): The on-line application of Binding Principle A in English as a second language. Bilingualism: Language and Cognition 12, 485 – 502. Felser, Claudia & Ian Cunnings (2012): Processing reflexives in English as a second language: The role of structural and discourse-level constraints. Applied Psycholinguistics 33, 571 – 603. Frazier, Lyn (1987): Sentence processing: A tutorial review. In Max Coltheart (Hrsg.), Attention and performance XII: The psychology of reading, 559 – 585. Hillsdale, NJ: Erlbaum. Friederici, Angela D. (2002): Towards a neural basis of auditory sentence processing. Trends in Cognitive Sciences 6, 78 – 84. Garnham, Alan (2001): Mental Models and the Interpretation of Anaphora. Hove: Psychology Press. Greenberg, Joseph H. (1963): Some universals of grammar with particular reference to the order of meaningful elements. In Joseph H. Greenberg (Hrsg.), Universals of human language, 73 – 113. Cambridge, MA: MIT Press. Grosz, Barbara J., Aravind K. Joshi & Scott Weinstein (1995): Centering: a framework for modelling the local coherence of a discourse. Computational Linguistics 21, 203 – 226. Gundel, Jeanette, Nancy Stenson & Elaine Tarone (1984): Acquiring pronouns in a second language: Evidence for hypothesis testing. Studies in Second Language Acquisition 6, 215 – 225. Harris, Tony, Kenneth Wexler & Phillip J. Holcomb (2000): An ERP investigation of binding and coreference. Brain and Language 75, 313 – 346. Hawkins, Roger (2001): Second language syntax: A generative introduction. Oxford: Blackwell. Hestvik, Arild (1991): Subjectless binding domains. Natural Language and Linguistic Theory 9, 455 – 496. Kazanina, Nina & Colin Phillips (2010): Differential effects of constraints in the processing of Russian cataphora. Quarterly Journal of Experimental Psychology 63, 371 – 400. Kazanina, Nina, Ellen F. Lau, Moti Lieberman, Masada Yoshida & Colin Phillips (2007): The effect of syntactic constraints on the processing of backwards anaphora. Journal of Memory and Language 56, 384 – 409. Kim, Eunah, Silvina Montrul & James Yoon (2014): The on-line processing of Binding Principles in L2 acquisition: evidence from eye-tracking. Applied Psycholinguistics. online Veröffentlichung. Koornneef, Arnout & Eric Reuland (2016): On the shallow processing (dis)advantage: Grammar and economy. Frontiers in Psychology 7:82. doi: 10.3389/fpsyg.2016.00082.
Verarbeitung von Pronomen bei erwachsenen L2-Lernern
219
Kush, David (2013): Respecting relations: Memory access and antecedent retrieval in incremental sentence comprehension. Doktorarbeit. University of Maryland. Levinson, Stephen C. (1987): Pragmatics and the grammar of anaphora: a partial pragmatic reduction of Binding and Control phenomena. Journal of Linguistics 23, 379 – 434. Levinson, Stephen C. (1991): Pragmatic reduction of the Binding Conditions revisited. Journal of Linguistics 27, 107 – 161. Lewis, Richard & Shravan Vasishth (2005): An activation-based model of sentence processing as skilled memory retrieval. Cognitive Science 29, 375 – 419. McDonald, Janet (2006): Beyond the critical period: Processing-based explanations for poor grammaticality judgment performance by late second language learners. Journal of Memory and Language 55, 381 – 401. McElree, Brian, Stephanie Foraker & Lisbeth Dyer (2003): Memory structures that subserve sentence comprehension. Journal of Memory and Language 48, 67 – 91. McElree, Brian (2000): Sentence comprehension is mediated by content-addressable memory structures. Journal of Psycholinguistic Research 29, 111 – 123. Morgan-Short, Kara (2014): Electrophysiological approaches to understanding second language acquisition: A field reaching its potential. Annual Review of Applied Linguistics 34, 15 – 36. Nicol, Janet & David Swinney (1989): The role of structure in coreference assignment during sentence comprehension. Journal of Psycholinguistic Research 18, 5 – 20. Nicol, Janet & David Swinney (2003): The psycholinguistics of anaphora. In Andrew Barss (Hrsg.), Anaphora: A reference guide, 72 – 104. Oxford: Blackwell. Pan, Hui-Yu & Claudia Felser (2011): Referential context effects in L2 ambiguity resolution: Evidence from self-paced reading. Lingua 121, 221 – 236. Pan, Hui-Yu, Sarah Schimke & Claudia Felser (2015): Referential context effects in non-native relative clause ambiguity resolution. International Journal of Bilingualism 19, 298 – 313. Patterson, Clare, Janna-Deborah Drummer & Claudia Felser (2015): Binding Condition C in native and non-native pronoun resolution. 10th International Symposium on Bilingualism, Rutgers University, New Jersey, USA, 20 – 24 Mai 2015. Patterson, Clare, Helena Trompelt & Claudia Felser (2014): The online application of binding condition B in native and non-native pronoun resolution. Frontiers in Psychology 5: 147. doi: 10.3389/fpsyg.2014.00147. Philippi, Jule (2008): Einführung in die generative Grammatik. Göttingen: Vandenhoeck & Ruprecht. Rayner, Keith (1998): Eye-movements in reading and information processing: 20 years of research. Psychological Bulletin 124, 372 – 422. Reinhart, Tanya (1983): Anaphora and semantic interpretation. London: Croom Helm. Reuland, Eric (2001): Primitives of binding. Linguistic Inquiry 32, 439 – 492. Reuland, Eric (2011): Anaphora and language design. Cambridge, Massachusetts: The MIT Press. Roberts, Leah & Anna Siyanova-Chanturia (2013): Using eye-tracking to investigate topics in L2 acquisition and L2 processing. Studies in Second Language Acquisition 35, 213 – 235. Roberts, Leah, Marianne Gullberg & Peter Indefrey (2008): Online pronoun resolution in L2 discourse: L1 influence and general learner effects. Studies in Second Language Acquisition 30, 333 – 357.
220
Claudia Felser
Sorace, Antonella (2011): Pinning down the concept of „interface“ in bilingualism. Linguistic Approaches to Bilingualism 1, 1 – 33. Sorace, Antonella & Francesca Filiaci (2006): Anaphora resolution in near-native speakers of Italian. Second Language Research 22, 339 – 368. Sportiche, Dominique (2013): Binding theory – structure sensitivity of referential dependencies. Lingua 130, 187 – 208. Steinhauer, Karsten (2014): Event-related potentials (ERPs) in second language research: A brief introduction to the technique, a selected review, and an invitation to reconsider critical periods in L2. Applied Linguistics 35, 393 – 417. Sturt, Patrick (2003): The time-course of the application of binding constraints in reference resolution. Journal of Memory and Language 48, 542 – 562. Sturt, Patrick (2013): Syntactic constraints on referential processing. In Roger P. G. van Gompel (Hrsg.), Sentence Processing, 136 – 159. Hove: Psychology Press. Thomas, Margaret (1991): Universal grammar and the interpretation of reflexives in a second language. Language 67, 211 – 239. Tomiyama, Machiko (1990): The acquisition of restrictions on backward pronominalization by adult ESL learners. In Angela Labarca and Leslie M. Bailey (Hrsg.), Issues in L2: Theory as practice/practice as theory. Proceedings of the 7th Delaware Symposium on Language Studies, 106 – 118. Norwood, NJ: Ablex. Trompelt, Helena & Claudia Felser (2014): Variable binding and coreference in non-native pronoun resolution. In Will Orman & Matthew J. Valleau (Hrsg.), BUCLD 38: Proceedings of the 38th annual Boston University Conference on Language Development, 471 – 483. Somerville, MA: Cascadilla Press. Van Gompel, Roger P. G. & Simon P. Liversedge (2003): The influence of morphological information on cataphoric pronoun assignment. Journal of Experimental Psychology: Learning, Memory, and Cognition 29, 128 – 139. Valenzuela, Elena (2006): L2 end state grammars and incomplete acquisition of the Spanish CLLD constructions. In Roumyana Slabakova, Silvina Montrul & Philippe Prévost (Hrsg.), Inquiries in linguistic development: in honor of Lydia White. 283 – 304. Amsterdam: John Benjamins. White, Lydia (1998): Second language acquisition and Binding Principle B: child/adult differences. Second Language Research 14, 425 – 439. Xiang, Ming, Brian Dillon & Colin Phillips (2009): Illusory licensing effects across dependency types: ERP evidence. Brain & Language 108, 40 – 55. Yuan, Boping (1994): Second language acquisition of reflexives revisited. Language 70, 539 – 545.
Sarah Schimke, Saveria Colonna, Israel de la Fuente und Barbara Hemforth
L1-Einfluss und allgemeine Lernereffekte bei der Auflösung ambiger Pronomen in einer L2 Alle Lernenden einer L2 haben vor Beginn des L2-Erwerbs mindestens eine L1 erworben. Die Frage, welche Rolle diese L1 spielt, ist eine zentrale Frage der L2Erwerbsforschung. Auch in der Forschung zur Verarbeitung einer L2 wurde diese Frage untersucht, mit sehr unterschiedlichen Ergebnissen, denn offensichtlich hängt es von vielen Faktoren ab, ob und wie die L1 die Verarbeitung der L2 beeinflusst. Ein wichtiger Faktor ist die linguistische Ebene, die untersucht wird. Im Bereich der phonologischen und lexikalischen Verarbeitung einer L2 gibt es viele Ergebnisse, die auf einen Einfluss der L1 hinweisen (Weber & Broersma in diesem Band). Die Ergebnisse im Bereich der Satz- und Diskursverarbeitung sind dagegen weniger eindeutig. Für diesen Bereich wurden häufig Verarbeitungsstrategien nachgewiesen, die bei L2-Sprechern verschiedener Erstsprachen in ähnlicher Weise auftreten und demnach nicht (nur) auf einen Einfluss der L1 zurückgeführt werden können (Clahsen & Felser 2006; Roberts, Gullberg & Indefrey 2008; Sorace 2011, 2016). Derartige Effekte werden im Folgenden wie in Roberts, Gullberg & Indefrey (2008) als allgemeine Lernereffekte bezeichnet. Im vorliegenden Beitrag werden Ergebnisse zur offline und online Interpretation ambiger Pronomen im Deutschen und anderen Zielsprachen zusammengefasst. Die Leitfrage ist dabei, ob die Ergebnisse für einen L1-Einfluss sprechen, oder ob sie durch allgemeine Lernereffekte sowie eventuelle weitere Einflussfaktoren erklärt werden können. Es bietet sich aus mindestens zwei Gründen an, das Zusammenspiel von L1-Einfluss und allgemeinen Lernereffekten speziell im Bereich der Pronomenauflösung zu untersuchen. Einerseits ist die Existenz allgemeiner Lernereffekte bei der Auflösung ambiger Pronomen gut etabliert (Felser in diesem Band; Sorace 2016). Andererseits wissen wir viel über zwischensprachliche Unterschiede im Pronomeninventar und hinsichtlich der Auflösungspräferenzen bei Muttersprachlern. Dies bietet eine gute Grundlage, um L1Einflüsse festzustellen, wenn sie tatsächlich eine Rolle spielen. Im Folgenden Sarah Schimke, Westfälische Wilhelms-Universität Münster Saveria Colonna, UPL, Université Paris 8 & CNRS Israel de la Fuente, STL, CNRS & Université de Lille 3 Barbara Hemforth, CNRS & Université Paris Diderot DOI 10.1515/9783110456356-010
222
Sarah Schimke, Saveria Colonna, Israel de la Fuente und Barbara Hemforth
greifen wir zwei dieser zwischensprachlichen Unterschiede heraus, nämlich einerseits Unterschiede in der obligatorischen Verwendung overter Subjekte (prodrop vs. nicht-pro-drop Sprachen), andererseits Unterschiede in der lokalen Verfügbarkeit nicht-ambiger alternativer Konstruktionen, die in einer Reihe von Studien untersucht wurden und die die Pronomenauflösung bei Muttersprachlern beeinflussen (Baumann, Hemforth & Konieczny 2014; Hemforth et al. 2010). Wir werden jeweils zunächst die Unterschiede in den Interpretationspräferenzen bei Muttersprachlern und dann Ergebnisse zu L2-Lernern zusammenfassen. In der abschließenden Diskussion werden Schlussfolgerungen gezogen und offene Forschungsfragen skizziert.
1 Die Auflösung ambiger Pronomen in pro-drop und nicht-pro-drop Sprachen Die Auflösung ambiger Pronomen wird durch ein Zusammenspiel syntaktischer, semantischer und diskursbasierter Faktoren bestimmt (siehe de la Fuente et al. 2016). Im Folgenden konzentrieren wir uns vor allem auf den Einfluss der Diskurssalienz von Antezedenten auf der einen Seite und des sprachspezifischen pronominalen Repertoires auf der anderen Seite (für die Auflösung von Reflexivpronomen und den Einfluss syntaktischer Beschränkungen, siehe Felser in diesem Band).
1.1 Ergebnisse zu Muttersprachlern Ein Pronomen wird als anaphorisches Pronomen bezeichnet, wenn es sich auf einen Antezedenten, also auf einen referentiellen Ausdruck im vorherigen Diskurs, bezieht. Zum Beispiel bezieht sich in Satz (1) das Personalpronomen er auf den Ausdruck der Straßenfeger. (1) Der Straßenfeger hat seine Arbeit beendet. Dann ging er nach Hause. Sprachen können dabei über mehr als eine pronominale Form verfügen. Im Deutschen wird zum Beispiel neben dem Personalpronomen er auch das sogenannte d-Pronomen, der, anaphorisch verwendet (Ahrenholz 2007). Dies wirft die Frage auf, ob sich die beiden pronominalen Formen in ihren Auflösungspräferenzen unterscheiden. Diese Frage lässt sich anhand ambiger Sätze untersuchen,
L1-Einfluss und allgemeine Lernereffekte
223
in denen es mehr als einen grammatikalisch möglichen Antezendenten für die pronominale Form gibt, wie in (2a) und in (2b). (2) a. Der Straßenfeger ist dem Briefträger begegnet. Dann ging er nach Hause. b. Der Straßenfeger ist dem Briefträger begegnet. Dann ging der nach Hause. Von verschiedenen Ansätzen wird eine umgekehrte Beziehung zwischen der Salienz oder Prominenz des durch den Antezedenten bezeichneten Diskursreferenten und der Reduziertheit der anaphorischen Form angenommen (Akzessibilitätshypothese; Ariel 1990; Givón 1983; Gundel, Hedberg & Zacharski 1993). Unter Reduziertheit werden dabei sowohl die Komplexität, insbesondere die Länge, als auch das Ausmaß an Information, das eine bestimmte Form enkodiert, gefasst. In diesem Sinne stellt im Deutschen das Personalpronomen in (2a) eine reduziertere Form dar als das d-Pronomen in (2b), und letzteres ist wiederum reduzierter als volle Nominalphrasen wie der Mann. Da er also jedenfalls in Sätzen vom Typ (2a) die reduziertest mögliche Form darstellt, sollte es bevorzugt auf einen salienten Referenten bezogen werden. Dies wirft die Frage auf, welche Faktoren die Salienz des Antezedenten bestimmen. Neben anderen Einflussfaktoren scheint hier insbesondere die Topikalität des Antezedenten eine große Rolle zu spielen. Unter dem Topik eines Satzes wird dabei das Element, über das der Satz eine Aussage macht, verstanden (vgl. Reinhart 1981; Lambrecht 1994). In vielen Sprachen hängt dies eng mit der grammatikalischen Rolle des Subjekts zusammen (Ariel 1990; Carminati 2002). Im Einklang mit diesen Annahmen wird er in Satz (2a) bevorzugt auf das Subjekt, also hier den Straßenfeger bezogen (Hemforth et al. 2010), während für der eine Präferenz für Nicht-Subjekt-Antezedenten beobachtet wurde (Bosch, Katz & Umbach 2017). Diese Ergebnisse werden durch die Ergebnisse anderer Studien zum Deutschen (Bouma & Hopp 2006), Englischen (Crawley, Stevenson & Kleiman 1990; Frederiksen 1981) und Finnischen (Järvikivi et al. 2005) bestätigt, in denen jeweils eine Präferenz beobachtet wurde, Personalpronomen auf Subjektantezedenten zu beziehen. Alle diese Sprachen haben gemeinsam, dass Personalpronomen die am meisten reduzierte pronominale Form darstellen, jedenfalls in der überwiegenden Anzahl syntaktischer Kontexte. Dies ist jedoch nicht in allen Sprachen der Fall, insbesondere nicht in pro-drop Sprachen, auf die wir im Folgenden eingehen. In pro-drop Sprachen wie dem Spanischen oder Italienischen können Subjekte finiter Sätze sowohl als Nullform (im Folgenden auch pro) realisiert werden, wie in dem spanischen Beispiel (2c), als auch als overtes Pronomen, wie in (2d).
224
Sarah Schimke, Saveria Colonna, Israel de la Fuente und Barbara Hemforth
(2) c. El barrendero se reunió con el cartero. Después, pro se fue al casa. d. El barrendero se reunió con el cartero. Después, él se fue al casa. Der Straßenfeger hat den Briefträger getroffen. Dann ging pro/er nach Hause. Wie nach den oben dargestellten Prinzipien zu erwarten, wurde beobachtet, dass Nullformen wie in (2c) eine Präferenz für Subjektantezedenten aufweisen (AlonsoOvalle et al. 2002; Carminati 2002; Gelormini-Lezama & Almor 2011). Wird in prodrop Sprachen dagegen eine overte Form benutzt, wie in (2d), so wird häufig angenommen, dass diese Form einen Topikwechsel signalisiert, also einen Bezug auf einen weniger salienten Antezedenten wie zum Beispiel den Briefträger in (2d) (Carminati 2002; Lujàn 1986). Tatsächlich sind die Ergebnisse zur Interpretation overter Subjektpronomen in pro-drop Sprachen jedoch gemischt: Einige Studien finden für overte Pronomen keine eindeutige Präferenz zwischen Subjekt- und Objektantezedenten (z. B. Alonso-Ovalle et al. 2002; Belletti, Bennati & Sorace 2007; Filiaci, Sorace & Carreirras 2013; Mayol 2010), während andere Studien eine Objektpräferenz festgestellt haben (Carminati 2002; de la Fuente & Hemforth 2013; Keating, Jegerski & VanPatten 2016). Festhalten lässt sich auf jeden Fall, dass sich Nullpronomen und overte Pronomen in ihren Auflösungspräferenzen unterscheiden, und dass nur das Nullpronomen eindeutig eine Subjektpräferenz zeigt. Damit scheint die Arbeitsteilung zwischen Nullform und overter Form in pro-drop Sprachen Ähnlichkeiten mit der Arbeitsteilung zwischen er und der im Deutschen zu haben. Ob diese Arbeitsteilung allerdings in verschiedenen Sprachen wirklich in gleicher Weise funktioniert, muss noch näher untersucht werden. Insbesondere wurde vorgeschlagen, dass die Subjektpräferenz von Nullformen in pro-drop Sprachen besonders stabil und weniger leicht durch andere Faktoren zu überschreiben ist als die Subjektpräferenz von Personalpronomen in nicht-pro-drop Sprachen (Carminati 2002; Jegerski, VanPatten & Keating 2011). Zusammenfassend lässt sich sagen, dass die Interpretation einer pronominalen Form in einer Sprache davon beeinflusst wird, wie reduziert die Form im Vergleich zu möglichen Alternativen ist. In Kontexten, in denen es mehrere mögliche Antezedenten für ein Pronomen gibt, wird für die jeweils reduzierteste Form typischerweise eine Präferenz für einen prominenten Antezedenten, häufig das Subjekt, beobachtet, für weniger reduzierte Formen nicht.
1.2 Studien mit L2-Lernern Im Folgenden werden wir eine Reihe von Studien vorstellen, in denen jeweils verschiedene Konstellationen von pro-drop oder nicht-pro-drop Quell- und Ziel-
L1-Einfluss und allgemeine Lernereffekte
225
sprachen untersucht wurden. Dabei fassen wir zunächst Studien zusammen, die anhand von offline Methoden das Ergebnis der pronominalen Verarbeitung, also die letztendliche Interpretation des Pronomens, erfasst haben, und kommen dann zu Studien, die die Verarbeitung direkt anhand von online Methoden untersucht haben.
1.2.1 Offline Studien Die Arbeitsteilung zwischen der Nullform und dem overten Pronomen im Italienischen wurde von Sorace & Filiaci (2006) bei Lernern mit Englisch als L1 untersucht, die das Italienische auf einem nahezu muttersprachlichen Niveau beherrschten. Sorace & Filiaci (2006) wollten die Hypothese überprüfen, dass Phänomene, die die Integration von syntaktischem und diskursbasiertem Wissen betreffen, selbst bei sehr weit fortgeschrittenen Lernern noch anders behandelt werden als bei Muttersprachlern (Schnittstellenhypothese; siehe Hopp & Schimke in diesem Band). Die Auflösung von ambigen Pronomen ist ein solches Phänomen. In ihrer Studie verwendeten sie Sätze wie (3): (3) La mamma dà un bacio alla figlia mentre pro/lei si mette il cappotto. Die Mutter gibt der Tochter einen Kuss, während pro/sie einen Mantel trägt. Die Teilnehmenden mussten auswählen, ob sich das ambige Pronomen (pro/lei) auf das vorangehende Subjekt, das vorangehende Objekt oder auf einen satzexternen Antezedenten bezog. Bei einer muttersprachlichen Kontrollgruppe zeigte sich wie erwartet eine Subjektpräferenz für das Nullpronomen und eine Objektpräferenz für das overte Pronomen. Die Lerner zeigten ebenfalls ein Subjektpräferenz für das Nullpronomen, unterschieden sich aber von den Muttersprachlern in der Interpretation des overten Pronomens. Für dieses Pronomen zeigten sie eine schwächer ausgeprägte Objektpräferenz als die Muttersprachler. Diese Ergebnisse zeigen zunächst einmal, dass die Auflösung von Pronomen auch bei sehr weit fortgeschrittenen Lernern von der Auflösung bei Muttersprachlern abweichen kann. Sorace & Filiaci (2006) vermuten außerdem, dass ein Einfluss des Englischen bei der abweichenden Interpretation eine Rolle spielt. Sie nehmen an, dass Muttersprachler des Italienischen die overte Form mit einem Topikwechsel assoziieren, und dass englischsprachige Lerner diese Assoziation deswegen nicht vollständig erwerben, weil es im Englischen keine entsprechende Assoziation zwischen overten Formen und einem Topikwechsel gibt. Eine ähnliche Schlussfolgerung wird auch von Jegerski, VanPatten & Keating (2011) gezogen, die Lerner des Spanischen mit Englisch als L1 untersuchten.
226
Sarah Schimke, Saveria Colonna, Israel de la Fuente und Barbara Hemforth
Ausgangspunkt ihrer Studie war die oben erwähnte Annahme, dass sich die Subjektpräferenz von Nullpronomen in pro-drop Sprachen weniger leicht durch andere Faktoren überschreiben lässt, als dies bei der Interpretation overter Pronomen im Englischen der Fall ist. Sie untersuchten Sätze wie (4) und (5), die sich in der Diskursbeziehung unterscheiden, die jeweils zwischen den beiden Teilsätzen besteht. (4) Jeffrey saw Ricky while he was hunting for coins in the fountain. Jeffrey sah Ricky, während er in dem Brunnen nach Münzen suchte. (5) Anita talked to her sister after she had a baby. Antia sprach mit ihrer Schwester, nachdem sie ein Kind bekommen hatte. In (4) stehen der Satz mit den Antezedenten und der Satz, der das Pronomen enthält, in einer koodinierenden Diskursbeziehung zueinander, während die Beziehung in (5) subordinierend ist (vgl. Asher & Vieu 2005). Bei englischen Muttersprachlern beobachteten Jegerski, VanPatten & Keating (2011) einen Unterschied in den Interpretationspräferenzen für Sätze vom Typ (4) im Vergleich zu Typ (5). Für Satz (4) wurde das Subjekt gegenüber dem Objekt deutlich präferiert, während die Präferenzen für Satz (5) nahezu ausgeglichen waren. Die Diskursbeziehung zwischen den Teilsätzen beeinflusst also, ob das vorangehende Subjekt präferiert wird. Interessanterweise zeigte sich kein derartiger Effekt in den Interpretationspräferenzen spanischer Muttersprachler für spanische Übersetzungsäquivalente von Sätzen wie (4) und (5). Stattdessen zeigten spanische Muttersprachler eine Subjektpräferenz in beiden Sätzen, wenn he/she mit einem Nullpronomen übersetzt wurde, und etwa gleich viele Subjekt- wie Objektinterpretationen, wenn he/she mit einem overten Pronomen übersetzt wurde. Die Beobachtung, dass die Diskursstruktur bei den spanischen Muttersprachlern keinen Einfluss hatte, steht im Einklang mit der oben erwähnten Annahme, dass die Subjektpräferenz von Nullpronomen in pro-drop Sprachen besonders stabil ist. Schließlich untersuchten Jegerski, VanPatten & Keating (2011) englischsprachige Lerner des Spanischen auf einem mittleren Fertigkeitsniveau. Diese Lerner machten keinen Unterschied zwischen dem Nullpronomen und dem overten Pronomen. Darüber hinaus zeigten sie die gleichen Interpretationspräferenzen wie englische Muttersprachler im Englischen: Sie bezogen beide Pronomen auf das vorangehende Subjekt, wenn eine koodinierende Diskursbeziehung vorlag, und zu gleichen Teilen auf das Subjekt und Objekt, wenn eine subordinierende Diskursbeziehung vorlag. Jegerski, VanPatten & Keating (2011) schließen, dass Lerner Interpretationsstrategien aus der L1 auf die L2 übertragen. Sowohl die Ergebnisse von Sorace & Filiaci (2006) als auch die von Jegerski, VanPatten & Keating (2011) sind mit der Annahme kompatibel, dass die L1 die
L1-Einfluss und allgemeine Lernereffekte
227
Interpretation von Pronomen beeinflusst. Allerdings hat keine der beiden Studien eine zweite Gruppe mit einer anderen L1 untersucht. Aus diesem Grund kann auch eine alternative Erklärung nicht ausgeschlossen werden: Es ist möglich, dass die beobachteten Interpretationsmuster nicht auf die L1 zurückgehen, sondern auf einen allgemeinen Lernereffekt. Möglicherweise bevorzugen L2-Lerner bei der Pronomeninterpretation grundsätzlich diskurssaliente Antezedenten. Bei Lernern mit einer nicht-pro-drop L1 lassen sich diese beiden Erklärungen kaum voneinander trennen, da auch in der L1 diskurssaliente Referenten bevorzugt werden. Es ist deswegen interessant, zu überprüfen, wie sich Lerner verhalten, die eine prodrop L1 haben und eine nicht-pro-drop L2 erwerben. Schimke & Colonna (2016) führten eine solche Studie durch. Sie untersuchten ähnlich wie Jegerski,VanPatten & Keating (2011), ob diskursstrukturelle Faktoren Auflösungspräferenzen für ambige Pronomen beeinflussen. Dabei konzentrierten sie sich auf Lerner der nicht-pro-drop Sprache Französisch, deren L1 die pro-drop Sprache Türkisch war. Unter anderem untersuchten sie die Interpretation impliziter Subjekte nicht-finiter Nebensätze (PRO), wie in (6). (6) Pierre a giflé Jean PRO étant jeune. Peter hat geschlagen Jan PRO jung seiend ‚Peter hat Jan geschlagen, als er jung war.‘ Für implizite Subjekte dieser Art wird angenommen, dass sie in verschiedenen Sprachen bevorzugt auf das vorangehende Subjekt bezogen werden, und dass diese Tendenz nur selten durch andere Faktoren überschrieben wird (Haspelmath 1995). Schimke & Colonna (2016) verglichen die Interpretationspräferenzen für Sätze vom Typ (6) mit den Präfenzen für Sätze vom Typ (7): (7) Pierre, Jean l′a giflé PRO étant jeune. Peter, Jan ihn hat geschlagen PRO jung seiend ‚Was Peter betrifft, Jan hat ihn geschlagen, als er jung war.‘ In Satz (7) ist der erstgenannte Referent nicht das Subjekt, sondern das Objekt. Es wird angenommen, dass eine solche Voranstellung des Objekts zu einer höheren Diskurssalienz des Referenten führt. Wenn muttersprachliche Interpretationspräferenzen aber hauptsächlich von der grammatikalischen Rolle bestimmt werden, dann sollte diese größere Diskurssalienz des Objektreferenten die Interpretationspräferenzen nicht wesentlich beeinflussen. Tatsächlich bevorzugten muttersprachliche Sprecher des Französischen sowohl für Satz (6) als auch für Satz (7) jeweils den Subjektantezedenten, also Pierre in Satz (6), aber Jean in Satz (7). In vergleichbaren Konstruktionen im Türkischen bevorzugten türkische
228
Sarah Schimke, Saveria Colonna, Israel de la Fuente und Barbara Hemforth
Muttersprachler ebenfalls jeweils den Subjektantezedenten. Türkische Lerner des Französischen dagegen bevorzugten in Satz (7) das Objekt. Dies lässt sich so erklären, dass die Diskurssalienz des erstgenannten Referenten für die Lerner einen stärkeren Einfluss hat als die grammatikalische Rolle. Die Tatsache, dass dieser Effekt ausschließlich in der Lernergruppe gefunden wurde, spricht dafür, dass er nicht auf einen L1-Einfluss zurückgeht. Das Ergebnis spricht also dafür, dass es bei der Interpretation von Pronomen allgemeine Lernereffekte geben kann, und dass sich diese in einer besonderen Sensitivität gegenüber Diskursfaktoren äußern können. Allerdings ist die hier untersuchte Konstruktion nicht direkt mit den in den vorherigen Studien untersuchen Konstruktionen vergleichbar. Eine besser mit den vorherigen Studien vergleichbare Untersuchung kommt von Sorace et al. (2009). Sie untersuchten bilinguale Kinder und Jugendliche, deren Erstsprachen entweder Englisch und Italienisch oder Italienisch und Spanisch waren. Durch einen Vergleich dieser beiden Konstellationen lässt sich überprüfen, ob mögliche Abweichungen in Interpretationspräferenzen im Vergleich zu monolingualen Kindern dadurch beeinflusst werden, ob die zweite L1 eine pro-drop-Sprache ist oder nicht. Die Aufgaben, die die Kinder bearbeiteten, entsprachen denen von Sorace & Filiaci (2006) in der oben vorgestellten Studie. Die Ergebnisse zeigten keine Unterschiede in der Interpretation des Nullpronomens, das von allen teilnehmenden Gruppen auf den Subjektantezedenten bezogen wurde. Bilinguale Kinder unterschieden sich dagegen von gleichaltrigen monolingualen Kindern darin, dass sie, wie die Lerner in Sorace & Filiaci (2006), overte Pronomen relativ häufig ebenfalls auf Subjektantezedenten bezogen. Dabei gab es keinerlei Einfluss der anderen L1, das heißt, englisch-italienische Kinder zeigten dieses Muster ebenso wie spanisch-italienische Kinder. Auf der Grundlage dieser neuen Ergebnisse schlägt Sorace (2011, 2016) vor, dass cross-linguistischer Einfluss vermutlich eine weniger große Rolle bei der Pronomenauflösung durch mehrsprachige Sprecher spielt als häufig angenommen. Sie vermutet, dass für bilinguale Sprecher eine generelle Präferenz, (alle) Pronomen auf saliente Antezedenten zu beziehen, ein höheres Gewicht hat als formspezifische Präferenzen. Außerdem vermutet sie, dass diese Tendenz sowohl kindliche als auch erwachsene Lerner einer L2 betrifft (siehe Sorace 2016, für eine ausführliche Diskussion). Eine weitere Studie, die sich mit dem Erwerb der Arbeitsteilung zwischen verschiedenen pronominalen Formen in einer L2 beschäftigt, kommt von Bryant & Noschka (2015). Sie präsentierten deutschen Muttersprachlern sowie Lernern des Deutschen mit den pro-drop Erstsprachen Türkisch oder Persisch Sätze vom Typ (8a) und (8b). (8) a. Ralf fährt mit seinem Opa zum Angeln. Er freut sich schon. b. Ralf fährt mit seinem Opa zum Angeln. Dieser freut sich schon.
L1-Einfluss und allgemeine Lernereffekte
229
Während Muttersprachler das Pronomen er auf das Subjekt (Ralf) bezogen und das Demonstrativpronomen dieser auf den zweitgenannten Referenten (der Opa), zeigten Lerner eine Tendenz, beide Formen auf das Subjekt zu beziehen. Dies unterstreicht nicht nur die Schwierigkeit, die Arbeitsteilung zu erwerben, sondern auch, dass eine Präferenz für (diskurssaliente) erstgenannte Subjekte eine DefaultPräferenz bei Lernern darstellen kann. Bryant & Noschka (2015) betonen jedoch, dass auch ein Einfluss der L1 nicht ausgeschlossen werden kann. Insbesondere postulieren sie, dass in Konstruktionen wie (8) in pro-drop Sprachen auch für overte Pronomen eine Subjektpräferenz zu erwarten wäre (siehe Bryant & Noschka 2015, für eine ausführlichere Erläuterung dieser Annahme). Die Gesamtheit der bisher vorgestellten offline Ergebnisse lässt sich nur erklären, wenn man annimmt, dass neben einem eventuellen L1-Einfluss auch allgemeine Lernereffekte eine Rolle spielen. Insbesondere scheinen Lerner auf der einen Seite Diskusfaktoren stärker zu gewichten als (monolinguale) Muttersprachler (Jegerski, VanPatten & Keating 2011; Schimke & Colonna 2016). Auf der anderen Seite scheinen sie weniger Unterschiede zwischen verschiedenen pronominalen Formen der Zielsprache zu machen, als Muttersprachler dies tun (Bryant & Noschka 2015; Jegerski,VanPatten & Keating 2011; Sorace & Filiaci 2006; Sorace et al. 2009). Diese Beobachtungen schließen natürlich nicht aus, dass die L1 bei den Ergebnissen von Sorace & Filiaci (2006), Jegerski, VanPatten & Keating (2011) und Bryant & Noschka (2015) eine Rolle spielte. Die Studien unterscheiden sich in Eigenschaften der untersuchten Populationen, und ähnliche Ergebnisse könnten in verschiedenen Gruppen auf unterschiedliche Ursachen zurückgehen. Schließlich können wir auf Grundlage der bisher vorgestellten Studien nicht sicher wissen, ob bestimmte Strategien erst durch die experimentelle Aufgabe ausgelöst wurden. In allen Studien wurden die Teilnehmenden vor eine explizite Wahl zwischen möglichen Antezedenten eines Pronomens gestellt. Es ist also möglich, dass die Teilnehmenden andere Präferenzen gezeigt hätten, wenn ihnen die Ambiguität nicht bewusst gemacht worden wäre. Außerdem ist es möglich, dass den beobachteten endgültigen Entscheidungen Verarbeitungsstadien vorausgingen, in denen andere Faktoren eine Rolle spielten. Um die gesamte Verarbeitung zu untersuchen und um einen Einfluss der bewussten Aufmerksamkeit auszuschließen, müssen offline Verfahren durch online Verfahren ergänzt werden. Im nächsten Abschnitt werden entsprechende Studien vorgestellt.
1.2.2 Online Studien Studien zur online Verarbeitung pronominaler Formen in einer L2 haben entweder Eyetracking während des Lesens oder Visual World Eyetracking angewandt (siehe
230
Sarah Schimke, Saveria Colonna, Israel de la Fuente und Barbara Hemforth
Hopp & Schimke in diesem Band). Die in Felser (in diesem Band) näher dargestellten Untersuchungen zum Lesen von Reflexiv- und Personalpronomen zeigen dabei, dass L2-Lerner häufig diskursbasierte Informationen stärker gewichten als syntaktische Beschränkungen, selbst wenn sie schließlich zu einer Interpretation kommen, die der muttersprachlichen Interpretation entspricht. Diese unterschiedliche Gewichtung wurde dabei sowohl bei Lernern beobachtet, deren L1 sich in den relevanten Eigenschaften von der L2 unterschied, als auch bei Lernern, bei denen das nicht der Fall war. Dies spricht dafür, dass eine generelle Tendenz, Diskursinformationen stark zu gewichten, nicht nur, wie oben zusammengefasst, offline eine Rolle spielt, sondern insbesondere auch während der Verarbeitung. Allerdings spielten die oben besprochenen Unterschiede zwischen pro-drop und nicht-pro-drop Sprachen in diesen Untersuchungen keine Rolle. Eine Studie von Roberts, Gullberg & Indefrey (2008) verglich dagegen die Auflösung ambiger Personalpronomen bei Lernern mit einer pro-drop L1 (Türkisch) und Lernern mit einer nicht-pro-drop L1 (Deutsch). Die beiden Gruppen unterschieden sich dabei nicht in ihrer Sprachfertigkeit. Die Zielsprache war eine nicht-pro-drop Sprache, Niederländisch. Die experimentellen Materialien bestanden aus Sätzen wie (9). (9) a. Peter en Hans zitten in het kantoor. Terwijl Peter aan het werk is, eet hij een boterham. Peter und Hans sitzen im Büro. Während Peter arbeitet, isst er ein Brot. In einer offline Aufgabe sollten die Teilnehmenden entscheiden, auf welchen Antezedenten sich das Pronomen (hij) bezog. Während sowohl die niederländischen Muttersprachler als auch die deutschsprachigen Lerner des Niederländischen das Pronomen in mehr als 90 % der Fälle auf das Subjekt desselben Satzes, Peter, bezogen, entschieden sich die türkischsprachigen Lerner in 45 % der Fälle für den satzexternen Referenten, Hans. Roberts, Gullberg & Indefrey (2008) führen dies auf einen Einfluss des Türkischen zurück, in dem nach den oben besprochenen Prinzipien das overte Pronomen bevorzugt nicht auf das Subjekt desselben Satzes bezogen wird. In einer weiteren experimentellen Aufgabe lasen die Probanden Sätze, während ihre Augenbewegungen erfasst wurden (Eyetracking während des Lesens). Das Ziel war, zu untersuchen, ob sich der Einfluss der L1 auch während des Lesens zeigt. Dazu wurde Satz (9a) um die Varianten (9b) und (9c) ergänzt, die jeweils eine Interpretation zum satzinternen (9b) oder satzexternen (9c) Antezedenten erzwingen.
L1-Einfluss und allgemeine Lernereffekte
231
(9) b. De werknemers zitten in het kantoor. Terwijl Peter aan het werk is, eet hij een boterham. Die Angestellten sitzen im Büro. Während Peter arbeitet, isst er ein Brot. c. De werknemers zitten in het kantoor. Terwijl Peter aan het werk is, eten zij een boterham. Die Angestellten sitzen im Büro.Während Peter arbeitet, essen sie ein Brot. Die Ergebnisse zeigten keinen Unterschied in den Lesemustern zwischen den beiden Lernergruppen. Insbesondere unterschieden sich die Lesezeiten auch dann nicht, wenn das satzinterne Subjekt der einzig mögliche Antezedent war (9b), obwohl diese Option durch die türkischsprachigen Lerner offline wesentlich seltener gewählt wurde als durch die deutschsprachigen Lerner. Stattdessen benötigten beide Lernergruppen mehr Zeit, um das Pronomen und das vorangehende Verb zu lesen, wenn das Pronomen ambig war,wie in (9a), als wenn es einen eindeutigen Antezedenten hatte, wie in (9b) und (9c). Dies war bei der niederländischen Kontrollgruppe nicht der Fall. Roberts, Gullberg & Indefrey (2008) schlossen aus diesen Ergebnissen, dass sich L2-Lerner im Allgemeinen und unabhängig von der L1 in der online Auflösung von Ambiguitäten von Muttersprachlern unterscheiden, und zwar in der Hinsicht, dass ambige Strukturen generell zu einer langsameren Verarbeitung führen. Dieser allgemeine Lernereffekt scheint einen möglichen Einfluss der L1 während der online Verarbeitung zu überlagern. Bei der Interpretation der Ergebnisse von Roberts, Gullberg & Indefrey (2008) muss berücksichtigt werden, dass Lesezeiten ein relativ indirektes Maß für Interpretationspräferenzen sind. Andere Studien verwenden stattdessen das Visual World-Paradigma, bei dem Blicke auf den Antezedenten nach Beginn des Pronomens erfasst werden können (vgl. Hopp & Schimke in diesem Band). Es ist gut etabliert, dass diese Blicke ein schnelles und direktes Maß der Sprachverarbeitungsprozesse und insbesondere der Interpretationspräferenzen für das Pronomen sind. Ellert (2011) untersuchte L2-Lerner, deren L1 und L2 ein sehr ähnliches pronominales System haben, nämlich niederländischsprachige Lerner des Deutschen (sowie deutschsprachige Lerner des Niederländischen, siehe Ellert 2011). Ellert (2011) untersuchte die Interpretation der Pronomen er und der in Sätzen wie (10). (10) Der Schrank ist schwerer als der Tisch. Er/Der stammt aus einem Möbelgeschäft in Belgien. Deutsche Muttersprachler zeigten eine Präferenz für den erstgenannten Antezedenten (der Schrank) für er, und für den zweitgenannten (der Tisch) für der. Diese
232
Sarah Schimke, Saveria Colonna, Israel de la Fuente und Barbara Hemforth
Ergebnisse zeigten sich sowohl in einem offline Fragebogen als auch in der online Visual World-Aufgabe. Eine Kontrollgruppe niederländischer Muttersprachler zeigte das gleiche Muster in niederländischen Übersetzungsäquivalenten. Die Lerner des Deutschen mit Niederländisch als L1 dagegen bezogen beide pronominale Formen sowohl offline als auch online auf den erstgenannten Antezedenten. Ähnlich wie die von Sorace & Filiaci (2006), Jegerski,VanPatten & Keating (2011) und Bryant & Noschka (2015) untersuchten Lerner machten diese Lerner also keinen Unterschied zwischen zwei pronominalen Formen der Zielsprache und schienen sich stattdessen auf eine Default-Präferenz für Subjektantezedenten zu verlassen. Post-hoc-Analysen zeigten, dass dieser Effekt dabei vor allem von Lernern auf einem mittleren Niveau der Sprachfertigkeit getragen wurde, während weiter fortgeschrittene Lerner die beiden Formen differenzierten. Da Ellert (2011) nicht Lerner zweier verschiedener L1 in derselben L2 untersucht hat, lassen sich aus ihren Daten keine direkten Schlüsse über L1-Einfluss ziehen. Insgesamt lässt sich also zusammenfassen, dass es bisher in online Studien keine eindeutige Evidenz für einen Einfluss der L1 gibt: Roberts, Gullberg & Indefrey (2008) beobachten L1-Einfluss offline, aber nicht online, und auch die Ergebnisse der anderen bisher zusammengefassten online Studien weisen auf allgemeine Lernereffekte hin, nicht aber auf L1-Einflüsse. Allerdings waren auch nicht alle Studien auf die Untersuchung möglicher L1-Einflüsse ausgerichtet. Im folgenden Teil dieses Kapitels soll eine weitere Dimension vorgestellt werden, in der es zwischensprachliche Unterschiede gibt, und die daher einen guten Ausgangspunkt darstellt, um L1-Effekte weiter zu untersuchen.
2 Pronomenauflösung im Kontext alternativer Konstruktionen Im Abschnitt 1.1 haben wir zwischensprachliche Unterschiede in der Auflösung ambiger Pronomen besprochen. Dabei haben wir gezeigt, dass es innerhalb einzelner Sprachen eine Arbeitsteilung zwischen verschiedenen pronominalen Formen geben kann, und dass es Variabilität in der Ausprägung solcher Arbeitsteilungen zwischen Sprachen gibt. Offen gelassen haben wir die Frage, wie variabel die aus der Arbeitsteilung resultierenden Antezedentenpräferenzen innerhalb einer bestimmten Sprache sind: Sind bestimmte Präferenzen fest mit bestimmten pronominalen Formen verknüpft, oder variiert die Arbeitsteilung in verschiedenen Kontexten? Einerseits gibt es durchaus Evidenz für eine enge Verknüpfung zwischen bestimmten Antezedenten-Präferenzen und bestimmten pronominalen Formen.
L1-Einfluss und allgemeine Lernereffekte
233
Das zeigt sich insbesondere darin, dass sich einzelne Formen auf bestimmte Eigenschaften von Antezedenten „spezialisieren“, so dass zum Beispiel bei der Auflösung von Personalpronomen besonders die grammatikalische Rolle eines Antezedenten eine Rolle spielt, bei Demonstrativpronomen aber eher die Wortstellung (Kaiser & Trueswell 2008). Derartige Beobachtungen können gut erklärt werden, wenn man von einer formspezifischen Präferenz für bestimmte Typen von Antezedenten ausgeht. Auf der anderen Seite können auch formspezifische Präferenzen in bestimmten Kontexten überschrieben werden, zum Beispiel durch semantische Faktoren oder durch den Einfluss von Diskursrelationen (Kehler et al. 2008; de la Fuente 2015). Außerdem scheinen die Präferenzen, die mit einzelnen Formen verknüpft sind, unterschiedlich stark ausgeprägt zu sein, je nachdem, wie zugänglich alternative Formen für die Probanden während der Verarbeitung sind. So zeigten de la Fuente & Hemforth (2013), dass spanische Nullpronomen und overte Pronomen nur dann die jeweils typischerweise mit diesen Formen assoziierten Antezedentenpräferenzen zeigten, wenn beide Formen im gleichen Experiment präsentiert wurden. Wurden dagegen die gleichen Materialien nur mit der Nullform präsentiert, so dass das overte Pronomen in dem Experiment gar nicht vorkam, resultierte eine ungefähr gleich häufige Wahl von Subjekt- und Objektantezedenten (siehe auch Colonna et al. 2016, für sehr ähnliche Ergebnisse für die französischen Formen il und lui, il). Dies spricht dafür, dass die Antezedentenpräferenzen nicht so stabil sind, wie häufig vermutet wurde. Sprecher scheinen in einzelnen Situationen jeweils neu einzuschätzen, welche alternativen Formen in diesem Kontext hätten benutzt werden können, und dies scheint die Interpretationspräferenzen zu beeinflussen. Im Folgenden stellen wir Ergebnisse zu der Rolle alternativer nicht-ambiger Konstruktionen vor, die in eine ähnliche Richtung weisen. Diese Ergebnisse zeigen zwischensprachliche Unterschiede auf einer lokaleren Ebene als die oben besprochene Unterscheidung zwischen pro-drop und nicht-pro-drop Sprachen.
2.1 Studien zu Muttersprachlern Hemforth et al. (2010) führten eine Studie mit deutschen, französischen und englischen Muttersprachlern durch, in der sie die Auflösung ambiger Subjektpronomen in Nebensätzen untersuchten, die mit der Subjunktion bevor (avant que/before) eingeleitet waren. Da die Ergebnisse für das Englische im Folgenden nicht relevant sind, konzentrieren wir uns hier auf das Deutsche und Französische. Überprüft wurden Sätze wie (11a) und das französische Übersetzungsäquivalent (11b).
234
Sarah Schimke, Saveria Colonna, Israel de la Fuente und Barbara Hemforth
(11) a. Der Straßenfeger hat den Briefträger getroffen, bevor er nach Hause ging. b. Le balayeur a rencontré le facteur avant qu′il rentre à la maison. Diese Sätze wurden Probanden in einem Fragebogen präsentiert, und es wurde erhoben, wie sie das Pronomen (er/il) interpretierten. Außerdem wurde eine weitere Version der Sätze erstellt, in denen das Ende des Satzes so verändert wurde, dass es eine Interpretation des Pronomens zum Subjekt- oder zum Objektantezedenten nahelegte (vgl. Satz 12). (12) a. Der Straßenfeger hat den Briefträger getroffen, bevor er seine Briefe/ seinen Besen geholt hat. b. Le balayeur a rencontré le facteur avant qu′il apporte ses lettres/son balai. Hemforth et al. (2010) verwendeten das Visual World-Paradigma, um die Präferenzen zu untersuchen, die Probanden in der Zeitspanne zwischen dem Beginn des Pronomens und dem Beginn der disambiguierenden Informationen entwickelten. Sie verwendeten also Bilder, auf denen die beiden möglichen Antezedenten des Pronomens dargestellt waren (vgl. Abbildung 1 für Satz 12).
Abbildung 1: Display in der Studie von Hemforth et al. (2010)
Deutsche Muttersprachler zeigten sowohl in dem offline Fragebogen als auch in den Augenbewegungen eine Subjektpräferenz für er. Da das Deutsche eine nicht-pro-drop Sprache ist und er somit die in diesem Kontext maximal reduzierte Form, ist dieses Ergebnis nicht überraschend. Überraschend ist jedoch, dass französische Muttersprachler für das Pronomen il den Objektantezedenten präferierten, sowohl offline als auch online, obwohl das Französische auch eine nichtpro-drop Sprache ist. Hemforth et al. (2010) erklären dies damit, dass es im Französischen eine alternative nicht-finite Konstruktion gibt, in der sich das im-
L1-Einfluss und allgemeine Lernereffekte
235
plizite Subjekt des Nebensatzes (PRO) eindeutig auf das Subjekt das Hauptsatzes bezieht, wie in (13). Im Deutschen ist so eine Konstruktion hier nicht möglich. (13) Le balayeur a rencontré le facteur avant de PRO rentrer à la maison. Der Straßenfeger hat den Briefträger getroffen, bevor PRO nach Hause gehen. ‚Der Straßenfeger hat den Briefträger getroffen, bevor er nach Hause ging.‘ Es ist plausibel, dass die französischen Muttersprachler il in mit avant que eingeleiteten Nebensätzen anders interpretieren als in anderen Kontexten, weil sie eine Arbeitsteilung zwischen der nicht-ambigen infinitiven Konstruktion und der finiten Konstruktion mit dem overten Pronomen annehmen. Die alternative Konstruktion könnte insbesondere deswegen einen so starken Einfluss ausüben, weil sie nicht ambig ist und daher eine besonders gute Alternative darstellt, um Referenz auf das Subjekt auszudrücken. Diese Ergebnisse legen den Schluss nahe, dass Antezedentenpräferenzen nicht unauflöslich mit einzelnen pronominalen Formen verknüpft sind. Stattdessen scheinen derartige Verknüpfungen überschrieben werden zu können, unter anderem durch lokal verfügbare alternative Konstruktionen. Eine interessante Frage ist, wie Sprecher von pro-drop Sprachen Nullpronomen und overte Pronomen im Kontext nicht-ambiger alternativer Konstruktionen interpretieren, denn im Fall einer pro-drop Sprache liegen dann potentiell drei parallele Konstruktionen vor. Wie in (14a-c) illustriert, ist dies zum Beispiel im Spanischen der Fall. (14) a. Nullsubjekt, finiter Nebensatz: El barrendero se reunió con el cartero antes de que pro trajera sus cosas. Der Straßenfeger hat den Brieträger getroffen, bevor pro seine Sachen holte. b. Overtes Subjekt, finiter Nebensatz: El barrendero se reunió con el cartero antes de que él trajera sus cosas. Der Straßenfeger hat den Brieträger getroffen, bevor er seine Sachen holte. c. Nullsubjekt, nicht-finiter Nebensatz: El barrendero se reunió con el cartero antes de PRO traer sus cosas. Der Straßenfeger hat den Brieträger getroffen, bevor PRO seine Sachen holte. Insbesondere für die finite Konstruktion mit Nullpronomen (14a) erscheinen mindestens zwei Interpretationsmöglichkeiten plausibel. Einerseits könnte die übliche Arbeitsteilung mit dem overten Pronomen zu einer Subjektpräferenz führen, andererseits könnte die Existenz der eindeutigen infiniten Alternative
236
Sarah Schimke, Saveria Colonna, Israel de la Fuente und Barbara Hemforth
dazu führen, dass auch das Nullpronomen auf den Objektantezedenten bezogen wird. Um herauszufinden, welche dieser Möglichkeiten den tatsächlichen Präferenzen entspricht, führten Schimke et al. (2015, eingereicht) eine Fragebogenstudie mit spanischen Muttersprachlern durch, in der Interpretationspräferenzen für (14a) und (14b) erhoben wurden. Die Ergebnisse zeigten in diesem Kontext sowohl für das Nullpronomen als auch für das overte Pronomen eine Objektpräferenz. Die alternative Konstruktion in (14c) scheint hier also die im Spanischen im Allgemeinen geltende Arbeitsteilung zwischen Nullpronomen und overten Pronomen so weit zu überschreiben, dass das Nullpronomen keine Subjektpräferenz zeigt (siehe Baumann, Hemforth & Konieczny 2014, für ähnliche Ergebnisse zum Portugiesischen). Zusammenfassend lässt sich sagen, dass lokale Alternativen einen starken Einfluss auf die Pronomeninterpretation haben können. Bei mit bevor (avant que/ antes de que) eingeleiteten Sätzen führt dies dazu, dass deutsche und französische Muttersprachler unterschiedliche Interpretationspräferenzen haben, obwohl sich die Interpretationspräferenzen für overte Pronomen außerhalb dieses Kontexts in den beiden Sprachen ähneln. Französische und spanische Muttersprachler zeigen beide in diesem Kontext eine Objektpräferenz für overte Pronomen, obwohl sie außerhalb dieses Kontexts unterschiedliche Interpretationspräferenzen für diese Form haben. Tabelle 1 fasst die Eigenschaften der drei Sprachen in diesem Kontext noch einmal zusammen. Tabelle 1: Eigenschaften der drei untersuchten Sprachen für ambige Pronomen in mit bevor/avant que/antes de que eingeleiteten temporalen Nebensätzen. Sprache
Typ
Alternative Konstruktion
Antezedentenpräferenz
Deutsch Französisch Spanisch
nicht-pro-drop nicht-pro-drop pro-drop
nein ja ja
Subjekt Objekt Objekt
Im folgenden Abschnitt werden zwei Studien vorgestellt, die diese Konfiguration ausnutzen, um die L2-Pronomenverarbeitung zu untersuchen.
2.2 Studien mit Lernern Zwei Studien haben untersucht, wie L2-Lerner Pronomen in Konstruktionen auflösen, in denen die Verfügbarkeit alternativer Konstruktionen in der L1 und L2 jeweils unterschiedlich ist.
L1-Einfluss und allgemeine Lernereffekte
237
In einer ersten Studie haben Hemforth, Blumenstock-Farges & Isel (2010) sehr weit fortgeschrittene Lerner des Französischen mit Deutsch als L1 untersucht. Dabei wurden die gleichen Materialien und experimentellen Aufgaben wie in der im letzten Abschnitt vorgestellten Studie mit Muttersprachlern verwendet (vergl. Sätz 11 und 12). Die Autoren stellten die Fragen, ob deutschsprachige Lerner des Französischen die in diesem spezifischen Kontext im Französischen beobachtete Objektpräferenz offline oder online zeigen, und welche weiteren Faktoren die Ergebnisse eventuell beeinflussen. Für die letzte Frage erfassten sie insbesondere die Sprachfertigkeit und die Arbeitsgedächtniskapazität ihrer Versuchsteilnehmer sowie eine Reihe von Daten zu ihrer Sprachbiographie und ihrem aktuellen Gebrauch des Deutschen und Französischen. Alle Teilnehmer waren sehr weit fortgeschrittene Lerner, die in den meisten Fällen seit vielen Jahren in Frankreich lebten. Die Ergebnisse zeigten, dass die Lerner insgesamt eine Subjektpräferenz zeigten, die jedoch offline deutlich stärker ausgeprägt war als online. Online zeigten die Lerner unmittelbar nach Beginn des Pronomens eine Präferenz für den Objektantezedenten, die sich dann erst nach einer gewissen Zeit in eine leichte Präferenz für den Subjektantezedenten umkehrte. Dies steht im Kontrast zu der eindeutigen Objektpräferenz, die französische Muttersprachler sowohl online als auch offline zeigten. Die offline beobachtete Subjektpräferenz war bei den Lernern schwächer ausgeprägt, die besonders viel Französisch sprachen, während die online Daten nicht signifikant von weiteren Einflussfaktoren beeinflusst wurden. Online zeigten die Lerner also ein Verhalten, das zwischen der Präferenz in der L1 (deutliche Subjektpräferenz) und der Präferenz in der Zielsprache (deutliche Objektpräferenz) liegt. Dies könnte so interpretiert werden, dass ein graduelles Umschwenken von der L1- zur Zielpräferenz stattfindet. Allerdings hätte diese Interpretation einen Einfluss der Sprachfertigkeit oder der Aufenthaltsdauer wahrscheinlich erscheinen lassen, die nicht beobachtet wurden. Ob eine Veränderung der Subjektpräferenz beobachtet werden könnte, wenn Lernende mit einer größeren Spanne an Sprachfertigkeit untersucht werden, werden weitere Studien zeigen müssen. In jedem Fall bestätigen diese Ergebnisse, dass auch sehr weit fortgeschrittene Lerner von muttersprachlichen Präferenzen in der Pronomeninterpretation abweichen können. Im Vergleich zu den ebenfalls weit fortgeschrittenen Lernern in den Studien von Sorace & Filiaci (2006) und Ellert (2011) unterscheiden sich die Präferenzen der hier untersuchten Lerner sogar auffällig stark von muttersprachlichen Präferenzen. Es ist möglich, dass auf nur lokal verfügbaren Alternativen beruhende Präferenzen besonders schwer zu erwerben sind. Dies könnte daran liegen, dass ein langer Kontakt zur Zielsprache nötig ist, um genug Wissen über die jeweils verfügbaren Alternativen und ihre Frequenz zu haben (zur Rolle der Frequenz, siehe Hemforth et al. 2010). Andererseits könnte auch das Be-
238
Sarah Schimke, Saveria Colonna, Israel de la Fuente und Barbara Hemforth
rücksichtigen von Alternativen im Allgemeinen für L2-Lerner besonders herausfordernd sein (vgl. Robenalt & Goldberg 2016). Eine weitere offene Frage ist, welche Faktoren die offline und online beobachtete Subjektpräferenz der Lerner verursachten. Sie könnte, wie von den Autoren angenommen, einen L1-Einfluss widerspiegeln, sie könnte aber auch auf eine lernerspezifische Default-Präferenz für (saliente) Subjektantezedenten zurückgehen. Um diese beiden Möglichkeiten zu trennen, ist es nötig, weitere Kombinationen aus Quell- und Zielsprachen zu untersuchen. In einer zweiten Studie haben Schimke et al. (2015, eingereicht) daher Lerner des Deutschen mit den Erstsprachen Französisch und Spanisch untersucht und dabei wiederum die gleichen Materialien wie in (11) und (12), diesmal in der Zielsprache Deutsch, verwendet. Für die online Aufgabe wurde dabei ein zusätzliches Adverbial eingefügt (sehr schnell in Satz 15), um die ambige Region zu verlängern und so auch sich eventuell vergleichsweise langsam entwickelnde Präferenzen von Lernern erfassen zu können. (15) Der Straßenfeger hat den Briefträger getroffen, bevor er sehr schnell seine Briefe/seinen Besen geholt hat. Wie in der Studie von Hemforth, Blumenstock-Farges & Isel (2010) erhoben auch Schimke et al. (2015, eingereicht) weitere Informationen über die Lerner. Insbesondere wurde sichergestellt, dass sich die spanisch- und französischsprachigen Lerner nicht in ihrer Sprachfertigkeit voneinander unterschieden. Auf Grundlage der muttersprachlichen Interpretationspräferenzen in diesem spezifischen Kontext und im Spanischen und Französischen im Allgemeinen erscheinen mehrere Vorhersagen für das Verhalten der beiden Lernergruppen möglich (vgl. auch Tabelle 1). Die Lerner könnten die Zielpräferenz im Deutschen erworben haben oder auf eine allgemeine Default-Präferenz für Subjektantezedenten zurückgreifen. In beiden Fällen sollten sie eine Subjektpräferenz für er zeigen. Sollten die Lerner die Interpretationspräferenzen für diese spezifische Konstruktion direkt aus ihrer L1 in die L2 übertragen, sollten beide Gruppen eine Objektpräferenz zeigen. Schließlich ist es auch möglich, dass nicht die Präferenzen in diesem spezifischen Kontext, sondern die allgemeinen Antezedentenpräferenzen overter Pronomen im Spanischen und Französischen die Auflösung in der L2 beeinflussen. Dies sollte zu einer Subjektpräferenz für die französischsprachigen Lerner, aber zu einer Objektpräferenz oder keiner spezifischen Präferenz bei den spanischsprachigen Lernern führen. Die Ergebnisse zeigten für beide Lernergruppen offline eine deutliche Subjektpräferenz. Diese war bei den französischsprachigen Lernern marginal stärker ausgeprägt als bei den spanischsprachigen Lernern. Online dagegen zeigten nur
L1-Einfluss und allgemeine Lernereffekte
239
die französischsprachigen Lerner eine Subjektpräferenz nach Beginn des ambigen Pronomens, wohingegen die spanischsprachigen Lerner gleich oft den Subjektantezedenten betrachteten wie den Objektantezedenten. Es gab keinen Einfluss der weiteren erhobenen Variablen auf diese Ergebnisse. Diese Ergebnisse sprechen für einen Einfluss der L1 auf einem allgemeinen, konstruktionsunabhängigen Niveau, und zwar auch und vor allem während der online Verarbeitung. Die französischsprachigen und spanischsprachigen Lerner scheinen bei der Verarbeitung des ambigen Pronomens im Deutschen die in ihrer L1 jeweils mit overten Formen assoziierten generellen Antezedentenpräferenzen anzuwenden. Ein Einfluss der Präferenzen in der spezifischen Konstruktion ließ sich dagegen nicht feststellen. Insgesamt ergeben die Ergebnisse der beiden Studien ein konsistentes Bild. Auf der einen Seite zeigen alle drei untersuchten Lernergruppen offline eine Subjektpräfenz, die bei den weniger fortgeschrittenen Lernern des Deutschen geringer ausgeprägt war als bei den Lernern des Französischen. Im Licht der Ergebnisse aus der online Verarbeitung erscheint es wahrscheinlich, dass diese offline Ergebnisse wenigstens teilweise dadurch beeinflusst wurden, dass die Teilnehmenden eine explizite Entscheidung über den Antezedenten des Pronomens treffen mussten. Anscheinend macht es die explizite Aufgabe wahrscheinlicher, dass Lerner eine Default-Strategie anwenden und das Subjekt bevorzugen. Dies macht es wiederum schwieriger, einen Einfluss der L1 zu entdecken. In den online Daten zeigen sich deutlichere Unterschiede zwischen den Gruppen: Deutschsprachige und französischsprachige Lerner bevorzugen jeweils das Subjekt, während spanischsprachige Lerner keine eindeutige Präferenz zeigten. Da andere Unterschiede zwischen den französischsprachigen und den spanischsprachigen Lernern so weit wie möglich ausgeschlossen wurden, erscheint es sehr wahrscheinlich, dass der Unterschied zwischen diesen beiden Gruppen auf einen Einfluss der L1 zurückgeht. Die Ergebnisse für die deutschsprachigen Lerner des Französischen sind mit der Annahme eines L1-Einflusses kompatibel. Bemerkenswerterweise scheinen Lerner sich nicht auf das L1-Äquivalent der spezifischen Konstruktion zu verlassen, sondern die Präferenz für overte Formen im Allgemeinen, d. h. außerhalb dieses spezifischen Kontexts, von der L1 in die L2 zu transferieren. Je stärker eine Interpretationspräferenz mit einer bestimmten Form verknüpft ist und je weniger sie von der spezifischen Konstruktion abhängt, desto leichter scheint sie also die L2-Verarbeitung zu beeinflussen.
240
Sarah Schimke, Saveria Colonna, Israel de la Fuente und Barbara Hemforth
3 Zusammenfassung und Ausblick Zwei wichtige Determinanten der online und offline Interpretation pronominaler Formen sind die Diskurssalienz der möglichen Antezedenten auf der einen und das Repertoire möglicher Formen in dem gegebenen Kontext auf der anderen Seite. Dabei unterscheiden sich Sprachen sowohl im Allgemeinen als auch in spezifischen Kontexten darin, welche Formen jeweils möglich sind. Dies bietet eine gute Grundlage, um zu untersuchen, ob Eigenschaften der L1 die Verarbeitung und Interpretation pronominaler Formen in der L2 beeinflussen. Die in diesem Kapitel zusammengefassten Ergebnisse zeigen, dass ein solcher Einfluss vorhanden sein kann, dass jedoch andere Einflussfaktoren auf die Pronomenauflösung in einer L2 L1-Effekte überlagern oder mit ihnen interagieren können. Einige der zusammengefassten Studien weisen auf allgemeine Lernereffekte hin, also auf Verarbeitungsmuster, die bei L2-Lernern im Allgemeinen und unabhängig von der L1 auftreten. Dies betrifft zum einen die Tendenz, Diskursinformationen ein größeres Gewicht zu geben, als Muttersprachler dies typischerweise tun (Jegerski, VanPatten & Keating 2011; Felser in diesem Band; Schimke & Colonna 2016). Diese Tendenz scheint sowohl offline als auch in der online Verarbeitung eine Rolle zu spielen und über verschiedenen Fertigkeitsstufen hinweg zu bestehen. Eine interessante Frage ist hier, ob dieser Effekt tatsächlich spezifisch für L2-Lerner ist, also immer dann auftritt, wenn eine Sprache verarbeitet wird, die nicht als L1 erworben wurde. Es könnte auch sein, dass dieses Verarbeitungsmuster ein Merkmal mehrsprachiger Sprachverarbeitung im Allgemeinen ist, also auch bei mehrsprachigen Sprechern auftritt, die seit ihrer Kindheit mehrere Sprachen als Muttersprachen sprechen (Sorace 2016). Angesichts der Tatsache, dass bei der Pronomeninterpretation Unterschiede zwischen Lernern und Muttersprachlern auch auf sehr hohen Stufen der Sprachfertigkeit beobachtet werden, bietet dieser Bereich sich an, um Effekte von Mehrsprachigkeit an sich und Spezifika der Verarbeitung einer L2 in zukünftigen Studien näher zu untersuchen und voneinander zu trennen. Dafür müssten nicht nur monolinguale Muttersprachler als Kontrollgruppe untersucht werden, wie dies in den bisherigen Studien meist der Fall war, sondern auch muttersprachliche Sprecher, die regelmäßig und seit ihrer Kindheit mehrere Sprachen benutzen. Zweitens scheinen Lerner in manchen Studien keine Unterschiede zwischen verschiedenen pronominalen Formen zu machen, und stattdessen eine DefaultStrategie anzuwenden, nach der verschiedene pronominale Formen gleichermaßen auf vorangehende Subjekte bezogen werden. Dies wurde von Ellert (2011), Jegerski, VanPatten & Keating (2011), Bryant & Noschka (2015); Hemforth, Blumenstock-Farges & Isel (2010), Schimke et al. (2015, eingereicht) sowie in gerin-
L1-Einfluss und allgemeine Lernereffekte
241
gerer Ausprägung von Sorace & Filiaci (2006) und Sorace et al. (2009) beobachtet. Es ist wahrscheinlich, dass diese Tendenz von mehr als einem Faktor beeinflusst wird. Weniger fortgeschrittene Lerner, wie in Ellert (2011), Jegerski, VanPatten & Keating (2011) und Bryant & Noschka (2015) haben eventuell noch kein Wissen über die Arbeitsteilung zwischen verschiedenen Formen in ihrer L2 erworben und fallen deswegen auf die Default-Strategie zurück. Bei sehr weit fortgeschrittenen Lernern wie in Sorace & Filiaci (2006) lassen sich diese Effekte weniger gut durch unvollständigen Erwerb und besser durch eine geringere Gewichtung formspezifischer Präferenzen erklären. Schließlich scheint auch die experimentelle Aufgabe einen Einfluss zu haben, da diese Default-Strategie mit größerer Wahrscheinlichkeit offline auftritt als online (Schimke et al. 2015, eingereicht). Ob die L1 das Auftreten und die Ausprägung dieser Strategie auch beeinflusst, ist zurzeit noch eine offene Forschungsfrage. Es ist in vielen Konstellationen schwierig zu unterscheiden, ob eine Subjektpräferenz auf L1-Einfluss zurückgeht, auf eine allgemeine Lernerstrategie, oder ob sie den Erwerb des zielsprachlichen Musters widerspiegelt. Um einen erfolgreichen Erwerb als Erklärung auszuschließen, ist es sinnvoll, Kontexte zu untersuchen, in denen die pronominale Form in der Zielsprache keine Subjektpräferenz aufweist. Dies ist im Deutschen für das d-Pronomen der und das Demonstrativpronomen dieser der Fall. Ellert (2011) und Bryant & Noschka (2015) haben hier jeweils bei Lernern mit mittlerer Sprachfertigkeit eine Subjektpräferenz beobachtet, die unabhängig von der L1 zu sein scheint. Es wurde aber noch nicht untersucht, ob die L1 auf höheren Stufen der Sprachfertigkeit eine Rolle spielt und zum Beispiel beeinflusst, ob die DefaultPräferenz aufgegeben wird. Ein weiterer Befund, der Anschlussuntersuchungen nahelegt, ist die Beobachtung, dass weit fortgeschrittene Lerner zwar Unterschiede zwischen verschiedenen pronominalen Formen der Zielsprache machen (Ellert 2011; Sorace & Filiaci 2006), aber im Vergleich weniger deutlich auf die lokale Verfügbarkeit alternativer nicht-ambiger Konstruktionen reagieren (Hemforth, Blumenstock-Farges & Isel 2010). Hier wäre es interessant zu überprüfen, ob eine systematische Variation der Frequenz der alternativen Struktur im lokalen Kontext die Interpretationspräferenzen beeinflusst. Dabei könnten Lerner in dem gleichen Experiment mit der ambigen und der nicht-ambigen Struktur konfrontiert werden. Schließlich gilt auch in diesem Fall, dass eine mögliche Rolle der L1 noch nicht ausreichend untersucht wurde. Eventuell könnten zum Beispiel die Lerner eine alternative Struktur besser oder früher im Erwerbsprozess berücksichtigen, die eine ähnliche Alternative aus ihrer L1 kennen. Die bisher besprochenen Effekte (Sensibilität für Diskursfaktoren, DefaultPräferenz für Subjekte) gehen nicht hauptsächlich auf die L1 der Lerner zurück, auch wenn mögliche Interaktionen mit Eigenschaften der L1 noch weiter unter-
242
Sarah Schimke, Saveria Colonna, Israel de la Fuente und Barbara Hemforth
sucht werden müssen. Die Ergebnisse von Roberts, Gullberg & Indefrey (2008) und Schimke et al. (2015, eingereicht) zeigen jedoch, dass es darüber hinaus auch einen direkten Transfer von Interpretationspräferenzen aus der L1 in die L2-Verarbeitung geben kann. In diesen Studien haben sich Lerner mit verschiedenen Erstsprachen systematisch voneinander unterschieden. Um diese Befunde zu bestätigen, wäre es gut, weitere Studien durchzuführen, in denen Lerner mit verschiedenen Erstsprachen verglichen werden. Dabei sollte auch die Annahme von Schimke et al. (2015, eingereicht) weiter überprüft werden, dass formspezifische Präferenzen übertragen werden, jedoch nicht Präferenzen, die an bestimmte Konstruktionen gebunden sind. Ein naheliegender erster Schritt wäre, online Interpretationspräferenzen für das Pronomen er im Deutschen auch bei Lernern anderer pro-drop Sprachen als dem Spanischen zu erheben. Insgesamt unterstreicht die Vielzahl dieser offenen Forschungsfragen, dass das Zusammenspiel verschiedener Einflussfaktoren während der Pronomenauflösung in einer L2 bisher nur unzureichend verstanden ist. Gleichzeitig bietet aber gerade die Existenz vieler interagierender Einflussfaktoren auf die Pronomenauflösung eine gute Grundlage, um diesen Bereich dafür zu nutzen, Eigenschaften der L2-Sprachverarbeitung weiter systematisch zu untersuchen.
Literaturangaben Ahrenholz, Bernt (2007): Verweise mit Demonstrativa im gesprochenen Deutsch: Grammatik, Zweitspracherwerb und Deutsch als Fremdsprache. Berlin: de Gruyter. Alonso-Ovalle, Luis, Susana Fernándes-Solera, Lyn Frazier & Charles Clifton (2002) : Null vs. overt pronouns and the Topic-Focus articulation in Spanish. Rivista di Linguistica 14 (2), 1 – 19. Ariel, Mia (1990): Accessing Noun Phrase Antecedents. London: Routledge. Asher, Nicholas & Laure Vieu (2005): Subordinating and coordinating discourse relations. Lingua 115(4), 591 – 610. Baumann, Peter, Lars Konieczny & Barbara Hemforth (2014): Conversational Implicatures in Anaphora Resolution: Alternative Constructions and Referring Expressions. In Hemforth, Barbara, Barbara Schmiedtová & Catherine Fabricius-Hansen (Hrsg.), Psycholinguistic approaches to meaning and understanding across languages, 197 – 212. München: Springer. Belleti, Adriana, Elisa Bennati & Antonella Sorace (2007): Theoretical and developmental issues in the syntax of subjects: Evidence from near-native Italian. Natural Language and Linguistic Theory 25, 657 – 689. Bosch, Peter, Graham Katz & Clara Umbach (2007): The Non-subject Bias of German Demonstrative Pronouns. In Monika Schwarz-Friesel, Manfred Consten & Mareile Knees (Hrsg.), Anaphors in Text: Cognitive, formal and applied approaches to anaphoric reference. Amsterdam: Benjamins, 145 – 164.
L1-Einfluss und allgemeine Lernereffekte
243
Bouma, Gerlof & Holger Hopp (2006): Effects of word order and grammatical function on pronoun resolution in German. In Artstein, Ron & Massimo Poesio (Hrsg), Ambiguity in Anaphora Workshop Proceedings, 5 – 12. Bryant, Doreen & Nadine Noschka (2015): Personal- und Demonstrativpronomen im Sprachverstehensprozess: Untersuchungen zum Erwerb funktionaler Anapherndistribution bei DaM, DaF und DaZ. In Hana Klages & Giulio Pagonis (Hrsg.), Linguistisch fundierte Sprachförderung und Sprachdidaktik. Grundlagen, Konzepte, Desiderate, 17 – 46. Berlin: de Gruyter. Carminati, Maria Nella (2002): The processing of Italian subject pronouns. Doktorarbeit, University of Massachusetts, Amherst. Clahsen, Harald & Claudia Felser (2006): Grammatical processing in language learners. Applied Psycholinguistics 27 (1), 3 – 42. Colonna Saveria, Sarah Schimke, Coralie Vincent, Israel de la Fuente & Barbara Hemforth (2016) : Influence du contexte expérimental sur l’interprétation des anaphores pronominales en français. Congrès Mondial de Linguistique Française, Tours, Frankreich. Crawley, Ros A., Rosemary J. Stevenson & David Kleinman (1990): The use of heuristic strategies in the interpretation of pronouns. Journal of Psycholinguistic Research 19, 245 – 264. Ellert, Miriam (2011): Ambiguous pronoun resolution in L1 and L2 German and Dutch. Doktorarbeit, Radboud University, Nijmegen. Filiaci, Francesca, Antonella Sorace & Manuel Carreiras (2013): Anaphoric biases of null and overt subjects in Italian and Spanish: a cross-linguistic comparison. Language, Cognition, and Neuroscience 29, 825 – 843. Frederiksen, John R. (1981): Understanding anaphora: rules used by readers in assigning pronominal reference. Discourse Processes 4, 323 – 347. Fuente, Israel de la & Barbara Hemforth (2013): Effects of clefting and left-dislocation on subject and object pronoun resolution in Spanish. In Jennifer Cabrelli Amaro, Gilian Lord, G., Ana de Prada Pérez & Jessi E. Aaron (Hrsg.), Selected Proceedings of the Hispanic Linguistics Symposium 2012, 27 – 45, Somerville, MA: Cascadilla Press. Fuente, Israel de la (2015): Putting pronoun resolution in context: The role of syntax, semantics, and pragmatics in pronoun interpretation. Unveröffentlichte Doktorarbeit, Universität Paris Diderot. Fuente, Israel de la, Barbara Hemforth, Saveria Colonna & Sarah Schimke (2016): The role of syntax, semantics, and pragmatics in pronoun resolution: A cross-linguistic overview. In Anke Holler & Katja Suckow (Hrsg.), Empirical Perspectives on Anaphora Resolution: Information Structural Evidence in the Race for Salience, 11 – 32. Berlin: de Gruyter. Gelormini-Lezama, Carlos & Amit Almor (2011): Repeated names, overt pronouns, and null pronouns in Spanish. Language and Cognitive Processes 26 (3), 437 – 454. Givón, Talmy (1983): Topic Continuity in Discourse. Amsterdam: Benjamins. Gundel, Jeanette K., Nancy Hedberg & Ron Zacharski (1993): Cognitive status and the form of referring expressions in discourse. Language and Cognitive Processes 69, 274 – 307. Haspelmath, Martin (1995): The converb as a cross-linguistically valid category. In Martin Haspelmath & Ekkehard König (Hrsg.), Converbs in cross-linguistic perspective, 1 – 56. Berlin: de Gruyter.
244
Sarah Schimke, Saveria Colonna, Israel de la Fuente und Barbara Hemforth
Hemforth, Barbara, Yvonne Blumenstock-Farges & Frederik Isel (2010): Working memory and sentence comprehension in late French-German bilinguals. Poster bei der Amlap Conference, York, Großbritannien. Hemforth, Barbara, Lars Konieczny, Christoph Scheepers, Saveria Colonna, Sarah Schimke & Joel Pynte (2010): Language specific preferences in anaphor resolution: Exposure or gricean maxims? 32nd Annual Conference of the Cognitive Science Society, United States. 2218 – 2223. Hulk, Aafke & Natascha Müller (2000): Cross-linguistic influence at the interface between syntax and pragmatics. Bilingualism: Language and Cognition 3 (3), 227 – 244. Järvikivi, Juhani, Roger P. G., Van Gompel, Jukka Hyönä & Raymond Bertram (2005): Ambiguous pronoun resolution: Contrasting the first-mention and subject preference accounts. Psychological Science 16 (4), 260–264. Jegerski, Jill, Bill VanPatten & Gregory D. Keating (2011): Cross-linguistic variation and the acquisition of pronominal reference in L2 Spanish. Second Language Research 33 (2), 193 – 221. Kaiser, Elsi, & John C. Trueswell (2008): Interpreting pronouns and demonstratives in Finnish: Evidence for a form-specific approach to reference resolution. Language and Cognitive Processes 23 (5), 709 – 748. Keating, Gregory D., Jill Jegerski & Bill VanPatten (2016): Online processing of subject pronouns in monolingual and heritage bilingual speakers of Mexican Spanish. Bilingualism: Language and Cognition 19 (1), 36 – 49. Kehler, Andrew, Laura Kertz, Hannah Rohde, H & Jeffrey L. Elman (2008): Coherence and Coreference Revisited. Journal of Semantics 25 (1), 1 – 44. Lambrecht, Knud (1994): Information Structure and Sentence Form. Cambridge: CUP. Luján, Marta (1986): Stress and binding of pronouns. Chicago Linguistic Society 22, 2, 248 – 262. Mayol, Laia (2010): Contrastive Pronouns in Null Subject Romance Languages. Lingua 120 (10), 2497 – 2514. Reinhart, Tanya (1981): Pragmatics and Linguistics: An Analysis of Sentence Topics. Philosophica 27, 53 – 94. Robenalt, Clarice & Adele E. Goldberg (2016): Nonnative speakers do not take competing alternative expressions into account the way native speakers do. Language Learning 66 (1), 60 – 93. doi: 10.1111/lang.12149. Roberts, Leah, Marianne Gullberg & Peter Indefrey (2008): On-line pronoun resolution in L2 discourse: L1 Influence and General Learner Effects. Studies in Second Language Acquisition 30, 333 – 357. Schimke, Sarah & Saveria Colonna (2016): Native and non-native interpretation of pronominal forms: Evidence from French and Turkish. Studies in Second Language Acquisition 38 (1), 131 – 162. Schimke, Sarah, Saveria Colonna, Israel de la Fuente & Barbara Hemforth (2015): Influence de la L1 dans l’interprétation d’un pronom anaphorique par des natifs francophones et hispanophones apprenants de l’allemand. Vortrag bei der 25th European Second Language Association Conference, Aix-en-Provence. Schimke, Sarah, Israel de la Fuente, Barbara Hemforth & Saveria Colonna (eingereicht): L1-influence on offline and online pronoun resolution.
L1-Einfluss und allgemeine Lernereffekte
245
Sorace, Antonella, & Francesca Filiaci (2006): Anaphora resolution in near-native speakers of Italian. Second Language Research 22 (3), 339 – 368. Sorace, Antonella (2011): Pinning down the concept of „interface“ in bilingualism. Linguistic Approaches to Bilingualism 1, 1 – 33. doi: 10.1075/lab.1.1.01sor Sorace, Antonella (2016): Referring expressions and executive functions in bilingualism. Linguistic Approaches to Bilingualism, DOI: 10.1075/lab.15055. Sorace, Antonella & Francesca Filiaci (2006): Anaphora resolution in near-native speakers of Italian. Second Language Research 22, 339 – 368. doi: 10.1191/0267658306sr271oa Sorace, Antonella, Ludovica Serratrice, Francesca Filiaci & Michela Baldo (2009): Discourse conditions on subject pronoun realization: testing the linguistic intuitions of older bilingual children. Lingua 119, 460 – 477. doi: 10.1016/j.lingua.2008.09.008
Hana Klages und Johannes Gerwien
Die Interpretation anaphorischer Pronomina bei Kindern im L1- und frühen L2-Erwerb¹ Bei der rezeptiven Verarbeitung von Texten, d. h. kommunikativen, meist aus mehreren Äußerungen bestehenden sprachlichen Einheiten, bewältigt ein Rezipient eine komplexe Aufgabe. Er muss in einem Lautstrom oder in einer Graphemkette sprachliche Konstruktionen (Morpheme, Wörter, Phrasen, Sätze) erkennen, sie mit bestimmten referentiellen, grammatischen und semantischen Funktionen verknüpfen und eine kohärente (zusammenhängende) kognitive Repräsentation des im Text dargestellten Sachverhalts aufbauen (Oakhill & Garnham 1992; Gernsbacher & Givón 1995). Eine solche Repräsentation wird Diskursrepräsentation (z. B. Kamp & Reyle 1993), mentales Modell (z. B. Johnson-Laird 1983) oder Situationsmodell (z. B. Dijk & Kintsch 1983) genannt. Ein wesentlicher Beitrag zum Aufbau einer kohärenten Diskursrepräsentation besteht in der Herstellung der referentiellen Kohärenz. Unter referentieller Kohärenz wird die Bezugnahme verschiedener Referenzausdrücke auf ein und dieselbe Entität (Koreferenz), auf ihre Teile (partielle Koreferenz, z. B. Auto und Lenkrad) oder auf eine Beziehung, in der zwei Entitäten zueinander stehen, wie z. B. schneiden und Messer (z. B. Schwarz 2000; Pörings & Schmitz 2003), verstanden. Viele Sprachen verwenden anaphorische Pronomina zur Markierung von referentieller Kohärenz in Texten. Sie dienen insbesondere der Markierung einer erneuten Referenz auf eine Entität, die zumeist mithilfe eines früheren referentiellen Ausdrucks bereits in die Diskursrepräsentation eingeführt wurde. Dieser einführende Ausdruck wird Antezedent des anaphorischen Pronomens genannt. Führen wir uns einmal genau die Aufgabe vor Augen, vor der ein Rezipient steht, wenn er einem Personalpronomen im Diskurs begegnet. Zunächst muss er die Funktion des Pronomens dekodieren, d. h. es als Marker für die Bezugnahme auf einen in der Diskursrepräsentation bereits vorhandenen Referenten erkennen. Dann muss er den Referenten bestimmen, d. h. das Pronomen auflösen. In einer Diskursrepräsentation, in der bereits mehrere Referenten enthalten sind, muss er entscheiden, welcher Referent als Kandidat für das Pronomen in Frage kommt. In
Wir danken Sarah Schimke, Holger Hopp und Barbara Hemforth für wertvolle Kommentare, Hinweise und Anregungen. Hana Klages und Johannes Gerwien, Ruprecht-Karls-Universität Heidelberg DOI 10.1515/9783110456356-011
248
Hana Klages und Johannes Gerwien
Abbildung 1: Herstellung von Koreferenz zwischen Anapher und Antezendent
den Beispielen (1) und (2) ist etwa die Entscheidung zwischen Mann und Tisch und in Beispiel (3) zwischen Mann und Kommode zu treffen. (1) Der Mann zersägte einen Tisch. Er war alt. (2) Der Mann zersägte einen Tisch. Dieser war alt. (3) Der Mann zersägte eine Kommode. Sie war alt. Für welchen Referenten sich der Rezipient entscheidet, d. h. wie er das Pronomen auflöst, ist von einer Reihe sprachlicher Informationen beeinflusst. Dazu zählen das Genus und der Numerus des Pronomens sowie das Genus und der Numerus der potentiellen Antezedenten. Des Weiteren beeinflussen auch die syntaktischen Eigenschaften der potentiellen Antezedenten (syntaktische Rolle, Nennposition im Satz), Bedeutungsinformationen der Referenzausdrücke (Agentivität, Intentionalität, Verursacher) oder der kontextuellen Ausdrücke (Konnektoren wie z. B. aber vs. weil, Verbsemantik) sowie die Form des anaphorischen Pronomens (Personalpronomen, Demonstrativpronomen) die Auflösungsprozesse. All diese Informationen werden zusammengenommen Auflösungshinweise, oder kurz Cues genannt. In einem Diskurs stehen in der Regel mehrere Cues gleichzeitig zur Verfügung. Der Rezipient muss bei der Diskursverarbeitung alle Cues erkennen und – im Falle, dass zwei oder mehrere Cues auf unterschiedliche Referenten hinweisen – entscheiden, welchem er folgt. In (3) wird das Pronomen in Richtung Kommode aufgelöst. Der Grund dafür ist die Genuskongruenz zwischen Pronomen und Antezedenten. In (1) und (2), d. h. in Fällen, in denen das Genus nicht zur Pronomenauflösung beiträgt, wird der Rezipient das Pronomen auf einer anderen Grundlage interpretieren müssen. Als Auflösungsgrundlage bietet sich hier die syntaktische Rolle der vorausgegange-
Die Interpretation anaphorischer Pronomina bei Kindern
249
nen Ausdrücke (Subjekt/Objekt) und unterschiedliche Formen des Pronomens (Personalpronomen, Demonstrativpronomen etc.) an. Für das Deutsche gilt, dass Personalpronomina bevorzugt auf Referenzausdrücke in Subjektfunktion bzw. Erstnennung und Demonstrativa auf nicht-erstgenannte Ausdrücke (in unseren Beispielen das syntaktische Objekt) Bezug nehmen (z. B. Ellert 2010; Bryant & Noschka 2015). Diese formspezifische Antezedenzpräferenz, die als in einer anaphorischen Form inhärent enthaltener Cue verstanden wird, nennen wir Antezedenttyp. Für das Personalpronomen kann der Cue Antezedenttyp folgendermaßen beschrieben werden: bevorzugter Antezedent ist das Subjekt bzw. der erstgenannte Referenzausdruck. Für das Demonstrativpronomen lautet der Cue: bevorzugter Antezedent ist der nicht-erstgenannte Referenzausdruck des vorausgegangenen Diskurses. Unter Berücksichtigung des Antezedenttyps wird das Pronomen er in Beispiel (1) in Richtung Mann und das Pronomen dieser in Beispiel (2) in Richtung Tisch interpretiert. Betrachten wir vor diesem Hintergrund Beispiel (3) erneut, so stellen wir fest, dass das Genus des Personalpronomens sie auf den Referenzausdruck in NichtErstnennung (Kommode) hinweist. Der Cue Antezedenttyp besagt jedoch, dass Personalpronomina bevorzugt mit Ausdrücken in Subjektfunktion bzw. Erstnennung koreferieren. Im Beispiel (3) weisen Genus und Antezedenttyp also auf unterschiedliche Referenten hin. Wie löst der Rezipient diesen Konflikt? Die meisten kompetenten Rezipienten würden vermutlich dem Cue Genus folgen und das Personalpronomen sie entgegen den Hinweisen des Cue Antezedenttyp in Richtung Kommode auflösen. Dies verdeutlicht, dass während der Pronomenauflösung systematisch eine Koordination bzw. eine Gewichtung mehrerer Cues vorgenommen wird. Durch das bisher Gesagte wird klar, dass der Pronomenauflösung komplexe Verarbeitungsmechanismen zugrunde liegen. Die Spracherwerbsforschung stellt sich vor diesem Hintergrund die folgenden Fragen: In welcher Abfolge erwerben Kinder Kenntnis über die einzelnen Cues, die in einer gegebenen Sprache für die Anapherauflösung zur Verfügung stehen, und wie vollzieht sich der Erwerb der Fähigkeit, mehrere Cues zu koordinieren (Erwerbsverlauf)? Wie lange benötigen Kinder für den Erwerb (Erwerbstempo)? Auch bei der Untersuchung des L2-Erwerbs interessiert man sich für den Erwerbsverlauf und das Erwerbstempo, untersucht darüber hinaus jedoch außerdem Gemeinsamkeiten und Unterschiede durch einen Vergleich des monolingualen L1-Erwerbs und des L2-Erwerbs. Derartige Studien können dann zum einen zur Beantwortung der Frage nach universellen (erwerbstypunabhängigen) Erwerbsmechanismen beitragen, und zum anderen Einblicke in die potentiellen Besonderheiten kognitiver Prozesse mehrsprachiger Lerner liefern.
250
Hana Klages und Johannes Gerwien
Die Bedingungen des frühen L2-Erwerbs unterscheiden sich von denen des L1Erwerbs in vielerlei Hinsicht. Vom frühen L2-Erwerb wird üblicherweise dann gesprochen, wenn der Erwerbsbeginn zwischen dem 2. und dem 4. Lebensjahr beginnt (Rothweiler 2006). Die Lerner sind zu Beginn des frühen L2-Erwerbs also älter und somit kognitiv weiter entwickelt als Lerner zu Beginn des L1-Erwerbs. Des Weiteren unterscheiden sich L1- und L2-Lerner hinsichtlich der Qualität und Quantität des Inputs, den sie in der Zielsprache erhalten (z. B. Thiersch 2007). Und schließlich erwerben kindliche L2-Lerner zusätzlich zu der L2 auch ihre L1, wodurch der Aufbau des Sprachwissen über beide Sprachen durch Interferenzen beeinflusst sein kann. All dies kann grundsätzlich zu einem vom monolingualen Erwerb abweichenden Erwerbsverlauf bzw. Erwerbstempo führen. Der L2-Erwerb kann langsamer oder schneller erfolgen, und die besonderen Erwerbsbedingungen können außerdem zu spezifischen Erwerbsschritten führen, die bei Lernern der Zielsprache als L1 nicht oder in anderer Form auftreten (z. B. Kaltenbacher & Klages 2012; Kaltenbacher 2015). Außerdem wird heute vielfach angenommen, dass L2Lerner durch die Verarbeitung von zwei Sprachsystemen kognitive Fähigkeiten entwickeln, die bei Lernern im monolingualen L1-Erwerb erst später zutage treten oder grundsätzlich weniger stark ausgeprägt sind. Dazu zählen z. B. das metasprachliche Wissen oder die Fähigkeiten zur Kontrolle der kognitiven Informationsverarbeitung, worunter auch die Kontrolle der Sprachverarbeitung fällt (Bialystok 2001). Das Ziel des vorliegenden Beitrags ist, Ergebnisse ausgewählter Studien zum Erwerb der Fähigkeiten zur Auflösung anaphorischer Pronomina im frühen L2Erwerb darzustellen und mit Ergebnissen aus dem monolingualen L1-Erwerb zu vergleichen. Um ein Grundverständnis für die Prozesse der Pronomenauflösung zu schaffen, werden in Abschnitt 1 zunächst sprachliche Faktoren der Pronomenauflösung charakterisiert und in Zusammenhang mit der inkrementellen Sprachverarbeitung gebracht. In Abschnitt 2 werden ausgewählte Befunde zur Entwicklung kindlicher Fähigkeiten zur Pronomenauflösung im monolingualen L1-Erwerb vorgestellt, die die Grundlage für den Vergleich mit Befunden aus dem frühen L2-Erwerb (Abschnitt 3) bilden. In Abschnitt 4 werden die Befunde zur Pronomenauflösung im L1- und frühen L2-Erwerb zusammengefasst und Forschungsdesiderate formuliert.
Die Interpretation anaphorischer Pronomina bei Kindern
251
1 Auflösung pronominaler Anaphern 1.1 Reliable und probabilistische Cues Während der Pronomenauflösung muss der Rezipient eine Vielzahl von verfügbaren Cues verarbeiten und koordinieren. Um zu erklären, wie dies geschieht, teilen Arnold, Brown-Schmidt & Trueswell (2007) in ihrem Cue-Reliability-Ansatz die verschiedenen Cues in zwei Gruppen auf: in reliable Cues und in probabilistische Cues. Reliable Cues zeigen zuverlässig an, welcher Antezedent einem Pronomen in einer Sprache zuzuordnen ist. In Sprachen, die über die grammatischen nominalen Kategorien Genus bzw. Sexus und Numerus verfügen (z. B. Deutsch und Englisch) zählen die konkrete Genus- und Numerusinformation, die im Pronomen kodiert ist, sowie die entsprechenden Genus- und Numerusinformationen der im Diskurs vorausgegangenen Substantive zu den reliablen Cues. Probabilistische Cues, auf der anderen Seite, helfen dabei, zu ermitteln, welcher Ausdruck als der bevorzugte, jedoch nicht zwingend als einzig möglicher Antezedent eines Pronomens in Frage kommt. Sie spielen eine Rolle insb. in (1– 2) illustrierten Auflösungskontexten. Als probabilistische Cues werden einerseits die Informationen zum Antezedenttyp, die in der spezifischen Form des Pronomens (z. B. Personalpronomen vs. Demonstrativpronomen) kodiert sind, verstanden (siehe oben). Anderseits zählen dazu Eigenschaften der Referenzausdrücke aus dem vorausgegangenen Diskurs wie z. B. ihre syntaktische Rolle (Subjekt vs. Nichtsubjekt) oder ihre Nennposition im Satz (Erstnennung vs. Letztnennung).Wir fassen diese spezifischen Eigenschaften unter den Begriff Referenttyp zusammen². Anzumerken ist, dass die probablistischen Cues sich – anders als die reliablen – in dem Grad voneinander unterscheiden, wie zuverlässig sie den potentiellen Antezedenten anzeigen können. Vereinfacht gesagt, können einige probabilistische Cues zuverlässiger sein als andere. Im Deutschen wird z. B. der Topikstatus eines Referenten (Topik vs. Nicht-Topik) im Vergleich zu der Nennposition des entsprechenden Referenzausdrucks (Erstnennung vs. Nicht-Erstnennung) vielfach als ein zuverlässigerer Hinweis auf Koreferenz betrachtet. Gleichzeitig zeigen zahlreiche Forschungsbefunde, dass die Interaktion verschiedener probabilisti-
Die kategoriale Unterscheidung zwischen reliablen und probabilistichen Cues wird in der Forschung nicht durchgehend verfolgt. So gehen z. B. Tannenhaus & Trueswell (1995) davon aus, dass die verschiedenen Cues eher an einem Kontinuum anzusiedeln sind und (situationsspezifisch) von Hörern als relevant (hier als reliabel bezeichnet) bzw. weniger relevant (hier als probabilistisch bezeichnet) eingestuft werden.
252
Hana Klages und Johannes Gerwien
scher Cues die Präferenz, mit der ein Ausdruck als Antezedent eines Pronomens gewählt wird, stark beeinflusst. So scheint z. B. die Koreferenzherstellung zwischen Personalpronomen und erstgenanntem Subjektausdruck leichter zu sein in Diskursen, in denen der andere potentielle Antezedent NICHT satzfinal erscheint (4) als in Diskursen, in denen der andere potentielle Antezedent die finale Satzposition einnimmt (5), (vgl. Song & Fisher 2005). (4) See the turtle and the bunny. The turtle takes the bunny to the store. […] Look, he has a kite! (5) See the turtle and the tiger. The turtle goes downstairs with the tiger. […] Look, he has a kite! In Kontexten, in denen beide Typen der Cues (reliable und probabilistische) zur Verfügung stehen, gewichtet ein kompetenter Rezipient die reliablen Cues stärker als die probabilistischen (vgl. Arnold, Brown-Schmidt & Trueswell 2007 sowie die Diskussion zu Bsp. 3 oben). Dies bedeutet jedoch nicht, dass Rezipienten zunächst die reliablen Cues „überprüfen“ und erst wenn diese sich als nicht zielführend erweisen, sich den probabilistischen zuwenden. Vielmehr wird heute davon ausgegangen, dass beide Cue-Typen gleichzeitig berücksichtigt werden, „zielführenden“ reliablen Cues jedoch der Vorrang gegeben wird (Tanenhaus & Trueswell 1995).
1.2 Verarbeitungsphasen Verschiedene Cues entfalten ihre Wirkung zu unterschiedlichen Zeitpunkten der Diskursverarbeitung (vgl. Arnold, Brown-Schmidt & Trueswell 2007). Die Phasen unterscheiden sich im Hinblick auf den Zeitpunkt, zu dem sie relativ zum Auftreten eines Pronomens stattfinden. Eine Zusammenfassung der hier folgenden Ausführungen bietet Abbildung 2. Die prä-pronominale Phase beginnt vor der Rezeption des Pronomens, d. h. während der Verarbeitung des Diskurses, der dem Pronomen vorausgeht.Während dieser Phase ergibt sich aus der Verarbeitung verschiedener Informationen in der mentalen Diskursrepräsentation für alle vorhandenen Referenten der Grad ihrer kognitiven Zugänglichkeit bzw. ihre Prominenz (vgl. Accessibility Theory, z. B. Ariel 1988 oder Givenness Hierarchy Theory, z. B. Gundel, Hedberg & Zacharski 1993). Derartige Informationen beeinflussen nach Annahmen der Expectancy Hypothese (Arnold, Brown-Schmidt & Trueswell 2007) Erwartungen, die der Rezipient in Hinblick auf die informationsstrukturelle und formal sprachliche Beschaffenheit des Folgediskurses generiert. So erwarten Rezipienten zum einen,
Die Interpretation anaphorischer Pronomina bei Kindern
253
dass prominente Referenten im Folgediskurs wieder aufgenommen werden (informationsstrukturelle Ebene). Zum anderen erwarten sie aber auch, dass auf den prominenten Referenten im Folgediskurs mit einem bestimmten anaphorischen Ausdruck z. B. mit einem Personalpronomen, Bezug genommen wird (formalsprachliche Ebene).
Abbildung 2: Phasen der inkrementellen Informationsverarbeitung während der anaphorischen Auflösung
Darüber hinaus beeinflusst die Referentenprominenz/-zugänglichkeit – vereinfacht gesagt – die Verarbeitung der Anapher dahingehend, dass z. B. im Folgediskurs auftretende anaphorische Personalpronomina präferiert in Richtung eines im Diskurs hoch zugänglichen, d. h. prominenten Referenten aufgelöst werden. Diese Tendenz ist auf eine Verknüpfung zwischen Komplexität der Anapher³ und den mit ihr verbundenen Informationen zum Antezedenttyp und dem Zugänglichkeitsgrad bzw. der Prominenz der Diskursreferenten zurückzuführen. Ihr zufolge nehmen wenig komplexe Anaphern wie Nullanapher oder Personalpronomina Bezug auf Referenten, die einen hohen Grad an Zugänglichkeit/Prominenz aufweisen, während komplexere Anaphern, wie Demonstrativa oder volle Nominalphrasen, sich auf einen weniger zugänglicheren Referenten
Die Komplexität einer Anapher wird durch phonetische Größe (Länge und Betonung), Informativität (semantischer Gehalt) und Rigidität (Eindeutigkeit der Referenz) determiniert (vgl. Ariel 1994).
254
Hana Klages und Johannes Gerwien
beziehen. Abbildung 3 gibt den Zusammenhang zwischen der Anapher und dem Zugänglichkeitsgrad des Referenten für das Deutsche wieder.
Abbildung 3: Form-Funktions-Relation der referentiellen Ausdrücke im Deutschen (nach Ellert 2010:27)
Die Zugänglichkeit eines Referenten wird von einer Reihe von auf verschiedenen sprachlichen Ebenen anzusiedelnden Faktoren beeinflusst. Hierzu zählen die bereits oben genannten syntaktischen und distributionellen Eigenschaften der Referenzausdrücke, wie z. B. ihre syntaktische Rolle (Subjekte > Nicht-Subjekte⁴; vgl. Givón 1992; Järvikivi et al. 2005; Frederiksen, 1981), ihre Nennposition im Satz (Erstnennungen > Nicht-Erstnennungen; Gernsbacher & Hargreaves, 1988), ihre Entfernung zur Anapher (nah stehende Ausdrücke > weiter entfernte Ausdrücke; Sekerina, Stromswold & Hestvik 2004) sowie die Häufigkeit ihrer Nennung (häufiger genannte Ausdrücke > weniger häufig genannte Ausdrücke; Ariel 2004). Eine vergleichbare Wirkung haben die semantischen Aspekte des Diskurses bzw. seiner Teile, wie die thematische Rolle der Referenzausdrücke (Agens, Verursacher, Ziel > andere; Arnold, Brown-Schmidt & Trueswell 2007; Schlenter et al. 2011), die Belebtheit der Diskursreferenten (belebte Referenten > unbelebte Referenten; Langacker 1991) und die Verbsemantik (semantisch hoch transitive Verben > semantisch weniger transitive Verben; Pyykkönen, Matthews & Järvikivi 2010). Nicht zuletzt zählen zu den hier wirkenden Faktoren auch diskursive Eigenschaften des Textes, wie z. B. der Informationsstatus der Referenzausdrücke (Satz- oder Diskurstopik > Nicht-Topik; Ariel 2004, Colona, Schimke & Hemforth 2012) sowie die Relationen, die zwischen den Sätzen des Diskurses bestehen (Kehler 2002; Rohde, Kehler & Elman 2007). Mit der Rezeption der pronominalen Anapher startet die Phase der pronominalen Verarbeitung (vgl. online processing bei Arnold 2013). Während dieser Phase werden Prozesse initiiert, die sich auf pronomeninhärente Eigenschaften wie Genus und Numerus sowie auf Informationen zum Antezedenttyp der jeweiligen Anapherform richten. Die pronominale Verarbeitung besteht also zum einen aus der Extraktion von grammatischen Informationen (z. B. Genus und Numerus) Zu lesen als Subjekte haben eine höhere Zugänglichkeit/Prominenz als Nicht-Subjekte.
Die Interpretation anaphorischer Pronomina bei Kindern
255
sowie der Extraktion von Informationen zum Antezedenttyp aus dem anaphorischen Pronomen, und zum anderen aus dem Abgleich dieser Informationen mit den Genus-Informationen der potentiellen Antezedenten sowie dem Zugänglichkeitsgrad der Referenten. Im Hinblick auf Letzteres gilt für das Deutsche und das Englische, dass z. B. die dem Pronomen vorausgegangenen Substantive (oder Eigennamen) mit den Spezifikationen [+Subjekt], [+Erstnennung] und [+Topik] die bevorzugten Antezedenten eines Personalpronomens sind und Substantive mit den Merkmalen [+Objekt], [+Zweitnennung], [‐Topik] bevorzugte Antezedenten eines Demonstrativpronomens. Mit der Verarbeitung der dem Pronomen folgenden Ausdrücke beginnt die sog. Offline–Verarbeitung (Arnold 2013; offline processing). Im Zentrum dieser Verarbeitungsphase stehen sprachliche Informationen, die durch den post-pronominalen Diskurs transportiert werden, wie z. B. die Semantik der Folgeausdrücke, Inferenzen auf der Grundlage des Weltwissens etc.
1.3 Sprachtypologische Unterschiede Da Sprachen sich hinsichtlich vieler grammatischer Kategorien unterscheiden können – einige Sprachen zum Beispiel verfügen über Genus, andere nicht, einige Sprachen haben eine feste Wortstellung, andere verfügen über eine eher freiere Wortstellung, einige Sprachen verfügen über Mittel zur Markierungen von Topikentitäten, andere nicht – liegt es auf der Hand, dass es in unterschiedlichen Sprachen unterschiedliche reliable und probabilistische Cues geben kann. Darüber hinaus kann derselbe probabilistische Cue in einer Sprache einen hohen Grad an Zuverlässigkeit aufweisen und in einer anderen einen eher geringen. Aber was bedeutet dies für die Untersuchung des Spracherwerbs? Einerseits ist im Kontext der Einsprachigkeit damit zu rechnen, dass Kinder sprachspezifische Erwerbsmuster zeigen. Je nach Vorhandensein eines Cues in einer bestimmten Sprache (z. B. Genus ja oder nein) gilt es, diesen zu identifizieren und entsprechend die Fähigkeit zu erwerben, Hinweise für die Ausprägung des Cues im Sprachsignal zu entdecken. Im Chinesischen beispielsweise enthält die Oberflächenform des Pronomens ta zwar Informationen über den Numerus des Antezedenten, aber keine Genusinformation. Um Koreferenz zwischen Antezedent und Pronomen herzustellen müssen Kinder mit L1 Chinesisch demnach lernen, ihre Aufmerksamkeit auf andere sprachliche Merkmale zu richten als beispielsweise Kinder mit Deutsch als L1. Andererseits erlaubt die funktionale Unterteilung der Cues in reliable und probabilistische, den Erwerb der Fähigkeiten zur Pronomenauflösung in gewisser Weise unabhängig von einzelsprachspezifischen Spezifikationen, also sprach-
256
Hana Klages und Johannes Gerwien
übergreifend, zu untersuchen. Das betrifft sowohl den Erwerbsverlauf als auch das Erwerbstempo. Lassen sich universale Erwerbsmechanismen entdecken, zum Beispiel, dass eine Cue-Kategorie (reliabel vs. probabilistisch), unabhängig davon welche Sprache man untersucht,vor der anderen erworben wird? Kann festgestellt werden, dass Kinder, egal welcher L1, denselben Erwerbsverlauf und dasselbe Erwerbstempo aufweisen?
2 Was wissen wir über den L1-Erwerb? Die Untersuchung des Erwerbs der Fähigkeit, anaphorische Ausdrücke korrekt aufzulösen, richtet sich zum einen auf die Frage wann welche spezifischen Cues als relevant erkannt werden (Erwerbsverlauf), wie lange der Erwerb dieser Fähigkeit dauert (Erwerbstempo) sowie auf die Frage wann Kinder in der Lage sind, mehrere Cues zu koordinieren. Da die verschiedenen Cues dem Rezipienten in unterschiedlichen Phasen der Verarbeitung zur Verfügung stehen (siehe oben), liefern Untersuchungen zum Erwerb der angeführten Fähigkeiten gleichzeitig auch Informationen über die Entwicklung der Kompetenz, die Aufmerksamkeit auf verschiedene Teile des Diskurses zu richten.
2.1 Probabilistische Cues Ergebnisse zum monolingualen Erwerb der Fähigkeiten zur Verarbeitung der probabilistischen Cues syntaktische Funktion und Nennposition deuten darauf hin, dass sich dieser über einen langen Zeitraum erstreckt, nämlich mindestens bis zum 9. Lebensjahr (vgl. Klages & Gerwien 2015). Zu den klassischen Studien, die das Auflösungsverhalten von Kindern mit Englisch als L1 untersuchen, zählen zwei Visual World-Studien von Song & Fisher (2005, 2007; zur Methode, siehe Hopp & Schimke in diesem Band). Darin verfolgten die Autorinnen die Frage, ob die syntaktische Rolle bzw. Nennposition potentieller Antezedenten (Subjekt in Erstnennung vs. Objekt in der postverbalen Position) bei der Auflösung anaphorischer Personalpronomina bei zweieinhalbbzw. dreijährigen Kindern (Song & Fisher 2005, 2007) eine Rolle spielen. Hierzu wurden den Kindern kurze Diskurse präsentiert, die in (4) und (5) illustriert sind. Bei diesen Studien handelt es sich um Untersuchungen der Anapherauflösung in genusambigen Kontexten, das heißt, dass das im Pronomen kodierte Genus (maskulin/feminin) keinen eindeutigen Hinweis darauf liefert, mit welchem Referenzausdruck Koreferenz besteht. Die Ergebnisse zeigen, dass Kinder beider Altersgruppen anaphorische Pronomina präferiert auf das Subjekt bzw. den
Die Interpretation anaphorischer Pronomina bei Kindern
257
erstgenannten Referenten hin auflösen. Unterschiede zwischen den zwei Altersgruppen wurden im Hinblick auf das Tempo der Pronomenauflösung festgestellt: Jüngere Kinder benötigen für die Interpretation zwischen 3000 – 4000 ms nach Pronomen-Onset, ältere Kinder jedoch nur bis max. 2000 ms nach PronomenOnset. Die unterschiedlichen Leistungen von älteren und jüngeren Kindern erklären Song & Fisher (2005, 2007) mit Unterschieden im Wortschatzumfang, mit Beschränkungen der kindlichen Gedächtniskapazität und mit der bei jüngeren Kindern noch eingeschränkten Fähigkeit zur Inhibierung der „unpassenden“ Diskursreferenten. Die beobachtete Präferenz der Kinder für Subjekte bzw. erstgenannte Referenten führen die Autorinnen auf die frühe kindliche Sensibilität für die Prominenz dieser Ausdrücke im sprachlichen Material zurück. Diese Sensibilität resultiert möglicherweise aus zwei Strategien, über die das sprachliche Verarbeitungssystem von bereits sehr jungen Kindern verfügt (Song & Fischer 2005: 48), die jeweils die Auflösungspräferenzen erklären können. Bei der First mention prominence strategy werden sprachliche Ausdrücke in Initialpositionen einer Äußerung als Grundlage für die Anknüpfung inkrementell eingehender sprachlicher Informationen betrachtet. Dadurch haben Ausdrücke in Initialposition bereits bei der Verarbeitung von Mehrworteinheiten einen besonderen Stellenwert, d. h. sie sind im Diskursmodell des Rezipienten prominent. Bei der Diskursverarbeitung schlägt sich die Prominenz darin nieder, dass Referenten, auf die mit Erstnennungen Bezug genommen wird, als präferierte Antezedenten anaphorischer Personalpronomina dienen. Bei der Anwendung der Subject prominence strategy werden syntaktische Subjekte als besonders prominent betrachtet. Die Prominenz des Subjekts ergibt sich aus seiner Korrespondenz mit semantischen Merkmalen wie Agentivität, Belebtheit, Intentionalität etc. (vgl. Song & Fisher 2005: 32 f). Ähnlich wie bei Erstnennungen wird durch die Prominenz der Ausdrücke in Subjektfunktion die Wahrscheinlichkeit des Pronomens, auf diese bezugzunehmen, erhöht. In Sprachen wie Englisch nehmen Subjekte gleichzeitig auch die prominente Nennposition ein, die Erstnennung. Demzufolge sind die Ergebnisse von Song & Fisher (2005, 2007), wie die Autorinnen anmerken, nicht eindeutig auf eine der beiden Strategien zurückzuführen. Weitere empirische Evidenz für den Einfluss der syntaktischen Rolle der Referenzausrücke in genusambigen Kontexten bei sehr jungen Kindern lieferte eine Visual World-Studie von Järvikivi et al. (2014). Die Autoren untersuchten die Pronomenauflösung bei Vierjährigen im L1-Erwerb des Deutschen, einer Sprache, in der die syntaktische Rolle Subjekt nicht zwingend an die Erstnennung im Satz gebunden ist (Den Hund sieht die Katze). Die Ergebnisse zeigen, dass die Kinder im Vergleich zum Objektreferenten mehr Aufmerksamkeit auf den Subjektreferenten
258
Hana Klages und Johannes Gerwien
richten, unabhängig von seiner Nennposition. Daraus ergibt sich, dass die syntaktische Rolle (hier Subjekt) prinzipiell einer der Faktoren sein kann, der die Zugänglichkeit des Diskursreferenten beeinflusst (Evidenz für die subject prominence strategy) und zum anderen, dass Kinder im L1-Erwerb des Deutschen im Alter von vier Jahren über das Wissen, dass zumindest Personalpronomina in bevorzugter Weise an das Subjekt angebunden werden (Antezedenttyp), bereits verfügen können. Jedoch scheint dieses Wissen bei Vierjährigen noch nicht so stark wie bei der Kontrollgruppe der Erwachsenen ausgeprägt zu sein. Diese Annahme begründen die Autoren mit Befunden zu Effekten der Fokussierung der Antezedenten mithilfe von Satzspaltung. Ein Vergleich von Kontexten mit Subjektausdrücken in Spaltsätzen (Es ist der Hase, der den Fuchs kitzelt) und Sätzen ohne Spaltung (Der Hase kitzelt den Fuchs) ⁵ zeigte, dass Kinder – anders als Erwachsene – Personalpronomina noch schneller in Richtung Subjekt auflösen, wenn dieses durch die Herausstellung in Spaltsätzen zusätzlich fokussiert wurde. Die Fokussierung des Subjekts scheint also seine Salienz und somit Zugänglichkeit zu steigern. Den Erwerb der Auflösung unterschiedlicher Pronomenformen (Antezedenttyp) im L1-Erwerb des Deutschen bei Kindern im Alter von ca. neun bis zehn Jahren haben Bryant & Noschka (2015) untersucht. Mithilfe einer Entscheidungsaufgabe (Auf welchen der zuvor genannten Referenten trifft eine bestimmte Eigenschaft zu? Bsp. Wer ist weiß?) wollten die Autorinnen herausfinden, inwiefern die Auflösung von Personalpronomina (er), D-Pronomina (der) und Demonstrativpronomina (dieser) in genusambigen Kontexten von der syntaktischen Rolle/Nennposition des Referenten beeinflusst wird. Die Autorinnen fanden heraus, dass Personalpronomina präferiert in Richtung des Referenzausdrucks in Subjektfunktion/Erstnennung und D-Pronomina sowie Demonstrativa häufiger an Referenzausrücke in Nicht-Subjektfunktion/Nicht-Erstnennung angebunden werden. Bei der Auflösung des Personalpronomens verhalten sich die Kinder vergleichbar wie Erwachsene. Bei den Demonstrativpronomina und D-Pronomina besteht jedoch ein Unterschied zwischen Kindern und Erwachsenen: die Tendenz, diese Anapherformen in Richtung des zweitgenannten Referenten aufzulösen, ist bei den Erwachsenen stärker ausgeprägt als bei den Kindern. Diese Befunde signalisieren, dass der Erwerb der Pronomenauflösung auf der Grundlage des Antezedenttyps im Alter von neun bis zehn Jahren noch nicht vollständig abgeschlossen ist. Weitere Befunde zum Einfluss der Form des Pronomens und der syntaktischen Rolle/Nennposition des Antezedenten liegen für den L1-Erwerb des Deutschen
Beispiele aus Järvikivi et al. (2014: 5)
Die Interpretation anaphorischer Pronomina bei Kindern
259
(Bittner 2007) und den L1-Erwerb des Russischen (Gagarina 2007) vor. Im Rahmen einer Entscheidungsaufgabe wurde zum einen die Interpretation verschiedener anaphorischer Pronomina (Nullpronomina, Personalpronomina und Demonstrativpronomina) in genusambigen Kontexten bei Kindern im Alter zwischen vier und sechs Jahren untersucht. Zum anderen interessierte man sich dafür, inwiefern die syntaktische Rolle der Diskursreferenten die Prominenz des Referenten in der mentalen Diskursrepräsentation bereits vor der Rezeption der anaphorischen Pronomina, also während der prä-pronominalen Verarbeitung, beeinflusst. Die Ergebnisse der Studien legen nahe, dass der Erwerb der Fähigkeit, Cues während der pronominalen Phase zu verarbeiten, in beiden Sprachen ähnlich verläuft. Ab ca. dem 4. Lebensjahr beginnen die Kinder in beiden Sprachen, die unterschiedlichen Formen des Pronomens an spezifische Referenten (Subjekte vs. Objekte) anzubinden. Die Anbindungspräferenzen verändern sich zwischen dem vierten und dem 5. Lebensjahr: im Alter von vier Jahren (3;06⁶) tendieren die Lerner beider Sprachen dazu, Nullanaphern häufiger in Richtung der Subjektantezedenten und Personalpronomina in Richtung der Objektantezedenten aufzulösen. Ab dem 5. Lebensjahr (4;06) ändert sich das Auflösungsverhalten: Das Personalpronomen wird mit dem Subjekt verknüpft, das Demonstrativpronomen tendenziell mit dem Objekt. Das Demonstrativpronomen wird allerdings in beiden Entwicklungsstadien – anders als bei Erwachsenen – auch an das Subjekt angebunden. Dieses Verhalten wurde insb. bei Kindern im Alter von 2;06, 4;00 und 5;06 beobachtet. Dies deutet darauf hin, dass der Erwerb des Cues Antezedenttyp, also des Wissens über die spezifischen Anbindungspräferenzen unterschiedlicher Formen anaphorischer Pronomina bei Kindern im Alter von ca. vier Jahren beginnt, bis zum 6. Lebensjahr jedoch noch nicht abgeschlossen ist. Im Hinblick auf die Entwicklung der Fähigkeit, die Zugänglichkeit von Diskursreferenten im laufenden Diskurs vor der Verarbeitung eines anaphorischen Ausdrucks zu berechnen (prä-pronominale Phase), deuten die Ergebnisse der Studien darauf hin, dass bereits bei den jüngsten Kindern in dieser Studie ein Subjektreferent eine höhere Zugänglichkeit hat als ein Nicht-Subjektreferent. Die Kinder tendieren dazu, alle Pronomenformen häufiger an den Subjektreferenten anzubinden. Dieses Verhalten ändert sich bis zum sechsten Lebensjahr nicht.
Die Zahl vor dem Semikolon gibt Jahre, die nach dem Semikolon Monate an: 3; 06 ist zu lesen als 3 Jahre und 6 Monate.
260
Hana Klages und Johannes Gerwien
2.2 Koordination probabilistischer und reliabler Cues Das kindliche Auflösungsverhalten in Kontexten, in denen beide Cue-Typen – der probabilistische Cue Antezedenttyp sowie der reliable Cue Genus – für die Pronomenauflösung zur Verfügung stehen, wurde für den L1-Erwerb des Englischen von Arnold, Brown-Schmidt & Trueswell (2007) untersucht. Im Rahmen einer Visual World-Studie sowie mithilfe einer Entscheidungsaufgabe (Welches Bild passt zum gehörten Diskurs?) verfolgten die Autoren die Frage, ob Kinder im Alter zwischen vier und fünf Jahren mit Englisch als L1 beide Cue-Typen bei der Pronomenauflösung gleichermaßen berücksichtigen. Hierzu wurden den Probanden Diskurse mit anaphorischen Personalpronomina in genusambigen Kontexten (Bsp. 6) sowie genuseindeutigen Kontexten (Bsp. 7) präsentiert. (6) Donald (mask) is bringing some mail to Mickey(mask). He’s carrying an umbrella, and it looks like they’re both going to need it. Donald(mask) bringt Mickey(mask) einen Brief. Er hat einen Schirm und es sieht so aus, als ob ihn beide bald brauchen würden. (7) Donald(maks) is bringing some mail to Minnie (fem). He’s/She’s carrying an umbrella, and it looks like they’re both going to need it. Donald(mask) bringt Minnie(fem) einen Brief. Er/Sie hat einen Schirm und es sieht so aus, als ob ihn beide bald brauchen würden. Die Ergebnisse aus beiden Aufgaben zeigen für die genuseindeutigen Kontexte (Bsp. 6), dass bereits 4-jährige Kinder Genus-Information für die Pronomenauflösung nutzen, d. h. die Pronomina an die genuskongruenten Referenten anbinden. In dieselbe Richtung deuten die Ergebnisse aus der Entscheidungsaufgabe. Bei 5-Jährigen erfolgt die Genus-Nutzung sogar genauso schnell wie bei den Erwachsenen, die in dieser Studie als Kontrollgruppe dienten (200 ms nach Pronomen-Onset). Effekte der syntaktischen Rolle / Nennposition der Referenzausdrücke konnten dagegen bei allen untersuchten Kindern in keinem der beiden Kontexte (genusambig vs. -eindeutig) festgestellt werden. Erwachsene berücksichtigen dagegen bereits bei 200 ms nach Pronomen-Onset die syntaktische Rolle der potentiellen Antezedenten (Arnold et al. 2000). Diese Ergebnisse interpretieren Arnold, Brown-Schmidt & Trueswell (2007) dahingehend, dass 5-jährige Kinder im L1-Erwerb das Wissen über die Rolle von probablistischen Cues noch nicht erworben haben. Im Hinblick auf den Verlauf des Erwerbs nehmen die AutorInnen an, dass reliable Hinweise (Genus) im Spracherwerb vor den probabilistischen (Antezedenttyp) erworben werden. Anders als in den vorigen Studien ist die Be-
Die Interpretation anaphorischer Pronomina bei Kindern
261
rücksichtigung probabilistischer Cues – selbst in genusambigen Kontexten – nicht vor dem 6. Lebensjahr zu erwarten. Die Annahme, dass reliable Cues vor den probabilistischen erworben werden, begründen Arnold, Brown-Schmidt & Trueswell (2007) damit, dass die Evidenz aus dem Input bei reliablen Hinweisen eindeutig ist und ihre Rolle bei der Auflösung deshalb für den Lerner leichter erschließbar ist als die Rolle und Funktionsweise der probabilistischen Cues. Der Erwerb probabilistischer Cues wird nach Arnold, Brown-Schmidt & Trueswell (2007) möglicherweise sogar erst durch die „Kenntnis“ der reliablen Cues ausgelöst: Nachdem Kinder den Antezedenten eines Pronomens auf der Grundlage der Genuskongruenz ausreichend häufig identifiziert haben, merken sie, dass dieser in Abhängigkeit von der Pronomenform vermehrt auch eine bestimmte Position bzw. syntaktische Funktion im vorausgegangenen Satz einnimmt (z. B. Subjekt vs. Nicht-Subjekt). Sie beginnen dann, ihre Aufmerksamkeit auf dieses Phänomen zu richten. Klages & Gerwien (2015) untersuchten im Rahmen ihrer Visual World-Studie, ob 5-, 7- und 9-jährige Kinder im L1-Erwerb des Deutschen die reliablen Cues Genus, sowie die probabilistischen Cues Referenttyp (syntaktische Rolle gekoppelt an die Nennposition) und Antezedenttyp (d. h. Anbindungspräferenz bei Personalpronomina) während der Pronomenauflösung nutzen. Hierzu wurden den Probanden kurze Diskurse präsentiert (8) Die Freunde waren im Sandkasten. Die Fee hat den König im Sand eingebuddelt. Sie/Er war zum ersten Mal in diesem Sandkasten. Um Erkenntnisse über die kindliche Sensibilität gegenüber den Eigenschaften der Referenzausdrücke im prä-pronominalen Diskurs zu gewinnen (syntaktische Rolle gekoppelt an die Nennposition), analysierten die Autoren Blicke, die 375 ms nach Pronomen-Onset (Zeitfenster 1) registriert wurden. Aussagen über die Verarbeitung von Genus und Antezedenttyp wurden auf der Grundlage der Analyse von Blicken im Zeitfenster zwischen 375 und 1000 ms nach Pronomen-Onset (Zeitfenster 2) getroffen. Die Ergebnisse zeigen, dass Kinder in allen drei Altersgruppen sowohl den reliablen Cue Genus als auch die probabilistischen Cues Referenttyp (syntaktische Rolle gekoppelt an die Nennposition) und Antezedenttyp während der Pronomenauflösung berücksichtigen. Dies bedeutet nicht nur, dass Kinder im L1-Erwerb des Deutschen eine Sensibilität für alle drei Cues bereits mit fünf Jahren entwickelt haben, sondern auch, dass sie in der Lage sind, diese während der Pronomenauflösung zu koordinieren. Des Weiteren zeigen die Ergebnisse, dass sich die Verarbeitung der probabilistischen Cues (in genuseindeutigen Kontexten) bis zum 9. Lebensjahr entwickelt.
262
Hana Klages und Johannes Gerwien
Im Hinblick auf die prä-pronominale Verarbeitung der syntaktischen Funktion der Referenzausdrücke als Hinweis auf die Prominenz des Diskursreferenten kann die Entwicklung als U-Form beschrieben werden: die jüngsten (fünf Jahre) und die ältesten Kinder (neun Jahre) richten ihre Aufmerksamkeit, bevor sie das Pronomen verarbeiten, stärker auf den Referenten mit der syntaktischen Funktion Objekt. Die mittlere Gruppe (sieben Jahre) zeigt hingegen keine Präferenz für Objekte oder Subjekte. Vergleichbares gilt auch für die Entwicklung der pronominalen Verarbeitung des Antezedenttypen. Auch hier deuten die Ergebnisse auf eine U-förmige Entwicklung hin. Während die 5- und die 9-jährigen eine höhere Aufmerksamkeit auf Objekte im Vergleich zu den Subjekten richten, ist bei den 7jährigen keine Präferenz festzustellen. Die Anteile der Blicke auf syntaktische Objekte sind bei den 9-jährigen niedriger als bei den 5-jährigen. Die erhöhte Aufmerksamkeit auf syntaktische Objekte kann auf vielfache Weise interpretiert werden. Für die 5-jährigen halten die Autoren es für möglich, dass die erhöhte Aufmerksamkeit auf die Objektausdrücke auf die sog. Überprüfungsstrategie zurückzuführen ist. Im Rahmen dieser Strategie wird das bereits vorhandene Default-Sprachwissen, das hier als (a) Subjekte sind präferierte Kandidaten zur Wiederaufnahme und (b) Subjekte fungieren als präferierte Antezedenten eines Personalpronomens umschrieben werden kann, überprüft. Im Rahmen der Überprüfung rücken diejenigen Formen in den Fokus der Aufmerksamkeit, die vom Lerner bislang nicht mit den beschriebenen Funktionen in Verbindung gebracht wurden. Dazu zählen z. B. Nicht-Subjekte. Die Überprüfungsstrategie, die die Autoren als charakteristisch für ein bestimmtes Erwerbsstadium (hier für das Stadium der 5-jährigen) betrachten, dient der Ausdifferenzierung des bisherigen Sprachwissens. Außerdem wird bei der Gruppe der Fünfjährigen die Möglichkeit in Betracht gezogen, dass die Befunde durch die Letztnennung des syntaktischen Objekts zusätzlich beeinflusst sind. Im Hinblick auf die 9-Jährigen gehen die Autoren hingegen davon aus, dass in diesem Alter das Wissen über die „Eignung“ von Subjekten bzw. Nicht-Subjekten für die beschriebenen Funktionen bereits ausdifferenziert ist. Die 9-jährigen „wissen“ also, dass Nicht-Subjekte im Deutschen die markierten Antezedenten eines Personalpronomens sind und „rechnen“ also eher selten damit, dass sie in dieser Funktion auftreten. In Diskursen, in denen dies trotzdem der Fall ist (wie in 50 % der Items in dem zugrunde gelegten Experiment), ist ihre Verarbeitung dann entweder mit einem höheren kognitiven Aufwand verbunden, oder syntaktische Objekte ziehen als Ausnahmen eine besondere Aufmerksamkeit auf sich. Letzteres kann als Resultat einer „Verwunderung“ betrachtet werden. Beides kann sich in einer erhöhten kognitiven Aufmerksamkeit, die entsprechend durch höhere Blickanteile reflektiert wird, niederschlagen.
Die Interpretation anaphorischer Pronomina bei Kindern
263
Den Grund für die unterschiedliche Interpretation der Befunde in diesen beiden Gruppen liefern die Ergebnisse bei den 7-jährigen, bei denen keine Effekte der syntaktischen Rolle beobachtet wurden. Dies spricht nach Klages & Gerwien (2015) dafür, dass das Alter von sieben Jahren im L1-Erwerb des Deutschen eine „Schwelle“ darstellt. In diesem Alter verschwinden einerseits die möglichen Effekte der Letztnennung. Anderseits ist in diesem Alter die Überprüfung der NichtDefault-Fälle abgeschlossen.
2.3 Fazit Die Ergebnisse der hier referierten Studien zeigen, dass die syntaktische Funktion oder Nennposition der Referenzausdrücke im L1-Erwerb verschiedener Sprachen die Prominenz der Diskursreferenten bei Kindern beeinflusst. Dabei scheinen Ausdrücke in Subjektfunktion bzw. Erstnennung prinzipiell prominenter als die komplementären Referenten zu sein, zumindest im Hinblick auf das DefaultWissen der Lerner. Ihre Prominenz kann allerdings in bestimmten Erwerbsphasen sinken, was der Umstrukturierung des Lernerwissens – wie für das Deutsche angenommen – geschuldet sein kann. Auch das Alter, in dem Kinder beginnen, die Sensibilität für die Referentenprominenz zu entwickeln, variiert scheinbar von Sprache zu Sprache. Für das Englische wurde eine solche Sensibilität bereits bei Kindern im Alter von zweieinhalb Jahren beobachtet, für das Deutsche und das Russische erst bei Kindern im Alter von ca. vier Jahren. Ein möglicher Grund für diese Befunde können die typologischen Unterschiede zwischen den Sprachen sein: Englisch hat eine relativ feste Wortstellung, bei der Subjekte immer in Erstnennungen auftreten, während im Deutschen und Russischen Subjekte an verschiedenen Positionen im Satz auftreten können, d. h. Subjekt und Erstnennung sind nicht immer deckungsgleich. Des Weiteren machen die Befunde deutlich, dass bereits junge Kinder im L1Erwerb verschiedene Pronomina in Texten in differenzierter Weise anaphorisch interpretieren, der Erwerb der spezifischen Anbindungpräferenzen der verschiedenen Pronomenformen, d. h. der Erwerb des probabilistischen Cues Antezedenttyp, sich aber bis mindestens zum 10. Lebensjahr vollzieht. In Hinblick auf reliable Cues (hier Genus) legen die Befunde nahe, dass diese mit großer Sicherheit bereits vor dem 5. Lebensjahr als relevante Cues erkannt werden. Für das Englische wurde dies für Kinder im Alter von vier Jahren nachgewiesen, für das Deutsche mit Sicherheit für Kinder im Alter von fünf Jahren. Anders als bei den probabilistischen Cues ist bei den reliablen davon auszugehen, dass der Erwerb nach Erkennen der Relevanz für die Pronomenauflösung auch relativ schnell abgeschlossen ist.
264
Hana Klages und Johannes Gerwien
Was die Koordination verschiedener Cues betrifft, lässt sich auf der Grundlage der hier referierten Studien sagen, dass die Berücksichtigung mehrerer Cues offenbar im Erwerbsverlauf später zu beobachten ist, als die Berücksichtigung nur eines Cues. Für das Deutsche scheint sich diese Fähigkeit ab etwa dem 5. Lebensjahr zu entwickeln, für das Englische wurde dies ab dem 6. Lebensjahr beobachtet.
3 Was wissen wir über den L2-Erwerb? Es wurde bereits oben auf spezifische sprachtypologische Unterschiede hingewiesen, die bei der Pronomenauflösung eine gewisse Rolle spielen. Derartigen sprachtypologischen Besonderheiten muss die L2-Erwerbsforschung natürlich Rechnung tragen. Unterschiede zwischen dem System der L1 und der L2 könnten zum Beispiel dazu führen, dass ein reliabler Cue C in der L2 vom Sprachlerner nicht bzw. im Vergleich zu monolingualen Lernern erst später als solcher erkannt wird, z. B. weil der Cue C in der L1 des mehrsprachigen Lerners nicht existiert. Ein Beispiel wäre das Genus im Deutschen, das von einem Lerner mit der L1 Türkisch erworben werden muss. Außerdem erscheint es möglich, dass ein Cue in der L2, obwohl er objektiv als reliabel zu kategorisieren wäre, für einen L2-Lerner keine verlässliche Quelle für die Pronomenauflösung darstellt, weil die Beherrschung dieses Cues eine solide Kenntnis der Lexik inklusive aller grammatischen Spezifikationen in der L2 voraussetzt. Das Genus, das in einem Pronomen kodiert ist, kann zum Beispiel nur dann für die Pronomenauflösung genutzt werden,wenn der Lerner das Genus des Pronomens (z. B. er =Maskulin) UND auch das Genus potenzieller Antezedenten (den Hund = Maskulin) dekodieren kann. Vor diesem Hintergrund stellt sich natürlich auch die Frage nach der Gewichtung und Koordinierung verschiedener Cues. Erfolgen sie ab einem bestimmten Zeitpunkt auf dieselbe Weise wie bei Monolingualen der Zielsprache (Erwerbsverlauf)? Wenn ja, ab wann werden welche Stadien dabei bewältigt (Erwerbstempo)? Da im Vergleich zum L1-Erwerb empirische Untersuchungen zum frühen L2-Erwerb viel seltener sind, ist eine differenzierte Beantwortung dieser Fragen schwierig. Im Folgenden werden Ergebnisse von drei aktuellen Studien zum Erwerb des Deutschen als L2 vorgestellt und diskutiert. Zwei davon befassen sich mit der Pronomenauflösung in genusambigen Kontexten und eine untersucht die Pronomenauflösung in nicht-genusambigen Kontexten.
Die Interpretation anaphorischer Pronomina bei Kindern
265
3.1 Probabilistische Cues Im Rahmen der bereits in Abschnitt 2 vorgestellten Studie von Bryant & Noschka (2015) wurden 9- bis 10-jährige L2-Lerner des Deutschen mit unterschiedlichen Erstsprachen untersucht. Die Ergebnisse zeigen, dass L2-Kinder tendenziell Personalpronomina (er) – ähnlich wie gleichaltrige L1-Kinder – in Richtung Subjekt und Demonstrativa (dieser) in Richtung des Antezedenten im Komplement (NichtSubjekt) auflösen. Diese Tendenz ist im L2-Erwerb jedoch deutlich geringer ausgeprägt als im L1-Erwerb. Dies ist insbesondere dem heterogenen Verhalten der mehrsprachigen Kinder geschuldet. Einige dieser Kinder verfolgen die oben genannte Anbindungstendenz nicht und binden beide Pronomentypen häufiger an das Subjekt an, andere dagegen an das Nicht-Subjekt. Das heterogene Verhalten der Kinder ist nach den Ergebnissen der qualitativen Analyse zu Kindern mit den Erstsprachen Russisch und Türkisch nicht auf die Ausgangssprachen der Kinder zurückführbar (vgl. Bryant & Noschka 2015: 37). Die Analyse der Anbindungspräferenzen des D-Pronomens (der) zeigte, dass dieses den Kindern die größten Schwierigkeiten bereitet und bei 10-Jährigen (noch) nach dem Zufallsprinzip erfolgt. Diese Ergebnisse sehen die Autorinnen als Beleg dafür, dass die Kinder im Erwerb der Anbindungspräferenzen verschiedener Anapherformen in der L2 Deutsch zunächst die Funktion für diejenigen pronominalen Formen erwerben, die sich auf dem Komplexitätskontinuum (s. Abb. 3) möglichst weit rechts oder links befinden. Das Wissen über Anbindungspräferenzen von Formen, die zwischen diesen zwei Polen liegen (z. B. D-Pronomen) wird erst in späteren Erwerbsstadien (nach dem 10. Lebensjahr) erworben. Schimke (2015) untersuchte im Rahmen einer Studie mit selbstgesteuertem Lesen die kindliche Fähigkeit zur Verarbeitung von verschiedenen Anaphertypen (Nullanapher, Personalpronomina und wiederholte NP) auf der Grundlage des probabilistischen Cues Antezedenttyp in Kontexten mit einem potentiellen Antezedenten. Untersucht wurden 10-jährige Kinder mit Türkisch als L1, die Deutsch als frühe L2 erwerben. Die Kontrollgruppe bildeten gleichaltrige Kinder mit Deutsch als L1. Die Ergebnisse der Studie zeigen, dass Kinder beider Erwerbstypen Sätze wie in Beispiel (9) schneller gelesen haben als Sätze wie in Beispiel (10) und diese wiederum schneller als Sätze wie in Beispiel (11). (9) Nullanapher: Jonas sitzt auf dem Boden, und _ malt ein Bild. (10) Personalpronomen: Jonas sitzt auf dem Boden, und er malt ein Bild. (11) Wiederholter Eigenname: Jonas sitzt auf dem Boden, und Jonas malt ein Bild. Dieses Leseverhalten interpretiert die Autorin als Beleg dafür, dass Kinder beider Erwerbstypen gleichermaßen zielsprachig die Angemessenheit der jeweiligen
266
Hana Klages und Johannes Gerwien
Anapher in den vorliegenden Diskursen beurteilen, d. h. die Nullanapher (Bsp. 9) als angemessener im Vergleich zu dem Personalpronomen (Bsp. 10) und diese wiederum angemessener als den anaphorisch verwendeten Eigennamen (Bsp. 11) wahrnehmen. Dies wird als Hinweis darauf gewertet, dass 10-jährige Kinder im L1und L2-Erwerb des Deutschen eine Sensibilität für den Zusammenhang zwischen Eigenschaften der Referenzausdrücke aus dem früheren Diskurs und den untersuchten Anapherformen besitzen. Anders als Bryant & Noschka (2015) hat Schimke (2015) keine quantitativen Unterschiede zwischen den zwei Erwerbstypen festgestellt: die Beurteilung der Angemessenheit der Anaphern wurde nach Ergebnissen ihrer Studie im L1- und L2Erwerb vergleichbar häufig und vergleichbar schnell vorgenommen (hier gemessen durch die Lesegeschwindigkeit). Das bedeutet, dass in diesem Untersuchungsparadigma Kinder im L2-Erwerb Deutsch mit zehn Jahren den gleichen Erwerbsstand aufweisen wie gleichaltrige Kinder im L1-Erwerb. Rückschlüsse darüber, ob der L2- und L1-Erwerb im Alter von zehn Jahren bereits abgeschlossen ist und wie sein Verlauf bzw. Tempo sich bis zum 10. Lebensjahr in dem jeweiligen Erwerbstyp gestaltet hat, können nicht gezogen werden. Obgleich die Ergebnisse in Schimke (2015) keine Unterschiede zwischen den Leistungen der L1- und der L2-Lerner aufdecken, so können sie trotzdem nicht als widersprüchlich zu den Hauptaussagen von Bryant & Noschka (2015) betrachtet werden, nach denen der Erwerb probabilistischer Cues in der pronominalen Phase für unterschiedliche Typen von Anaphern unterschiedlich schnell erfolgt. Vielmehr sind die beiden Studien als komplementär zu betrachten. Bis auf das Personalpronomen untersuchte Schimke (2015) andere Anaphertypen als Bryant & Noschka (2015). Betrachtet man Befunde aus beiden Studien zusammen, so kann geschlussfolgert werden, dass Lerner des Deutschen als L2 die Interpretation von Personalpronomina, Nullanaphern und wiederholten Nominalphrasen im Alter von zehn Jahren weitgehend beherrschen (Schimke 2015), während der Erwerb der Fähigkeit zur Auflösung von D-Pronomina und Demonstrativpronomina bei ihnen noch nicht vollständig abgeschlossen ist (Bryant & Noschka 2015).
3.2 Koordinierung probabilistischer und reliabler Cues Klages & Gerwien untersuchten die Entwicklung der Fähigkeit zur Verarbeitung reliabler (Genus) und probabilistischer (syntaktische Rolle/Nennposition und Antezedenttyp) Cues im L2-Erwerb des Deutschen durch 5-, 7- und 9-jährige Kinder mit Russisch als L1 (2015, s. auch Abschnitt 3). Die Ergebnisse ihrer Visual WorldStudie zeigen, dass Kinder aller Altersgruppen in der L2 ebenso wie L1-Kinder den reliablen Cue Genus für die Pronomenauflösung nutzen. Im Hinblick auf den
Die Interpretation anaphorischer Pronomina bei Kindern
267
Erwerb der probabilistischen Cues ergibt sich für die L2-Kinder ein anderes Bild. So wird deutlich, dass Kinder im L2-Erwerb des Deutschen erst ab dem 7. Lebensjahr die probabilistischen Cues verarbeiten: In der Gruppe der 5-Jährigen wurden weder in der prä-pronominalen, noch in der pronominalen Phase Effekte der syntaktischen Rolle der Referenzausdrücke aus dem vorausgehenden Diskurs beobachtet. Solche Effekte konnten erst bei den 7-Jährigen für die pronominale Phase (Antezedenttyp) und bei den 9-Jährigen für die prä-pronominale Phase (Referenttyp) festgestellt werden. Dabei wurden bei den 7-Jährigen höhere Blickanteile auf dem Objektreferenten, bei den 9-Jährigen auf dem Subjektreferenten registriert. Diese Befunde interpretieren die Autoren dahingehend, dass Kinder im L2-Erwerb des Deutschen die Fähigkeiten zur Koordination des reliablen Cues Genus und der probabilistischen Cues mit Sicherheit erst ab dem 7. Lebensjahr erwerben. Im Hinblick auf die Erwerbsabfolge der verschiedenen probabilistischen Cues Antezedenttyp und Referenttyp schlussfolgern die Autoren, dass Kinder im L2Erwerb des Deutschen zunächst für den Cue Antezedenttyp sensibel werden. Die Fähigkeit zur Berücksichtigung der syntaktischen Rolle der Referenzausdrücke als Hinweis auf die Wahrscheinlichkeit, mit der ein Referent im Folgediskurs wiederaufgenommen wird (Referenttyp), scheint sich dagegen erst in späteren Erwerbsstadien zu entwickeln. Besonderes Augenmerk legen Klages & Gerwien (2015) auf die bei den 7Jährigen beobachtete Objektpräferenz bei der Anbindung anaphorischer Personalpronomina. Für möglich halten die Autoren analog zu den Befunden zum L1Erwerb des Deutschen (vgl. Abschnitt 3), dass die höhere Aufmerksamkeit auf dem Objektantezedenten mit dem Erkennen seines markierten Charakters zusammenhängt (Ausdrücke in Objektfunktion sind eher untypische Antezedenten eines Personalpronomens). Die mentale Kategorisierung des Objektantezedenten als markiert setzt das Vorhandensein des Wissens über unmarkierte Antezedenten voraus (Ausdrücke in Subjektfunktion sind die typischen Antezedenten eines Personalpronomens). Dieses Wissen wird im ersten Erwerbsstadium zwischen dem 5. und dem 7. Lebensjahr erworben, so lassen es die Ergebnisse vermuten. Mit sieben Jahren „überprüfen“ die Kinder also die Gültigkeit des Wissens über den Default in ihrer L2 (verknüpfe Pronomen mit Subjekten), indem sie die Ausnahmen in den Fokus der Aufmerksamkeit nehmen (verknüpfe Pronomina mit Objekten). Diese Überprüfungsphase, die als zweites Erwerbsstadium bezeichnet werden kann, ist vor dem 9. Lebensjahr abgeschlossen. Darauf weisen sowohl das Verschwinden der höheren Aufmerksamkeit auf dem Objektantezedenten bei 9-Jährigen hin, als auch die im Vergleich zu den 5-Jährigen festgestellte höhere Aufmerksamkeit auf dem Subjektreferenten. Letzteres reflektiert den Beginn des
268
Hana Klages und Johannes Gerwien
dritten Erwerbsstadiums, in dem die Konsolidierung des Default, also der Präferenz, Personalpronomina an Antezedenten in Subjekt anzubinden, beginnt. Alternativ halten die Autoren für möglich, dass das erste Erwerbsstadium durch russischsprachige Lerner durch die Anbindung des Personalpronomens an Objekte gekennzeichnet ist. Dieses Stadium findet im L2-Erwerb um das 7. Lebensjahr statt. Wie die Untersuchungen zum L1-Erwerb des Deutschen von Bittner (2007) und Gagarina (2007) zeigen, binden auch L1-Lerner des Deutschen und des Russischen Personalpronomina im ersten Stadium (Alter ca. 4 Jahre) an Objekte an. Diese Tendenz verschwindet im zweiten Stadium um das 5. Lebensjahr (vgl. Abschnitt 3). Klages & Gerwien (2015) schließen einen ähnlichen Erwerbseinstieg auch für den L2-Erwerb nicht aus, wobei entsprechend ihrer Befunde der Beginn des ersten Stadiums wesentlich später zu liegen scheint. Dies kann durch verschiedene Faktoren bedingt sein, wie z. B. die meist geringere Quantität und Qualität des Inputs in der L2 oder dem gegenseitigen Einfluss der Wissensbestände aus den zwei Sprachen Russisch und Deutsch (Interferenz). Auch wenn das Deutsche und das Russische über das gleiche Inventar an pronominalen Formen, die anaphorisch gebraucht werden können, verfügen (Nullformen, Personalpronomina, D-Pronomina, Demonstrativpromina), so unterscheiden sich die beiden Sprachen hinsichtlich der Vorkommensbeschränkungen der jeweiligen Formen (zu Nullformen im Russischen vgl. Gagarina 2007: 145, 146). So muss ein L2-Lerner nicht nur die einzelsprachspezifischen Beschränkungen erkennen, sondern sie auch den jeweiligen Systemen zuordnen – all dies kann sich in einer längeren Erwerbsdauer manifestieren (siehe auch Schimke et al. in diesem Band).
3.3 Fazit Auch für den L2-Erwerb gilt, dass die syntaktische Funktion oder Nennposition der Referenzausdrücke die Prominenz der Diskursreferenten beeinflusst. Im Hinblick auf das Alter, in dem Kinder über die Sensibilität für diesen Einfluss verfügen, ist auf der Grundlage der referierten Studien davon auszugehen, dass erst bei den 9jährigen Lernern des Deutschen als L2 (mit Russisch als L1) eine solche Sensibilität vorhanden ist. Des Weiteren belegen die Befunde, dass Kinder im L2-Erwerb bereits mit fünf Jahren verschiedene Pronomina in Texten prinzipiell in differenzierter Weise anaphorisch interpretieren können, der Erwerb der spezifischen Anbindungspräferenzen der verschiedenen Pronomenformen, d. h. der Erwerb des Wissens über den Cue Antezedenttyp, sich aber bis mindestens zum 10. Lebensjahr vollzieht.
Die Interpretation anaphorischer Pronomina bei Kindern
269
Inwiefern der Erwerb der Fähigkeit, bestimmte probabilistische Cues während der pronominalen Phase zu verarbeiten, sprachspezifischen Mustern unterliegt, kann aufgrund der eher raren Ergebnisse zum jetzigen Zeitpunkt noch nicht endgültig beantwortet werden. Als ein sprachübergreifendes Erwerbsmuster kann dagegen derzeit Folgendes betrachtet werden. Zunächst wird das Wissen über die Anbindungspräferenzen von wenig komplexen anaphorischen Pronomina, z. B. von Personalpronomina, erworben. Darauf folgt der Erwerb der Informationen zum Antezedenttyp von komplexeren bedeutungsleeren anaphorischen Formen. Die Anbindungsregel für Demonstrativpronomina (dieser) wird dabei leichter erlernt als die Regel für D-Pronomina (der). In Hinblick auf reliable Cues (hier Genus) können nur Ergebnisse aus der Studie von Klages & Gerwien (2015) herangezogen werden. Die Befunde legen nahe, dass Kinder im Erwerb des Deutschen als L2, die einen bestimmten Cue bereits aus ihrer L1 kennen, spätestens mit fünf Jahren dessen Relevanz für die Pronomenauflösung auch in der L2 erkennen und nutzen. In diesem Alter ist Genus auch der einzige Cue, den Kinder innerhalb der pronominalen Phase verarbeiten. Für die Fähigkeit zur Koordination verschiedener Cue-Typen liefert der derzeitige Forschungsstand Hinweise darauf, dass sich diese bei Kindern mit Deutsch als L2 etwa ab dem 7. Lebensjahr zu entwickeln beginnt.
4 Zusammenfassung und Ausblick Kompetente Sprecher verfügen über die Fähigkeit, Koreferenz zwischen einem Antezedens und einem anaphorischen Ausdruck herzustellen (Abb. 1). Die Frage, die sich die Sprachverstehensforschung in diesem Zusammenhang stellt, lautet, welche kognitiven Prozesse zusammengenommen diese Fähigkeit ergeben und welche Informationen für die beteiligten Prozesse relevant sind. Neben der Unterscheidung verschiedener Phasen während der Informationsverarbeitung hat die bisherige Forschung relativ klar herausgearbeitet, welche Informationen kompetente Sprecher überhaupt für die Herstellung von Koreferenz nutzen. Diese Informationen wurden hier Auflösungshinweise, kurz Cues, genannt. Eine mögliche Unterscheidung in diesem Zusammenhang ist die Differenzierung zwischen solchen, die als reliabel und solchen, die als probabilistisch gelten. In Hinblick auf den Erwerb der Fähigkeit anaphorische Ausdrücke zu interpretieren wurde im vorliegenden Beitrag zunächst dargelegt, was im Bereich des monolingualen L1-Erwerbs bisher bekannt ist. Als aktuelle Forschungsfragen konnten die folgenden identifiziert werden: Wann im Erwerbsverlauf erwerben
270
Hana Klages und Johannes Gerwien
Kinder die Kompetenz, reliable und probabilistische Cues zu nutzen? Und wie entwickelt sich die Fähigkeit zur Koordination beider Cue-Typen im Erwerb? Einerseits wurde Evidenz dafür gefunden, dass Kinder im L1-Erwerb (Englisch) bereits in einem sehr frühen Alter (zweieinhalb Jahre) probabilistische Cues für die Zuweisung der Referentenzugänglichkeit als Grundlage für die Pronomenauflösung nutzen (z. B. syntaktische Rolle/Nennposition). Andererseits wurden Hinweise darauf gefunden, dass probabilistische Cues erst später erworben werden (ab ca. 5 Jahre). Im Vergleich zu den probabilistischen Cues scheint der Erwerb der Fähigkeit zur Verarbeitung reliabler Cues nach Ergebnissen der hier berücksichtigten Studien im L1-Kontext also etwas später zu beginnen, allerdings scheint er früher abgeschlossen zu sein, wahrscheinlich bereits in einem Alter von fünf Jahren. Was die Entwicklung der Fähigkeit zur Koordination verschiedener Cues (probabilistische und reliable) betrifft, sind empirische Befunde derzeit rar. Es ist jedoch davon auszugehen, dass Kinder zunächst nicht in der Lage sind, mehrere Cues simultan zu nutzen und zu koordinieren. Die wenigen verfügbaren Studien deuten darauf hin, dass sich diese Fähigkeit zwischen dem 5. und 6. Lebensjahr, womöglich abhängig von der zu erwerbenden Sprache, entwickelt. Anzumerken bleibt natürlich, dass in den hier vorgestellten Studien unterschiedliche experimentelle Paradigmen bzw. Analyseverfahren verwendet wurden, was zumindest die Möglichkeit nicht ausschließt, dass die Ergebnisse nicht uneingeschränkt vergleichbar sind. Im Hinblick auf den L2-Erwerb wurde deutlich, dass die bestehenden Konzeptionen im L1-Erwerb im Prinzip auch auf den Erwerb einer L2 übertragen werden. Auch hier werden Fragen zum Erwerbsverlauf und zum Erwerbstempo gestellt. Die Befunde zum L2-Erwerb müssen auf dem jetzigen Stand der Forschung allerdings als unvollständig bezeichnet werden. Dies ist zum einen dadurch gerechtfertigt, dass bisher längst nicht alle relevanten Altersstufen untersucht wurden und zum anderen dadurch, dass bis jetzt nur für sehr wenige L1-L2Konstellationen empirische Befunde vorliegen. Was probabilistische Cues betrifft kann aus den bisherigen Studien geschlussfolgert werden, dass diese im Alter von sieben Jahren genutzt werden, zumindest der Cue Antezedenttyp. Generell ist aber davon auszugehen, dass der Erwerb dieses Cues in der L2 (zumindest in der L2 Deutsch) bis zum 10. Lebensjahr noch nicht vollständig abgeschlossen ist. Besondere Schwierigkeiten scheint den Lernern die Auflösung von Formen zu bereiten, die sich in der Abb. 2 eher in der Mitte befinden, wie z. B. das D-Pronomen. Ob dies eher mit der geringen Frequenz dieser Formen im Input zusammenhängt, oder es der Anordnung der Form auf dem Kontinuum der Korrespondenz zwischen Form und Referentenprominenz geschuldet ist, kann derzeit nicht beantwortet werden.
Die Interpretation anaphorischer Pronomina bei Kindern
271
Zum Erwerb der probabilistischen Cues syntaktische Rolle bzw. Nennposition liegen bis dato nur Befunde für die L1-L2-Konstellation Russisch-Deutsch vor. Die Befunde legen nahe, dass L2-Kinder erst im Alter von neun Jahren die Zugänglichkeit potenzieller Antezedenten für die Pronomenauflösung nutzen. Es ist allerdings nicht auszuschließen, dass Kinder mit einer anderen L1, zum Beispiel Englisch, bereits sehr viel früher Anzeichen für die Nutzung dieser Cues zeigen. Reliable Cues werden im L2-Erwerb bereits von 5-Jährigen genutzt, dies gilt zumindest für das Genus und für Lerner mit einer L1, die über die Kategorie Genus verfügt. Über den Zeitpunkt, ab dem L2-Lerner über die Fähigkeit verfügen, verschiedene Cuetypen zu koordinieren, kann auf der Grundlage der verfügbaren Daten derzeit lediglich gesagt werden, dass 7-jährige Kinder mit L1-Russisch und L2-Deutsch in der L2 Anzeichen sowohl für die Berücksichtigung des Cues Genus als auch des Cues Antezedenttyp zeigen. Vergleicht man nun den L1- mit dem L2-Erwerb, scheint zu gelten, dass diejenigen Hinweise, die hier als probabilistisch bezeichnet werden, im L1-Erwerb vor den reliablen erkannt und verarbeitet werden. Im L2-Erwerb scheint es andersrum zu sein. Für beide Erwerbstypen gilt jedoch, dass die Fähigkeit, probabilistische Cues zu nutzen wesentlich länger einer Entwicklung unterliegt als die Fähigkeit, reliable Cues zu nutzen. Die Kompetenz zur Koordinierung verschiedener Cues entwickelt sich bei L1-Lernern etwas früher als bei L2-Lernern. So bewältigen Kinder im L1-Erwerb des Deutschen mit dem 5. Lebensjahr (im Englischen mit dem 6. Lebensjahr) die Cue-Koordination, während vergleichbares im L2-Erwerb des Deutschen „erst“ für die 7-Jährigen angenommen wird. Wie die hier vorliegende Darstellung zweifelsohne nahelegt, steckt die aktuelle Forschung zum L2-Erwerb der Fähigkeit, anaphorische Ausdrücke zielsprachlich zu verarbeiten, noch in den Kinderschuhen. Es ist bisher nur etwas über eine Handvoll von Sprachen bekannt. Darüber, wie Kinder mit den Erstsprachen Chinesisch, Hindi oder Arabisch zum Beispiel die Anapherauflösung in der L2 Deutsch, Englisch oder Spanisch erwerben, ist momentan unseres Wissens wenig bekannt. Weitere offene Fragen betreffen auch die gegenseitige Einflussnahme der L1 und L2, über die momentan bestenfalls spekuliert werden kann. Was das betrifft, könnte die systematische Erforschung des L2-Erwerbs durch Lerner mit Erstsprachen, die einerseits hohe und anderseits sehr geringe typologische Ähnlichkeit mit der L2 aufweisen, deutliche Einblicke ermöglichen. Des Weiteren könnte ein Vergleich sprachtypologisch verschieden zu kategorisierender L1-L2Konstellationen Muster aufdecken, die konstellationsunabhängig, also universell sind.
272
Hana Klages und Johannes Gerwien
Doch auch „im Kleinen“, d. h. in Bezug auf Details, die auch im vorliegenden Beitrag bereits angerissen wurden, gibt es noch viel zu tun. Zum Beispiel stehen systematische Untersuchungen, die das Spektrum der anaphorischen Formen stärker in den Fokus nehmen und dabei auch Aspekte der gesprochenen Sprache, wie z. B. Betonung, noch immer aus. Schließlich müssten auch die stärker an einzelne Individuen gebundenen Faktoren wie z. B., individueller Input (auch der Input in Bildungsinstitutionen oder Sprachunterricht), Sprachlerneignung, individuelle Motivation, familiäre Situation etc. stärker kontrolliert werden. Erst wenn man mehr über die Rolle dieser Faktoren in Erfahrung gebracht hat, sind differenziertere Aussagen über die Rolle von sprachspezifischen Faktoren sowie Faktoren, die mit der Kognition zweisprachiger Lerner zusammenhängen, möglich.
Literaturangaben Ariel, Mira (1988): Referring and accessibility. Journal of Linguistics 24, 65 – 87. Ariel, Mira (1994): Interpreting anaphoric expressions: A cognitive versus a pragmatic approach. Journal of Linguistics 30, 3 – 42. Ariel, Mira (2004): Accessibility marking: Discourse functions, discourse profiles, and processing cues. Discourse Processes 37, (2) 9 – 116. Arnold, Jenifer, E.: (2013): What should a theory of pronoun interpretation look like? Commentary on Kehler & Rohde (2013): A reliabilistic reconciliation of coherence-driven and centering-driven theories of pronoun interpretation. In Manfred Krifka & Hans-Martin Gärtner (Hrsg.), Theoretical Linguistics 39, 59 – 74. Arnold, Jennifer E., Sarah Brown-Schmidt & John C. Trueswell (2007): Children’s use of gender and order-of-mention during pronoun comprehension. Language and Cognitive Processes 22, 527 – 565. Arnold, Jennifer E., Janet G. Eisenband, Sarah Brown-Schmidt & John C. Trueswell, (2000): The rapid use of gender information: evidence of the time course of pronoun resolution from eyetracking. Cognition 76, B13–B26. Bialystok, Ellen (2001): Bilingualism in Development. Language, Literacy and Cognition. New York: Cambridge University Press. Bittner, Dagmar (2007): Influence of animacy and grammatical role on production and comprehension of intersentential pronouns in German L1-acquisition. ZAS Papers in Linguistics 48, 103 – 138. Bryant, Doreen & Nadine Noschka (2015): Personal- und Demonstrativpronomen im Sprachverstehensprozess. Untersuchungen zum Erwerb funktionaler Anapherdistribution bei DaM, DaF und DaZ. In Hana Klages & Giulio Pagonis (Hrsg.), Linguistisch fundierte Sprachförderung und Sprachdidaktik. Grundlagen, Konzepte, Desiderate, 17 – 46. De Gruyter. Colonna, Saveria, Sarah Schimke & Barbara Hemforth (2012): Information structure effects on anaphora resolution in German and French: A cross-linguistic study of pronoun resolution. Linguistics 50 (5), 991 – 1013.
Die Interpretation anaphorischer Pronomina bei Kindern
273
Dijk, Teun A. van & Walter Kintsch (1983): Strategies of discourse comprehension. New York: Academic Press. Ellert, Miriam (2010): Ambiguous Pronoun Resolution in L1 and L2 German and Dutch. MPI Series in Psycholinguistics (58). Wageningen: Ponsen & Looijen. Frederiksen, John (1981): Understanding anaphora: Rules used by readers in assigning pronominal referents. Discource Processes 4, 323 – 347. Gagarina, Natalia (2007): The hare hugs the rabbit. He is white … Who is white? Anaphoric reference in Russian. ZAS Papers in Linguistics 48, 133 – 149. Gernsbacher, Morton A. & Thomas Givón (1995): Coherence in Spontaneous Text. Amsterdam, Philadelphia: John Benjamins Publishing Company. Gernsbacher, Morton A. & David J. Hargreaves (1988): Accessing sentence participants: The advantage of first mention. Journal of Memory and Language 27, 699 – 717. Givón, Thomas (1992): The grammar of referential coherence as mental processing instruction. Linguistics 30, 5 – 55. Gundel, Jeanette K., Nancy Hedberg & Ron Zacharski (1993): Cognitive status and the form of referring expressions in discourse. Language 69, 274 – 307. Järvikivi, Juhani, Pirita Pyykkönen-Klauck, Sarah Schimke, Severina Colonna & Barbara Hemforth (2014): Information structure cues for 4-year-olds and adults: tracking eye movements to visually presented anaphoric referents. Language, Cognition and Neuroscience 29, 877 – 892. Järvikivi, Juhani, Roger P. van Gompel, Jukka Hyönä & Raymond Bertram (2005). Ambiguous pronoun resolution contrasting the first-mention and subject-preference accounts. Psychological Science 16, 260 – 264. Johnson-Laird, Philip (1983): Mental Models. Harvard University Press. Kaltenbacher, Erika (2015): Einfluss der Erstsprache im frühen kindlichen Zweitspracherwerb. Erwerb des deutschen Genussystems durch russische und türkische Kinder. In Heidi Rösch & Julia Webersik (Hrsg.), Deutsch als Zweitsprache – Erwerb und Didaktik, 55 – 72. Stuttgart: Fillibach bei Klett. Kaltenbacher, Erika & Klages, Hana (2012): Sprachprofil und Sprachförderung bei Vorschulkindern mit Migrationshintergrund. In Bert Ahrenholz (Hrsg.), Kinder mit Migrationshintergrund. Spracherwerb und Förderungsmöglichkeiten, 80 – 97. Freiburg i.Br.: Fillibach. Kamp, Hans & Uwe Reyle (1993): From Discourse to Logic. Kluwer: Dordrecht. Kehler, Andrew (2002): Coherence, Reference, and the Theory of Grammar. Stanford: CSLI Publications. Klages, Hana & Johannes Gerwien (2015): Verstehen anaphorischer Personalpronomina im DaZ- und DaM-Erwerb. In Hana Klages & Giulio Pagonis (Hrsg.), Linguistisch fundierte Sprachförderung und Sprachdidaktik. Grundlagen, Konzepte, Desiderate, 71 – 98. Berlin: de Gruyter. Langacker, Ronald W. (1991): Foundation of cognitive grammar. Vol. 2: Descriptive applications. Stanford: University Press. Oakhill, Jane V. & Alan Garnhamm (1992): Linguistic prescriptions and anaphoric reality. Text 12, 161 – 182. Pörings, Ralf & Ulrich Schmitz (2003): Sprache und Sprachwissenschaft. Eine kognitiv orientierte Einführung. Tübingen: Narr.
274
Hana Klages und Johannes Gerwien
Pyykkönen, Pirita, Danielle Matthews & Juhani Järvikivi (2010): Three-year-olds are sensitive to semantic prominence during online language comprehension: A visual world study of pronoun resolution. Language and Cognitive Processes 25, 115 – 129. Rohde, Hannah, Andrew Kehler & Jeffrey L. Elman (2007): Pronoun Interpretation as a Side Effect of Discourse Coherence. The Proceedings of the 29th Annual Conference of the Cognitive Science Society, 617 – 622. Nashville, Tennessee. Rothweiler, Monika (2006): The acquisition of V“ and subordinate clauses in early successive aquisition of German. In Conxita Lleó (Hrsg.), Hamburg studies on multilingualism: Interfaces in multilingualism. Acquisition and representation, 91 – 133. Amsterdam: Benjamins. Schlenter, Judith, Johanna Klages, Miriam Ellert & Anke Holler (2011): Pronomen, Konnektoren und Verben aus psycholinguistischer Sicht. Quelle: https://www.uni-goettingen.de/de/ psycholinguistik-verarbeitungsprozesse-im-gesprochenen-diskurs/307991. html.(23. 9. 2016) Schimke, Sarah (2015): Die rezeptive Verarbeitung von Markierungen der Diskurskohärenz bei Grundschulkindern mit Deutsch als Erst- und Zweitsprache. In Hana Klages & Giulio Pagonis (Hrsg.), Linguistisch fundierte Sprachförderung und Sprachdidaktik. Grundlagen, Konzepte, Desiderate, 193 – 209. Berlin: de Gruyter. Schwarz, Monika (2000): Indirekte Anaphern in Texten. Studien zur domänengebundenen Kohärenz und Referenz im Deutschen. Tübingen: Niemeyer. Sekerina, Irina A., Karina Stromswold & Arild Hestvik (2004): How do adults and children process referentially ambiguous pronouns? Journal of Child Language 31, 123 – 152. Song, Hyun-joo & Cynthia Fisher (2005): Who′s „she“? Discourse structure influences preschooler′s pronoun interpretation. Journal of memory and language 52, 29 – 57. Song, Hyun-joo & Cynthia Fisher (2007): Discourse prominence effects on 2,5-year-old children′ s interpretation of pronoun. Lingua 117, 1959 – 1987 Tanenhaus, Michael K. & John C. Trueswell (1995). Sentence Comprehension. In Joanne L. Miller, Peter D. Eimas (Hrsg.), Speech, language, and communication. Handbook of perception and cognition 11, 217 – 262. San Diego, CA, US: Academic Press. Thiersch, Renate (2007): Sprachförderung mehrsprachiger Kinder im Kindergarten. In Tanja Anstatt (Hrsg.), Mehrsprachigkeit bei Kindern und Erwachsenen. Erwerb, Formen, Förderung, 9 – 30. Tübingen: Narr Francke Attempto.
V Perspektiven
Mona Timmermeister und Monika S. Schmid
Zusammenhänge zwischen Attrition der L1 und L2-Erwerb Die meisten Menschen lernen zu einem bestimmten Zeitpunkt ihres Lebens aus verschiedenen Gründen eine L2. Unabhängig davon, ob eine neue Sprache für Schule oder Beruf erlernt wird oder weil jemand in ein Land zieht, in dem eine andere Sprache gesprochen wird, ist es weitgehend bekannt, dass nicht jeder Mensch gleichermaßen erfolgreich im Erlernen einer L2 ist, und dass verschiedene Faktoren wie z. B. Alter, Motivation oder Ähnlichkeit zur L1 den Erwerb einer L2 beeinflussen können. Während sich die Linguistik schon seit vielen Jahren damit beschäftigt zu erforschen, welche Faktoren es genau sind, die den Erwerb einer L2 beeinflussen, lag der Fokus der Mehrsprachigkeitsforschung lange Zeit eher selten auf dem Status der Muttersprache oder L1 beim Erlernen einer L2. Im Gegensatz zum L2-Erwerb, wo die verschiedenen Formen von Variabilität und Einfluss der L1 auf die L2 (zwischensprachliche Interferenz) vielfach erforscht sind, gibt es bedeutend weniger Studien, die Einflüsse einer L2 auf die L1 bilingualer Individuen betrachten. Dieser Prozess fällt im Allgemeinen unter den Begriff der Attrition oder Erosion der L1 (auch wenn die damit einhergehenden Phänomene strenggenommen nicht immer eine Erosion bzw. einen Verlust darstellen, hat sich diese Begrifflichkeit etabliert). Attrition wird oft im Kontext der Migration bemerkt, wenn Menschen in ein anderes Land ziehen und somit in einer Umgebung leben, in der hauptsächlich eine L2 gesprochen wird. Zunächst wurde in der Forschung angenommen, dass es nur unter Bedingungen, in denen Menschen schon seit Jahren in der neuen Sprachumgebung leben und ihre L1 kaum oder sogar überhaupt nicht mehr benutzen, zur Attrition der L1 kommen kann. Attritionsprozesse sind jedoch nicht auf solch langfristige Kontexte beschränkt (Schmid & Köpke, 2007). In diesem Kapitel möchten wir einen Einblick in die Forschung zur Attrition der L1 als Teilbereich der Mehrsprachigkeitsforschung geben. Was versteht man unter Attrition der L1 und welchen Beitrag kann die Attritionsforschung zu einem besseren Verständnis des L2-Erwerbs liefern? Wie kann Attrition der L1 aus der Sicht der bilingualen Sprachverarbeitung erklärt werden? Wir werden sowohl den theoretischen Hintergrund dieses Forschungsbereiches erläutern als auch an Hand einiger Beispielstudien zeigen, welche verschiedenen Aspekte der Sprachverarbeitung in diesem Forschungsbereich untersucht werden und welche psyMona Timmermeister, Universiteit Utrecht Monika S. Schmid, Universiteit Groningen & University of Essex DOI 10.1515/9783110456356-012
278
Mona Timmermeister und Monika S. Schmid
cholinguistischen Methoden dazu verwendet werden können. Vollständigkeitshalber werden wir uns dabei nicht auf einen bestimmten Aspekt der Sprachverarbeitung beschränken, sondern neben der syntaktischen Attrition auch Studien zur lexikalischen und phonetischen Attrition besprechen. Aus dem gleichen Grund werden wir auch Studien, die sich mit anderen Sprachen als der deutschen Sprache beschäftigen, mit in diese Übersicht einbeziehen.
1 Wann spricht man von Attrition der L1? In der L2-Erwerbsforschung gibt es zahlreiche Studien, die belegen, auf welche Weise die bereits vorhandene L1 den Erwerb einer zusätzlichen Sprache beeinflussen kann (siehe Jarvis & Pavlenko 2008 für eine Übersicht). Besonders bei sprachlichen Aspekten, in denen sich die neu zu erlernende Sprache von der L1 unterscheidet, kann es dazu kommen, dass die L1 mit der L2 in „Konkurrenz“ tritt, und somit den Erwerb behindert und gegebenenfalls zu langfristigen Unterschieden zwischen L2-Sprechern und Muttersprachlern führt. Erst später begannen Forscher sich zu fragen, ob das Erlernen einer neuen Sprache in ähnlicher Weise auch die L1 beeinflussen kann. Die geringe Anzahl der Studien, die sich mit zwischensprachlichen Einflüssen auf die L1 beschäftigen, ist damit zu erklären, dass oft fälschlicher Weise angenommen wurde, eine L1, die ein bestimmtes Entwicklungsniveau erreicht hat, sei stabil und somit nicht weiter interessant als Forschungsobjekt in Hinblick auf zwischensprachliche Einflüsse. Diese Auffassung repräsentieren inzwischen veraltete Modelle der Sprachkompetenz, die auf Konzepten wie Parametern basieren, die im Erwerbsprozess an- und ausgeschaltet werden können. Aufgrund von Erkenntnissen der psycholinguistischen Forschung zur Mehrsprachigkeit wird mittlerweile weitgehend angenommen, dass es sich bei bilingualen Fähigkeiten um ein Kontinuum handelt, bei dem weder die L1 noch die Zweitsprache(n) von zwischensprachlichen Einflüssen und Veränderung ausgenommen sind (Cook 2003; Schmid & Köpke 2017), und in dem Fluktuation zwischen den grammatischen Merkmalen der Sprachen auftreten kann, wie es etwa beim Erwerb des englischen Artikelsystems durch Muttersprachler von Sprachen, die keine Artikel besitzen, für die Merkmale der Definitheit (auf der im Englischen der Unterschied zwischen dem definiten und indefiniten Artikel beruht) bzw. Spezifizität (die im Englischen keine Rolle spielt, für L2-Sprecher jedoch ebenfalls wichtig war) beobachtet wurde (Ionin, Zubizarreta & Maldonado 2008). So kann es selbst in frühen Stadien des L2-Erwerbs zu zwischensprachlichen Einflüssen oder Interferenz in beiden Richtungen kommen.
Zusammenhänge zwischen Attrition der L1 und L2-Erwerb
279
Ein Kontext, in dem es in den meisten Fällen notwendigerweise zum Erwerb einer L2 kommt, ist, wenn Menschen in ein anderes Land ziehen, in dem eine andere Sprache als deren L1 gesprochen wird. Bei Migranten kann es mit der Zeit zu einer Verschiebung der sprachlichen Dominanz kommen, wodurch die L2, die im Zielland im Alltagsgebrauch gesprochen wird, zur dominanten Sprache wird. In dieser Situation sind Einflüsse der L2 auf die L1 besonders ausgeprägt. Derartige Veränderungen der L1 führen oft zu Unsicherheit und Irritation: Die L1 stellt für viele Menschen einen wichtigen Teil der eigenen Identität oder der kulturellen Herkunft dar (Schmid 2002). Gerade in solchen Fällen kann es schwierig sein, sich vorzustellen oder zu akzeptieren, dass dieses sprachliche Fundament durch andere Sprachen beeinflusst werden kann und es z. B. passieren kann, dass man als Muttersprachler für einen L2-Sprecher gehalten wird. Ein Faktor, der nicht nur in Bezug auf den Erwerb einer L2, sondern auch bezüglich der L1-Attrition eine Rolle zu spielen scheint, ist das Alter der Person, die eine neue Sprache erlernt. Empirische Studien, in denen Attritionsprozesse mit verschiedenen Methoden untersucht wurden, haben gezeigt, dass Veränderungen im Sprachgebrauch überraschend gering sein können, wenn die Migration nach einem Alter von 12 Jahren stattgefunden hat (Karayayla in Vorbereitung; Schmid 2013). Bei Migration nach der Pubertät ist es oft so, dass Migranten in verschiedenen sprachlichen Tests nach wie vor Muttersprachniveau erreichen (siehe Köpke & Schmid 2004 für eine Übersicht). Hat die Migration im Kindesalter und somit vor der Pubertät stattgefunden, kann es jedoch zu einem erheblichen oder sogar vollständigen Verlust der L1 kommen, wie z. B. Studien von international adoptierten Kindern mit Adoptionsalter von bis zu zehn Jahren belegen (Pallier et al. 2003). Innerhalb der Mehrsprachigkeitsforschung wird deshalb oft ein Unterschied zwischen den Begriffen unvollständiger Spracherwerb und Attrition der L1 gemacht. Bei Ersterem handelt es sich um Veränderungen der Sprachsituation im Kindesalter, wodurch die Entwicklung der L1 unterbrochen oder verlangsamt wird, bevor vollständige Sprachkompetenz erreicht ist, oder nach dem Schuleintritt eine Regression des vorher erreichten Muttersprachniveaus auftritt (Montrul 2008). Von Attrition spricht man hingegen bei Jugendlichen oder Erwachsenen, bei denen der L1-Erwerb zum Zeitpunkt der Migration weitgehend abgeschlossen ist (Köpke & Schmid 2004). Beim Erforschen der L1-Attrition stellt sich die Frage, ob es sich um strukturelle Veränderungen der L1 handelt oder ob Attritionsanzeichen lediglich auf oberflächliche Veränderungen der Sprachverarbeitung zurückzuführen sind. In letzterem Fall ist zu erwarten, dass L2-Sprecher in der L1 zwar Strukturen manchmal akzeptieren oder gebrauchen, die hier ungrammatisch, in der L2 jedoch korrekt sind – z. B. das Nichtbefolgen der Verb-Zweitstellung in deutschen Hauptsätzen bei Sprechern des Englischen – dass jedoch die korrekte Anwendung
280
Mona Timmermeister und Monika S. Schmid
der Regel weiterhin überwiegt. Bisher scheinen Forschungsergebnisse eher darauf hin zu deuten, dass Attrition bei erwachsenen Muttersprachlern keinen tiefgreifenden bzw. strukturellen Effekt mit sich bringt (Schmid 2013). Bei unvollständigem Spracherwerb scheint es hingegen möglich zu sein, dass das Erlernen einer L2 zur Restrukturierung der L1 führt (Montrul 2008; Schmitt 2004, 2010).
2 Vergleiche zwischen L2-Lernern und Muttersprachlern mit Attrition In der L2-Erwerbsforschung wird kontrovers diskutiert, ob es fundamentale und qualitative Unterschiede zwischen Sprachen gibt, die im Kindesalter oder erst nach der Pubertät erlernt werden, oder ob Unterschiede lediglich quantitativ sind. Die Frage hierbei ist, ob es eine kritische Periode oder sensitive Periode für den Erwerb einer L2 gibt (Birdsong 1999; s. hierzu auch die Einleitung des vorliegenden Bandes), welche den L2-Erwerb nach einem bestimmten Alter, z. B. der Pubertät, sehr erschwert oder verändert. In diesem Zusammenhang sind die Ergebnisse zur prä- vs. postpubertären Attrition von besonderem Interesse. Wenn man den Erwerb der L1 im Gegensatz zum Erwerb einer L2 betrachtet, ist ein wichtiger Unterschied schon ganz einfach, dass bei dem Erwerb einer L2 bereits das System einer anderen Sprache vorhanden ist, mit dem das neu erlernte Sprachsystem unweigerlich konkurrieren muss. In Bezug auf das Alter des L2Erwerbs bedeutet das, dass das L1-System im Kindesalter noch nicht so weit entwickelt oder verwurzelt ist. Dadurch sollte eine solche zwischensprachliche Konkurrenz, gegen die sich die L2 durchsetzen muss, bei Erwachsenen in der Regel stärker sein als bei Kindern (MacWhinney 2012). Ein weiterer Unterschied ist, dass die Art und Weise, in der Kinder ihre L1 lernen, vollkommen implizit ist, während sich Jugendliche und Erwachsene im Allgemeinen auf kognitive und analytische Strategien berufen können. Dadurch stellt der L2-Erwerb bei älteren Lernern zumindest zum Teil einen expliziten Prozess dar (Herschensohn 2007; zum Unterschied von implizitem und explizitem Lernen s. die Einleitung zu diesem Band). Die Frage ist nun, was die Forschung nach der Attrition der L1 für ein besseres Verständnis der L2-Erwerbsforschung beitragen kann. Menschen, bei denen es zur Attrition kommt, haben ihre L1 als (zumeist) einsprachige Muttersprachler erworben. Doch ähnlich wie bei L2-Lernern gilt für diese Population, dass ihre sprachlichen Fähigkeiten von denen monolingualer Muttersprachler im Erwachsenenalter abweichen. Systematische Vergleiche zwischen Muttersprachlern mit Attrition, L2-Lernern und monolingualen Muttersprachlern, deren L1 keiner Konkurrenz durch ein anderes Sprachsystem ausgesetzt ist, können somit wich-
Zusammenhänge zwischen Attrition der L1 und L2-Erwerb
281
tige Erkenntnisse für die L2-Erwerbsforschung liefern. Falls es tatsächlich eine kritische/sensitive Periode für den Spracherwerb gibt, dann sollten Muttersprachler in einem Attritionskontext in ihren sprachlichen Fähigkeiten eher denen einsprachiger Muttersprachler ähneln als denen von L2-Lernern, da sie die Sprache bereits vor der Pubertät erworben haben. Wenn man jedoch davon ausgeht, dass es sich bei nicht-zielsprachlichem – also inkorrektem Sprachgebrauch von L2-Lernern hauptsächlich um das Ergebnis von Konkurrenz zwischen den beiden Sprachen auf der Ebene von Sprachproduktion und -verarbeitung handelt, ändert sich die Vorhersage. In diesem Fall sollten sich alle mehrsprachigen Gruppen (unabhängig vom Spracherwerbskontext) generell von einsprachigen Muttersprachlern unterscheiden, da Muttersprachler im Attritionskontext dieser zwischensprachlichen Konkurrenz ja ebenfalls ausgesetzt sind. Wie groß der Unterschied zu einsprachigen Muttersprachlern ist, wäre in dem Fall weniger abhängig vom Alter des Spracherwerbs, sondern von Faktoren wie zum Beispiel der Häufigkeit des Kontakts mit der L2. Es ist also sinnvoll, auch mehrsprachige Menschen in einem Kontext der Sprachattrition mit einzubeziehen, wenn es um die L2-Erwerbsforschung geht. Durch ihre besondere Sprachsituation (muttersprachliche Repräsentationen und zugleich eine dominante, aktive L2) kann diese Gruppe zu einem besseren Verständnis davon führen, wie dominante und nicht-dominante Sprachen durch bilinguale Sprecher verarbeitet werden. Zudem kann der Einbezug der Sprachattrition dabei helfen, die wichtige Frage zu beantworten, ob das unterliegende System einer Sprache, die zu einem späteren Zeitpunkt im Leben erworben wird, grundlegend anders ist als das einer L1. Es gibt bislang nur sehr wenige Studien, die den direkten Vergleich zwischen Muttersprachlern im Attritionskontext auf der einen Seite und L2-Sprechern auf der anderen Seite ziehen. Hopp & Schmid (2013) führen einen solchen Vergleich für fremdsprachlichen Akzent durch. Das Ergebnis hier legt nahe, dass es bei Attritern wahrscheinlicher ist, dass sie nach einer langen Periode der Zweitsprachigkeit noch als Muttersprachler wahrgenommen werden; allerdings finden sich unter den L2-Sprechern auch eine Anzahl Probanden, die als Muttersprachler durchgehen, und auch unter den Attritern solche, deren Akzent nicht mehr überzeugt. Dies spricht gegen eine klare kritische Periode. Schmid (2014) hingegen untersucht, wie korrekt L2-Sprecher und Muttersprachler die deutsche Morphologie in frei gesprochener Sprache verwenden, und ihre Daten legen nahe, dass es zumindest was die Nominalphrase (insbesondere das Genus) betrifft keine Überschneidungen gibt: ihre schlechtesten Attriter verwenden diese durchweg korrekter als die besten L2-Sprecher, obwohl beide Gruppen ansonsten das gleiche Sprachniveau haben und beide Sprachen gleich viel verwenden. Dies deutet
282
Mona Timmermeister und Monika S. Schmid
darauf hin, dass ein früher Spracherwerb zumindest für bestimmte morphosyntaktische Phänomene langfristig einen qualitativen Vorteil verschafft. Es besteht hier eindeutig die Notwendigkeit nach mehr Forschung, um diese Fragen eingehender klären zu können.
3 Ursachen der Attrition der L1 Eine weitere Frage ist, was die Ursachen dafür sein können, dass Menschen, die eine L2 lernen und benutzen, plötzlich Veränderungen im Gebrauch ihrer L1 erfahren. Anzeichen von Attrition, die von Betroffenen selbst oder Muttersprachlern in deren Umfeld geschildert werden, sind oft lexikalischer Art, wie zum Beispiel Schwierigkeiten, das richtige Wort zu finden (z. B. Olshtain & Barzilay 1991). Es ist wahrscheinlich, dass diese Erscheinungen auf Probleme im lexikalischen Zugriff und zwischensprachliche Interferenz zurückzuführen sind und nicht auf einen bleibenden Verlust bisheriger Sprachkenntnisse (Schmid 2013). Es wird allgemein angenommen, dass, wenn ein Muttersprachler eine L2 lernt, selbst beim Gebrauch der L1, die neu erlernte Sprache niemals völlig abgeschaltet werden kann und somit mit der L1 in Konkurrenz steht (Kroll et al. 2015). Je öfter und länger eine L2 benutzt wird, desto stärker ist wahrscheinlich diese zwischensprachliche Konkurrenz. In Bezug auf die Attrition wird angenommen, dass es nicht so ist, dass die L1 „vergessen“ wurde und nicht länger zugänglich ist, sondern dass die L2 so stark geworden ist, dass sie mit der L1 konkurriert und nicht ohne Weiteres vollständig unterdrückt werden kann (Schmid 2007). Durch diese zwischensprachliche Konkurrenz kann es zu (gewolltem oder ungewolltem) Code-Switching (das Verwenden von Elementen aus beiden Sprachen in derselben Äußerung), grammatikalischen Fehlern oder Schwierigkeiten im Aufrufen von Wörtern kommen (BenRafael 2004). Es wird zwar weithin angenommen, dass diese Konkurrenz oder Interferenz bei Menschen, die in der L2 besonders kompetent sind und/oder diese Sprache besonders häufig hören oder benutzen, stärker und auffälliger ist (z. B. Andersen 1982; Paradis 2007). Hierfür fehlen jedoch bislang empirische Belege. Eine in der Mehrsprachigkeitsforschung weit verbreitete Hypothese ist die Activation Threshold (AT) Hypothese (Paradis 2004), bei der die Frequenz, mit der eine Sprache benutzt wird, ausschlaggebend dafür ist, wie einfach diese Sprache aktiviert werden kann. Dieser Hypothese folgend würde es also allmählich zum Sprachverlust kommen, wenn eine Sprache nicht benutzt wird. Es stellt sich jedoch unerwarteter Weise heraus, dass ein solcher direkter Zusammenhang zwischen dem Umfang des Muttersprachgebrauchs und dem Ausmaß der Attrition schwer nachzuweisen ist. Verschiedene Studien, die sich mit dieser Frage beschäftigt haben, konnten keinen Beweis für einen direkten Zusammenhang zwi-
Zusammenhänge zwischen Attrition der L1 und L2-Erwerb
283
schen der Häufigkeit des Sprachgebrauchs und dem Ausmaß der Attrition finden (Cherciov 2011; Dostert 2009; Keijzer 2007; Opitz 2011; Schmid 2007; Schmid & Dusseldorp 2010; Varga 2012). Der einzige Fall, in dem der regelmäßige Gebrauch der L1 Attrition (wenn auch in geringem Ausmaß) zu beeinflussen scheint, ist, wenn die L1 weiterhin in einem beruflichen Kontext benutzt wird (Schmid 2007; Schmid & Dusseldorp 2010). Die Analyse von Aufnahmen spontaner Sprache zeigt hingegen, dass die Häufigkeit, mit der innerhalb der Familie oder unter Freunden die L1 benutzt wird, keinen Effekt auf lexikalische Vielfalt, grammatische Komplexität und sprachliche Flüssigkeit zu haben scheint (Schmid 2007; Schmid & Jarvis 2014). Bei erwachsenen Muttersprachlern, die bis zur Pubertät in der L1Umgebung gelebt haben, ist es also möglich, dass sich die L1 soweit stabilisiert hat, dass regelmäßiger Sprachgebrauch nicht notwendig ist, um einen möglichen Abbau sprachlicher Fähigkeiten zu verhindern.Vielmehr könnten die bestimmten Kontexte, in denen die L1 benutzt wird, eine Rolle spielen (Schmid 2007; Schmid & Köpke, in Vorbereitung). In diesem Zusammenhang ist Grosjeans Modell (2001) des bilingualen Sprachgebrauchs relevant. Dieses Modell nimmt an, dass mehrsprachige Menschen sich abhängig von der Sprachsituation in einem monolingualen oder bilingualen Modus oder in einem Zwischenmodus befinden. Es handelt sich hierbei um ein Kontinuum des Sprachgebrauchs, wobei ausschließlich monolinguale Situationen auf der einen Seite und bilinguale Situationen (alle Teilnehmer sind kompetent im Gebrauch beider Sprachen und Code-Switching tritt häufig auf) auf der anderen Seite die zwei äußeren Extreme darstellen. In der Mitte befinden sich Situationen, in denen eine der Sprachen aufgrund externer Stimuli sehr aktiv ist, aber unterdrückt werden muss, da Code-Switching unangebracht wäre. Hierzu zählen z. B. formelle Situationen wie berufliche Interaktionen und Fremdsprachenunterricht, aber auch informellere Kommunikation z. B. in Expat-Clubs, die sich der Sprach- und Kulturpflege widmen. Die oben genannten Ergebnisse deuten darauf hin, dass Menschen, die ihre L1 weiterhin regelmäßig in solchen Situationen benutzen, in denen die L2 unterdrückt werden muss,weniger oder gar keine L1-Attrition haben. Menschen, die zum Beispiel ihre L1 noch für berufliche Zwecke benutzen, haben wahrscheinlich mehr Erfahrung mit Situationen, in denen es nicht angebracht ist, in die L2 zu wechseln und haben deshalb mehr Übung in diesem Kontrollmechanismus (Schmid 2007). Inwieweit dann L1-Attrition auftritt, hängt dann mehr davon ab, wie viel Routine der oder die jeweilige SprecherIn bei der Inhibierung der (oft stärkeren) L2 hat. Es lassen sich hier interessante Parallelen zum Modell der behavioral ecology of bilingualism (Green 2011) ziehen, welches auch annimmt, dass Sprachgebrauch mit häufigem Code-Switching zu geringer ausgeprägtem Training mit Inhibierungsprozessen führt.
284
Mona Timmermeister und Monika S. Schmid
4 Attrition auf verschiedenen sprachlichen Ebenen Wenn es bei der L1-Attrition darum geht, dass die L2 den Zugriff auf die L1 beeinträchtigt, dann sollte das vor allem für Informationen aus dem deklarativen Gedächtnis, wie zum Beispiel das Aufrufen lexikalischer Information, der Fall sein. Informationen, die sich auf das prozedurale Gedächtnis berufen und somit eher automatisierte Sprachkenntnisse darstellen, wie zum Beispiel Grammatik oder Phonologie einer Sprache, sollten somit weniger stark von Attritionsprozessen beeinträchtigt werden (Paradis 2004; 2009). Auch das deklarativ/prozedurale Modell sagt vorher, dass lexikalischer Zugriff in der L1 einer der Bereiche ist, der am wahrscheinlichsten von Attritionsprozessen beeinträchtigt wird (zum Beispiel de Bot 1996; Köpke & Nespoulous 2001; Köpke & Schmid 2004; Montrul 2008; Schmid & Köpke 2009, Schmid & Jarvis 2014). In den ersten Studien zur lexikalischen Attrition der L1 wurden oft gängige und leicht durchführbare Tests, wie zum Beispiel Kategorienbenennungsaufgaben (z. B. Benennen Sie innerhalb einer Minute so viele Tiere wie möglich) oder Bildbenennungstests ausgeführt. Spätere Studien haben außerdem auch die Analyse von lexikalischer Vielfalt in frei gesprochener Sprache (Schmid 2002) oder das Auftreten von Verzögerungslauten wie ähm, Wiederholungen und Reformulierungen (Schmid & Beers Fägersten 2010; Bergmann, Sprenger & Schmid 2015) in die Forschung mit einbezogen. Schmid & Jarvis (2014) nennen als Motivation dafür, die lexikalische Sprachverarbeitung unter Attrition nicht nur in gezielten Experimenten, sondern auch im natürlichen Sprachgebrauch zu untersuchen, die Möglichkeit, dass sich lexikalische Attritionserscheinung in verschiedenen Kontexten nicht gleich stark äußern könnten. In kontrollierten Experimenten ist die Anzahl der Zielwörter oft begrenzt. Testpersonen haben die Möglichkeit, ihre volle Aufmerksamkeit dieser einen Aufgabe zu widmen. Wenn sich Anzeichen von lexikalischer Attrition stärker in frei gesprochener Sprache äußern als in experimentellen Situationen, dann könnte das ein Zeichen dafür sein, dass die Ursache hierfür eher daran liegt, dass bei Mehrsprachigen kognitive Reserven wie Arbeitsgedächtnis und mentale Kontrollfunktionen stärker beansprucht werden als bei Einsprachigen, da sie ständig eine Sprache aktivieren und gleichzeitig die andere Sprache inhibieren müssen. Es wäre dann naheliegend, dass es diese zusätzliche Anstrengung ist, die für Attritionserscheinungen sorgt, und nicht, dass die Elemente der L1 vergessen worden wären (Schmid & Jarvis 2014). Um diese Hypothese zu testen und zu untersuchen, ob Anzeichen lexikalischer Attrition sowohl in einem kontrollierten Experiment als auch in frei gesprochener Sprache auftreten und ob es Unterschiede im Ausmaß der Attrition
Zusammenhänge zwischen Attrition der L1 und L2-Erwerb
285
gibt, verglichen Schmid & Jarvis (2014) deutsche Muttersprachler, die entweder in den englischsprachigen Teil Kanadas oder in die Niederlande gezogen waren, mit einsprachigen Deutschen, die zu keiner Zeit ihres Lebens regelmäßigen Kontakt mit einer L2 hatten. Sowohl Daten eines Kategorienbenennungstests als auch die lexikalische Vielfalt in frei gesprochener Sprache wurden mit in die Analyse einbezogen. Es stellte sich heraus, dass die bilingualen Teilnehmer beim Kategorienbenennungstest durchschnittlich signifikant weniger Wörter als die einsprachigen Muttersprachler produzierten, allerdings handelte es sich dabei um einen kleinen Effekt. Was die Analyse der frei gesprochenen Sprachaufnahmen angeht, konnten die Messungen der lexikalischen Dichte nicht zwischen den Mono- und Bilingualen differenzieren. In Bezug auf die zwei verschiedenen Gruppen von Migranten (wohnhaft in den Niederlanden vs. wohnhaft in Kanada), gab es einige Unterschiede, wie zum Beispiel, dass die deutschen Muttersprachler in den Niederlanden verhältnismäßig mehr Kognate benutzten als die Gruppe in Kanada. Das hat wahrscheinlich damit zu tun, dass es eine große Überschneidung zwischen dem Lexikon des Deutschen und dem des Niederländischen gibt, was den lexikalischen Zugriff befördern könnte. Die Analyse externer Faktoren, wie zum Beispiel Dauer des Aufenthalts, Häufigkeit des L1 Gebrauchs oder Einstellungen zur L1 bzw. L2, konnte jedoch keinen eindeutigen Aufschluss darüber geben, welche Migranten stärkere Anzeichen der Attrition aufweisen als andere. Wie schon zuvor erwähnt, war der einzige relevante Faktor hierbei, ob Menschen ihre L1 in beruflichen Kontexten benutzten oder nicht. Die Menschen, für die das der Fall war, zeigten eine höhere Produktivität im Kategorienbenennungstest. Bisherige Studien zur L1-Attrition haben sich jedoch nicht ausschließlich auf die lexikalische Attrition beschränkt. In Hinblick auf die Attritionsforschung im Bereich der Phonetik zum Beispiel gibt es Hinweise darauf, dass sich phonetische Kategorien in bilingualen Sprechern durch den Einfluss einer anderen Sprache verschieben können und sich somit mehr an die Laute der anderen Sprache anpassen. Nach langer Zeit des mehrsprachigen Sprachgebrauchs scheint dieses Phänomen am stärksten aufzutreten (Flege 1987; Bergmann, Nota & Schmid, im Druck). Darüber hinaus gibt es auch Studien, die Anzeichen phonetischer Attrition auch schon kurz nach Beginn des L2-Erwerbs zeigten. In einer Studie von Chang (2012) wurde der Sprachgebrauch von englischsprachigen Erwachsenen untersucht, die einen sechswöchigen Intensivkurs in Koreanisch belegt hatten. Teilnehmer mussten sowohl auf Englisch als auch auf Koreanisch Wörter vorlesen, deren akustische Eigenschaften später analysiert wurden. Die Forscher der Studie fanden, dass selbst nach kurzem Kontakt mit der koreanischen Sprache die produzierten englischen Wörter durch phonetische Eigenschaften des Koreanischen auf verschiedenen phonetischen Ebenen beeinflusst wurden.
286
Mona Timmermeister und Monika S. Schmid
Andere Studien haben ähnliche phonetische Einflüsse auch für andere Phoneme gefunden: In einer Studie von de Leeuw, Mennen & Scobbie (2012) wurde eine phonetische Analyse des Phonems /l/ bei Muttersprachlern des Deutschen, die Englisch als L2 erworben haben, ausgeführt. Es handelte sich hierbei um deutsche Auswanderer, die in Kanada wohnhaft waren. Da das Phonem /l/ im Deutschen und kanadischen Englisch unterschiedlich realisiert wird, eignet sich eine phonetische Analyse dieses Lautes dazu, mögliche zwischensprachliche Einflüsse in der Aussprache deutsch-englischer Migranten zu identifizieren. Mit Hilfe eines Experiments, in dem Teilnehmer in beiden Sprachen Wörter, die den Laut /l/ beinhalten, aussprechen mussten, konnte die Aussprache der Migranten mit der von sowohl einer deutschsprachigen als auch einer (aus Kanada stammenden) englischsprachigen Kontrollgruppe verglichen werden. Die Ergebnisse der Studie ließen Anzeichen von Attrition bei der Realisierung des Phonems /l/ sehen. Es ist jedoch wichtig anzumerken, dass die Autoren sowohl innerhalb der Ergebnisse einzelner Personen als auch zwischen verschiedenen Personen einen hohen Grad an Variabilität fanden. Diese hohe Variabilität wird von den Autoren als Beleg für Mehrsprachigkeit als ein „dynamisches System“ interpretiert, in dem sprachliche Fähigkeiten von verschiedenen Faktoren abhängig sind, die sich untereinander beeinflussen können und somit ständiger Veränderung unterliegen. Die Tatsache, dass Anzeichen von Attrition auch bei Migranten gefunden werden konnten, die erst im (jungen) Erwachsenenalter die L2 erworben hatten, sehen die Autoren als Beleg gegen mögliche Altersbeschränkungen im L2-Erwerb. Verschiedene Studien haben sich damit beschäftigt, zu erforschen, inwiefern sich der Gebrauch einer L2 auf die syntaktische Verarbeitung in der L1 auswirken kann. Eine oft angewendete Methode in der Satzverarbeitung ist die Eyetracking Methode (vgl. Hopp & Schimke in diesem Band für eine genauere Beschreibung dieser Methode). Ein Beispiel einer Studie, in der diese Methode für die Erforschung syntaktischer Attrition benutzt wird, ist Dussias & Sagarra (2007). Die Autorinnen verglichen einsprachige Muttersprachler des Spanischen mit zwei Gruppen spanischer L2-Lerner des Englischen, die sich bezüglich der Dauer und des Umfangs ihres Kontakts mit der L2 unterschieden. Während die eine Gruppe zum Zeitpunkt des Experiments schon seit vielen Jahren in einer größtenteils englischsprachigen Umgebung gelebt hatte, war die Dauer des L2-Kontakts in der anderen Gruppe kürzer und weniger intensiv. Die beiden bilingualen Gruppen waren in Bezug auf ihre Sprachfertigkeit im Englischen vergleichbar, so dass etwaige Unterschiede im Verhalten tatsächlich aus dem Kontakt mit der L2 und nicht aus Unterschieden in den sprachlichen Fähigkeiten in der L2 stammen. Die Autorinnen wollten damit die Frage danach beantworten, inwiefern die Dauer des Sprachgebrauchs eventuelle Auswirkungen auf mögliche Anzeichen von Sprachattrition hat. Bei der Satzkonstruktion, die in dieser Studie betrachtet
Zusammenhänge zwischen Attrition der L1 und L2-Erwerb
287
wurde, handelt es sich um eine komplexe Nominalphrase (NP) und einen Relativsatz, wie zum Beispiel beim folgenden Satz: (1) Jemand erschoss die Bedienstete der Schauspielerin, die sich auf dem Balkon befand. Der Relativsatz kann sich in diesem Fall sowohl auf die NP1 die Bedienstete, als auch auf die NP2 der Schauspielerin beziehen. Studien haben gezeigt, dass eine solche Ambiguität in verschiedenen Sprachen anders interpretiert wird. Während Muttersprachler des Spanischen zum Beispiel eine Präferenz für einen N1-Bezug zeigen (Dussias 2003), bevorzugen Muttersprachler des Englischen in der Regel eine Interpretation mit N2-Bezug (Fernández 2003). Aufgrund dieser zwischensprachlichen Variabilität eignen sich diese Konstruktionen zum Erforschen möglicher Effekte des L2-Erwerbs bzw. der Attrition. Dussias & Sagarra (2007) stellten die Hypothese auf, dass sich durch erhöhten Kontakt mit einer L2 die Mechanismen, mit denen ein Satz vorzugsweise interpretiert wird, möglicherweise an die Eigenschaften der L2 anpassen, was zur Folge hätte, dass auch Sätze in der L1 auf diese Weise interpretiert werden würden. Die Ergebnisse der EyetrackingStudie schienen diese Hypothese zu bestätigen: Während sowohl die einsprachige spanische Kontrollgruppe als auch die bilinguale Gruppe mit wenig L2-Kontakt eine N1-Interpretation bevorzugte, zeigten die bilingualen Testpersonen mit viel Kontakt zur L2 eine Präferenz für eine N2-Interpretation. So zeigt die Studie von Dussias & Sagarra (2007), dass auch die syntaktische Verarbeitung der L1 nicht unveränderlich, sondern empfänglich für Einflüsse der L2 ist. Einen weiteren Hinweis auf L2-bedingte Veränderungen bei der Verarbeitung bestimmter Konstruktionen in der L1 liefert eine Studie von Ribbert & Kuiken (2010). In dieser Studie wurden in den Niederlanden wohnende Muttersprachler des Deutschen mit einer Kontrollgruppe deutscher Muttersprachler in Deutschland ohne jeglichen Kontakt zum Niederländischen verglichen. Die sprachliche Konstruktion, um die es in diesem Experiment ging, war eine Infinitivkonstruktion, wie im Deutschen die um…zu + INF Konstruktion und die äquivalente Konstruktion im Niederländischen om…te + INF. Generell erfüllen beide Konstruktionen dieselbe Funktion, jedoch kommt die niederländische Variante in einer größeren Anzahl verschiedener Kontexte vor. In vorhergehenden Studien schien diese Konstruktion im spontanen Sprachgebrauch Anzeichen von Attrition der L1 zu bieten (Brons-Albert 1992, 1994). Ribbert & Kuiken (2010) nahmen jene Befunde als Anlass, um zu testen ob eine ähnliche Übergeneralisierung auch im Rahmen eines gezielten Experiments zum Vorschein kommt. Es wurden Grammatikalitätsurteile benutzt, in dem die Testpersonen angeben mussten, ob ein Satz in einer bestimmten Sprache grammatisch korrekt oder inkorrekt ist. Insgesamt
288
Mona Timmermeister und Monika S. Schmid
gesehen war es so, dass die in den Niederlanden wohnen Deutschen die meisten Fehler machten bei Sätzen, in denen eine um…zu + INF Konstruktion im Deutschen ungrammatisch, im Niederländischen jedoch optional war. In dieser Bedingung war es auch der Fall, dass sich die deutschen Muttersprachler in den Niederlanden signifikant von der Kontrollgruppe deutscher Muttersprachler in Deutschland unterschieden. Die Studie von Ribbert & Kuiken (2010) zeigt, dass Anzeichen der Attrition auch bei Sprachen auftreten können, die sich typologisch sehr ähnlich sind. Als Erklärung schlagen die Autoren vor, dass für die deutschen Studenten, die längere Zeit in den Niederlanden gelebt haben, die Regeln für den Gebrauch der Konstruktionen in den beiden Sprachen ineinander übergegangen sind und nicht mehr ohne Schwierigkeiten unterschieden werden können. Die Resultate von Ribbert & Kuiken (2010) führen außerdem zu der Frage, ob ähnliche Anzeichen von sprachlichem Transfer zu beobachten sind, wenn man die Verarbeitung dieser Konstruktion bei in Deutschland lebenden Niederländern testen würde.
5 Selektive Attrition an grammatischen Schnittstellen Interessanterweise scheint es so zu sein, dass Attrition bei den Eigenschaften einer Sprache wahrscheinlicher ist, die situations- und kontextgebunden optional sind – wie z. B. das Auslassen von Pronomina in Nullsubjektsprachen – als bei obligatorischen grammatikalischen Merkmalen (Gürel 2004; Tsimpli 2007). Eine Hypothese, die im Zusammenhang mit der syntaktischen L1-Attrition des Öfteren angewandt wurde, ist die Schnittstellen oder Interface-Hypothese (Sorace & Filiaci 2006), welche besagt, dass Variabilität im Kontext des L2-Erwerbs oder der Attrition wahrscheinlicher ist bei Sprachstrukturen, die an einer Schnittstelle zwischen syntaktischen und zum Beispiel pragmatischen oder phonologischen Eigenschaften angesiedelt sind, sodass bei diesen Konstruktionen der Satzbau kontextbedingt variabel sein kann. Diese Optionalität könnte dafür sorgen, dass solche sprachlichen Strukturen eher durch Attritionsprozesse beeinträchtigt werden, als Strukturen, die rein syntaktischen Regeln unterliegen. Diese Hypothese wurde am Beispiel von overten und Null-Pronomina verschiedentlich getestet, u. a. am Beispiel von Griechen und Italienern, die auf sehr hohem Niveau Englisch als L2 beherrschen, aber auch noch regelmäßig ihre L1 benutzen (Tsimpli et al. 2004). Die zwei Gruppen wurden jeweils mit einer Gruppe einsprachiger Muttersprachler derselben Sprache verglichen. In verschiedenen Experimenten wurde die Produktion und die Interpretation von a) Nullsubjekten vs. overten Subjekten und b) Subjekten, die entweder vor dem Verb oder nach dem
Zusammenhänge zwischen Attrition der L1 und L2-Erwerb
289
Verb stehen, untersucht. Sowohl bei den mehrsprachigen Griechen als auch bei den mehrsprachigen Italienern konnten Anzeichen der Attrition durch den Gebrauch des Englischen festgestellt werden. In der mehrsprachigen griechischen Gruppe war es zum Beispiel der Fall, dass der Gebrauch von overten Subjekten vor dem Verb durch Einfluss der L2 Englisch zugenommen hatte. Die bilingualen Italiener zeigten Anzeichen der Attrition in der Interpretation von overten pronominalen Subjekten. Dadurch, dass diese Subjekte im Englischen obligatorisch sind, während sie im Italienischen nur in bestimmten Situationen verwendet werden, akzeptierten die bilingualen Italiener den Gebrauch dieser Subjekte in mehr Kontexten als die italienischen Muttersprachler. Die Anzeichen der Attrition in dieser Studie sind somit auf ein höheres Maß an Variabilität bei der Verarbeitung der L1 durch L2-Lerner zurückzuführen. Ähnliche Ergebnisse wurden von Chamorro, Sorace & Sturt (2016) für spanisch-englische Probanden erzielt, die darüber hinaus die Frage stellen, ob es sich bei möglichen Attritionserscheinungen um Schwierigkeiten in der online Verarbeitung dieser Konstruktionen oder um permanente Veränderungen der Muttersprachrepräsentationen der mehrsprachigen Teilnehmer handelt, sowie untersuchen ob Attrition vermindert werden oder sogar völlig verschwinden kann, wenn Muttersprachler im Attritionskontext direkt vor dem Zeitpunkt des Experiments erneut in hohem Maß der L1 ausgesetzt sind. Aus diesem Grund wurde eine dritte Gruppe hinzugefügt, die aus im Vereinigten Königreich wohnenden Muttersprachlern des Spanischen bestand, die jedoch vor dem Zeitpunkt des Experiments einige Zeit in Spanien verbracht hatten. Die verschiedenen Gruppen absolvierten ein kombiniertes Experiment, in dem spanische Sätze gelesen wurden. Mit Hilfe der Eyetracking Methode wurde die online Verarbeitung der spanischen Sätze gemessen. Zusätzlich mussten die Teilnehmer nach dem Lesen beurteilen, wie natürlich sich die gezeigten Sätze im Spanischen anhören. Chamorro, Sorace & Sturt (2016) zeigten, dass sich die drei Gruppen bezüglich der anschließenden offline Beurteilung der Sätze nicht unterschieden, was die Autoren als Beweis dafür sahen, dass Attritionserscheinungen keine permanenten Veränderungen des unterliegenden Systems einer Sprache darstellen. Was die online Verarbeitung der Sätze betrifft, unterschieden sich die Eyetracking Daten der Gruppe, die vor dem Experiment erneut intensiven Kontakt mit der L1 hatte, nicht signifikant von denen der einsprachigen Kontrollgruppe. Dieses Ergebnis scheint darauf hin zu deuten, dass Effekte der L1-Attrition durch erneuten Kontakt mit der L1 verringert werden können. Die Gruppe einsprachiger Muttersprachler und die Gruppe mit erneutem Muttersprachkontakt waren besser darin, einen unpassenden Gebrauch von Pronomen zu bemerken, wohingegen die bilinguale Gruppe ohne erneuten Kontakt zur L1 Attritionsphänomene zeigte.
290
Mona Timmermeister und Monika S. Schmid
Eine ähnliche Studie derselben Forschungsgruppe (Chamorro, Sturt & Sorace 2015) betrachtete mögliche Attritionseffekte bei der Verarbeitung von differenzieller Objektmarkierung (DOM) im Spanischen. Im Spanischen muss ein direktes Objekt mit der Dativpräposition a gekennzeichnet werden, wenn es die semantischen Bedingungen von Belebtheit und Spezifität erfüllt. Es handelt sich hierbei also laut der Interface-Hypothese (Sorace & Filiaci 2006) ebenfalls um eine Konstruktion, bei der es eine Schnittstelle zwischen syntaktischen und semantischen Eigenschaften gibt. Ein vergleichbares Phänomen gibt es in der englischen Sprache nicht. Wie in der anderen Studie wollten die Autoren (Chamorro, Sturt & Sorace 2015) wissen, ob Muttersprachler des Spanischen, die in einer englischsprachigen Umgebung wohnen, bei dieser Konstruktion Anzeichen von L1-Attrition aufweisen und ob erneuter Kontakt mit der L1 Auswirkungen auf mögliche Attritionserscheinungen hat. Zu dem Zweck wurden nochmals Daten der drei gleichen Gruppen miteinander verglichen: einsprachige Muttersprachler des Spanischen, Muttersprachler im Attritionskontext und Muttersprachler im Attritionskontext, die vor dem Zeitpunkt des Testens intensiven Kontakt mit der L1 hatten. Das Experiment glich dem der anderen Studie. Die Teilnehmer lasen verschiedene Sätze, die sowohl einen korrekten als auch inkorrekten Gebrauch der Zielstruktur beinhalteten. Dabei wurde die online Verarbeitung der Sätze mit Hilfe der Eyetracking Methode gemessen. Nach jedem Satz mussten die Teilnehmer bewerten, wie natürlich sich der jeweilige Satz im Spanischen anhört. Sowohl die Analyse der Eyetracking Daten als auch der offline Bewertungen zeigten, dass inkorrekter Gebrauch der DOM in allen Gruppen gleichermaßen zu Leseverzögerungen bzw. niedrigem Beurteilen der Natürlichkeit führten. Chamorro, Sturt & Sorace (2015) kamen somit zu dem Schluss, dass Konstruktionen, bei denen es um semantische Bedingungen geht, nicht durch Attrition beeinträchtigt werden. Aufgrund dieses Ergebnisses war es nicht möglich, zu testen, ob der erneute Kontakt mit der L1 die Attrition dieser sprachlichen Strukturen vermindert. Es könnte sein, dass diese Resultate darauf hinweisen, dass Strukturen an der syntaktisch-semantischem Schnittstelle nicht für Attritionsprozesse anfällig sind. Eine alternative Erklärung dafür, dass in keiner der mehrsprachigen Gruppen Anzeichen von Attrition in der Verarbeitung der DOM auftreten, könnte sein, dass es sich um eine im Spanischen sehr häufig vorkommende Konstruktion handelt, die selbst im Input der spanischen Muttersprachler mit begrenztem Kontakt zur L1 noch oft genug auftritt. Eine weitere Studie, in der die Interface-Hypothese (Sorace & Filiaci 2006) im Zusammenhang mit der L1-Attrition getestet wurde, legt Perpiñán (2011) vor. Sie testet das Verständnis und die Produktion verschiedener Konstruktionen bei erwachsenen Muttersprachlern des Spanischen. Hierbei wurde eine SpanischEnglisch-sprechende Gruppe nach etwa fünf Jahren Aufenthalt in den USA mit
Zusammenhänge zwischen Attrition der L1 und L2-Erwerb
291
einer einsprachigen spanischen Kontrollgruppe verglichen. Getestet wurden Verständnis und Produktion von Subjekt-Verb Inversion zweier wh-Konstruktionen: Fragen und Relativsätze. Ähnlich wie im Deutschen ist eine Subjekt-Verb Inversion im Spanischen syntaktisch obligatorisch (z. B. ¿Qué dijo Maria?- ‚Was sagte Maria?‘). In Relativsätzen kann die Subjekt-Verb Inversion hingegen auch durch nicht-syntaktische Aspekte, zum Beispiel pragmatischer oder phonologischer Art beeinflusst werden. Durch diesen Unterschied bezüglich der Inversionsregeln eignen sich diese zwei Konstruktionen gut zum Erforschen von Variabilität im L2-Erwerb bzw. in der L1-Attrition. Laut der Interface-Hypothese (Sorace & Filiaci 2006) sollte Inversion in Fragen auch unter Attritionsbedingungen stabil sein und keine Variabilität aufzeigen, da sie vollkommen syntaktisch bedingt ist. Bei Inversion in Relativsätzen sollte es zu mehr Variabilität durch L1-Attrition kommen. Die Teilnehmer der Studie absolvierten einen online Leseverständnistest, zwei mündliche Produktionsaufgaben, und eine schriftliche Produktionsaufgabe. Die Ergebnisse der Studie zeigten den Erwartungen entsprechend, dass der Gebrauch von Subjekt-Verb Inversion in Matrixfragen intakt blieb und nicht durch langzeitigen Kontakt mit einer L2 beeinträchtigt wurde. Bei der Produktion von Relativsätzen kam es zu signifikanten Unterschieden zwischen den beiden Gruppen. Im Verständnis fanden sich hingegen bei beiden Konstruktionen ähnliche Ergebnisse in beiden Gruppen. Diese Asymmetrie zwischen Produktion und Verständnis deutet darauf hin, dass es bei den Muttersprachlern im Attritionskontext zu Schwierigkeiten in der Verarbeitung der L1 kommt. Darüber hinaus wurden keine Zusammenhänge zwischen der Dauer des Aufenthalts in der L2Umgebung oder der L2-Kenntnisse und dem Gebrauch der Inversion gefunden.
6 Neurolinguistische Studien Neurokognitive Methoden zur Untersuchung der Sprachverarbeitung online, wie z. B. ereigniskorrelierte Potentiale (EKPs) haben in der Spracherwerbsforschung zunehmend an Bedeutung gewonnen (siehe Van Hell & Tokowicz 2010 für eine Übersicht). Bei dieser Methode werden elektrische Ströme im Gehirn mithilfe von auf der Kopfhaut angebrachten Elektroden gemessen, und wird z. B. untersucht, inwieweit sich die elektrische Aktivität im Gehirn unterscheidet, wenn ein korrekter Satz bzw. ein Satz mit einem lexikalischen oder grammatischen Fehler gehört oder gelesen wird. Was die Attritionsforschung betrifft, gibt es jedoch bislang nur zwei Studien, die diese Methode einsetzen, um zu untersuchen, ob und in wieweit sich die Verarbeitung von grammatischen Konstruktionen in dieser Situation verändern kann.
292
Mona Timmermeister und Monika S. Schmid
Die erste dieser Studien, Kasparian, Verspignani & Steinhauer (2014), untersucht die Verarbeitung von lexikalischen und morphosyntaktischen Elementen. Sie vergleicht italienische Immigranten in Kanada mit Italienisch als L1 und Englisch als L2 mit in Italien wohnenden Muttersprachlern des Italienischen. Im ersten Experiment wurde getestet, ob die italienischen Migranten italienische Wörter, die einander stark ähneln, miteinander verwechseln (zum Beispiel mento ‚Kinn‘ vs. menta ‚Münze‘) und ob die italienischen Migranten dazu in der Lage sind,Wörter die durch solche Minimalpaare ausgetauscht wurden, im Satzkontext zu erkennen. Verschiedene Typen von Sätzen wurden miteinander verglichen: Sätze, in denen ein Wort durch ein Minimalpaar ausgetauscht wurde und Sätze, in denen das ausgetauschte Wort dem ursprünglichen Wort in keiner Weise ähnelte. Um Informationen über die online Verarbeitung dieser Sätze zu erlangen, wurden in diesem Experiment ereigniskorrelierte Potentiale (EKPs) der Teilnehmer gemessen (vgl. Mueller in diesem Band). Für die in Italien wohnenden Muttersprachler wurden in beiden Formen der Sätze (Minimalpaar vs. anderes Wort) große N400-Effekte gefunden, was darauf hindeutet, dass für die ausgetauschten Wörter in beiden Fällen eine semantische Abweichung wahrgenommen wurde. Bei den englischsprechenden Italienern hingegen kommt es nur für die Sätze, bei denen ein Wort durch ein völlig anders Wort ausgetauscht wurde zu einem solchen N400-Effekt. Für die Sätze mit Minimalpaaren wurde in dieser Gruppe ein starker P600-Effekt gefunden, was eher auf eine syntaktische Anomalie hindeuten würde. Eine weitere Aufteilung der bilingualen Gruppe in Sprecher nach Sprachfertigkeit in der L1 zeigte, dass es bei der Gruppe mit hohem Grad an Italienischkenntnissen zum gleichen N400-Effekt wie bei den einsprachigen Muttersprachlern kam. Anzeichen der Attrition waren somit also davon abhängig, wie gut die L1 zum Zeitpunkt des Experiments beherrscht wurde. In einem zweiten Experiment wurde bei den zwei ursprünglichen Testgruppen die online Verarbeitung von Relativsätzen in der L1 Italienisch getestet. Im Italienischen gibt es vier verschiedene mögliche Satzstellungen im Relativsatz. Im Englischen sind jedoch zwei dieser Satzstellungen ungrammatisch. Die Ergebnisse der EKP-Studie zeigten, dass Sprecher des Italienischen, die in einer hauptsächlich englischsprachigen Umgebung leben, die zwei Satzstellungen, die im Englischen nicht möglich sind, auch im Italienischen nicht mehr akzeptierten und einen P600 Effekt aufwiesen. Während Kasparian, Verspignani & Steinhauer (2014) also Hinweise auf eine Veränderung der Verarbeitung von lexikalischen und Satzstellungsphänomenen bei Muttersprachlern mit geringem L1-Gebrauch finden, zeigt eine weitere EKPStudie eine weitgehend unveränderte Verarbeitung von Genuskongruenz: Bergmann et al. (2015) finden gleich große P600-Effekte bei Attritern des Deutschen mit Englisch als L2 und bei Monolingualen als Reaktion auf ungrammatische Sätze wie z. B. Leider ist *das Bart des Opernsängers vor ein paar Wochen abrasiert
Zusammenhänge zwischen Attrition der L1 und L2-Erwerb
293
worden. Obwohl die Probandengruppe Teilnehmer mit sehr langem Emigrationszeitraum (6.5 – 34 Jahre, Durchschnitt 17.2 Jahre) und niedrigem L1-Gebrauch (0 – 77 %, Durchschnitt 19.4 %) umfasste, blieben die Reaktionen auf die Ungrammatikalität gleich stark und traten im gleichen Zeitfenster auf. Es kam also weder zu einer Verzögerung noch zu einer Abmilderung der Reaktion. Die Anwendung der EEG-Methode stützt somit die Annahmen, dass lexikalische Phänomene und grammatische Phänomene, bei denen die beiden Sprachen in direkter Konkurrenz stehen, anfälliger für Attrition sind als Phänomene, bei denen ein struktureller Unterschied besteht.
7 Zusammenfassung und Ausblick Generell scheint es so zu sein, dass Menschen im Kontext der Sprachattrition in sprachlichen Tests im Vergleich zu einsprachigen Kontrollgruppen oft ein höheres Maß an Variabilität zeigen. Der Einblick in verschiedene Studien und Methoden dieses Forschungsbereiches hat gezeigt, dass Attrition der L1 sich auf verschiedenen sprachlichen Ebenen (z. B. lexikalisch, syntaktisch, phonetisch) äußern kann. Außerdem gibt es Hinweise dafür, dass Attrition der L1 nicht nur nach jahrelangem Aufenthalt in einem anderen Land, sondern auch schon in früheren Stadien des L2-Erwerbs auftreten kann. So gibt es zum Beispiel Studien, in denen gezeigt wurde, dass die L1 von Studenten während eines Auslandssemesters, bei dem eine L2 benutzt wird, schon nach etwa drei Monaten weniger einfach zugänglich ist als bei Studenten, die die L2 im Heimatland lernen (Linck, Kroll & Sunderman 2009). Durch die besondere Sprachsituation, in der sich bilinguale Menschen mit L1-Attrition befinden, d. h. sie haben die L1 früh als Muttersprachler erworben, aber gebrauchen nun intensiv die L2, können sie einen wichtigen Beitrag für die Erforschung verschiedener Aspekte leisten, die in der L2-Erwerbsforschung relevant sind, wie zum Beispiel das Alter beim Spracherwerb und die Frage nach der kritischen Periode. Bisher deuten verschiedene Studien darauf hin, dass es sich bei der L1-Attrition nicht um einen permanenten Verlust sprachlicher Fähigkeiten, sondern um bestimmte Schwierigkeiten in der online Verarbeitung der L1 handelt. Die Ursache von Attritionserscheinungen liegt wahrscheinlich in der zwischensprachlichen Konkurrenz, die durch den vermehrten Gebrauch der L2 entsteht. Es ist dem Forschungsbereich der L1-Attrition jedoch bislang nicht gelungen, systematisch die Faktoren zu benennen, die das Ausmaß der Attrition vorhersagen können. Weitere Untersuchungen zu diesen Fragen und vor allem zum Einfluss des Alters beim Spracherwerb stellen ein wichtiges Forschungsdesiderat für die Zukunft dar.
294
Mona Timmermeister und Monika S. Schmid
Literaturangaben Andersen, Roger W. (1982): Determining the linguistic attributes of language attrition. In Richard D. Lambert & Barbara F. Freed (Hrsg.), The loss of language skills, 83 – 118. Rowley, MA: Newbury House. Ben-Rafael, Miriam (2004): Language contact and attrition: The spoken French of Israeli Francophones. In Monika S. Schmid, Barbara Köpke, Merel Keijzer & Lina Weilemar (Hrsg.), First Language Attrition: Interdisciplinary perspectives on methodological issues, 165 – 187. Amsterdam: John Benjamins. Bergmann, Christopher, Nienke Meulman, Laurie A. Stowe, Simone A. Sprenger & Monika S. Schmid (2015): Prolonged L2 immersion engenders little change in morphosyntactic processing of bilingual natives. Neuroreport 26, 1065 – 1070. Bergmann, Christopher, Simone A. Sprenger & Monika S. Schmid (2015): The impact of language co-activation on L1 and L2 speech fluency. Acta Psychologica 161, 25 – 35. Bergmann, Christopher, Amber Nota & Monika S. Schmid (In Druck): L2 influence causes non-native-like pronunciation of vowels and consonants in German L1 attriters. Journal of Phonetics 58, 71 – 86. Birdsong, David (Hrsg.) (1999): Second language acquisition and the critical period hypothesis. New Jersey: Lawrence Erlbaum Associates. Bot, Kees de (1996): Language loss. In Hans Goebl, Peter H. Nelde, Zdenek Stary & Wolfgang Wölck (Hrsg.), Contact Linguistics. An International Handbook of Contemporary Research. Vol. I., 579 – 585. Berlin: de Gruyter. Brons–Albert, Ruth (1992): Verlust der Muttersprache in fremdsprachiger Umgebung. Info DaF 19 (3), 315 – 325. Brons–Albert, Ruth (1994): Interferenzfehler in der Muttersprache von in den Niederlanden lebenden Deutschen. In Bernd Spillner (Hrsg.), Nachbarsprachen in Europa, 96 – 104. Frankfurt am Main: Peter Lang. Chamorro, Gloria, Antonella Sorace & Patrick Sturt (2016): What is the source of L1 attrition? The effect of recent L1 re-exposure on Spanish speakers under L1 attrition. Bilingualism: Language and Cognition 19, 1 – 13. Chamorro, Gloria, Patrick Sturt & Antonella Sorace (2015): Selectivity in L1 Attrition: Differential Object Marking in Spanish Near-Native Speakers of English. Journal of Psycholinguistic research 45, 1 – 19. Chang, Charles B. (2012): Rapid and multifaceted effects of second-language learning on first language speech production. Journal of Phonetics 40, 249 – 268. Cherciov, Mirela (2011): Between Attrition and Acquisition: the Case of Romanian in Immigrant Contexts. PhD dissertation, University of Toronto. Cook, Vivian (2003): Introduction: The changing L1 in the L2 user’s mind. In Vivian Cook (Hrsg.), Effects of the second language on the first, 1 – 18. Clevedon: Multilingual Matters. Dostert, Susan (2009): Multilingualism, L1 attrition and the concept of ’native speaker’. PhD dissertation, Heinrich–Heine Universität Düsseldorf. Dussias, Paola E. (2003): Syntactic ambiguity resolution in L2 learners. Studies in Second Language Acquisition 25 (4), 529 – 557. Dussias, Paola E. & Nuria Sagarra (2007): The effect of exposure on syntactic parsing in Spanish- English bilinguals. Bilingualism: Language and Cognition 10 (1), 101 – 116.
Zusammenhänge zwischen Attrition der L1 und L2-Erwerb
295
Fernández, Eva M. (2003): Bilingual sentence processing: Relative clause attachment in English and Spanish. Amsterdam, Philadelphia: John Benjamins. Flege, James E. (1987): The production of ‘new’ and ‘similar’ phones in a foreign language: evidence for the effect of equivalence classification. Journal of Phonetics 15, 47 – 65. Green, David W. (2011): Language control in different contexts: the behavioral ecology of bilingual speakers. Frontiers in psychology 2, 103. Grosjean, François (2001): The bilingual’s language modes. In Janet Nicol (Hrsg.), One Mind, Two Languages: Bilingual language processing, 1 – 22. Oxford: Blackwell. Gürel, Ayşe (2004): Attrition in L1 competence: The case of Turkish. In Monika S. Schmid, Barbara Köpke, Merel Keijzer & Lina Weilemar (Hrsg.), First language attrition. Interdisciplinary perspectives on methodological issues, 225 – 242. Amsterdam: John Benjamins. Hell, Janet van & Natasha Tokowicz (2010): Event-related brain potentials and second language learning: Syntactic processing in late L2 learners at different L2 proficiency levels. Second Language Research 26, 43 – 74. Herschensohn, Julia (2007): Language Development and Age. Cambridge: Cambridge University Press. Hopp, Holger & Monika S. Schmid (2013). Perceived foreign accent in L1 attrition and L2 acquisition: the impact of age of acquisition and bilingualism. Applied Psycholinguistics 34 (2), 361 – 394. Ionin, Tania, Maria L. Zubizarreta & Salvador B. Maldonado (2008): Sources of linguistic knowledge in the second language acquisition of English articles. Lingua 118 (4), 554 – 576. Jarvis, Scott & Aneta Pavlenko (2008): Crosslinguistic influence in language and cognition. New York: Routledge. Karayayla, Tuğba. (In Vorbereitung): Evidentiality in Turkish heritage speakers and attriters. Kasparian, Kristina, Francesco Vespignani & Karsten Steinhauer (2014): The case of a non– native–like first language: ERP evidence of first language (L1) attrition in lexical and morphosyntactic processing. International Journal of Psychophysiology 2 (94), 159 – 160. Keijzer, Merel (2007): Last in first out? An investigation of the regression hypothesis in Dutch emigrants in Anglophone Canada. PhD dissertation, Vrije Universiteit Amsterdam. Köpke, Barbara & Jean–Luc Nespoulous (2001): First language attrition in production skills and metalinguistic abilities in German–English and German–French bilinguals. In Tom Ammerlaan, Madeleine Hulsen, H. Strating & Kutlay Yağmur (Hrsg.), Sociolinguistic and Psycholinguistic Perspectives on Maintenance and Loss of Minority Languages, 221 – 234. Münster u. a.: Waxmann. Köpke, Barbara & Monika S. Schmid (2004): First language attrition: the next phase. In Monika S. Schmid, Barbara Köpke, Merel Keijzer & Lina Weilemar (Hrsg.), First Language Attrition: Interdisciplinary perspectives on methodological issues 1 – 43. Amsterdam, Philadelphia: John Benjamins. Kroll, Judith F., Paola E. Dussias, Kinsey Bice & Lauren Perroti (2015): Bilingualism, Mind, and Brain. Annual Review of Linguistics 1, 377 – 394. Leeuw, Esther de, Ineke Mennen & James M. Scobbie (2012): Dynamic systems, maturational constraints and L1 phonetic attrition. International Journal of Bilingualism 17 (6), 683 – 700.
296
Mona Timmermeister und Monika S. Schmid
Linck, Jared A., Judith F. Kroll & Gretchen Sunderman (2009): Losing access to the native language while immersed in a second language: Evidence for the role of inhibition in second-language learning. Psychological Science 20 (12), 1507 – 1515. MacWhinney, Brian (2012): The logic of the Unified Model. In Susan M. Gass & Alison Mackey (Hrsg.) The Routledge handbook of second language acquisition, 211 – 227. New York: Routledge. Montrul, Silvina (2008): Incomplete Acquisition in Bilingualism. Re–examining the age factor. Amsterdam, Philadelphia: John Benjamins. Olshtain, Elite & Margaret Barzilay (1991): Lexical retrieval difficulties in adult language attrition. In Herbert W. Seliger & Robert M. Vago (Hrsg.), First Language Attrition, 139 – 150. Cambridge: Cambridge University Press. Opitz, Conny (2011): First language Attrition and Second Language Acquisition in a Second– Language Environment. PhD dissertation, Trinity College Dublin. Pallier, Christophe, Stanislas Dehaene, Jean-Baptiste Poline, Denis LeBihan, Anne-Marie Argenti, Emmanuel Dupoux & Jacques Mehler (2003): Brain imaging of language plasticity in adopted adults: can a second language replace the first? Cerebral Cortex 13, 155 – 161. Paradis, Michel (2004): A neurolinguistic theory of bilingualism. Amsterdam: John Benjamins. Paradis, Michel (2007): L1 attrition features predicted by a neurolinguistic theory of bilingualism. In Barbara Köpke, Monika S. Schmid, Merel Keijzer & Susan Dostert (Hrsg.), Language Attrition: Theoretical perspectives, 121 – 134. Amsterdam: John Benjamins. Paradis, Michel (2009): Declarative and Procedural Determinants of Second Languages. Amsterdam, Philadelphia: John Benjamins. Perpiñán, Silvia (2011): Optionality in bilingual native grammars. Language, Interaction and Acquisition 2 (2), 312 – 341. Ribbert, Anne & Folkert Kuiken (2010): L2–induced changes in the L1 of Germans living in the Netherlands. Bilingualism: Language and Cognition 13 (01), 41 – 48. Schmid, Monika S. (2002): First Language Attrition, Use and Maintenance: The case of German Jews in Anglophone countries. Amsterdam: John Benjamins. Schmid, Monika S. (2007): The role of L1 use for L1 attrition. In Barbara Köpke, Monika S. Schmid, Merel Keijzer & Susan Dostert (Hrsg.), Language attrition: theoretical perspectives, 135 – 53. Amsterdam, Philadelphia: John Benjamins. Schmid, Monika S. & Barbara Köpke (2007): Bilingualism and attrition, In Barbara Köpke, Monika S. Schmid, Merel Keijzer & Susan Dostert (Hrsg.), Language attrition: Theoretical perspectives, 1 – 8. Amsterdam, Philadelphia: John Benjamins. Schmid, Monika S. & Barbara Köpke (2009): L1 attrition and the mental lexicon. In Aneta Pavlenko (Hrsg.), The Bilingual Mental Lexicon 209 – 238. Clevedon: Multilingual Matters. Schmid, Monika S. & Kristy Beers Fägersten (2010): Fluency and language attrition. Language Learning 60 (4), 753 – 791. Schmid, Monika S. & Elise Dusseldorp (2010): Quantitative analyses in a multivariate study of language attrition. Second Language Research 26, 125 – 60. Schmid, Monika S. (2013): First language attrition. Linguistic Approaches to Bilingualism 3 (1), 97 – 116. Schmid, Monika S. (2014): The debate on maturational constraints in bilingual development: a perspective from first language attrition. Language acquisition 21 (4), 386 – 410. Schmid, Monika S. & Scott Jarvis (2014): Lexical access and lexical diversity in first language attrition. Bilingualism: Language and Cognition 17 (4), 729.
Zusammenhänge zwischen Attrition der L1 und L2-Erwerb
297
Schmid, Monika S. & Barbara Köpke (In Begutachtung). Language attrition. Keynote article in Linguistic Approaches to Bilingualism. Schmitt, Elena (2004): No more reductions! To the problem of evaluation of language attrition data. In Monika S. Schmid, Barbara Köpke, Merel Keijzer & Lina Weilemar (Hrsg.), First language attrition: Interdisciplinary perspectives on methodological issues, 299 – 316. Amsterdam, Netherlands: John Benjamins. Schmitt, Elena (2010): When boundaries are crossed: Evaluating language attrition data from two perspectives. Bilingualism: Language and Cognition 13 (1), 63 – 72. Sorace, Antonella & Francesca Filiaci (2006): Anaphora resolution in near-native speakers of Italian. Second Language Research 22 (3), 339 – 368. Tsimpli, Ianthi, Antonella Sorace, Caroline Heycock & Francesca Filiaci (2004): First language attrition and syntactic subjects: A study of Greek and Italian near–native speakers of English. International Journal of Bilingualism 8 (3), 257 – 277. Tsimpli, Ianthi (2007): First language attrition from a minimalist perspective: Interface vulnerability and processing effects. In Barbara Köpke, Monika S.Schmid, Merel Keijzer & Susan Dostert (Hrsg.), Language attrition: Theoretical Perspectives, 83 – 98. Amsterdam, Philadelphia: John Benjamins. Varga, Zsolt (2012): First language attrition and maintenance among Hungarian speakers in Denmark. PhD dissertation, Århus University.
Carrie Jackson, Courtney Johnson Fowler, Bianca Gavin und Nick Henry
Zusammenhänge zwischen der Sprachverarbeitung und dem Erwerb neuer Strukturen bei erwachsenen L2-Lernern
Bisher wurden die Forschung in der Psycholinguistik und die angewandte Forschung im Bereich des L2-Erwerbs, vor allem mit Fokus auf dem Fremdsprachenunterricht, als zwei verschiedene Forschungsfelder betrachtet. Innerhalb der letzten Jahre wurden allerdings Fragestellungen und Methoden dieser beiden Bereiche immer mehr miteinander verbunden, so dass die Forschungsfelder sich gegenseitig annäherten (für einen Überblick z. B. Mackey & Marsden 2015; Morgan-Short, Faretta-Stutenberg & Bartlett 2015). Zum Beispiel kann die psycholinguistische Forschung zur inkrementellen Verarbeitung lexikalischer und morphosyntaktischer Informationen während des Sprachverstehens unser Verständnis der Lernprozesse im erwachsenen L2-Erwerb vertiefen und die Frage beantworten, inwiefern unterschiedliche Verarbeitungsstrategien unter L2-Lernern vom Sprachniveau des Lerners abhängig sind (für einen Überblick Juffs & Rodriguez 2014; Roberts 2015; siehe auch Hopp in diesem Band). Insbesondere kann diese Forschung auch auf die Frage eingehen, ob und wie die Sprachverarbeitung und das Lernen neuer Strukturen in der L2 sich gegenseitig beeinflussen (z. B. Dekydtspotter & Renaud 2014; Pienemann 1998; VanPatten 2012). In diesem Kapitel wird besprochen, wie L2-Lerner des Deutschen verschiedene grammatische Strukturen, insbesondere Kasus- und Genusmarkierungen und Adverbial-Verb-Subjekt (XVS)-Wortstellungen, erwerben. Hier liegt der Schwerpunkt auf dem Verlauf des L2-Erwerbs bei Anfängern und weniger fortgeschrittenen Fremdsprachenlernern in Unterrichtskontexten, wohingegen im Kapitel von Hopp (in diesem Band) der Schwerpunkt auf der inkrementellen Verarbeitung dieser Strukturen bei fortgeschrittenen Lernern liegt. Zwei Hauptthemen in diesem Kapitel sind, (a) wie lexikalische und semantische Informationen die Verarbeitung und den Erwerb grammatischer Strukturen in der L2 beeinflussen und (b) inwiefern der Verlauf des L2-Erwerbs von der Existenz und Frequenz dieser Strukturen in der L1 beeinflusst wird. In Abschnitt 1 wird das Input-Processing Modell von VanPatten (2004, 2007, 2012) vorgestellt, und es werden einschlägige Studien zum Erwerb von Kasus- und Genusmarkierungen im Deutschen besproCarrie Jackson, Courtney Johnson Fowler, Bianca Gavin und Nick Henry, Pennsylvania State University DOI 10.1515/9783110456356-013
300
Carrie Jackson, Courtney Johnson Fowler, Bianca Gavin und Nick Henry
chen. In Abschnitt 2 wird auf strukturelles Priming eingegangen und diskutiert, wie Priming-Studien zu einem besseren Verständnis des Erwerbs der Satzstellung durch L2-Lerner des Deutschen beitragen können.
1 Sprachverarbeitung und Sprachdidaktik In der Forschung im Bereich des L2-Erwerbs mit Fokus auf dem Fremdsprachenunterricht geht es hauptsächlich darum, wie der Unterricht am besten gestaltet werden kann, um das Lernen der L2 zu fördern. Hier wird unter anderem untersucht, ob explizite Grammatikerklärungen gegenüber impliziten Methoden der Vermittlung für das Lernen neuer Strukturen bei erwachsenen L2-Lernern vorteilhaft sind (für einen Überblick Sanz & Morgan-Short 2005; Spada & Tomita 2010). Unabhängig davon, ob explizite Informationen in den Unterricht einbezogen werden, wird heutzutage der Schwerpunkt daraufgelegt, dass der L2-Input und die entsprechenden Unterrichtsaufgaben Lerner dazu bringen sollen, die Beziehung zwischen grammatischen Formen und deren Bedeutung zu erkennen. Es wird dabei angestrebt, dass das Lernen und die darauffolgende Anwendung grammatischer Strukturen in der L2 immer in einen kommunikativen Kontext eingebettet sind. Nach den Prinzipien des Fokus-auf-Form Ansatzes sollen grammatische Strukturen nie isoliert von deren kommunikativer Funktion diskutiert werden, und Lerner sollen auf grammatische Formen aufmerksam gemacht werden, wenn grammatische Fehler zu Missverständnissen während des Sprachverstehens oder der Sprachproduktion führen (z. B. Long 1991; als Überblick Doughty & Williams 1998). Diese Ansätze konzentrieren sich hauptsächlich auf den Sprachunterricht, stützen sich jedoch größtenteils nicht explizit auf Erkenntnisse aus der Psycholinguistik. Andererseits gibt es Theorien, wie zum Beispiel die Processability Theorie (Pienemann 1998), die versuchen, den Verlauf des L2-Erwerbs anhand psychologischer bzw. psycholinguistischer Prinzipen der L1-Sprachproduktion zu erklären und daraus didaktische Implikationen abzuleiten. In seiner Processability Theorie geht Pienemann davon aus, dass der Erwerb komplizierter grammatischer Strukturen im L2-Erwerb durch die Verarbeitungskapazität der Lerner beschränkt ist und daraus bestimmte Entwicklungsstufen resultieren, die alle L2-Lerner durchlaufen müssen. Der Schwierigkeitsgrad einer bestimmten Struktur und die daraus entstehenen Sequenzen der Entwicklungsstufen spiegeln die inkrementellen Verarbeitungsroutinen aus der Sprachproduktion unter Muttersprachlern wider, in der zuerst einzelne Wörter auf der lexikalischen Ebene aktiviert werden und erst danach Verarbeitungsroutinen, die den Austausch wortübergreifender Informationen und grammatischer Informationen zwischen Phrasen verlangen,
Zusammenhänge der Sprachverarbeitung und dem Erwerb neuer Strukturen
301
aktiviert werden (vgl. Kempen & Hoenkamp 1987; Levelt 1989). Kein L2-Lerner kann eine Entwicklungsstufe überspringen, da die erfolgreiche Anwendung der Verarbeitungsroutinen auf einer Stufe eine Voraussetzung für die Entwicklung der jeweils nächsten Stufe ist. Mehrere Langzeitstudien zur Sprachproduktion von erwachsenen L2-Lernern in verschiedenen Sprachen belegen derartige Entwicklungsstufen (z. B. Baten 2011; Håkansson, Pienemann & Sayehli 2002; Jansen 2008; für einen Überblick Pienemann 2005). In Bezug auf den Sprachunterricht soll nun gemäß der Teachability Hypothese, die aus der Processability Theorie abgeleitet ist, die Vermittlung grammatischer Strukturen didaktisch an die entsprechende Entwicklungsstufe des Lerners angepasst werden, weil er ansonsten die Struktur nicht verarbeiten und damit nicht erwerben kann (z. B. Keßler, Liebner & Mansouri 2011). Ein zweites Modell, das versucht zu erklären, warum L2-Lerner nicht alle linguistischen Formen im Input effizient verarbeiten können und einige Strukturen deswegen schwieriger zu erwerben sind, ist das Input-Processing (IP) Modell von VanPatten (2004, 2007, 2012). Im Gegensatz zur Processability Theorie (Pienemann 1998), die als Ausgangspunkt die psycholinguistichen Prinzipien der Sprachproduktion benutzt, konzentriert sich das IP Modell auf psycholinguistische Prozesse des Satzverstehens. Aus diesen lassen sich konkrete Ansätze für den Unterricht entwickeln, die die Verarbeitung und den dadurch entstehenden Erwerb der L2 grammatischen Strukturen fördern. Als Modell des L2-Erwerbs besteht das IP-Modell aus Prinzipien, die erklären sollen, welche Verständnisstrategien L2Lerner benutzen, um Sätze zu verstehen, und warum L2-Lerner grammatische Formen oft nicht verarbeiten, auch wenn sie wichtige linguistische Informationen beinhalten (VanPatten 2012). Der Begriff Verarbeitung wird allerdings hier etwas enger als in der Psycholinguistik verstanden, denn Verarbeitung bezieht sich im IP-Modell auf den Prozess, bei dem L2-Lerner eine bestimmte linguistische Form mit einer Bedeutung verbinden (VanPatten 2012). Der Ausgangspunkt des Modells ist die Annahme, dass L2-Lerner sich das Ziel setzen, die Bedeutung eines Satzes zu verstehen. Nach VanPatten (2004, 2012) heißt dieses Prinzip Vorrang der Bedeutung. Um die Bedeutung eines Satzes vollständig zu erschließen, müssen dem Lerner die zur Verfügung stehenden kognitiven Ressourcen ausreichen, um alle linguistischen Informationen (insbesondere auch morphosyntaktische Informationen) in der Interpretation des Satzes zu berücksichtigen (das Prinzip der Verfügbarkeit kognitiver Ressourcen). Die Verarbeitung einer L2 ist aber für L2-Lerner so aufwändig, dass die verfügbaren kognitiven Ressourcen schneller aufgebraucht sind als in der L1, so dass L2-Lerner bestimmte Filter einsetzen müssen, um die Informationen im Input so effizient wie möglich zu verarbeiten. Die Filter und Strategien, die L2-Lerner verwenden, um die
302
Carrie Jackson, Courtney Johnson Fowler, Bianca Gavin und Nick Henry
Bedeutung eines Satzes zu verstehen, sind die sogenannten Prinzipien des Input Processing. Zwei wichtige Prinzipien des IP-Modells erklären, warum L2-Lerner gerade am Anfang des L2-Erwerbs die im Satz enthaltenen grammatischen Informationen oft nicht verarbeiten. Das Prinzip des Vorrangs der Inhaltswörter erklärt, dass der L2Lerner die lexikalische Bedeutung von Wörtern, wie zum Beispiel Nomen und Verben, zuerst verarbeitet. Diese inhaltstragenden Wörter sind zudem oft beim Sprechen betont und sind deswegen einfacher wahrnehmbar als Funktionswörter. Dazu kommt auch das Prinzip der lexikalischen Präferenz, welches erklärt, dass, wenn die gleiche Bedeutung sowohl durch grammatische als auch durch lexikalische Mittel ausgedrückt wird, der L2-Lerner Informationen aus lexikalischen Quellen bevorzugt (VanPatten 2004, 2012). Wenn zum Beispiel in einem Satz ein Verb im Präteritum steht, aber auch das Wort gestern vorkommt, würden beginnende Lerner sich eher auf das Wort gestern verlassen, um zu verstehen, dass sich der Satz auf die Vergangenheit bezieht, als die Tempusmarkierung auf dem Verb zu verarbeiten. Eines der wichtigsten Prinzipien des IP-Modells erklärt, wie L2-Lerner transitive Sätze verstehen.Wenn der L2-Lerner einen Satz liest, neigt er dazu, das erste Substantiv als Subjekt wahrzunehmen, egal welche grammatische Funktion dieses Substantiv im Satz tatsächlich hat (siehe auch Hopp in diesem Band). Dieses Prinzip des ersten Nomens kann in einer Sprache wie dem Deutschen manchmal zu Fehlinterpretationen führen, wenn zum Beispiel ein Akkusativobjekt statt eines Nominativsubjekts am Anfang eines Satzes steht. Der L2-Lerner nimmt dieses Nomen als Subjekt wahr (z. B.: Den Mann sieht die Frau wird als Der Mann sieht die Frau falsch verstanden), es sei denn, diese Interpretation ist kontextuell implausibel oder unlogisch (Den Kuchen isst die Frau wird trotzdem als Die Frau isst den Kuchen verstanden, da es nicht logisch wäre, wenn ein Kuchen eine Frau essen würde). In diesem Fall können zwei Prinzipien Vorrang vor dem Prinzip des ersten Nomens haben: die Prinzipien lexikalische Semantik und Ereigniswahrscheinlichkeit. Diese Prinzipien spielen eine entscheidende Rolle, da der L2-Lerner hiermit semantische und pragmatische Informationen nutzt, um zu überprüfen, ob ein Satz Sinn ergibt, und die Interpretation des Satzes an sein Weltwissen anpasst. Tabelle 1 fasst die zentralen Prinzipien des IP-Modells zusammen.
Zusammenhänge der Sprachverarbeitung und dem Erwerb neuer Strukturen
303
Tabelle 1: Zusammenfassung der zentralen Prinzipien des IP-Modells Prinzip
Beschreibung
Vorrang der Bedeutung
L-Lerner setzen sich das Ziel, die Bedeutung des Satzes zu verstehen. Die kognitiven Ressourcen von L-Lernern sind beschränkt, so dass sie nicht immer alle linguistischen Informationen verarbeiten können. L-Lerner verarbeiten zuerst die lexikalische Bedeutung von Wörtern, wie zum Beispiel Substantiven und Verben. L-Lerner bevorzugen Informationen aus lexikalischen statt aus grammatischen Quellen. L-Lerner neigen dazu, das erste Substantiv im Satz als Subjekt wahrzunehmen.
Verfügbarkeit kognitiver Ressourcen Vorrang der Inhaltswörter Lexikalische Präferenz Prinzip des ersten Nomens
1.1 Processing Instruction und die Implikationen des IP-Modells Die Prinzipien des Input Processing haben unmittelbare Konsequenzen für die Fremdsprachendidaktik, denn sie erlauben es, Aufgaben für L2-Lerner zu konzipieren, die sie dazu zwingen, einen Satz anders zu verarbeiten, als sie es gewöhnt sind. Um sicher zu stellen, dass L2-Lerner eine bestimmte grammatische Form während des Satzverstehens verarbeiten, wird der Input so strukturiert, dass der L2-Lerner eine bestimmte grammatische Form verarbeiten muss, um einen Satz richtig zu verstehen und anschließend eine Frage zu dem Satz richtig zu beantworten. Um das zu ermöglichen, wird die didaktische Methode der Processing Instruction (PI) und deren Structured-Input (SI)-Aufgaben (Aufgaben zu strukturiertem Input) eingesetzt. In jüngerer Zeit wird für letztere auch der Begriff TaskEssential Activities immer öfter verwendet, aber diese zwei Begriffe haben im Prinzip dieselbe Bedeutung. Um zu erklären, wie SI-Aufgaben den Input strukturieren und damit die Verarbeitung einer grammatischen Form erfordern, nehmen wir als Beispiel den Erwerb von bestimmten Artikeln im Akkusativ im Deutschen, der für viele L2Lerner sehr schwierig ist. Wenn L2-Lerner einen transitiven Satz hören, wie zum Beispiel Der Hund beißt den Mann, können sie den Satz durch eine erstes Nomen Strategie verstehen, oder sie können auch einfach ihr Weltwissen benutzen, um den Satz zu verarbeiten (es ist wahrscheinlicher, dass ein Hund einen Mann beißt, und eher unwahrscheinlich, dass ein Mann einen Hund beißt). Damit Lerner solche Strategien nicht benutzen können und stattdessen grammatische Kasusmarkierungen verwenden müssen, versucht PI, disambiguierende lexikalisch-
304
Carrie Jackson, Courtney Johnson Fowler, Bianca Gavin und Nick Henry
semantische Informationen aus dem Input zu entfernen und die Wortstellung der Sätze im Input zu variieren. In einer typischen PI-Unterrichtseinheit zum Akkusativ im Deutschen lesen die L2-Lerner zuerst eine kurze Grammatikerklärung mit einer Warnung vor der falschen Verarbeitungsstrategie (in diesem Kontext vor der Strategie des ersten Nomens). Dann machen sie eine SI-Aufgabe mit sowohl subjektinitialen (SVO) Sätzen, wie Der Hund hört die Katze, als auch objektinitialen (OVS) Sätzen, wie Den Studenten sieht die Lehrerin. Während der L2-Lerner einen Satz hört, sieht er auch zwei Bilder, die den zwei möglichen Interpretationen des Satzes entsprechen (d. h. entweder ein Bild von einem Hund, der eine Katze hört, oder ein Bild von einem Hund, den eine Katze hört). Der L2-Lerner muss dann das Bild auswählen, das zu dem Satz passt. Wenn er das nicht schafft, wird er sofort korrigiert, damit er wahrnehmen kann, dass er den Satz falsch verarbeitet hat. In der ersten Studie, die PI verwendete, untersuchten VanPatten & Cadierno (1993) den Erwerb von klitischen Pronomen im Spanischen, die eine OVS-Wortstellung verlangen, und deswegen von vielen L2-Lernern falsch verstanden werden (LoCoco 1987; VanPatten 1984). VanPatten & Cadierno verglichen L2-Lerner, die diese Struktur durch PI oder durch traditionelle Output-orientierte Aufgaben (traditionelle Aufgaben, TA) lernten. In diesen traditionellen Aufgaben beschrieben die Probanden Bilder oder führten ein kurzes Interview mit einem Partner. Äußerst wichtig ist es, dass in diesen traditionellen Output-orientierten Aufgaben die Probanden keine Interpretationsübungen machten. Nach dem Unterricht verstanden die L2-Lerner in der PI-Gruppe diese Struktur besser als die TAGruppe. Auch produzierten beide Gruppen die Struktur gleich gut, obwohl die L2Lerner in der PI-Gruppe während des Unterrichts nichts produzieren mussten. Hieraus schlossen VanPatten & Cardierno, dass die richtige Verarbeitung der Struktur starke Form-Bedeutungsbeziehungen schafft. Inzwischen berichten mehrere andere Studien, die PI mit TA verglichen, ähnliche Ergebnisse (Benati 2001, 2005; Cadierno 1995; Henry 2015). Diese Studien deuten nicht nur auf die Wirksamkeit von Processing Instruction, sondern sie unterstützen auch die Annahmen des IP-Modells.
1.2 Processing Instruction und Kasus Wie schon erwähnt, ist der Erwerb des Akkusativs im Deutschen für L2-Lerner und vor allem englischsprachige Lerner oft sehr schwierig. L2-Lerner folgen oft dem Prinzip des ersten Nomens, demzufolge das erste Substantiv des Satzes das Subjekt ist (LoCoco 1989; Jackson 2007). Besonders im Deutschen haben viele L2-Lerner Probleme, Artikelformen zu erwerben, denn nur bei maskulinen Artikeln gibt es einen Unterschied zwischen den nominativen und akkusativen Formen, so dass
Zusammenhänge der Sprachverarbeitung und dem Erwerb neuer Strukturen
305
eine eindeutige Beziehung zwischen morphosyntaktischen Formen und der syntaktischen Funktion von Nominalphrasen oft nicht möglich ist (Kempe & MacWhinney 1998). PI ist für dieses Phänomen gut geeignet, denn PI soll es ermöglichen, eine starke Form-Bedeutungsbeziehung herzustellen. Eine der ersten Studien zum Erwerb von Kasus im Deutschen, die PI verwendete, wurde von Henry, Culman & VanPatten (2009) durchgeführt. Diese Studie verwendete eine SI-Aufgabe, um L2-Lernern die zielsprachliche Interpretation des Akkusativs beizubringen. Das Hauptziel dieser Studie war es, zu untersuchen, ob eine Grammatikerklärung während eines PI-Unterrichts vorteilhaft ist. Obwohl VanPatten & Oikkenon (1996) schon zeigten, dass eine Grammatikerklärung nicht nötig ist, weist Fernandez (2008) darauf hin, dass sie für manche Strukturen doch vorteilhaft sein könnte. Wie Fernandez (2008) verwendeten Henry, Culman & VanPatten (2009) eine SI-Aufgabe auf dem Computer, in der die Probanden 20 OVS- und 10 SVO-Sätze hörten. Wie in der oben beschriebenen Aufgabe wählten die Probanden dann eines der zwei Bilder aus, die den zwei möglichen Interpretationen des Satzes entsprachen, um zu zeigen, welchen Satz sie hörten. Henry, Culman & VanPatten (2009) testeten zwei Gruppen von Probanden: eine Gruppe (‐GRAM), die nur die SI-Aufgabe machte, und eine Gruppe (+GRAM), die neben der SI-Aufgabe auch eine explizite Grammatikerklärung las. Während der Aufgabe wurden gemessen, ab wann die Probanden begannen, die Sätze richtig zu verarbeiten, d. h., ab wann sie mindestens vier Sätze nacheinander richtig verstehen konnten. Die Ergebnisse zeigten, dass die +GRAM-Gruppe den Input früher richtig verarbeitete als die -GRAM-Gruppe. Weiterhin verarbeitete mehr als die Hälfte aller Probanden in der -GRAM-Gruppe die Sätze bis zum Ende der Aufgabe nie richtig. Da diese Ergebnisse im Gegensatz zu Fernandez (2008) standen, kamen Henry, Culman & VanPatten (2009) zu dem Schluss, dass die Vorteile einer Grammatikerklärung von der spezifischen linguistischen Form abhängig sind. In einer zweiten Studie untersuchten VanPatten et al. (2013) die Verarbeitung von OVS-Sätzen bei englischsprachigen L2-Lernern des Deutschen, Russischen, Spanischen und Französischen, wenn sie eine längere SI-Aufgabe bearbeiteten. VanPatten et al. beobachteten, dass, wenn die Probanden 50 statt nur 30 Sätze hörten, eine ähnliche Grammatikerklärung im Deutschen (aber nicht in den anderen Sprachen) immer noch vorteilhaft war, da die +GRAM-Gruppe den Input früher richtig verarbeitete als die -GRAM-Gruppe. Am Ende des Experiments verstanden hingegen die +GRAM- und -GRAM-Gruppen in einem Posttest SVOund OVS-Sätze mit ähnlicher Richtigkeit, was darauf hindeutet, dass eine Grammatikerklärung nicht erforderlich ist, wenn Lerner ausreichenden Input durch eine längere SI-Aufgabe bekommen.
306
Carrie Jackson, Courtney Johnson Fowler, Bianca Gavin und Nick Henry
Da PI versucht, die Verständnisstrategien eines L2-Lerners zu verändern, ist es wichtig, eine mögliche Veränderung direkt während der online Verarbeitung eines Satzes zu messen. Jedoch haben die meisten PI-Studien bisher nur die Ergebnisse von PI indirekt durch offline Verständnistests untersucht. Erst seit kurzem untersuchen Forscher die Auswirkungen von PI mit psycholinguistischen Methoden wie selbstgesteuertem Lesen oder Eyetracking. Diese Methoden messen die Lesezeiten von verschiedenen linguistischen Strukturen in einem Satz und ermöglichen dadurch eine direkte Beobachtung der Satzverarbeitung. Sie sind deswegen zur Untersuchung von PI und dessen Auswirkungen gut geeignet, denn die Verständnisstrategien der L2-Lerner können direkt beobachtet werden. Eine der ersten dieser Studien war Henry (2015), der den Erwerb von akkusativmarkierten OVS-Sätzen im Deutschen durch selbstgesteuertes Lesen untersuchte. In dieser Studie lernten zwei Gruppen von L2-Lernern den Akkusativ. In der PI-Gruppe bearbeiteten die Probanden eine PI-Aufgabe, wie die von Henry, Culman & VanPatten (2009) und VanPatten et al. (2013). In der TA-Gruppe absolvierten die Lerner traditionelle Aufgaben, die das Schreiben des Akkusativs erforderten. Als Prä- und Posttest bearbeiteten die Probanden zwei Aufgaben, und anschließend nahmen sie an einem Leseexperiment teil. Die erste Aufgabe war eine geschriebene Verständnisaufgabe, in der die Probanden SVO- und OVS-Sätze interpretierten. Die zweite Aufgabe war eine schriftliche Produktionsaufgabe, in der die Probanden eine Bildergeschichte beschrieben. Dabei mussten sie Nominativ- und Akkusativartikel benutzen. Für das Leseexperiment lasen die Probanden SVO- und OVS-Sätze mit einem maskulinen Substantiv (als erstes oder drittes Satzglied), die phrasenweise präsentiert wurden (vgl. 1): (1) a. b. c. d.
Der Kellner / küsst / die Frau / im / Restaurant / neben / dem Kino. Den Kellner / küsst / die Frau / im / Restaurant / neben / dem Kino. Die Frau / küsst / den Kellner / im / Restaurant / neben / dem Kino. Die Frau / küsst / der Kellner / im / Restaurant / neben / dem Kino.
Längere Lesezeiten für die Phrasen, die den Satz zu einer OVS-Abfolge disambiguieren, sollten auf Verarbeitungs- und Integrationsschwierigkeiten deuten. Da frühere Studien zeigen, dass fortgeschrittene L2-Lerner und deutsche Muttersprachler zu einer SVO-Präferenz neigen (z. B. Hemforth, Konieczny & Strube 1993; Hopp 2006, 2010; Schlesewsky, Fanselow, Kliegl & Krems 2000; Schriefers, Frederici & Kühn 1995; siehe auch Hopp in diesem Band), würden längere Lesezeiten an dem disambiguierenden Substantiv der OVS-Sätze darauf hinweisen, dass die Probanden die Kasusmarkierung auf dem Artikel verwenden, um den Satz zu verstehen. Nachdem die Probanden einen Satz gelesen hatten, beantworteten
Zusammenhänge der Sprachverarbeitung und dem Erwerb neuer Strukturen
307
sie eine Verständnisfrage zu dem Satz, um zu prüfen, ob sie den Satz verstanden. Die Hälfte dieser Fragen bezogen sich auf die thematischen Rollen im Satz (d. h., ob der Kellner die Frau küsste oder umgekehrt). Die Ergebnisse der Verständnisaufgabe zeigten, dass die PI-Gruppe nach der Intervention im Vergleich zum Prätest die OVS-Sätze besser verstanden. Die TAGruppe hingegen verbesserte sich nach der Intervention nicht. Allerdings zeigten die Ergebnisse der Produktionsaufgabe, dass beide Gruppen sich verbesserten, da sie die Artikel der und den mit ähnlicher Richtigkeit verwenden konnten. Somit spiegeln diese Aufgaben die Ergebnisse von VanPatten & Cadierno (1993) wider und deuten auf die Vorteile von PI für den Erwerb des Akkusativs im Deutschen hin. Die Ergebnisse des selbstgesteuerten Lesens zeigten allerdings, dass die beiden Gruppen sogar nach der Intervention Schwierigkeiten hatten, die Sätze in dieser Aufgabe richtig zu verstehen, wie sich in ihren Antworten auf die Verständnisfragen offenbarte. Zusätzlich hatten weder die PI-Gruppe, noch die TAGruppe längere Lesezeiten für das Objekt in OVS-Sätzen nach der Intervention. Jedoch beobachtete Henry (2015), dass die PI-Gruppe längere Lesezeiten auf allen Substantiven unabhängig von SVO- oder OVS-Wortstellung hatte. Dieses Ergebnis zeigte, dass die Probanden der PI-Gruppe ihre Verständnisstrategie veränderten. Auch wenn sie in der Aufgabe Probleme hatten, Kasus inkrementell zu verarbeiten, versuchten sie, die Artikel zu verarbeiten. Diese Ergebnisse deuten auf einen zweistufigen Prozess des Kasuserwerbs hin, d. h. dass L2-Lerner zuerst eine starke Form-Bedeutungsbeziehung erwerben, aber erst, wenn sie genug kognitiven Ressourcen haben, die Struktur inkrementell verarbeiten können. Die Ergebnisse von Henry (2015) zeigen, dass Unterrichtsaufgaben, die sich auf die Verarbeitung einer linguistischen Struktur konzentrieren, positive Auswirkungen auf den Erwerb dieser Struktur haben und den Erwerb von Form-Bedeutungsbeziehungen unterstützen.Weiterhin zeigt diese Studie, dass sogenannte task-essential Aufgaben auch Auswirkungen auf psycholinguistische Verarbeitungsprozesse von L2-Lernern haben können. Zudem ist diese Studie auch ein Beispiel für einen Brückenschlag zwischen Forschung in der Psycholinguistik und dem L2-Erwerb, da sie eine psycholinguistisch motivierte Unterrichtsart mit traditionellen und psycholinguistischen Methoden untersuchte.
1.3 Processing Instruction und Genus Neben dem Kasuserwerb ist der Genuserwerb selbst für fortgeschrittene L2Sprecher oft problematisch (z. B. Hopp 2013; Franceschina 2001; Sabourin, Stowe & de Haan 2006). Ein Großteil der Kongruenzfehler zwischen Artikel, Adjektiv und
308
Carrie Jackson, Courtney Johnson Fowler, Bianca Gavin und Nick Henry
Nomen, die bei L2-Lernern des Deutschen oft vorkommen, haben ihre Ursache in der Unsicherheit über das Genus eines Substantivs (Ritterbusch, LaFond & Agustin 2006). Im Vergleich zu manch anderen Sprachen ist das deutsche Genussystem ein dreigliedriges System, und Nomen bieten wenige phonologische oder morphologische Hinweise auf ihr Genus. Forscher haben verschiedene didaktische Methoden im Unterricht und im Labor eingesetzt, um L2-Lerner beim Genuserwerb zu unterstützen (z. B. Arnon & Ramscar 2012; Chew 1989; Santos 2015; Strong 1976). Obwohl Genusinformationen allgegenwärtig im Input sind, haben L2-Lerner Probleme damit, das Genussystem zu erlernen. Wenn man dieses Problem aus Sicht der IP betrachtet, nämlich mit dem Prinzip des Vorrangs der Inhaltswörter von VanPatten (2004, 2012), wird klar, dass L2-Lerner die Genusinformationen im Satz, z. B. auf dem bestimmten Artikel oder bei den Adjektivendungen, oft gar nicht wahrnehmen. Der L2-Lerner liest einen Satz wie Hier ist der Hund und versteht nur einen Teil der Bedeutung des Artikels der (nämlich, dass der Artikel signalisiert, dass ein definites Nomen folgt), und nicht alle weiteren grammatischen Informationen (Hund ist maskulin). Weil diese Strategie in dem oben angegebenen Beispiel das richtige Verständnis des Satzes nicht verhindert, hat der L2-Lerner keinen Grund dafür, auf das Genus überhaupt zu achten, und er kann weiterhin die Strategie des Vorrangs der Inhaltswörter verwenden. Um den Genuserwerb zu stimulieren, wäre es sinnvoll, die Verarbeitung der Genusinformationen notwendig zu machen, um einen Satz zu verstehen. Dadurch wäre der L2-Lerner gezwungen, das Genus wahrzunehmen. PIMethoden bieten eine Möglichkeit, genau das zu erreichen. Bisher hat aber noch keine Studie erforscht, wie man den Genuserwerb mittels PI unterstützen kann. Johnson Fowler & Jackson (in Vorbereitung) versuchten in einer Studie mit L2Lernern im ersten Semester des DaF-Unterrichts, PI-Methoden anzuwenden, damit L2-Lerner darauf aufmerksam gemacht werden, dass das Genus ein wichtiger Teil der Sprache ist und es viele Vorteile im Sprachgebrauch bietet, wenn man es besser verstehen kann. Die Intervention dauerte eine Woche und in diesem Zeitraum lernten die Lerner von zwei DaF-Kursen 24 Substantive und deren Genus: der eine Kurs mittels traditioneller Output-orientierter Aufgaben (TA) und der zweite mittels Aufgaben, die den Prinzipen von PI folgten. Beide Gruppen erhielten am ersten Tag eine Liste von 24 Wörtern für Kleidungsstücke. Am selben Tag schrieben die L2-Lerner einen Prätest, um sicher zu stellen, dass sie die Zielwörter noch nicht kannten. In den nächsten drei Tagen machte die PI-Gruppe jeden Tag zwei PI-Aufgaben im Kurs. In der ersten Aufgabe gab es eine PowerPoint-Präsentation, bei der man sich vorstellen sollte, mit einer Freundin beim Einkaufen zu sein. Die L2-Lerner erhielten die folgende Beschreibung der Szene:
Zusammenhänge der Sprachverarbeitung und dem Erwerb neuer Strukturen
309
Sie sind mit einer Freundin in einem Kleidungsgeschäft in Wien, und es ist sehr laut. Ihre Freundin hat eine Liste der Kleidungsstücke, die sie kaufen möchte. Sie zeigt ständig auf verschiedene Sachen, wenn sie Sachen von ihrer Liste sieht, aber Sie hören immer nur den Anfang des Satzes. Versuchen Sie zu erraten, über welches Stück Ihre Freundin redet.
Die L2-Lerner sahen drei verschiedene Kleidungsstücke auf der Leinwand (zB: einen Schuh, ein Kleid und einen Pulli) und hörten gleichzeitig einen einfachen Satz (Ah hier ist der…). Hier mussten sie den bestimmten Artikel und dessen Genus benutzen, um die möglichen Kleidungsstücke zu identifizieren. In der zweiten Aufgabe sahen sie wieder eine PowerPoint-Präsentation, dieses Mal mit der folgenden Anleitung: Ihre Freundin hat nun alles von ihrer Liste gefunden. Nun gehen Sie zusammen durchs Geschäft und schauen andere Sachen an. Ihre Freundin zeigt immer wieder auf neue Sachen, die sie sieht. Worauf bezieht sich ihr Kommentar in den folgenden Beispielen?
Die L2-Lerner sahen wieder drei Kleidungsstücke auf der Leinwand (zB: eine Socke, ein Kleid und einen Hut) und hörten gleichzeitig einen einfachen Satz (Sie ist toll!). Hier mussten sie das Pronomen zur Inferenz des Referenten nutzen und die einzige richtige Antwort ankreuzen. Am vierten Tag, nachdem die L2-Lerner der PI-Gruppe die Präsentationen ein drittes Mal angesehen und die L2-Lerner der TA-Gruppe ihre dritte Aufgabe gemacht hatten, schrieben alle Studenten einen Posttest. Sie mussten für jedes der 24 Kleidungsstücke den bestimmten Artikel und das Nomen notieren. Nach zwei Wochen bearbeiteten sie auch noch einen abermaligen Posttest, worin sie wieder alle 24 Wörter mit deren Genus schreiben mussten. In der folgenden Tabelle sind die Ergebnisse der beiden Gruppen zu sehen. Tabelle 2: Prozent der richtig zugeordneten Genera der 24 Vokabelwörter per Gruppe (Mittelwerte und Standardabweichung).
PI TA
Prätest M
SD
Posttest M
SD
Abermaliger Posttest M SD
, % , %
, ,
, % , %
, ,
, % , %
, ,
Sowohl die PI- als auch die TA-Gruppen zeigten beim Posttest, dass sie sich verbesserten und das richtige Genus im Durchschnitt zu 57 % zuordnen konnten. Hierbei ist zu bedenken, dass die PI-Gruppe, im Gegensatz zu der TA-Gruppe, in allen PI-Aufgaben (vor dem Posttest) keine Produktionsaufgaben machten. Dass die PI- und TA-Gruppen bei der Produktionsaufgabe ein ähnliches Niveau er-
310
Carrie Jackson, Courtney Johnson Fowler, Bianca Gavin und Nick Henry
reichten, ist nicht ganz ungewöhnlich, da dies auch in anderen PI-Studien der Fall war (z. B. Henry 2015; VanPatten & Cadierno 1993). Bei dem abermaligen Posttest hatte die TA-Gruppe einen leichten Vorteil (52 % / 48 %), aber beide Gruppen konnten nach zwei Wochen noch ungefähr 50 % der Genusmarkierungen richtig zuordnen: Diese Ergebnisse belegen, dass die PI-Methode auch auf längere Zeit wirken kann (siehe auch VanPatten & Fernandez 2004). Die Ergebnisse zeigen zum ersten Mal, dass PI-Methoden auch für den Erwerb des deutschen Genussystems effektiv sein können. Diese Studie wirft aber auch viele Fragen auf, zum Beispiel, ob das Niveau der L2-Lerner für die Frage eine Rolle spielt. Genauer gefragt, sind PI-Methoden zum Erwerb des Genussystems am effektivsten, wenn man sie bei fortgeschritteneren Lernern oder gleich bei den absoluten Anfängern verwendet? Die L2-Lerner in dieser Studie lernten erst seit ungefähr zwei Monaten Deutsch an der Universität. Wären die PI-Methoden wirksamer, wenn sie später angewendet worden wären? Im Gegensatz zu den L2-Lernern in Henry (2015) hatten diese L2Lerner auch die Möglichkeit, selbst zu Hause die Vokabeln zu lernen und zu üben. Es wäre zu untersuchen, ob andere Ergebnisse zu verzeichnen wären, wenn die L2Lerner alle Aufgaben im Labor gemacht hätten, wo der Input genauer kontrolliert werden kann. Diese Fragen zeigen deutlich, dass diese Methoden noch weiter erforscht werden müssen. Die ersten Ergebnisse sind aber vielversprechend und deuten darauf hin, dass sich solche weiteren Untersuchungen zur Effektivität von strukturierten Inputaufgaben lohnen.
2 Die Beziehung von Priming und Lernen bei Fremdsprachenlernern Strukturelles Priming beschreibt das Phänomen, dass Sprecher eine bestimmte Satzstruktur in der Sprachproduktion wiederholen, die sie vor kurzem gehört oder gelesen haben. Wenn man zum Beispiel gerade einen Passivsatz gehört hat, wie Der Elefant wurde im Lastwagen transportiert, ist es wahrscheinlicher, dass man danach einen Passivsatz selbst produziert, d. h. zum Beispiel Das Buch wurde vom Mann geschrieben, statt eines Aktivsatzes, wie Der Mann hat das Buch geschrieben (Bock 1986; Bock et al. 2007). Über die Jahre haben viele Studien diesen Effekt in verschiedenen Sprachen gezeigt (für einen Überblick Pickering & Ferreira 2008). Priming ist auch unter L2-Lernern zu sehen. Bisher konzentriert sich die meiste Forschung im Bereich des L2-Primings auf cross-linguistisches oder zwischensprachliches Priming, in der ein Prime-Satz in einer Sprache präsentiert wird und der Ziel-Satz in der anderen Sprache geäußert werden soll. Hier wurde schon mehrmals gezeigt, dass Priming zwischen den zwei Sprachen eines L2-Sprechers
Zusammenhänge der Sprachverarbeitung und dem Erwerb neuer Strukturen
311
stattfinden kann, was zur Hypothese führt, dass zumindest bei fortgeschrittenen L2-Sprechern die syntaktische Strukturen der zwei Sprachen gemeinsam repräsentiert werden (Hartsuiker, Veltkamp & Pickering 2004; Hartsuiker & Bernolet 2017; für einen Überblick Hartsuiker & Pickering 2008). Auch wichtig für den L2Erwerb ist die Hypothese, dass Priming den Erwerb neuer Strukturen in der L2 fördern kann (für einen Überblick McDonough & Trofimovich 2009). Ursprünglich haben Forscher Bildbeschreibungen benutzt, um strukturelles Priming zu untersuchen (z. B. Bock 1986). In solchen Experimenten hören oder lesen Probanden einen Satz, der als Prime-Satz dient, und nebenbei müssen sie eine kleine Gedächtnisaufgabe durchführen oder eine Verständnisfrage beantworten, um ihre Aufmerksamkeit auf die gezielte Satzstruktur zu verringern. Anschließend beschreiben die Probanden ein Bild, das mit verschiedenen strukturellen Alternativen beschrieben werden kann (z. B. eine Aktiv- oder Passivkonstruktion). Dadurch wird gemessen, wie oft Probanden eine bestimmte syntaktische Konstruktion gebrauchen, um das Bild zu beschreiben, und inwiefern der Gebrauch einer bestimmten Konstruktion von der Struktur des vorherigen Prime-Satzes abhängig ist. In letzter Zeit wird auch die Confederate ScriptingTechnik eingesetzt, da sie die natürliche Interaktion zwischen Gesprächspartnern besser widerspiegelt (Branigan, Pickering & Cleland 2000). Hier nehmen ein Proband und ein sogenannter Komplize, der kein richtiger Proband ist, an einer Bildzuordnungsaufgabe teil, in der beide Probanden einander Bilder beschreiben. Während der Aufgabe dienen die Bildbeschreibungen des Komplizen als PrimeSätze für den echten Probanden. Mehrere Theorien wurden aufgestellt, um solche Primingeffekte zu erklären. Auf der einen Seite stehen lexikalische Erklärungen, nach denen strukturelles Priming durch die Restaktivierung abstrakter syntaktischer Knoten entsteht (Pickering & Branigan 1998). Knoten, die lexikalische Einheiten (z. B. Verben) abbilden, sind mit Knoten verbunden, die abbilden, wie solche lexikalischen Einheiten kombiniert werden können (z. B. [Nominalphrase + Nominalphrase] für Dativkonstruktionen, wie in Der Mann gibt der Frau eine Blume). Während der Sprachproduktion wird der Knoten für das jeweilige Verb (z. B. geben), der Knoten der entsprechenden grammatischen Regel (z. B. Nominalphrase + Nominalphrase), und die Verbindung zwischen diesen beiden Knoten aktiviert. Die Aktivierung dieser Knoten und Verbindungen bleibt noch einige Sekunden nach der Produktion eines Satzes aktiv, und diese Restaktivierung führt zur Verwendung der gleichen syntaktischen Struktur über mehrere Sätze. Diese Erklärung kann kurzzeitiges Priming und vor allem den sogenannten lexikalischen Verstärkungseffekt (der sogenannte lexical boost), wobei kurzfristiges Priming verstärkt wird, wenn sich Wörter im Prime-Satz und Zielsatz überschneiden, gut erklären. Allerdings vermögen Erklärungen, die auf Restaktivierungen basieren, kaum
312
Carrie Jackson, Courtney Johnson Fowler, Bianca Gavin und Nick Henry
Langzeiteffekte zu beschreiben, zum Beispiel, dass strukturelles Priming noch stattfinden kann, wenn mehrere Sätze zwischen dem Prime-Satz und dem Zielsatz stehen (Bock & Griffin 2000) oder es sich über mehrere Testsitzungen, die um mehr als eine Woche getrennt sind, erstreckt (Kaschak, Kutta & Coyle 2014). Verschiedene Studien zeigen, dass solche Langzeiteffekte durch Priming unter Kindern, Erwachsenen und L2-Lernern zu finden sind (z. B. Kaschak, Kutta & Coyle 2014; Kidd 2012a, 2012b; McDonough & Mackey 2006, 2008; Nitschke, Kidd & Serratrice 2011; Serratrice, Hesketh & Ashworth 2015; Shin & Christianson 2012; Vasilyeva, Huttenlocher & Waterfall 2006). Da Priming längerfristige Auswirkungen auf die Wahl einer bestimmten Satzstruktur in der Sprachproduktion haben kann, stellten einige Forscher die Hypothese auf, dass Langzeiteffekte durch Priming am besten als implizites Lernen beschrieben werden sollten (z. B. Bock & Griffin 2000; Chang, Dell & Bock 2006; Dell & Chang 2014; Jaeger & Snider 2013). Dell & Chang (2014) machen diese Verbindung zwischen Priming und Lernen explizit, wenn sie Priming als Lernen aus Fehlern schildern. Wenn man zum Beispiel während des Sprachverstehens einen Aktivsatz erwartet und stattdessen einen Passivsatz hört, steigt die Erwartung in darauffolgenden Äußerungen einen Passivsatz zu hören. Solche angepassten Erwartungen erleichtern das Verständnis von Passivkonstruktionen im darauffolgenden Input und erhöhen die Chancen, dass man eine Passivkonstruktion in seiner eigenen Produktion verwendet. Mit der Zeit führen solche Anpassungen zu kumulativen Änderungen im Sprachsystem, d. h. es findet Lernen statt. Implizites Lernen durch Priming ist besonders wichtig für die Forschung im Bereich des L2-Erwerbs, da es einen möglichen Mechanismus darstellt, wodurch L2-Lerner syntaktische Strukturen in der L2 erwerben bzw. ihr Verständnis solcher Strukturen vertiefen können (McDonough & Trofimovich 2009; Shin & Christianson 2012). Allerdings ist es noch umstritten, ob strukturelles Priming überhaupt stattfinden kann, wenn nicht bereits ausreichende Repräsentationen der Zielstrukturen vorhanden sind (z. B. Arai & Mazuka 2014; McDonough & Fulga 2015; McDonough 2006; McDonough & Trofimovich 2015). Zum Beispiel zeigten McDonough & Fulga (2015), dass nur L2-Lerner, die die Zielstruktur im Input erkennen konnten – gemessen in einer rezeptiven Verständnisaufgabe –signifikantes Priming dieser Struktur in ihrer eigenen Produktion aufwiesen (siehe auch McDonough 2006). Auch ist es für das Ausmaß und die Dauer von Primingeffekten in der L2 wichtig, ob Priming ohne lexikalische Verstärkung stattfindet. Da Priming auf der Basis von lexikalischen Wiederholungen zwischen einem Prime-Satz und Zielsatz nur von kurzer Dauer ist, behaupten einige Forscher, dass Priming nur dann zum Erlernen einer L2-Struktur führt, wenn der Lerner signifikantes Priming auch in Abwesenheit solcher lexikalischen Überlappung zeigt (Hartsuiker & Bernolet 2017; Kim & McDonough 2008; McDonough & Mackey 2006; siehe auch
Zusammenhänge der Sprachverarbeitung und dem Erwerb neuer Strukturen
313
Bernolet, Collina & Hartsuiker 2016, für eine parallele Diskussion in Bezug auf Langzeiteffekte durch Priming unter Muttersprachlern). Auch ist es von Interesse für das Priming in der L2, ob die Häufigkeit verschiedener Strukturen in der L1 des Lerners eine Rolle spielt. Diese Frage ist besonders wichtig für Modelle des L2-Erwerbs, in denen L1-Repräsentationen einen wesentlichen Einfluss auf den Erwerb und die Anwendung von L2-Strukturen haben (z. B. MacWhinney 2012). Hier zeigt die bisherige Forschung, dass zumindest unter fortgeschrittenen Lernern die Existenz einer bestimmten Struktur in der L1 wenig Auswirkungen auf das Ausmaß des Primings in der L2 hat (Flett, Branigan & Pickering 2013; Shin & Christianson 2012). Auf der anderen Seite behaupten Hartsuiker & Bernolet (2017), dass L2-Anfänger auf syntaktische Repräsentationen in der L1 zurückgreifen, wenn ihre Kenntnis einer gezielten L2Struktur noch nicht vorhanden ist.Wie später genauer erklärt wird, bleiben Fragen zur Wechselwirkung zwischen dem Sprachfertigkeitsniveau der Lerner und dem relativen Einfluss der L1 in Bezug auf Priming und das L2-Lernen durch Priming noch offen.
Wortstellung und V2 im Deutschen Im Deutschen können temporale oder lokative Adverbialphrasen an verschiedenen Positionen im Satz stehen. Sätze (2a) und (2b) sind Beispiele für die Realisierung temporaler Adverbialphrasen und Sätze (3a) und (3b) zeigen lokative Adverbialphrasen. (2) a. b. (3) a. b.
Paul trägt im Winter eine Jacke. (SVX) Im Winter trägt Paul eine Jacke. (XVS) Opa trinkt heiße Schokolade auf dem Berg. (SVX) Auf dem Berg trinkt Opa heiße Schokolade. (XVS)
In deutschen Hauptsätzen steht das Verb an zweiter Position, unabhängig davon, ob der Satz mit einem Subjekt oder einem anderen Satzteil beginnt. Diese Eigenschaft unterscheidet das Deutsche von anderen Sprachen, wie zum Beispiel Englisch. Im Englischen ist es zwar auch möglich, einen Satz mit temporalen oder lokativen Adverbialphrasen zu beginnen, allerdings ist dies eher selten der Fall (z. B. Doherty 2005). Pienemann (1998) zeigte, dass englischsprachige Lerner zu Beginn des Deutschlernens entweder eine Subjekt-Verb-Objekt Satzstruktur benutzten oder ungrammatische Sätze dadurch bildeten, dass sie das Subjekt vor das Verb stellten, wenn sie einen Satz mit einer Adverbialphrase bildeten (XSVO). Im Deutscherwerb müssen daher englischsprachige Lerner des Deutschen nicht nur
314
Carrie Jackson, Courtney Johnson Fowler, Bianca Gavin und Nick Henry
darauf achten, mehr XVS Sätze mit Adverbialphrasen am Satzanfang zu bilden, sondern auch darauf, das Verb in einem Hauptsatz immer an die zweite Position zu stellen. Ruf (2011) untersuchte, ob strukturelles Priming während einer Confederate Scripting-Aufgabe englischsprachige Lerner des Deutschen dazu bringen kann, Sätze mit satzinitialen Lokativadverbialphrasen zu bilden. Satz (4) ist ein Beispiel für einen lokativen Satz aus der Studie von Ruf. (4) Auf dem Tisch steht eine Lampe. An dieser Studie nahmen drei Gruppen teil: deutsche Muttersprachler, englischsprachige Lerner von fortgeschrittener Sprachkompetenz, sowie englischsprachige Lerner mit weniger fortgeschrittenem Deutsch. Die Probanden sprachen während eines individuellen Treffens mit einem Komplizen und hatten die Aufgabe, Bilder zu beschreiben. Die Bildbeschreibung des Komplizen diente als strukturelles Priming für die Probanden. Die Ergebnisse zeigten, dass sowohl die deutschen Muttersprachler als auch die L2-Lerner mehr adverbialinitiale Sätze bildeten, wenn sie vorher einen solchen Satz von dem Komplizen gehört hatten. Allerdings bildeten die weniger fortgeschrittenen Probanden diese Sätze nur dann, wenn die lokative Adverbialphrase im Prime-Satz und im Zielsatz identisch waren (d. h. bei lexikalischer Verstärkung). Zusätzlich bildeten die deutschen Muttersprachler sowie die fortgeschrittenen L2-Lerner lokative Sätze mit der Adverbialphrase an erster Stelle auch in einer darauffolgenden Phase des Experiments, in der keine lokativen Prime-Sätze zu hören waren. Demgegenüber zeigten die weniger fortgeschrittenen Lerner keine solchen Langzeiteffekte. Diese Ergebnisse deuten auf ein Potential für Langzeiteffekte durch Priming hin, allerdings nur bei Lernern, die schon ein gewisses Sprachniveau erreicht haben (siehe auch McDonough 2006; McDonough & Fulda 2015). Diese Ergebnisse motivierten Jackson & Ruf (2017) dazu, eine weitere Studie mit englischsprachigen Lernern des Deutschen auf Anfängerniveau (im dritten oder vierten Semester des Sprachunterrichts) durchzuführen. Für diese Studie benutzten Jackson & Ruf nicht nur lokative Adverbialphrasen (LA), sondern auch temporale Adverbialphrasen (TA),wie in den Sätzen (2) und (3). Die Studie bestand aus zwei Experimenten. Im ersten Experiment hörten die Probanden zuerst temporale oder andere Satzkonstruktionen und mussten daraufhin ein Bild beschreiben. Wie in Ruf (2011) gab es am Ende des Experiments auch eine zweite Phase, in der Probanden Bilder ohne vorigen Prime-Satz beschreiben mussten. Die Ergebnisse zeigten, dass Probanden mehr Sätze mit temporalen Adverbialphrasen an erster Stelle produzierten, wenn der Prime-Satz auch eine solche temporale Adverbialphrase am Satzanfang enthielt, unabhängig davon, ob sich die tempo-
Zusammenhänge der Sprachverarbeitung und dem Erwerb neuer Strukturen
315
ralen Adverbialphrasen im Prime-Satz und Zielsatz lexikalisch überschnitten oder nicht. Hinzu kam, dass die Probanden in der zweiten Phase mehr Sätze mit temporalen Adverbialphrasen an erster Stelle produzierten als am Anfang des Experiments. Diese Ergebnisse stehen im Gegensatz zu der Studie von Ruf (2011), in der es keine signifikanten Ergebnisse mit LA-Prime-Sätzen und auch keine Langzeiteffekte für LA-Sätze mit solchen weniger fortgeschrittenen Lernern gab. Um auszuschließen, dass der Unterschied in den Ergebnissen der beiden Studien an Unterschieden in der Methode und der Satzkonstruktionen lag, wurde in Jackson & Ruf (2017) ein zweites Experiment entwickelt. Der Aufbau des zweiten Experiments glich dem des ersten, allerdings enthielten die Sätze lokative (LA) statt temporale Adverbialphrasen. Die Ergebnisse zeigten signifikante Primingeffekte für LA-Sätze, sogar wenn sich keine Wörter zwischen dem Prime-Satz und dem Zielsatz überschnitten, aber nur, wenn der Proband direkt vorher einen LAPrime-Satz gehört hatte. Der Langzeiteffekt, gemessen durch die Produktion von Sätzen in der zweiten Phase des Experiments, die keine Primesätze enthielt, war minimal. Ein Vergleich mit den Ergebnissen des ersten Experimentes zeigte, dass Probanden des ersten Experimentes mit TA-Sätzen im Allgemeinen mehr Sätze bildeten, in denen die Adverbialphrase an erster Stelle standen, als Probanden des zweiten Experimentes. Zusammenfassend kann gesagt werden, dass das Fehlen von Langzeiteffekten von LA-Sätzen gegenüber den Langzeiteffekten mit TA-Sätzen darauf hinweist, dass L2-Lerner des Deutschen schon am Anfang ihres Sprachstudiums eine strukturelle Repräsentation von Adverbial-Verb-Subjekt (XVS) Satzkonstruktionen im Deutschen besitzen. Allerdings sind solche Repräsentationen noch konstruktionsspezifisch, und Anfänger scheinen nicht unbedingt in der Lage zu sein, eine Verbindung zwischen Satzkonstruktionen von TAs und LAs herzustellen. Jackson & Ruf argumentieren, dass diese unterschiedlichen längerfristigen Primingeffekte im L2 Deutschen an Präferenzen im L1 Englischem liegen, da im Englischen temporale häufiger als lokative Adverbialphrasen am Satzanfang stehen (Jackson 2012). Diese Tendenz zur XVS-Wortstellung mit temporalen Adverbialphrasen wird durch Lehrbücher verstärkt, da diese oft XVSWortstellung nur anhand von Beispielsätzen mit temporalen Adverbialphrasen einführen. Aus diesen Gründen ziehen Jackson & Ruf den Schluss, dass in früheren Phasen des L2-Erwerbs die Häufigkeit einer bestimmten Konstruktion in der L1, zusammen mit dem Input aus Lehrbüchern, das Ausmaß und die Dauer von Primingeffekten in der L2 beeinflusst, was nicht zuletzt auch Auswirkungen auf den Verlauf des Erwerbs der XVS-Wortstellung im Deutschen haben kann. Weitere Priming-Studien, die sowohl Kurzzeit- als auch Langzeiteffekte untersuchen, sind somit notwendig, um ein besseres Verständnis davon zu erhalten, wie Priming und Lernen interagieren. Hinzu kommt die Notwendigkeit für mehr Forschung mit unterschiedlichen Erwerbsstufen, damit die Wechselwirkung
316
Carrie Jackson, Courtney Johnson Fowler, Bianca Gavin und Nick Henry
zwischen L1- und L2-Strukturen und deren Einfluss auf Priming und das durch Priming entstehende Lernen besser verstanden werden kann. Auch fehlen Untersuchungen zum Priming innerhalb erweiterter Diskurskontexte (aber siehe z. B. McDonough & Chaikitmongol 2010; Serratrice, Hesketh & Ashworth 2015; Vasilyeva, Huttenlocher & Waterfall 2006). Einige aktuelle L1- und L2- Priming-Studien zeigen, dass Primingeffekte durch konzeptuelle Informationen und Informationsstruktur moduliert werden können (z. B. Bernolet, Hartsuiker & Pickering 2009; Bunger, Papafragou & Trueswell 2013; Gerwien & Flecken 2015; Griffin & Weinstein-Tull 2003; Vernice, Pickering & Hartsuiker 2012). Zum Beispiel zeigten Vernice, Hartsuiker & Pickering (2012) in einer Studie mit niederländischen Muttersprachlern, dass Sprecher häufiger Passivsätze äußerten, um den Fokus auf das Patiens im Satz zu legen, nachdem sie Objekt-Spaltsätze gehört hatten, in denen das Patiens auch im Fokus stand, obwohl die syntaktischen Strukturen in Passiv- und Spaltsätzen nicht gleich sind. Solche Studien weisen auf die enge Beziehung zwischen der Informationsstruktur, der Bedeutung eines Satzes im Zusammenhang des größeren Diskurses, und der Auswahl verschiedener syntaktischer Möglichkeiten in der Sprachproduktion hin. Angesichts solcher Ergebnisse haben einige Forscher mehr Forschung gefordert, die die Kurz- und Langzeiteffekte von Priming untersucht, wenn Priming-Aufgaben in sinnvollen Diskurskontexten eingebettet sind (Kidd 2012b; Serrratrice, Hesketh & Ashworth 2015; McDonough 2015). Da das Ziel des L2-Erwerbs nicht nur darin liegt, eine bestimmte Struktur zu erwerben, sondern diese Struktur in einer kontextadäquaten Weise zu verstehen und zu verwenden, hat die Forschung zu Priming in Diskurskontexten auch wichtige potentielle Implikationen für den Fremdsprachenunterricht und Theorien des L2-Erwerbs.
3 Zusammenfassung und Ausblick Die Ergebnisse der Studien in diesem Kapitel zeigen, wie die Anwendung psycholinguistischer Modelle und Methoden Konsequenzen für die Fremdsprachendidaktik und die Unterrichtsgestaltung in frühen Phasen des Fremdsprachenunterrichts bei erwachsenen Lernern aufzeigen kann. Die PI-Studien zum Erwerb des deutschen Kasussystems weisen darauf hin, dass L2-Lerner oft lexikalische Informationen bevorzugen und wichtige morphosyntaktische Merkmale vernachlässigen, wenn sie den L2-Input verarbeiten. Deswegen reicht es im Fremdsprachenunterricht nicht, sich auf das Lernen neuer grammatischer Strukturen selbst zu beschränken, sondern es müssen auch die Verarbeitungsstrategien Berücksichtigung finden, die die Lerner anwenden, um den L2-Input zu verstehen, da eine enge Beziehung zwischen Verarbeitungsstrategien und dem
Zusammenhänge der Sprachverarbeitung und dem Erwerb neuer Strukturen
317
Erwerb neuer Strukturen in der L2 besteht. Aufgaben zu strukturiertem Input und andere Aufgaben, die L2-Lerner dazu zwingen, morphosyntaktische Informationen zu verarbeiten, um den Input zu verstehen, bieten eine Möglichkeit, die Anwendung effizienter Verarbeitungsstrategien und dadurch das Erlernen neuer grammatischen Strukturen zu fördern. Anhand der L2-Priming-Studien mit XVS-Wortstellung im Deutschen wurde auch gezeigt, dass die Frequenz einer bestimmten Konstruktion in der L1 und auch deren Häufigkeit im L2-Input einen Einfluss auf den Erwerb neuer Strukturen und deren Anwendung in der L2-Sprachproduktion hat. Zusammen betonen diese PIund Priming-Studien die zentrale Rolle, die L2-Input und die Strukturierung dieses Inputs für den erfolgreichen Erwerb neuer grammatischer Strukturen spielen. Im nächsten Schritt müssen mehr cross-linguistische Vergleiche unternommen werden. Obwohl Forschung im Bereich der Processability Theorie sich schon länger mit cross-linguistischen Vergleichen beschäftigt (z. B. Pienemann 2005), untersuchen die meisten bisherigen Studien den Lernprozess englischsprachiger Lerner und den Erwerb grammatischer Strukturen des Deutschen, nämlich Kasusund Genusmarkierung und XVS-Wortstellung, die für diese Lernergruppe besonders schwierig sind. Um ein präziseres Verständnis der Verarbeitungsstrategien von weniger fortgeschrittenen Lernern und deren Einfluss auf den Verlauf des L2Erwerbs zu gewinnen, muss noch festgestellt werden, inwiefern diese Schwierigkeiten an das Fehlen oder die Seltenheit äquivalenter Strukturen in der L1 gebunden sind, oder ob sie universale Tendenzen bei weniger fortgeschrittenen Lernern darstellen, die unabhängig von der L1 sind. Hieraus können dann Empfehlungen für die didaktische Praxis abgeleitet werden. Eine weitere wichtige Frage für zukünftige Forschung betrifft die Art und Weise, wie L2-Lerner mit dem L2-Input interagieren. Nach dem Input Processing Ansatz von VanPatten (2004, 2012) sollten Input-orientierte Aufgaben im Anfängerunterricht bevorzugt werden, die das rezeptive Verstehen neuer Strukturen fördern, da L2-Lerner in der Anfangsphase des L2-Erwerbs nicht genug kognitive Ressourcen besitzen, um neue L2-Strukturen produktiv anzuwenden. Andererseits stellen andere Forscher die Hypothese auf, dass Output-orientierte Aufgaben, in denen L2-Lerner neue Strukturen produktiv verwenden müssen, notwendig sind, da nur durch solche produktiven Übungen neue Strukturen erworben werden können (z. B. Mackey, Abbuhl & Gass 2012; Swain 1985; für einen Überblick Shintani, Li & Ellis 2013). Dieser Kontrast ist besonders interessant im Hinblick auf Priming-Studien mit jungen Kindern und weniger fortgeschrittenen Fremdsprachenlernern, die größere Kurzzeit- und Langzeitprimingeffekte zeigen, wenn sie den Prime-Satz laut wiederholen müssen (sogenanntes Produktion-zu-Produktion Priming), statt den Prime-Satz nur rezeptiv hören und verstehen müssen (sogenanntes Verständnis-zu-Produktion Priming). Es wird angenommen, dass die
318
Carrie Jackson, Courtney Johnson Fowler, Bianca Gavin und Nick Henry
Wiederholung des Prime-Satzes als zusätzliche Erfahrung und Übung für die Zielstruktur dient (Gámez & Shimpi 2016; Shimpi et al. 2007; siehe auch Jackson et al. 2015). Schließlich heben die hier besprochenen Studien hervor, wie psycholinguistische und didaktische Ansätze einander im Bereich der Forschung über den L2Erwerb bereichern können. Durch die Anwendung von Forschungsmethoden aus dem Bereich der Psycholinguistik kann man einen wertvollen Einblick in den Lernprozess bei Anfängern und weniger fortgeschrittenen L2-Lernern gewinnen. Gleichzeitig schafft solche Forschung die Grundlage dafür, Unterrichtsmethoden z. B. in DaF-Kursen zu verbessern. Auf diese Art und Weise ist solch interdisziplinäre Forschung in der Lage, zentrale und offene Fragen in beiden Forschungsfeldern anzusprechen und dadurch unser Verständnis der kognitiven und sprachlichen Mechanismen zu vertiefen, die der L2-Verarbeitung und dem L2Erwerb zugrunde liegen.
Literaturangaben Arai, Manabu & Reiko Mazuka (2014): The development of Japanese passive syntax as indexed by structural priming in comprehension. Quarterly Journal of Experimental Psychology 67 (1), 60 – 78. Arnon, Inbal, & Michael Ramscar (2012): Granularity and the acquisition of grammatical gender: How order-of-acquisition affects what gets learned. Cognition 122 (3), 292 – 305. Baten, Kristof (2011): Processability theory and German case acquisition. Language Learning 61 (2), 455 – 505. Benati, Alessandro (2001): A comparative study of the effects of processing instruction and output-based instruction on the acquisition of the Italian future tense. Language Teaching Research 5 (2), 95 – 127. Benati, Alessandro (2005): The effects of processing instruction, traditional instruction and meaning-output instruction on the acquisition of the English past simple tense. Language Teaching Research 9 (1), 67 – 93. Bernolet, Sarah, Simona Collina & Robert J. Hartsuiker (2016): The persistence of structural priming revisited. Journal of Memory and Language 91, 99 – 116. Bernolet, Sarah, Robert J. Hartsuiker & Martin J. Pickering (2009): Persistence of emphasis in language processing: A cross-linguistic approach. Cognition 112 (2), 300 – 317. Bock, J. Kathryn (1986): Syntactic persistence in language production. Cognitive Psychology 18 (3), 355 – 387. Bock, Kathryn, Gary S. Dell, Franklin Chang & Kristine H. Onishi (2007): Persistent structural priming from language comprehension to language production. Cognition 104 (3), 437 – 458. Bock, Kathryn & Zenzi M. Griffin (2000): The persistence of structural priming: transient activation or implicit learning? Journal of Experimental Psychology: General 129 (2), 177 – 192.
Zusammenhänge der Sprachverarbeitung und dem Erwerb neuer Strukturen
319
Branigan, Holly P., Martin J. Pickering & Alexandra A. Cleland (2000): Syntactic co-ordination in dialogue. Cognition 75 (2), B13–B25. Bunger, Ann, Anna Papafragou & John C. Trueswell (2013): Event structure influences language production: Evidence from structural priming in motion event description. Journal of Memory and Language 69 (3), 299 – 323. Cadierno, Teresa (1995): Formal instruction from a processing perspective: An investigation into the Spanish past tense. The Modern Language Journal 79 (2), 179 – 193. Chang, Franklin, Gary S. Dell & Kathryn Bock (2006): Becoming syntactic. Psychological Review 113 (2), 234 – 272. Chew, Jane S. (1989): Learning German nouns: Bridging the gender gap. Unterrichtspraxis 22 (1), 52 – 54. Dekydtspotter, Laurent & Claire Renaud (2014): On second language processing and grammatical development. Linguistic Approaches to Bilingualism 4 (2), 131 – 165. Dell, Gary S. & Franklin Chang (2014): The P-chain: relating sentence production and its disorders to comprehension and acquisition. Philosophical Transactions of the Royal Society of London. Series B, Biological Sciences 369 (1634), 20120394. Doherty, Monika (2005). Topic-worthiness in German and English. Linguistics 43 (1), 181 – 206. Doughty, Catherine & Jessica Williams (Hrsg.) (1998): Focus on Form in Classroom Second Language Acquisition. Cambridge: Cambridge University Press. Fernández, Claudia (2008): Reexamining the role of explicit information in processing instruction. Studies in Second Language Acquisition 30 (3), 1 – 51. Flett, Susanna, Holly P. Branigan & Martin J. Pickering (2013): Are non-native structural preferences affected by native language preferences? Bilingualism: Language and Cognition 16 (4), 751 – 760. Franceschina, Florencia (2001): Morphological or syntactic deficits in near-native speakers? An assessment of some current proposals. Second Language Research 17 (3), 213 – 247. Gámez, Perla B. & Priya M. Shimpi (2016): Structural priming in Spanish as evidence of implicit learning. Journal of Child Language 43 (1), 207 – 233. Gerwien, Johannes & Monique Flecken (2015): There is no prime for time: The missing link between form and concept of progressive aspect in L2 production. International Journal of Bilingual Education and Bilingualism 18 (5), 561 – 587. Gries, Stefan Th. (2005): Syntactic priming: A corpus-based approach. Journal of Psycholinguistic Research 34 (4), 365 – 399. Griffin, Zenzi M. & Justin Weinstein-Tull (2003): Conceptual structure modulates structural priming in the production of complex sentences. Journal of Memory and Language 49 (4), 537 – 555. Håkansson, Gisela, Manfred Pienemann & Susan Sayehli (2002): Transfer and typological proximity in the context of second language processing. Second Language Research 18 (3), 250 – 273. Hartsuiker, Robert J. & Sarah Bernolet (2017): The development of shared syntax in second language learning. Bilingualism: Language and Cognition 20 (2), 219 – 234. Hartsuiker, Robert J. & Martin J. Pickering (2008): Language integration in bilingual speech production. Acta Psychologica 128 (3), 479 – 489. Hartsuiker, Robert J., Martin J. Pickering & Eline Veltkamp (2004): Is syntax separate or shared between languages? Cross-linguistic syntactic priming in Spanish-English bilinguals. Psychological Science 15 (6), 409 – 414.
320
Carrie Jackson, Courtney Johnson Fowler, Bianca Gavin und Nick Henry
Hemforth, Barbara, Lars Konieczny & Gerhard Strube (1993): Incremental syntax processing and parsing strategies. Proceedings of the Fifteenth Annual Conference of the Cognitive Science Society, 539 – 545. Hillsdale, NJ.: Erlbaum. Henry, Nick (2015): Morphosyntactic Processing, Cue Interaction, and the Effects of Instruction: An Investigation of Processing Instruction and the Acquisition of Case Markings in L2 German. Ph.D. Dissertation. The Pennsylvania State University. Henry, Nicholas, Bill VanPatten & Hillah Culman (2009): More on the effects of explicit information in instructed SLA. Studies in Second Language Acquisition 31 (4), 559 – 575. Hopp, Holger (2006): Syntactic features and reanalysis in near-native processing. Second Language Research 22 (3), 369 – 397. Hopp, Holger (2010): Ultimate attainment in L2 inflection: Performance similarities between non-native and native speakers. Lingua 120 (4), 901 – 931. Hopp, Holger (2013): Grammatical gender in adult L2 acquisition: Relations between lexical and syntactic variability. Second Language Research 29 (1), 33 – 56. Jackson, Carrie N. (2007): The use and non-use of semantic information, word order, and case markings during comprehension by L2 learners of German. The Modern Language Journal 91 (3), 418 – 432. Jackson, Carrie N. (2012). The clause-initial position in oral production among English-German L2 learners. Vortrag am 18th Germanic Linguistics Annual Conference, Bloomington, IN. Jackson, Carrie N. & Helena T. Ruf (2017): A role for L1 preferences in L2 priming: Priming word order in second language German. Applied Psycholinguistics 38 (2), 315 – 345. Jackson. Carrie N., Helena T. Ruf, Marta Millar & Theodore Smith (2015): When production matters: task-based differences in priming among less-proficient L2 learners. Vortrag am the Second Language Research Forum (SLRF), Atlanta, GA. Jaeger, T. Florian & Neal E. Snider (2013): Alignment as a consequence of expectation adaptation: Syntactic priming is affected by the prime’s prediction error given both prior and recent experience. Cognition 127(1), 57 – 83. Jansen, Louise (2008): Acquisition of German word order in tutored learners: A cross-sectional study in a wider theoretical context. Language Learning 58 (1), 185 – 231. Johnson Fowler, Courtney & Carrie N. Jackson (in Vorbereitung): Learning grammatical gender through processing instruction methods: Making L2 learners aware of gender’s role in the language. Juffs, Alan & Guillermo A. Rodríguez (2014): Second Language Sentence Processing. New York: Routledge. Kaschak, Michael P., Timothy J. Kutta & Jacqueline M. Coyle (2014): Long and short term cumulative priming effects. Language and Cognitive Processes 29 (6), 728 – 743. Kempe, Vera & Brian MacWhinney (1998): The acquisition of case marking by adult learners of Russian and German. Studies in Second Language Acquisition 20 (4), 543 – 587. Kempen, Gerard & Edward Hoenkamp (1987): An incremental procedural grammar for sentence formulation. Cognitive Science 11 (2), 201 – 258. Keßler, Jörg-U, Matias Liebner & Fethi Mansouri (2011): Teaching. In Manfred Pienemann & Jörg-U Keßler (Hrsg.), Studying Processability Theory: An Introductory Textbook, 149 – 156. Amsterdam: John Benjamins. Kidd, Evan (2012a). Implicit statistical learning is directly associated with the acquisition of syntax. Developmental Psychology 48 (1), 171 – 184.
Zusammenhänge der Sprachverarbeitung und dem Erwerb neuer Strukturen
321
Kidd, Evan (2012b). Individual differences in syntactic priming in language acquisition. Applied Psycholinguistics 33 (2), 393 – 418. Kim, Youjin & Kim McDonough (2008): Learners’ productions of passives during syntactic priming activities. Applied Linguistics 29 (1), 149 – 154. Levelt, Willem J. M. (1989): Speaking: From Intention to Articulation. Cambridge, MA: MIT Press. LoCoco, Veronica (1987): Learner comprehension of oral and written sentences in German and Spanish: The importance of word order. In Bill VanPatten, Trisha R. Dvorak & James F. Lee (Hrsg.), Foreign Language Learning: A Research Perspective, 119 – 129. Rowley, MA: Newbury House. Long, Michael H. (1991): Focus on form: A design feature in language teaching methodology. In Kees de Bot, Ralph B. Ginsberg & Claire Kramsch (Hrsg.), Foreign Language Research in Cross-Cultural Perspective, 39 – 52. Amsterdam: John Benjamins. Mackey, Alison, Rebekha Abbuhl & Susan M. Gass (2012): Interactionist approach. In Susan M. Gass & Alison Mackey (Hrsg.), The Routledge Handbook of Second Language Acquisition, 7 – 23. London: Routledge. Mackey, Alison & Emma Marsden (Hrsg.) (2015): Advancing Methodology and Practice: The IRIS Repository of Instruments for Research into Second Languages. New York: Routledge. MacWhinney, Brian (2012): The logic of the unified model. In Susan M. Gass & Alison Mackey (Hrsg.), The Routledge Handbook of Second Language Acquisition, 211 – 227. London: Routledge. McDonough, Kim (2006): Interaction and syntactic priming: English L2 speakers’ production of dative constructions. Studies in Second Language Acquisition 28 (2), 179 – 207. McDonough, Kim (2015): Application x2: researching structural priming in laboratories and classrooms. Plenarvortrag Second Language Research Forum (SLRF), Atlanta, GA. McDonough, Kim & Wanpen Chaikitmongkol (2010).Collaborative syntactic priming activities and EFL learners’ production of wh-questions. The Canadian Modern Language Review 66 (6), 817 – 842. McDonough, Kim & Angelica Fulga (2015): The detection and primed production of novel constructions. Language Learning 65 (2), 326 – 357. McDonough, Kim & Alison Mackey (2006): Responses to recasts: Repetitions, primed production, and linguistic development. Language Learning 56 (4), 693 – 720. McDonough, Kim & Alison Mackey (2008): Syntactic priming and ESL question development. Studies in Second Language Acquisition 30 (1), 31 – 47. McDonough, Kim & Pavel Trofimovich (2009): Using Priming Methods in Second Language Research. New York: Routledge. McDonough, Kim & Pavel Trofimovich (2015): Structural priming and the acquisition of novel form-meaning mappings. In Teresa Cadierno & Søren W. Eskildson (Hrsg.), Usage Based Perspectives on Second-Language Learning, 105 – 124. Berlin: de Gruyter. Morgan-Short, Kara, Mandy Faretta-Stutenberg & Laura Bartlett-Hsu (2015): Contributions of event-related potential research to issues in explicit and implicit second language acquisition. In Patrick Rebuschat (Hrsg.), Implicit and Explicit Learning of Languages, 349 – 384. Amsterdam: John Benjamins. Nitschke, Sanjo, Evan Kidd & Ludovica Serratice (2011): First language transfer and long-term structural priming in comprehension. Language and Cognitive Processes 25 (1), 94 – 114.
322
Carrie Jackson, Courtney Johnson Fowler, Bianca Gavin und Nick Henry
Pickering, Martin J., & Holly P. Branigan (1998): The representation of verbs: Evidence from syntactic priming in language production. Journal of Memory and Language 39 (4), 633 – 651. Pickering, Martin J. & Victor S. Ferreira (2008): Structural priming: A critical review. Psychological Bulletin 134 (3), 427 – 459. Pienemann, Manfred (1998): Language Processing and Second Language Development: Processability Theory. Amsterdam: John Benjamins. Pienemann, Manfred (Hrsg.) (2005): Cross-Linguistic Aspects of Processability Theory. Amsterdam: John Benjamins. Ritterbusch, Rachel, Larry LaFond & Marcus Agustin (2006): Learner difficulties with German case: Implications from an action research study. Die Unterrichtspraxis 39 (1 – 2), 30 – 45. Roberts, Leah (2015): Self-paced reading and L2 grammatical processing. In Alison Mackey & Emma Marsden (Hrsg.), Advancing Methodology and Practice: The IRIS Repository of Instruments for Research into Second Languages, 58 – 72. New York: Routledge. Ruf, Helena T. (2011). An Investigation of Syntactic Priming among German Speakers at Varying Proficiency Levels. Ph.D. Dissertation. University of Wisconsin-Madison. Sabourin, Laura, Laurie A. Stowe & Ger J. de Haan (2006): Transfer effects in learning a second language grammatical gender system. Second Language Research 22 (1), 1 – 29. Santos, Victor Dias de Oliveira (2015): Can colors, voices, and images help learners acquire the grammatical gender of German nouns? Language Teaching Research 19 (4), 473 – 498. Sanz, Cristina & Kara Morgan-Short (2005): Explicitness in pedagogical interventions: Input, practice and feedback. In Cristina Sanz (Hrsg.), Mind and Context in Adult Second Language Acquisition: Methods, Theory and Practice, 234 – 263. Washington DC: Georgetown University Press. Schlesewsky, Matthias, Gisbert Fanselow, Reinhold Kliegl & Josef Krems (2000): The subject preference in the processing of locally ambiguous wh-questions in German. In Barbara Hemforth & Lars Konieczny (Hrsg.), German Sentence Processing, 65 – 93. Dordrecht: Kluwer. Schriefers, Herbert, Angela D. Friederici & Katja Kühn (1995): The processing of locally ambiguous relative clauses in German. Journal of Memory and Language 34 (4), 499 – 520. Serratrice, Ludovica, Anne Hesketh & Rachel Ashworth (2015): The use of reported speech in children’s narratives: A priming study. First Language 35 (1), 68 – 87. Shimpi, Priya M., Perla B. Gámez, Janellen Huttenlocher & Marina Vasilyeva (2007): Syntactic priming in 3- and 4-year old children: Evidence for abstract representations of transitive and dative forms. Developmental Psychology 43 (6), 1334 – 1346. Shin, Jeong-Ah & Keil Christianson (2012): Structural priming and second language acquisition. Language Learning 62 (3), 931 – 964. Shintani, Natsuko, Shaofeng Li & Rod Ellis (2013): Comprehension-based versus production-based grammar instruction: A meta-analysis of comparative studies. Language Learning 62 (2), 296 – 329. Spada, Nina & Yasuyo Tomita (2010): Interactions between type of instruction and type of language feature: A meta-analysis. Language Learning 60 (2), 263 – 308. Strong, Mark (1976): German noun gender: A matter of memorization? Die Unterrichtspraxis 9 (1), 74 – 77.
Zusammenhänge der Sprachverarbeitung und dem Erwerb neuer Strukturen
323
Swain, Merrill (1985): Communicative competence: Some roles of comprehensible input and comprehensible output in its development. In Susan M. Gass & Carolyn Madden (Hrsg.), Input in Second Language Acquisition, 235 – 253. Rowley, MA: Newbury House. VanPatten, Bill (1984): Learners’ comprehension of clitic pronouns: More evidence for a word-order strategy. Hispanic Linguistics 1 (1), 57 – 67. VanPatten, Bill (2004): Input processing in second language acquisition. In Bill VanPatten (Hrsg.), Processing Instruction: Theory, Research, and Commentary, 5 – 31. Mahwah, NJ: Lawrence Erlbaum. VanPatten, Bill (2007): Input processing in adult SLA. In B. VanPatten & Jessica Williams (Hrsg.), Theories in Second Language Acquisition, 115 – 135. Mahwah, NJ: Lawrence Erlbaum. VanPatten, Bill (2012): Input processing. In Susan M. Gass & Alison Mackey (Hrsg.), The Routledge Handbook of Second Language Acquisition, 268 – 281. Hoboken, NJ: Taylor & Francis. VanPatten, Bill & Teresa Cadierno (1993): Explicit instruction and input processing. Studies in Second Language Acquisition 15 (2), 225. VanPatten, Bill, Erin Collopy, Joseph E. Price, Stefanie Borst & Anthony Qualin (2013): Explicit information, grammatical sensitivity, and the first-noun principle: A cross-linguistic study in processing instruction. The Modern Language Journal 97 (2), 506 – 527. VanPatten, Bill & Claudia Fernández (2004): The long-term effects of processing instruction. In Bill VanPatten (Hrsg.), Processing Instruction: Theory, Research, and Commentary, 273 – 289. Mahwah, NJ: Lawrence Erlbaum. VanPatten, Bill & Soile Oikkenon (1996): Explanation versus structured input in processing instruction. Studies in Second Language Acquisition 18 (4), 495 – 510. Vasilyeva, Marina, Janellen Huttenlocher & Heidi Waterfall (2006): Effects of language intervention on syntactic skill levels in preschoolers. Developmental Psychology 42 (1), 164 – 174. Vernice, Mirta, Robert J. Hartsuiker, R. J. & Martin J. Pickering (2012): Thematic emphasis in language production. Language and Cognitive Processes 27 (5), 631 – 664.
Monique Flecken und Christiane v. Stutterheim
Sprache und Kognition: Sprachvergleichende und lernersprachliche Untersuchungen zur Ereigniskonzeptualisierung Die Frage nach dem Zusammenhang zwischen Sprache und Kognition wird gegenwärtig kontrovers diskutiert und ist noch nicht annähernd beantwortet. Ein Weg, unseren Erkenntnishorizont zu erweitern, liegt in der Untersuchung von L2Lernern und mehrsprachigen Sprechern. In dem vorliegenden Artikel werden Arbeiten dargestellt, die den Zusammenhang zwischen Sprache und Kognition unter Anwendung empirischer Methoden unter zwei Aspekten thematisieren: zum einen werden Zusammenhänge zwischen bestimmten sprachlichen Strukturen und kognitiven Prozessen (e. g. visuelle Aufmerksamkeitslenkung) im Kontext der Sprachverarbeitung dargestellt, und zum anderen werden kognitive Einflüsse der Erstsprache (L1) im Gebrauch von Zweitsprachen nachgewiesen. Dabei stehen Bewegungsereignisse im Fokus, deren Ausdruck wesentlich auf Kategorien aus den Bereichen der Raum- und Zeitkognition beruht. Sprachliche Formen, die räumliche (wo?) und zeitliche (wann?) Aspekte eines Ereignisses ausdrücken, sind insbesondere deswegen interessant, weil im Verlauf der Sprachproduktion Entscheidungen zur räumlichen und sprachlichen Perspektivierung früh stattfinden. Diese frühe Sprachplanungsphase wird nach Levelt (1989) als Konzeptualisierung bezeichnet. In dieser Phase konstruiert der Sprecher die sogenannte message, auf Grund derer bestimmt wird, was man versprachlichen wird (Informationsselektion), wie man die Information strukturiert (Informationsstruktur), und welche Perspektive man einnimmt (Perspektivierung). Der Sprecher legt während dieser Phase fest, durch welche inhaltlichen Komponenten er einen bestimmten Sachverhalt repräsentieren möchte. Auf die Phase der Konzeptualisierung folgt die sogenannte Formulierungsphase, in der ein Sprecher die konkreten linguistischen Formen abruft. Im Zugriff auf das mentale Lexikon werden die morphosyntaktischen und phonologischen Eigenschaften der jeweiligen Wörter mit abgerufen. Darauf folgt die Phase der Artikulation und damit die konkrete Äußerung (cf. das Sprachproduktionsmodell in Levelt 1989, 1999). Das Ereignis, das in Abb. 1 in einem Standbild dargestellt ist, zeigt beispielsweise eine Person, die über einen Weg in Richtung eines Hauses läuft. Während der Konzeptualisierungsphase wird entschieden, welchem Ereignistyp das Gesehene Monique Flecken, MPI für Psycholinguistik, Nijmegen Christiane v. Stutterheim, Ruprecht-Karls-Universität Heidelberg DOI 10.1515/9783110456356-014
326
Monique Flecken und Christiane v. Stutterheim
zugeordnet wird und durch welche Informationen dieses Ereignis sprachlich dargestellt wird: Geht die Frau auf das Haus zu? Läuft sie einen Weg entlang? Oder geht sie im Feld spazieren? Im vorliegenden Kapitel erläutern wir, von welchen Faktoren die Entscheidung eines Sprechers für eine bestimmte Ereignisprofilierung (Langacker 2007) abhängt.
Abbildung 1: Standbild eines Bewegungsereignisses
Was den Ausdruck von Zeit- und Raumkonzepten betrifft, so unterscheiden sich Sprachen in vielfältiger Weise. Zahlreiche typologische Arbeiten haben sich mit Unterschieden in diesen Bereichen befasst (vgl. den Überblick zur Zeittypologie in Dahl 1985, zur Raumtypologie in Talmy 1985). Unterschiede liegen zum einen auf der Ebene der Grammatik. Ein Beispiel stellt hier der Verbalaspekt dar. Sogenannte Aspektsprachen weisen verbale Flexionsformen auf, die unterschiedliche temporale Perspektiven auf eine Situation zum Ausdruck bringen. Als Beispiel kann das Englische dienen, in dem mit der sogenannten simplen Verbform the girl walks to school ein sich wiederholendes Ereignis dargestellt wird (every morning), während die ing-Form the girl is walking to school ein singuläres Geschehen in seinem aktuellen Verlauf zum Ausdruck bringt (right now). Andere Sprachen, wie das Russische oder Arabische, verfügen über einen imperfektiven und einen perfektiven Aspekt. Diese Verbalformen erfordern obligatorisch die Unterscheidung, ob ein Geschehen als nicht abgeschlossen oder als abgeschlossen dargestellt wird (das Kind geht (imperfektiv) in das Haus – d. h. das Kind ist noch nicht angekommen oder das Kind geht (perfektiv) in das Haus – d. h. das Kind ist angekommen.) Andere Sprachen, wie das Deutsche, bleiben in dieser Hinsicht
Sprache und Kognition
327
unterspezifiziert. Zum anderen liegen sprachsystematische Unterschiede im Lexikon vor. Sprachen unterscheiden sich darin, welche konzeptuellen Kategorien für eine lexikalische Differenzierung salient sind. Ein Beispiel hierfür stellt das Inventar der Verben dar, die zum Ausdruck von Bewegungsereignissen zur Verfügung stehen. Es besteht ein Kontrast zwischen Sprachen, in denen es ein differenziertes Lexikon zum Ausdruck von Weginformationen (path verbs) gibt (z. B. das Französische mit Verben wie s’approcher ‚sich nähern‘, s’avancer ‚sich voran bewegen‘, se diriger ‚sich ausrichten‘), und solchen, die ein differenziertes Lexikon im Bereich der Bewegungsart (manner verbs/Artverben) aufweisen (z. B. das Deutsche mit Verben wie schleichen, schlurfen, schlendern). Die Forschung, die sich mit Sprachvergleich und Sprachkontrast beschäftigt, stellt sich seit Wilhelm von Humboldt die Frage, ob die Unterschiede zwischen Sprachsystemen nur auf der Formulierungsebene zum Tragen kommen, also gewissermaßen „Gekräusel auf der Oberfläche“ darstellen, oder ob die Unterschiede bereits in der Phase der Konzeptualisierung zu sprachspezifischen Mustern der Informationsorganisation führen. Diese zweite Annahme wird dadurch nahegelegt, dass im Verlauf des L1-Erwerbs die sprachliche und die kognitive Entwicklung in enger Verzahnung ablaufen (vgl. Bowerman & Choi 2003). In den letzten Jahrzehnten hat die Forschung zum Zusammenhang von Sprache und Kognition durch den Einsatz empirischer und experimenteller Methoden erheblich Fahrt aufgenommen. Einen Meilenstein auf diesem Weg stellen die Untersuchungen von Slobin dar, der auf der Grundlage umfassender sprachvergleichender Analysen seine These des Thinking for Speaking formulierte (1996). Sie besagt, dass im Prozess der Sprachproduktion bereits in der Konzeptualisierungsphase der Inhalt nach sprachspezifischen Prinzipien selegiert und strukturiert wird (vgl. zum Überblick Carroll, v. Stutterheim & Nüse 2004). Die einzelsprachlichen Strukturen wirken somit als „Filter“ auf der Ebene der konzeptuellen Planung. Zahlreiche Studien haben diesen Zusammenhang zwischen Sprache und Kognition auf der Grundlage von Sprachproduktionsexperimenten für eine Reihe unterschiedlicher Sprachen belegen können (e. g., Berman & Slobin 1994; Slobin 2006; v. Stutterheim et al. 2012; Sauppe et al. 2013; Norcliffe et al. 2015; zum Überblick Pederson 2010). Slobin, der seine These ausdrücklich auf Konzeptualisierungsprozesse im Kontext der Sprachverwendung beschränkt hat, stützt sie ausschließlich auf empirische Evidenz, die er aus einem großen sprachvergleichenden Korpus von mündlichen Nacherzählungen einer Bildergeschichte gewinnt. Eine wichtige weiterführende Frage ist, inwiefern diese sprachnahen kognitiven Prozesse auch unabhängig von dem sprachlichen Produkt selbst über andere Verhaltensdaten beobachtbar sind. Eine Methode, die dies ermöglicht, ist die Blickbewegungsmessung. Dabei wird die visuelle Aufmerksamkeit (Fixationen) eines Sprechers erfasst, während er einen Stimulus betrachtet, den er sprachlich darstellen soll.
328
Monique Flecken und Christiane v. Stutterheim
Diese Methode bietet Einblicke in den Konzeptualisierungsprozess, indem zeitgenau registriert wird, worauf ein Sprecher wann seine Aufmerksamkeit richtet, in Relation zum Stimulusonset sowie zum Anfangspunkt des Sprechens. In der Wahrnehmungsforschung wird angenommen, dass die Muster der visuellen Aufmerksamkeit mit kognitiven Prozessen korrelieren. So konnten zahlreiche Studien zeigen, dass frühe Fixationen¹ direkt nach Stimulusbeginn und vor Sprechbeginn konzeptuell mit frühen Sprachplanungsprozessen korrelieren (cf. Griffin & Bock 2000; Bock, Irvin & Davidson 2004; Henderson & Ferreira 2004). Ein weiteres Fenster auf den Zusammenhang zwischen Sprache und Kognition bieten Studien zu Fremd- bzw. Zweitsprachensprechern (L2-Sprecher). Diese Sprecher verfügen über (mindestens) zwei sprachliche Systeme. Das eine wird als L1 im Kontext der allgemeinen kognitiven Entwicklung erworben, das andere typischerweise im späteren Alter. In Bezug auf die Sprachverarbeitung in der L2 stellt sich die Frage, inwiefern sich dort, wo es Unterschiede im Lexikon oder der Grammatik zwischen den beiden Sprachen gibt, Konzeptualisierungsmuster beim Gebrauch einer L2 denen der Zielsprache anpassen – hier spricht man von konzeptueller Reorganisation -, oder inwiefern Sprecher sich auf L1-basierte Prinzipien stützen – hier spricht man von konzeptuellem Transfer auf der Grundlage der Persistenz muttersprachlicher Muster (cf. Jarvis & Pavlenko 2008; Odlin 2005; Pavlenko 2011; Cook & Bassetti 2011). Die Untersuchungen, auf die wir unsere Überlegungen aufbauen können, sind gegenwärtig noch sehr heterogen und widersprüchlich in ihren Ergebnissen. So zeigen einige Studien, dass Lerner sich den zielsprachlichen Mustern annähern, bzw. dass sie sie vollständig erwerben, andere Studien liefern Belege für konzeptuellen Transfer (Überblicke in Jarvis & Pavlenko 2008; Pavlenko 2011; Han & Cadierno, 2010; Benazzo, Flecken & Soroli 2012; v. Stutterheim, Flecken & Carroll 2013). Die heterogenen Forschungsergebnisse sind nicht verwunderlich, denn zum einen stellt die jeweils gegebene L2Kompetenz eine wesentliche Einflussgröße dar, die von Studie zu Studie variiert, zum anderen unterscheiden sich die Untersuchungen in den strukturellen oder kognitiven Bereichen, die den Forschungsgegenstand darstellen. Die meisten Studien konzentrieren sich auf einen bestimmten strukturellen (z. B.Wortstellung, Subordination) oder kognitiven Bereich (z. B. Ausdruck von Zeit oder Raum), für den es zwischensprachliche Unterschiede gibt. Weiterführend sind hier Studien, die sich mit Untersuchungsgegenständen befassen, die es erlauben, unterschiedliche kognitive Bereiche in ihrem Zusammenspiel zu analysieren. Die Analyse von Ereigniskognition bietet hier einen Zugang, durch den die Interaktion
Eine Fixation ist dadurch bestimmt, dass der Blick mindestens einige Millisekunden (mindestens 80 msek) an einer Stelle des Stimulus verweilt.
Sprache und Kognition
329
zwischen räumlichen und zeitlichen Kategorien untersucht werden kann. Dabei lässt sich erfassen, ob es für ein und denselben L2-Sprecher begriffliche Komponenten gibt, bei denen ihm eine Restrukturierung gelingt, während in anderen Bereichen die muttersprachlichen Prinzipien bestimmend sind. Im Folgenden soll anhand der Untersuchung von visueller Wahrnehmung (Aufmerksamkeitsmuster gemessen mittels der Methode der Blickbewegungsmessung) und Versprachlichung von Bewegungsereignissen gezeigt werden, wie muttersprachliche Strukturen die Wahl einer bestimmten konzeptuellen Profilierung und der damit verbundenen Perspektivierung beeinflussen und welche Faktoren eine Reorganisation im L2-Gebrauch befördern bzw. beschränken. Ausgehend von sprachtypologischen Unterschieden im Ausdruck von Bewegungsereignissen (Kap. 1) stellen wir zunächst eine Untersuchung zum Einfluss lexikalischer Strukturen auf Konzeptualisierungprozesse dar (Kap. 2). In einem nächsten Schritt geht es um den Einfluss grammatischer Strukturen (Verbalaspekt) auf Konzeptualisierungsprozesse (Kap. 3). In beiden Untersuchungen werden neben muttersprachlichen auch lernersprachliche Daten betrachtet.Während sich ein L1-Einfluss auf der Ebene der sprachlichen Form als unmittelbar beobachtbarer struktureller Transfer gut nachweisen lässt, ist die Frage des konzeptuellen Transfers, der sich nicht unbedingt in abweichenden sprachlichen Strukturen manifestiert, weitaus schwieriger zu klären. Untersuchungen, wie die im Folgenden dargestellten, weisen theoretisch wie methodisch Wege, um hier zu einer differenzierten Antwort zu gelangen.
1 Der Ausdruck von Bewegungsereignissen Der Ausdruck von Bewegungsereignissen nimmt einen besonderen Platz in den Untersuchungen zum Verhältnis zwischen Sprache und Kognition ein. Die Frage nach der Sprachspezifik kognitiver Prozesse im Kontext verbaler und nonverbaler Aufgaben (neben Sprachproduktion und -verstehen, z. B. Gedächtnistests, Kategorisierungsaufgaben) wurde in zahlreichen empirischen Studien anhand von Bewegungsereignissen untersucht (Gennari et al. 2002; Flecken et al. 2015; Papafragou, Massey & Gleitman 2002; von Stutterheim & Carroll 2006; Athanasopoulos & Bylund 2013; Soroli & Hickmann 2010;Trueswell & Papafragou 2010). Die Gründe für diese Wahl liegen auf der Hand. Zum einen liegen hervorragende und viele Sprachen umfassende typologische Studien zum Bereich Bewegungsereignisse vor. Man kann folglich auf einer soliden Basis linguistischer Theorie aufbauen. Die typologische Analyse zahlreicher sprachlicher Systeme hat im Ergebnis zur Identifikation bestimmter Merkmale geführt, die in der Form sprachspezifischer Cluster Abgrenzungen zwischen unterschiedlichen Systemen
330
Monique Flecken und Christiane v. Stutterheim
erlauben und damit als Grundlage für Hypothesenbildung zur Sprachverarbeitung dienen können. Ein weiterer Grund für die Prominenz des Forschungsgebiets Bewegungsereignisse ist ein methodischer. Da es sich um konkret wahrnehmbare Geschehnisse handelt, lassen sich Methoden einsetzen, die außersprachliche Korrelate mit Wahrnehmungs- und Versprachlichungsprozessen experimentell zu verknüpfen erlauben. Ausgangspunkt und theoretische Grundlage aller Arbeiten in diesem Bereich bilden Talmys wegweisende Studien zur Raumtypologie (1985, 1988, 2000a, b). Kernkomponenten, die in der Konzeptualisierung von Bewegungsereignissen integriert werden, bilden – in der Terminologie von Talmy – die sich bewegende Figur, die Bewegung an sich (motion), der Weg und durch Objekte ausgegrenzte Grundelemente am Beginn (Ausgangsort), im Verlauf und am Endpunkt (Zielort) des Weges. Daneben nimmt Talmy von ihm als co-event bezeichnete begriffliche Komponenten an, i. e., die Art der Bewegung und die Verursachung von Bewegung. Betrachten wir zur Illustration den Satz Der Junge überquert den Platz. Der Satz setzt sich wie folgt begrifflich zusammen: Der Junge ist Figur, überquert drückt Bewegung und Weginformation aus, der Platz liefert Information über den Grund. Im Beispiel Der Junge rennt zur Haltestelle wird die Bewegung zusammen mit der Art der Bewegung im Verb kodiert, und der Weg wird durch die Erwähnung des Endpunkts gekennzeichnet. Talmy kommt zu der These, dass es zwei Typen von Sprachen gibt: verb-framed und satellite-framed Sprachen. Die beiden Typen unterscheiden sich dadurch, in welcher sprachlichen Kategorie die Informationen über den Weg typischerweise gegeben werden. In verb-framed Sprachen wird die Weginformation im Verbstamm ausgedrückt wie in folgendem Beispiel im Französischen: Un enfant entre la maison en courant (‚Ein Kind betritt das Haus rennend‘), in satellite-framed Sprachen in Affixen, Partikeln oder anderen verbnahen syntaktischen Kategorien wie das folgende Beispiel aus dem Deutschen illustriert: Ein Kind rennt rein. Beispiele für ersteren Sprachtyp sind altaische, romanische und semitische Sprachen, für letzteren germanische und slawische. Die Analyse zahlreicher Sprachen im Rahmen dieses Ansatzes hat jedoch deutlich gemacht, dass Talmys Annahmen in verschiedener Hinsicht zu eng waren (z. B. Beavers, Levin & Tham 2010; Loucks & Pederson 2011; Pourcel & Kopecka 2006; Slobin 2006; Bohnemeyer et al. 2007). So geht man heute von einer weiteren Definition des Begriffs Satellit aus, der auch Adjunkte in Form von prä/postpositionalen Phrasen mit einschließt. Auch haben vor allem vertiefende Studien zum Sprachgebrauch deutlich gemacht, dass das empirische Bild sehr viel vielfältiger ist, als von Talmy angenommen. So weist jede Sprache Ausdrucksmöglichkeiten beiden Typs auf (vgl. die Beispiele zum Deutschen oben). Darüber hinaus gibt es Sprachen, die typischerweise Weg und Bewegungsart in mehreren Verben innerhalb eines Satzes kodieren, wie beispielsweise das Chinesische. Man nimmt
Sprache und Kognition
331
daher nicht mehr eine typologische Dichotomie an, die sich ausschließlich an der verbalen Komponente orientiert, sondern vielmehr sprachspezifische Gewichtungen der unterschiedlichen konzeptuellen Komponenten (vgl. Slobins Vorschlag einer Skala der manner salience basierend auf der Anzahl der Verben im Lexikon, die die Art der Bewegung ausdrücken, cf. Slobin 2006). Betrachten wir zur Illustration noch einmal das Deutsche und das Französische. Im Französischen werden Bewegungsereignisse präferiert durch Wegverben zum Ausdruck gebracht, im Deutschen durch Verben der Art und Weise. Dies hat zur Folge, dass in französischen Ereignisbeschreibungen Information über die Art der Bewegung häufig unerwähnt bleibt, während im Deutschen diese Information typischerweise in einer Äußerung enthalten ist. Man kann daher sagen, dass die strukturellen Eigenschaften einer Sprache bestimmte Komponenten eines Bewegungsereignisses in den Vordergrund rücken, andere eher implizit oder gänzlich unberücksichtigt bleiben und nur in Fällen, in denen diese Information von besonderer kommunikativer Relevanz ist, zum Ausdruck gebracht werden. Es stellt sich nun die Frage der Relevanz dieses Sprachkontrastes für Konzeptualisierungsprozesse. Kommen die beobachteten sprachspezifischen Muster ausschließlich auf der Ebene der Formulierung zustande, oder finden sich entsprechende Unterschiede bereits in der Phase der Konzeptualisierung eines Redeinhalts? Besonders aufschlussreich sind in diesem Zusammenhang empirische Untersuchungen zu Lernersprachen. Betrachtet man beispielsweise Sprecher, deren Zweitsprache (L2) sich typologisch von ihrer Erstsprache (L1) erheblich unterscheidet, so lässt sich prüfen, inwiefern diese Sprecher mit den Ausdrucksformen ihrer L2 konzeptuelle Muster ihrer L1 abbilden. Wir verdeutlichen dies an einem Beispiel: Ein Sprecher mit französischer Muttersprache stellt ein Bewegungsereignis im Deutschen als L2 mit den Worten Eine Person geht vorwärts zu einem Haus dar, eine Formulierung, die ein deutscher Muttersprachler nie wählen würde. Als entsprechende L1-Beschreibungen im Französischen finden sich Sätze wie Un homme avance vers une maison. Hier kann man annehmen, dass ein Einfluss der L1 auf der Ebene der Ereigniskonzeptualisierung zur Wirkung kommt, in der Phase, in der bestimmte Komponenten selegiert (Weginformation), Perspektiven festgelegt (von der sich bewegenden Figur aus gesehen) und bestimmte Komponenten ausgeblendet werden (Art und Weise der Bewegung). In den folgenden Kapiteln werden wir anhand empirischer Studien genauer auf diese These eingehen. Zahlreiche Studien haben sich mit dem Zusammenhang von Sprache und Kognition anhand von Bewegungsereignissen und ihrem sprachlichen Ausdruck im Kontext der L2-Verwendung beschäftigt (e. g., Bylund & Jarvis 2011; Cadierno 2004, 2010; Cadierno & Ruiz 2006; Hohenstein, Eisenberg & Naigles 2006; Carroll et al. 2012; Flecken 2011; Flecken et al. 2015; v. Stutterheim & Carroll 2006; Bylund
332
Monique Flecken und Christiane v. Stutterheim
2009; Athanasopoulos & Bylund 2013; Daller, Treffers-Daller & Furman 2011). Die Befunde sind insofern weitgehend einheitlich, dass sich in den meisten Studien Einflüsse der L1 belegen lassen. Diese beziehen sich sowohl auf die Auswahl der Informationen (z. B. Weg vs. Art der Bewegung) als auch auf die Präferenz bestimmter Formulierungsmuster. Offen diskutiert wird nach wie vor die Frage, wie „tief“ diese L1-Effekte auf die kognitiven Prozesse einwirken. Handelt es sich um einen Einfluss, der zum Tragen kommt, wenn im Sprachproduktionsprozess die Wörter und Strukturen abgerufen werden (Formulierung) und die geplante message in sprachliche Form übertragen wird? Oder wirkt sich der muttersprachliche Einfluss auf der Ebene der message-Planung aus oder zeigt er sich sogar bereits während der Wahrnehmungsphase, in der etwas visuell Wahrgenommenes kognitiv verarbeitet wird, ohne dass sprachliche Formen abgerufen werden? Dies ist durch Methoden zu testen, die Aufmerksamkeitsmuster und Zeitverlauf von Wahrnehmungsprozessen registrieren können und somit die mit der visuellen Wahrnehmung verbundenen kognitiven Prozesse mit Sprechanfangszeit und Sprachinhalten verknüpfen können. Im Folgenden sollen beispielhaft zwei solcher feinkörnigen experimentellen Studien dargestellt werden.
2 Zum Einfluss lexikalischer Strukturen auf die Konzeptualisierung von Bewegungsereignissen: Französisch und Deutsch 2.1 Raumkognitive Strukturen Die im Folgenden dargestellte Studie (Carroll et al. 2012; Flecken et al. 2015; v. Stutterheim, Bouhaous & Carroll 2017) geht insofern über die vorangehenden hinaus, als sie die raumtypologischen Analysen semantisch verfeinert und methodisch neben sprachlichen Daten auch Muster visueller Aufmerksamkeit (erfasst mittels Blickbewegungsmessung) zur Ermittlung kognitiver Prozesse einsetzt. Im Zentrum stehen die Sprachen Französisch und Deutsch². Französisch weist wesentliche Merkmale von verb-framed Sprachen auf. Weg- und Bewegungsinformation wird typischerweise im Verb dargestellt (e. g., se diriger vers x ‚sich zubewegen auf x‘, (s’) avancer vers x ‚sich vorwärts bewegen in Richtung auf
Die Studie Carroll et al. (2012) umfasst auch Englisch sowie französische Lerner des Englischen. In dem vorliegenden Artikel gehen wir aus Platzgründen nur auf Deutsch und Französisch, sowie die Lernersprache L1 Französisch/L2 Deutsch ein.
Sprache und Kognition
333
x‘, (s’) approcher (de) x ‚sich x annähern‘), Adjunkte informieren über Ausgangsund Zielorte (1). Information zur Art der Bewegung bleibt in diesen Kontexten häufig unerwähnt; wenn sie zum Ausdruck gebracht wird, dann entweder syntaktisch integriert in einem Gerund (2) oder direkt in einem eigenen Satz (3). (1) Une femme s’approche d’une église. Eine Frau nähert sich einer Kirche (2) Une femme entre une maison en courant. Eine Frau betritt ein Haus rennend (3) Une femme court et entre une maison. Eine Frau rennt und betritt ein Haus Unbeachtet blieb in bisherigen typologischen Studien ein Aspekt, der wesentlich für die unterschiedlichen konzeptuellen Ausprägungen raumkognitiver Systeme ist. Es handelt sich um die Kriterien, nach denen Sprecher spezifische Raumkonzepte konstruieren und auf die jeweilige Situation anwenden (Carroll, 2000). Im Französischen werden die Raumkonzepte, die für die Darstellung eines Bewegungsereignisses selegiert werden, präferiert von der Figur abgeleitet; ihre Orientierung, ihr räumliches Verhältnis zu Grundobjekten (z. B., ihre Ausrichtung und Distanz zu einem Endpunkt oder Ziel) bilden die konzeptuelle Grundlage für die meisten Wegverben im Lexikon (vgl.v. Stutterheim & Bouhaous 2016). Somit ist eine figurbezogene Konzeptualisierung eines Bewegungsereignisses das präferierte Muster im Französischen. Betrachten wir zur Illustration vergleichend zuerst eine grundbezogene und dann eine figurbezogene Strategie für die Konzeptualisierung von Bewegungsereignissen: Im Satz Eine Frau überquert einen Platz (grundbezogene Konzeptualisierung des Ereignisses) bezieht sich das Verb überqueren auf Eigenschaften des Grundes, über den sich die Figur bewegt. Es handelt sich um einen abgegrenzten Raum, wie einen Platz, eine Straße. Der Satz Une femme se dirige vers une église (‚Eine Frau bewegt sich auf eine Kirche zu‘, figurbezogene Konzeptualisierung des Ereignisses) dagegen gibt keine Auskunft über die Eigenschaften des Grundes, über den sich die Figur bewegt. Die Weginformation bezieht sich auf die Orientierung der Figur auf ein bestimmtes Objekt hin; Verben diesen Typs sind im französischen Verballexikon in differenzierter Weise vertreten und ihre Selektion hängt mit der genauen Orientierung der Figur des Bewegungsereignisses zusammen. Die prominente Funktion der sich bewegenden Figur in der Konzeptualisierung von Bewegungsereignissen zeigt sich auch im Zusammenhang mit Aussagen über die Bewegungsart. Auch das Französische verfügt über Artverben, die durchaus gebräuchlich sind (e. g., marcher ‚laufen‘, rouler ‚fahren‘). Allerdings fügen sich die Bedingungen des Gebrauchs in das übergreifende raumkognitive System insofern, als Informationen über die Art
334
Monique Flecken und Christiane v. Stutterheim
und Weise in Bezug auf die sich bewegende Figur als Eigenschaft der Figur konzeptualisiert werden, und verknüpft werden mit einer statischen Raumreferenz: Une voiture roule sur la route (‚Ein Auto fährt auf der Straße‘). Man kann sich diese Perspektive verdeutlichen, wenn man sehr auffallende Bewegungsarten in den Blick nimmt, z. B. Der Mann humpelt. Hier wird der Hörer/Leser eher eine Vorstellung über eine Eigenschaft der Person entwickeln. Die Tatsache, dass auch eine Bewegung dabei impliziert ist, tritt in den Hintergrund. Es ist diese Perspektive, die im Französischen typischerweise mit der Angabe von der Bewegungsart und damit der Verwendung von Artverben als Prädikaten gewählt wird. Damit einher geht die Möglichkeit, Artverben als „nackte“ Verben zu verwenden, d. h. sie erfordern keine weiteren Adjunkte, z. B. Une femme court (‚Eine Frau rennt‘). Die andere Sprache der Untersuchung, das Deutsche, ist dagegen dem Typ satellite-framed zuzuordnen. Präferiert werden Artverben zur Darstellung von Bewegungsereignissen verwendet. Weginformation wird in Form von Partikeln und Prä-/Postpositionalphrasen mit Kasusmarkierung zum Ausdruck gebracht (z. B. Eine Frau rennt in das Haus). Die Raumkonzepte, die zur Darstellung des Bewegungsereignisses selegiert werden, werden typischerweise von den Eigenschaften des Grundes abgeleitet (entlang der Straße, über die Brücke, in das Haus); dies gilt auch im eher markierten Fall des Gebrauchs von Wegverben: sie profilieren typischerweise Eigenschaften des Grundes (z. B. Ein Mann überquert eine Straße) und figurbezogene Verben wie im Französischen werden so gut wie nie verwendet. Für den L2-Sprecher, der von einem zum anderen Sprachtyp übergeht, stellt sich eine komplexe Erwerbsaufgabe, die mehrere Ebenen umfasst. Neben dem Erwerb neuer lexikalischer Formen und grammatikalischer Strukturen muss der Lerner diejenigen Prinzipien entdecken, die der Konzeptualisierung von Ereignissen zu Grunde liegen. Diese beziehen sich auf die Selektion von bestimmten Komponenten, die Perspektivenwahl sowie deren Zusammenschluss zu einer Ereignisrepräsentation. Die für die L2 relevanten Prinzipien auf der Ebene der Konzeptualisierung zu erkennen und im Kontext der Sprachverwendung automatisiert einzusetzen stellt eine enorme Herausforderung dar. Um der Frage nachzugehen, ob die Sprachproduktion in einer L2 Zeichen von konzeptuellem Transfer (Einfluss der L1) oder konzeptueller Reorganisation (zielsprachlich) aufweist, muss differenziert betrachtet werden,wie sich das Zusammenwirken von L1- und L2-basierten Prinzipien in der Sprachproduktion gestaltet. Die hier dargestellten Studien gehen diesen Fragen unter Einsatz experimenteller Methoden nach.
Sprache und Kognition
335
2.2 Das Untersuchungsdesign Die Datenerhebung erfolgte durch eine Sprachproduktionsaufgabe (vgl. für eine genaue Darstellung der Untersuchung Carroll et al. 2012; Flecken et al. 2015). Die Probanden waren aufgefordert, Videoclips zu versprachlichen, in denen unterschiedliche Typen von Bewegungsereignissen eingebunden in Filler-Szenen³ gezeigt wurden. Die Videoclips waren 6 Sekunden lang. Insgesamt 20 Stimuli zeigten Bewegungsereignisse, mit unterschiedlich langem Weg zu einem potentiellen Endpunkt; in keinem der Videos wurde der Endpunkt von der Figur erreicht. Wir werden uns in diesem Artikel auf die Darstellung der Ergebnisse zu einem Stimulustyp beschränken (Stimuli, bei denen ein potentieller Endpunkt gut erkennbar war, vgl. zur Darstellung der gesamten Studie v. Stutterheim et al. 2012). Abb. 2 zeigt ein Standbild dieses Ereignistyps.
Abbildung 2: Standbild eines Videoclips: ein Mann läuft einen Weg entlang an einem Gebäude vorbei in Richtung eines Autos
Die Probandengruppen bildeten je 20 Sprecher des Deutschen und Französischen, sowie sehr fortgeschrittene L2-Sprecher (Niveau C1 nach dem Europäischen Referenzrahmen) des Deutschen mit Französisch als L1. Das Alter der Probanden lag zwischen 18 und 35 Jahren. Ihr sozialer Hintergrund war vergleichbar, alle waren entweder Studenten oder hatten einen akademischen Abschluss. Die Aufgabe der Probanden bestand darin, auf die Instruktion Was passiert in den Videoclips? hin die Szenen zu beschreiben. Die Probanden wurden aufgefordert, mit der Versprachlichung zu beginnen, sobald sie die gezeigte Situation identifizieren
Darunter versteht man Stimulusmaterial im Rahmen eines Experiments, das nicht ausgewertet wird. Es dient der Ablenkung der Probanden, die das eigentliche Ziel der jeweiligen Studie so nicht erschließen können.
336
Monique Flecken und Christiane v. Stutterheim
konnten. Neben Audiodaten der Sprachproduktionen wurden Blickbewegungsdaten während des Betrachtens der Videoclips erhoben.
2.3 Ergebnisse der Sprachproduktionsanalyse Die Ergebnisse der Sprachproduktionsanalysen bestätigen für die L1-Daten die Muster, die auf Grund der sprachtypologischen Einordnung zu erwarten sind. Französische Sprecher wählen Weg- und Artverben, während deutsche Sprecher beinahe ausschließlich Artverben verwenden. Die französischen Sprecher verwendeten im Zusammenhang mit Artverben überwiegend statische Lokalisationen (z. B. sur la route ‚auf der Straße‘). Wie oben ausgeführt, konzeptualisieren französische Sprecher Situationen, in denen die Art der Bewegung als prominent gesehen wird, als Eigenschaftszuweisungen, und somit tritt die Ereignishaftigkeit einer dynamischen Bewegung in den Hintergrund⁴. Diese Art der Profilierung der gezeigten Situationen lässt auch ein Darstellungsmuster zu, in dem Äußerungen ohne Adjunkt vom Typ Une voiture roule (‚Ein Auto fährt‘) produziert werden. Im Deutschen werden präferiert Artverben zur Verbalisierung von Bewegungsereignissen herangezogen, z. B. Ein Auto fährt eine Straße entlang. Das Verb fahren, in Kombination mit dem Adjunkt, das grundbezogene Weginformation ausdrückt, trägt damit sowohl Art wie auch Bewegungsinformation bei. Die Ausblendung der Bewegungskomponente zu Gunsten einer eher statischen „Momentaufnahme“ durch den Gebrauch von Lokalisierungsadjunkten (z. B. auf der Straße), wie dies im Französischen erfolgt, ist keine präferierte Option. Die folgenden Tabellen stellen die Ergebnisse der Datenkodierung dar. Die Daten werden unter zwei Aspekten quantifizierend ausgewertet. Zunächst werden die Verben, die als Prädikate gewählt werden, nach Art- und Wegverben kategorisiert. Eine geringe Anzahl verbloser Sätze wurde nach dem Muster ein Auto auf der Straße gebildet. Ein weiterer Analyseaspekt bezieht sich auf die Raumkonzepte, die in Adjunkten kodiert werden. Auch hier gibt es Äußerungen, in denen kein Adjunkt formuliert wird, z. B. Une voiture roule.
Eine vergleichbare Studie mit arabischen Sprechern (v. Stutterheim et al. 2017) bestätigt diese Muster. Die arabischen Varietäten sind dem verb-framed Typ zuzuordnen. Sprecher gehen bei der Konstruktion von Bewegungsereignissen ebenso vor wie französische Sprecher. Diese Befunde machen deutlich, dass es sich um ein sprachbedingtes und nicht kulturbedingtes kognitives Muster handelt.
337
Sprache und Kognition
Tabelle 1: Relative Häufigkeit der Verb- und Adjunkttypen in den Ereignisbeschreibungen Verb
Art ⁵
Weg
ohne Verb
L Französisch L Deutsch L Deutsch
% % %
% % %
% %
Adjunkt
Lokalisierung
Weg
Endpunkt
ohne Adjunkt
L Französisch L Deutsch L Deutsch
% % %
% % %
% % %
% % %
Betrachtet man die Ergebnisse der L2-Gruppe, so zeigen sich gemischte Befunde. Die Lerner haben die Artverben als das zentrale verbale Mittel zur Darstellung von Bewegungsereignissen im Deutschen erworben. Die Ergebnisse divergieren jedoch erheblich im Bereich der Adjunkte. Die Beispiele (4) und (5) zeigen typische lernersprachliche Formulierungen im Gegensatz zu typischen Formulierungen deutscher L1-Sprecher in (6) und (7): (4) (5) (6) (7)
Ein Auto fährt. Ein Auto fährt auf der Straße. Ein Auto fährt einen Weg entlang. Ein Auto fährt eine Straße entlang zu einem Dorf.
Hier entsprechen die Lerner in Selektion der Inhalte und Perspektivenwahl weitgehend den französischen L1-Sprechern: Wenn die Art und Weise der Bewegung im Vordergrund steht, ausgedrückt durch Artverben, so ist dies hinreichend, um die wahrgenommene Situation sprachlich darzustellen. Wenn Rauminformation gegeben wird, so wird die Lokalisierung der Figur enkodiert, ausgedrückt in Lokalisationsadjunkten. Dies könnte einerseits bedeuten, dass ein L2-Sprecher Formulierungen, die näher an typischen französischen Formulierungen liegen, einfacher oder schneller nutzen kann. Andererseits könnte es ein Hinweis dafür sein, dass die raumkognitiven Muster, nach denen in der Zielsprache die Bewegung einer Entität konzeptualisiert wird, nicht vollständig erworben sind: Die Muster weisen eine figur-basierte Konzeptualisierung des Ereignisses auf, in der die Bewegung als Eigenschaft der Figur dargestellt wird. Wenn letztere Erklärung zutrifft, sollte das Blickbewegungsverhalten der L2-Sprecher dem Blickverhalten Das deiktische Verb gehen wird den Artverben zugeordnet. In Kontexten, in denen es um konkrete Bewegungsereignisse geht, steht es in Opposition zu anderen Artverben.
338
Monique Flecken und Christiane v. Stutterheim
der L1-Französischsprecher ähneln. Dies wäre dann ein Beleg dafür, dass wir es hier mit konzeptuellem Transfer aus der L1 in die L2 zu tun haben: die sprachliche Form der L2-Beschreibung ist grammatisch in der L2, die eingenommene Perspektive weicht jedoch von dem zielsprachlichen Muster ab.
2.4 Ergebnisse der Blickbewegungsanalyse Blickbewegungserfassung im Kontext der Sprachproduktion hat sich in zahlreichen Studien als aufschlussreich für Sprachplanungsprozesse erwiesen (e. g. Griffin & Bock 2000). Diese Methode ist besonders im Zusammenhang mit fortgeschrittenen Lernersprachen interessant, um Fragen des konzeptuellen Transfers zu untersuchen. Vor dem Hintergrund der oben dargestellten Ergebnisse zur sprachspezifischen Profilierung von Bewegungsereignissen im Französischen und Deutschen lassen sich die folgenden Annahmen formulieren: Sprecher des Deutschen und des Französischen „benötigen“ unterschiedliche Informationen aus dem visuellen Input, um die jeweils präferierten Darstellungsmuster mit konzeptuellem Material füllen zu können. Französische Sprecher konzeptualisieren räumliche Verhältnisse von der sich bewegenden Entität aus, deutsche Sprecher fokussieren die Objekte, die den Weg markieren (Grund), auf dem sich die Bewegung vollzieht. Vor Sprechanfang wird daher die visuelle Aufmerksamkeit der französischen Sprecher im Vergleich zu den Deutschsprechern verstärkt auf der Figur liegen.⁶ Da die Beschreibungen der französischen Lerner des Deutschen vermuten lassen, dass ihre raumkognitiven Konzeptualisierungsmuster keine Reorganisation zeigen, erwarten wir bei den Lernern ein Aufmerksamkeitsmuster, das den L1-Sprechern des Französischen entspricht (konzeptueller Transfer). Die Blickbewegungen wurden mit Beginn des Stimulus erfasst, parallel dazu wurde die Sprechanfangszeit registriert. Um den Verlauf der visuellen Aufmerksamkeitsmuster über die 6 Sekunden Präsentationszeit der Stimuli zu ermitteln wurden alle 60 Millisekunden (msek) Fixationen registriert. Dabei wurden pro Stimulus jeweils zwei AoI (areas of interest) festgelegt: 1) die sich bewegende Figur sowie 2) der potentielle Wegendpunkt (für Einzelheiten zur Analyse und Auswertung, Flecken et al. 2015). Abb. 3 zeigt die relative Häufigkeit von Fixationen auf der sich bewegenden Figur, mit Zeitpunkt 0 als Stimulusbeginn, für die drei Da die Sprecher in beiden Sprachen die Referenzen auf die Figur durchgängig in der ersten Satzposition geben, können Unterschiede in der Position der Figurbenennung in der sprachlichen Äußerung keine Quelle für Unterschiede in der visuellen Aufmerksamkeit vor Sprechanfangszeit sein.
Sprache und Kognition
339
Gruppen: L1 Französisch, L1 Deutsch und L2 Deutsch für die ersten 3000 msek nach Stimulusonset. Da die durchschnittliche Sprechanfangszeit bei 2390 msek liegt, wird so die Phase der präverbalen Sprachplanung erfasst.
Abbildung 3: Prozentzahl aller Fixationen in die AoI „Figur“ (die x-Achse stellt die Zeit von Stimulusonset bis 3000 msek dar)
Die Analyse über mehrere Zeitfenster von jeweils 600 msek zeigt, dass es zwischen 600 und 1200 msek einen Sprachunterschied gibt: die französischen Sprecher zeigen im Vergleich zu den deutschen Sprechern eine höhere Aufmerksamkeit auf die Figur. Die L2-Sprecher zeigen Muster, die eher den französischen L1-Sprechern als den deutschen L1-Sprechern ähneln. In späteren Zeitfenstern gab es keine signifikanten Unterschiede. Zusammenfassend ergibt sich folgendes Bild: Es zeigen sich gruppenbezogene Unterschiede in den Mustern visueller Aufmerksamkeit auf die Figur in den Videoclips. Französische Sprecher weisen einen höheren Aufmerksamkeitsgrad auf die sich bewegende Figur in einem Zeitfenster kurz nach Stimulusonset auf. Dasselbe Muster, wenn auch nicht so ausgeprägt, findet sich bei den L2-Sprechern. Die Befunde bestätigen damit die beiden oben formulierten Annahmen. Es zeigt sich ein Unterschied im Grad der visuellen Aufmerksamkeit auf die sich bewegende Figur zwischen deutschen und französischen Sprechern, wobei die französische Gruppe ein höheres Maß an Aufmerksamkeit aufweist. Die L2-Sprecher stehen dem Aufmerksamkeitsmuster ihrer L1 näher. Die Untersuchung der visuellen Aufmerksamkeit ermöglicht Rückschlüsse auf die kognitive Verarbeitung, die der Sprachplanung vorausgeht. Sprachspezifische Muster auf der Ebene der visuellen Wahrnehmung lassen den Schluss zu, dass bereits auf der Konzeptualisierungsebene einzelsprachliche Prinzipien zur Wirkung kommen. Die auf der
340
Monique Flecken und Christiane v. Stutterheim
sprachlichen Oberfläche beobachteten Unterschiede (z. B. im Gebrauch der Verbund Adjunkttypen) können damit nicht als unterschiedliche Formen einer im Prinzip zielsprachlichen Konzeptualisierung angesehen werden. Der Sprachverarbeitung geht ein sprachspezifischer Konzeptualisierungsprozess voraus. Die Lernerdaten aus der Blickbewegungsstudie zeigen, dass diese den in ihrer L1 präferierten Prinzipien der Konzeptualisierung folgen (konzeptueller Transfer).
2.5 Diskussion Die Ergebnisse der Sprachproduktionsstudie und der Blickbewegungsstudie konvergieren. Die Sprecher des Französischen konzeptualisieren Bewegungsereignisse von den Eigenschaften der sich bewegenden Figur aus. Dies hat Konsequenzen sowohl für die Wahl der Raumkonzepte, die für die sprachliche Wiedergabe ausgewählt werden, als auch für die Konzeptualisierung von Bewegungsart vorrangig als Eigenschaft. Deutsche Sprecher bauen Repräsentationen von Bewegungsereignissen ausgehend von den Spezifika des zurückgelegten Weges auf. Sie wählen entsprechende Konzepte zur Repräsentation eines Bewegungsereignisses aus. Die Figur liefert Artinformation, aber wird nicht zur Ableitung räumlicher Konzepte herangezogen. Dies korreliert mit dem geringeren Maß an visueller Aufmerksamkeit auf die Figur in den Blickbewegungsdaten der deutschen Probanden relativ kurz nach Stimulusonset, d. h. in die Phase, in der nach gegenwärtigem Forschungsstand die Konzeptualisierung der message stattfindet. Die fortgeschrittenen L2-Sprecher sind in den Mustern, die der Konstruktion der räumlichen Konzepte zu Grunde liegen, in ihren muttersprachlichen Prinzipien verhaftet, und dies, obwohl sie wesentliche lexikalische Mittel in der L2 erworben haben. Diese Befunde machen deutlich, dass mit dem Erwerb bestimmter sprachlicher Mittel – im vorliegenden Fall der Erwerb von Artverben im Deutschen als L2 – nicht notwendigerweise der Erwerb der konzeptuellen Implikationen der jeweiligen Formen und deren Zusammenführung in Prinzipien der Ereigniskonzeptualisierung verbunden ist.
Sprache und Kognition
341
3 Zum Einfluss grammatischer Strukturen auf die Konzeptualisierung von Bewegungsereignissen: Deutsch und Arabisch 3.1 Grammatischer Aspekt und Ereigniskonzeptualisierung In der Studie zur Raumkognition wurden sprachspezifische Effekte belegt, die auf einzelsprachliche Ausprägungen lexikalischer Strukturen zurückzuführen sind. Im Folgenden wird es um eine Studie gehen, in der der Einfluss grammatischer Strukturen auf Konzeptualisierungsprozesse untersucht wurde (v. Stutterheim et al. 2012, vgl. auch v. Stutterheim & Carroll 2006; Flecken, v. Stutterheim & Carroll 2014). Es geht wiederum um Bewegungsereignisse und deren visuelle Verarbeitung und Versprachlichung. Typologische Überlegungen stehen auch hier am Ausgangspunkt der Überlegungen. Im Bereich der Temporalität stellt der Aspekt eine Kategorie dar, die in vielen Sprachen grammatikalisiert ist. Sprachen werden daher typologisch in Aspektsprachen und Nicht-Aspektsprachen eingeordnet (vgl. Croft 2012; Klein 1994; Sasse 2002; Smith 1991). Aspektsprachen weisen im Verbalparadigma grammatikalisierte Formen zur Bezugnahme auf bestimmte Phasen eines Geschehens auf. Aspektsysteme können dabei unterschiedlich ausdifferenziert sein. Wesentlich ist, dass sie im Unterschied zu Nicht-Aspektsprachen Aussagen auf bestimmte (Teil)-Intervalle eines Ereignisses begrenzen. Eine wichtige Unterscheidung, die in vielen Aspektsprachen getroffen wird, ist die zwischen perfektiv und imperfektiv. Ein imperfektiv markierter Satz begrenzt die Aussage auf ein Teilintervall der dargestellten Situation, z. B. Peter is baking a cake im Englischen (‚Peter backt gerade einen Kuchen‘). Ein perfektiv markierter Satz bringt zum Ausdruck, dass eine Situation als zum Abschluss gekommen dargestellt wird, z. B. Peter has taken a shower (‚Peter hat sich geduscht‘). Eine Nicht-Aspektsprache, wie das Deutsche, ist in dieser Hinsicht unterspezifiziert. Ein Satz wie Das Kind rennt zum Spielplatz kann sich auf ein Teilintervall der Situation beziehen, aber auch das Ankommen auf dem Spielplatz mit zum Ausdruck bringen. In diesem Zusammenhang stellt sich nun die Frage, ob die grammatischen Unterschiede im Bereich des Aspekts Einfluss auf die Konzeptualisierung von Situationen haben und, wenn ja, wie L2-Sprecher entsprechende neue Konzeptualisierungsmuster erwerben. Um dies zu prüfen, wurden wiederum Experimente durchgeführt, in denen Verbalisierungsmuster von Sprechern unterschiedlicher Sprachen mit der Variable +/-Aspektsprache unter vergleichbaren Bedingungen erhoben wurden. Parallel dazu wurde auch das Blickbewegungsverhalten erfasst.
342
Monique Flecken und Christiane v. Stutterheim
Mit vergleichbarer Methode durchgeführte Untersuchungen zu fortgeschrittenen Lernern lassen Rückchlüsse darauf zu, ob Lerner ihre L1-Muster reorganisieren oder ob sie die L1-basierten Konzeptualisierungsmustern in die L2 transferieren.⁷ Welche Effekte grammatikalisierter Aspektmarkierung kann man auf die Konzeptualisierung von Bewegungsereignissen im Besonderen erwarten? Bewegungsereignisse sind dadurch gekennzeichnet, dass eine Figur sich von einem Ausgangsort (A) zu einem Zielort (Z) bewegt, sie also nach zwei Seiten räumlich und damit auch zeitlich begrenzt sind. Aspektkodierungen am Verb können unterschiedliche Phasen, und das heißt auch Wegabschnitte, in der Versprachlichung herausgreifen und damit hervorheben. Beispiele aus dem Englischen (Abb. 4) verdeutlichen einige Möglichkeiten, wobei die Klammerungen die mit der Aspektmarkierung jeweils zum Ausdruck gebrachten Phasen kennzeichnen; die Linien stellen den Weg zwischen Ausgangsort und Zielort dar.
Abbildung 4: Typen phasaler Zerlegung eines Ereignisses mittels verbalem Aspekt
Der Satz The driver was driving to the church (‚Der Fahrer fährt gerade zur Kirche‘) bezieht sich auf ein Teilintervall des Bewegungsereignisses, während The driver drove to the church (‚Der Fahrer fuhr zur Kirche‘) das Ereignis holistisch, d. h. den gesamten Weg von A bis Z darstellt. The driver has walked into the room (‚Der Fahrer ist in das Zimmer gelaufen und ist jetzt drin‘) wählt eine Phase aus, die nach dem Erreichen des Zielorts liegt. Für die Frage nach der Sprachspezifik von Konzeptualisierungsprozessen ist es wesentlich, dass Sprecher von Sprachen, in denen imperfektive und perfektive Formen grammatikalisiert sind, in ihren Ver Eine Reihe von Studien haben sich in den letzten Jahren mit dem Einfluss des Aspektsystems auf die Konzeptualisierung von Bewegungsereignissen befasst (z. B. Athanasopoulos & Bylund 2013; Schmiedtová, v. Stutterheim & Carroll 2011; v. Stutterheim & Carroll 2006; v. Stutterheim et al. 2012).
Sprache und Kognition
343
balisierungen von Bewegungsereignissen Grenzüberschreitungen am Ausgangspunkt oder Endpunkt eines Weges berücksichtigen müssen. Sind diese nicht beobachtbar oder gesichert, so kann mit der imperfektiven Form auf den Verlauf, das Unterwegssein (das obere Beispiel in Abb. 4), Bezug genommen werden. Wird dagegen eine Grenzerreichung oder -überschreitung wahrgenommen (z. B. Eine Person läuft in ein Haus hinein), so wird dieses Wegsegment mit dem perfektiven Aspekt sprachlich dargestellt (vgl. Schmiedtová & Sahonenko 2008; Schmiedtová, v. Sutterheim & Carroll 2011, zum Russischen). Wir illustrieren die Bedeutung aspektueller Markierungen an einem konkreten Beispiel.Wenn ein russischer und ein deutscher Sprecher eine Frau beobachten, die auf den Hauseingang eines Instituts zugeht, so wird der russische Sprecher den imperfektiven Aspekt zur Darstellung dieser Situation wählen, das heißt, Die Frau ist auf dem Weg. Der deutsche Sprecher kann die Situation mit dem Satz Eine Frau geht ins Institut darstellen. Hat die Frau das Institut erreicht, so muss der russische Sprecher den perfektiven Aspekt wählen. Die Frage, ob ein Endpunkt tatsächlich erreicht wird, ist für den russischen Sprecher im Unterschied zum deutschen Sprecher von entscheidender Bedeutung für die Wahl der Verbform. Ausgehend von diesen sprachtypologischen Unterschieden lässt sich die folgende Annahme über den Effekt aspektueller Kategorien auf die Konzeptualisierung und Verbalisierung von Bewegungsereignissen formulieren: Sprachen mit grammatikalisierten Aspekt werden Bewegungsereignisse, die in ihrem Verlauf ohne erreichten Zielpunkt gezeigt werden, in dieser Phase darstellen und einen potentiellen Endpunkt nicht weiter berücksichtigen. Sprachen, die keine grammatischen Mittel besitzen, um Phasen eines Ereignisses zu selegieren, werden letztere in ihrer Gesamtheit, d. h. im Falle von Bewegungsereignissen unter Einschluss eines potentiellen Endpunktes darstellen. Um diese Annahme zu prüfen, wurden experimentelle Untersuchungen durchgeführt (v. Stutterheim & Nüse, 2003; Carroll & v. Stutterheim 2006; v. Stutterheim et al. 2012; Flecken, v. Sutterheim & Carroll 2014).
3.2 Das Untersuchungsdesign Das Untersuchungsdesign entspricht weitgehend dem der vorangehend dargestellten Studie (vgl. die ausführliche Darstellung der Studien in v. Stutterheim et al. 2012; Flecken, v. Sutterheim & Carroll 2014). Es wurden Sprecher von sieben verschiedenen Sprachen verglichen. Die wesentliche Variable war die aspekttypologische Einordnung. Deutsch und Niederländisch bildeten die Gruppe der Nichtaspektsprachen; Englisch, Russisch, Spanisch und Modernes Standard
344
Monique Flecken und Christiane v. Stutterheim
Arabisch⁸ (im folgenden MSArabisch) bildeten die Gruppe der Aspektsprachen⁹. Den Probanden wurden kurze Videoclips gezeigt, die sie versprachlichen sollten. Das Stimulusmaterial bestand aus 60 Videoclips, 10 kritische Szenen zeigten Situationen, in denen eine Figur (Person oder Fahrzeug) sich auf einem Weg bewegte. Ein potentieller Zielpunkt war vorhanden, wurde aber nicht erreicht (siehe Beispiel oben in Abbildung1: eine Frau geht einen Weg entlang in Richtung eines Hochhauses). Zehn Kontrollszenen zeigten Bewegungsereignisse, in denen ein Zielpunkt von der Figur erreicht wurde (z. B. ein Auto fährt in eine Parkgarage). Diese 20 Videoclips waren in 40 Filler-Szenen eingebettet, in denen unterschiedliche Situationstypen (Zustände, z. B. eine Kerze brennt, Aktivitäten, z. B. Männer spielen Fußball, kausative Ereignisse, z. B. ein Mann schält Kartoffeln) dargestellt wurden. Die Probanden (N=20 pro Gruppe) wurden aufgefordert, mit der Versprachlichung zu beginnen, sobald sie die gezeigte Situation identifizieren konnten. Die sprachlichen Äußerungen der Probanden wurden aufgenommen und transkribiert. Während der Präsentation der Stimuli wurden Blickbewegungsmuster erhoben. Die Analyse berücksichtigt Dauer und Zahl der Fixationen auf potentiellen Endpunkten in den Videoclips (zum Beispiel, das Hochhaus in Abbildung 1). In der folgenden Darstellung beschränken wir uns auf die beiden Sprachen Deutsch und MSArabisch, die die beiden Pole der Grammatikalisierungsskala zwischen Aspektsprachen und Nichtaspektsprachen repräsentieren.¹⁰
3.3 Ergebnisse der Sprachproduktionsanalyse Für die Auswertung der Sprachproduktionsdaten wurde die Erwähnung eines räumlichen Endpunktes für die kritischen Szenen (Endpunkt (EP) nicht erreicht) sowie die Kontrollszenen (Endpunkt (EP) erreicht) kodiert. Während es keinen
Neben den zahlreichen Varietäten des Arabischen, die als Muttersprachen erworben werden, steht das MSArabische (MSA) als Bildungssprache. Das MSA ist vorwiegend eine Schriftsprache, wird aber in formellen Kontexten und in Medien auch gesprochen (vgl. zur Diskussion des Status des MSA v. Stutterheim, Bouhaous & Carroll 2017). Die Probanden in der hier dargestellten Studie verwendeten alle das MSA. Das Arabische als Fremdsprache wird in der Regel als MSA gelehrt. In der Studie waren auch Sprecher des Tschechischen aufgenommen. Für eine ausführliche Analyse der Sprachen in ihren spezifischen aspektuellen Eigenschaften vgl. v. Stutterheim et al. (2012). Für diese beiden Sprachen wurde in Flecken, v. Sutterheim & Carroll (2014) eine Reanalyse durchgeführt. Die ausführliche Studie zu den sieben Sprachen findet sich in v. Stutterheim et al. (2012).
Sprache und Kognition
345
Unterschied in Bezug auf die Kontrollszenen gab, zeigte sich für die kritischen Szenen ein signifikanter Unterschied zwischen den Sprachen (vgl. Abbildung 5)¹¹.
Abbildung 5: Erwähnung des Endpunkts durch Sprecher des Deutschen und MSArabischen für 2 Stimulustypen (vgl. Flecken, v. Stutterheim & Carroll 2014)
In der Kontrollbedingung (EP erreicht) werden von allen Sprechern erwartungsgemäß ähnlich häufig Endpunkte erwähnt. In der kritischen Bedingung (EP nicht erreicht) unterscheiden sich die Gruppen. Sprecher des Deutschen erwähnen Endpunkte signifikant häufiger als Sprecher des MSArabischen. Sprecher der Aspektsprache MSArabisch geben eher Rauminformation, die sich auf den Ort der Bewegung (z. B. Eine Frau läuft durch eine Landschaft) oder die Orientierung der sich bewegenden Figur (z. B. Eine Frau bewegt sich vorwärts) bezieht. Die von den Sprechern gezeigte Präferenz für eine spezifische Konzeptualisierung der Bewegungsereignisse korreliert somit mit dem Faktor grammatikalisierter Aspekt.
3.4 Ergebnisse der Blickbewegungsanalyse Die parallel erhobenen Blickbewegungsmuster weisen in dieselbe Richtung. Ausgewertet wurden Blicke auf die Region des potentiellen Endpunktes (z. B. das Hochhaus in Abbildung1). Als Parameter für die Messung wurden die Dauer und die Häufigkeit der Fixationen auf die Region während der gesamten Laufzeit der
Weitere Untersuchungen zum Norwegischen und Tschechischen bestätigen diese Befunde (vgl. die Zusammenfassung in Schmiedtová, v. Stutterheim & Carroll 2011). Auch Studien zum Schwedischen und Spanischen (Bylund & Jarvis 2011) führen zu vergleichbaren Ergebnissen.
346
Monique Flecken und Christiane v. Stutterheim
Videos herangezogen (vgl. Abbildung 6 für die Dauer der Fixationen auf Endpunkte in den Videoclips).
Abbildung 6: Dauer der Fixationen (in msek) auf der Region „Endpunkt“
Die Analyse zeigt eine Interaktion zwischen Sprache und Endpunkt-Bedingung: Der Unterschied zwischen EP nicht erreicht und EP erreicht im Deutschen ist größer als im MSArabischen. Man kann daraus entnehmen, dass die deutschen Sprecher den Endpunkten in der nicht-erreicht Bedingung mehr Aufmerksamkeit widmen als die arabischen Sprecher. Die Endpunkte wurden in der EP erreicht Bedingung insgesamt weniger fixiert, weil sie hochgradig evident waren und daher keine Überprüfung durch den Betrachter erforderlich war. In den Videos mit einem potentiellen Endpunkt dagegen war der Zielort nicht direkt als solcher zu erkennen, die Probanden waren durch diese Unklarheit bedingt generell in höheren Maße an dieser Komponente des Bewegungsereignisses interessiert.
3.5 Diskussion Die Ergebnisse zeigen eine Korrelation zwischen den sprachspezifischen Mustern in den Produktionsdaten und den Mustern der visuellen Aufmerksamkeit – diese Korrelation war für alle sieben Sprachen in der größeren Studie zu finden (v. Stutterheim et al. 2012). Wir schlussfolgern daraus, dass typologische Eigenschaften der jeweiligen Sprache die Auswahl der für die Darstellung ausgewählten Ereigniskomponenten beeinflussen. Die Auswahl der inhaltlichen Komponenten einer message erfolgt auf der Ebene der Konzeptualisierung. Sprachen, die bedingt durch die Kategorien des verbalen Aspektes eine obligatorische Markierung einer bestimmten Phase eines Geschehens erfordern, konzeptualisieren folglich
Sprache und Kognition
347
Ereignisse in Abhängigkeit von dieser Größe. Im Falle von Bewegungsereignissen bedeutet dies, dass auf der Grundlage des Wahrgenommenen bestimmte Wegsegmente versprachlicht werden können. Sprecher von Sprachen ohne Aspektmarkierung sind durch ihre Grammatik nicht dazu angehalten, eine temporale Perspektive zu wählen, und Ereignisse werden ganzheitlich, d. h. unter Einschluss eines möglichen Endpunkts konzeptualisiert. Diese Unterschiede zeigen sich in den visuellen Aufmerksamkeitsmustern der beiden Gruppen Aspekt/Nichtaspektsprachen.¹² In einem weiteren Experiment (Flecken, v. Stutterheim & Carroll 2014) wurde geprüft, ob sich diese sprachspezifischen Aufmerksamkeitsmuster auch in Kontexten zeigten, in denen keine Versprachlichungsaufgabe gegeben war. Es wurde untersucht, ob unsere Aufmerksamkeit, auch dann durch muttersprachliche Muster geprägt ist, wenn wir keine Sprechabsicht haben. Eine solche Studie führt über die Befunde eines Thinking for speaking hinaus, indem sprachspezifische Einflüsse auf nonverbale kognitive Prozesse untersucht werden. Um dies zu untersuchen, wurde die oben beschriebene Studie zur Versprachlichung von Bewegungsereignissen modifiziert. Die Stimuli wurden beibehalten, die Probanden waren je 20 deutsche und arabische L1 Sprecher. Es wurden wiederum die Blickbewegungsmuster auf die Stimuli registriert. Den Probanden wurde eine Distraktor-Aufgabe gestellt, die sich auf einfache Tonsignale bezog, die bei einigen Stimuli eingespielt wurden. Es wurde keine sprachliche Formulierung gefordert (vgl. zu Einzelheiten Flecken, v. Stutterheim & Carroll 2014). Auch in diesem Experiment zeigten die deutschen Probanden eine höhere Aufmerksamkeit auf die Region der Endpunkte in den Videoclips als die arabischen Probanden. Dieser Befund deutet darauf hin, dass Szenen der außersprachlichen Welt automatisch unter Rückgriff auf sprachstrukturell induzierte Prinzipien verarbeitet werden: die Komponenten, die unsere Aufmerksamkeit im Kontext der Sprachproduktion anziehen, spielen auch in nonverbalen Kontexten eine Rolle. Diese Befunde erhärten unsere Ausgangshypothese zum Zusammenhang zwischen Sprache und Kognition: mit dem Erwerb der L1 werden Präferenzen für bestimmte Muster der kognitiven Verarbeitung entwickelt, die hochgradig automatisiert und unabhängig von der jeweils spezifischen Aufgabe, eingesetzt werden.
Ein weiteres Verhaltensmaß für kognitive Prozesse bieten Gedächtnistests. In der hier vorgetragenen Studie (v. Stutterheim et al. 2012) wurde zusätzlich ein Gedächtnistest durchgeführt. Nach der Sprachproduktionsaufgabe wurden den Probanden Standbilder der Videos gezeigt, auf denen das potentielle Zielobjekt ausgeschnitten war. Die Ergebnisse bestätigen die Unterschiede zwischen den deutschen und den arabischen Sprechern. Die deutschen Sprecher erinnerten sich besser an die potentiellen Endpunkte als die Sprecher des MSArabischen (vgl. hierzu im Detail v. Stutterheim et al. 2012).
348
Monique Flecken und Christiane v. Stutterheim
Um die Tiefe der Verankerung und die Stabilität solcher sprachspezifischer Konzeptualisierungspräferenzen zu prüfen, sind auch hier Studien mit fortgeschrittenen Lernern aufschlussreich. Eine methodisch vergleichbar angelegte Studie mit sehr fortgeschrittenen L2-Sprechern des Sprachenpaares Deutsch (Nicht-Aspektsprache)-Englisch (Aspektsprache) (Sprachniveau C1) ergab ein komplexes Bild¹³ (vgl. v. Stutterheim & Carroll 2006, Schmiedtová,v. Stutterheim & Carroll 2011). Die Sprachproduktionsdaten bestätigen die Unterschiede zwischen den muttersprachlichen deutschen und den englischen Sprechern (n=20) bezüglich der Endpunkterwähnung: Die deutschen Sprecher erwähnen Endpunkte häufiger als die englischen Sprecher. Die L2-Sprecher nähern sich jedoch in unterschiedlicher Weise der jeweiligen Zielsprache an: Die englischen Lerner des Deutschen entsprechen bei der Berücksichtigung der potentiellen Endpunkte eher dem Muster ihrer L1, d. h. sie zeigen eine geringere Benennungsanzahl von Endpunkten als deutsche Muttersprachler. Demgegenüber benennen die deutschen Lerner des Englischen Endpunkte im L2-Englischen mit einer geringeren Frequenz als im Deutschen, d. h. sie nähern sich dem Muster an, das in der Zielsprache (Englisch) präferiert wird (phasale Zerlegung der Ereignisse, ohne Endpunkterwähnung). Die Befunde der englischen Lerner deuten auf konzeptuellen Transfer hin, die Gruppe der deutschen Lerner auf erfolgreiche Reorganisation. Offensichtlich stellen die Übergänge zwischen unterschiedlichen Typen der Ereigniskonzeptualisierung bezogen auf ein Sprachenpaar die Lerner jeweils vor mehr oder weniger schwierige Aufgaben.¹⁴ Es ist anzunehmen, dass der Grund hierfür in der Erkennbarkeit der sprachlichen Formen liegt, mit der bestimmte konzeptuelle Differenzierungen zum Ausdruck gebracht werden. Der grammatikalisierte Aspekt im Englischen ist für den Lerner auffällig und stellt dadurch eine vergleichsweise gut zu meisternde Lernaufgabe dar. Der Erwerb einer neuen grammatischen Kategorie führt den Lerner dazu, nach einer Funktion für diese neue Form zu suchen. In dem vorliegenden Fall wird der deutsche Lerner des Englischen nach einem funktionalen Unterschied zwischen der unmarkierten Form (walks) und der ingForm (is walking) suchen. Der Weg zum Erwerb der Unterscheidung zweier temporaler Perspektiven ist damit gewissermaßen vorbereitet, d. h. die Konzeptualisierung von Phasen eines Geschehens wird dem Lerner durch die grammatikalisierte und damit obligatorische Markierung des Aspekts zugänglich gemacht. Der Lerner des Deutschen findet keine korrespondierende Form, die das holistische Englisch war auch in der Studie v. Stutterheim et al. 2012 vertreten. Interessant ist in diesem Zusammenhang die Studie von Schmiedtová & Sahonenko (2008), in der tschechische und russische Lerner des Deutschen untersucht wurden. Es handelte sich ebenfalls um eine Sprachproduktionsstudie zum Ausdruck von Bewegungsereignissen. Hier zeigten beide Lernergruppen eine weitgehend L1-bestimmte Ereigniskonstruktion in der L2.
Sprache und Kognition
349
Ereigniskonzept in spezifischer Weise kennzeichnet; der Lerner wird durch keine Form angeleitet, die von deutschen Sprechern präferierte ganzheitliche Konzeptualisierung von Ereignissen aufzunehmen. Der Unterschied zwischen der L1 und L2 ist damit für den englischen L2-Sprecher des Deutschen weniger evident. Hierin liegt ein Faktor, der die unterschiedlichen Befunde zu konzeptuellem Transfer zwischen Sprachen erklären kann.
4 Allgemeine Diskussion Führen wir zunächst die Befunde aus den beiden L2 Studien zusammen, so zeigt sich, dass der Umfang des konzeptuellen Transfers in Abhängigkeit von den jeweiligen L1-L2-Sprachpaaren sowie der maßgeblichen kognitiven Domäne variiert. Die Ergebnisse der empirischen Untersuchungen deuten auf zwei mögliche Erklärungsfaktoren hin. Ein Faktor liegt in dem Grad der Eindeutigkeit in der Korrespondenz zwischen sprachlicher Form und Konzeptualisierungsmuster und die damit verbundene Obligatorik der sprachlichen Markierung einer bestimmten konzeptuellen Kategorie. Dies zeigt sich auf der Lexikonebene im Bereich raumtypologischer Konzepte, wo klare Unterschiede im Bereich lexikalisierter Bedeutungen zwischen Sprachen vorliegen: Der Übergang von der Verwendung von Wegverben zu Artverben wird von L2-Lernern in diesem Bereich vollzogen. Auch grammatisch ausgedrückte Konzepte,wie sie in verbalen Aspektsystemen gegeben sind, werden erworben. Die Lerner haben gewissermaßen keinen Ausweg, mit dem sie den Erwerb dieser Formen umgehen könnten. Die damit verbundenen begrifflichen Differenzierungen werden damit dem Lerner zugänglich gemacht. Der zweite Faktor liegt in der Komplexität der zu erwerbenden konzeptuellen Struktur. Wie der Vergleich zwischen dem Französischen und Deutschen illustriert hat, bestehen die Unterschiede nicht nur auf der Ebene der in einzelnen lexikalischen oder grammatischen Einheiten ausgedrückten begrifflichen Kategorien. Vielmehr konvergieren diese zu sprachspezifischen Prinzipien der Konzeptualisierung größerer kognitiver Einheiten, wie zum Beispiel eine entweder figur- oder grundbezogene Konzeptualisierung eines Bewegungsereignisses, was zu bestimmten Mustern der Versprachlichung auf der Satzebene führt (z. B. die präferierte Kombination von Artverben mit Lokalisierungsadjunkten im Französischen, und die Abwesenheit einer solchen Einschränkung im Deutschen). Sich diese Ebene in einer L2 zu erschließen, stellt eine erheblich schwierigere Aufgabe dar. Betrachtet man die Ergebnisse der beiden Studien, so wird deutlich, dass auch die sehr fortgeschrittenen L2-Sprecher die Prinzipien der Ereigniskonzeptualisierung in der L2 nicht immer vollständig erwerben. Da diesen Prinzipien keine 1 zu 1 Korrelate auf der Formebene entsprechen, sind sie im L2-Erwerb schwierig zu
350
Monique Flecken und Christiane v. Stutterheim
entdecken, zu überschreiben oder zu reorganisieren. Diese Tatsache führt zu L2Ereignisbeschreibungen, die zwar formal nicht „falsch“ oder ungrammatisch sind, aber konzeptuell nicht den zielsprachlichen Mustern entsprechen. Die in der Phase der Konzeptualisierung zu lösenden Aufgaben der Informationsselektion, -strukturierung und Perspektivenwahl werden durch muttersprachliche Prinzipien gesteuert. Sprachvergleichende Untersuchungen bilden die Grundlage, um mögliche Transferprozesse dieser komplexen Natur zu identifizieren. In den hier dargestellten Studien wurde unter Einsatz experimenteller Methoden zur Erfassung von online Verarbeitungsprozessen für den Bereich der Bewegungsereignisse gezeigt, dass die grammatische und lexikalische Struktur einer Sprache Vorgaben für die Informationsorganisation einer Äußerung macht. Die begrifflichen Kategorien, die in der Sprache grammatikalisiert oder lexikalisiert sind, bieten ein „Gerüst“ für die Aufmerksamkeitslenkung während der Wahrnehmung eines Stimulus und während der Konzeptualisierung von Sprachinhalten – ein Prozess, den wir als Seeing for speaking bezeichnen (v. Stutterheim et al. 2012). Die Sprache funktioniert hier als Filter. Mit der Methode der Blickbewegungsmessung während der Beschreibung von Videoclips konnte gezeigt werden, dass die L1 die visuelle Verarbeitung eines Stimulus beeinflusst. Die Studie zum Blickbewegungsverhalten im Rahmen einer nonverbalen Aufgabe lässt vermuten, dass sprachliche Konzeptualisierungsmuster generell zu Präferenzen in der Aufmerksamkeitslenkung führen können. Die Studien konkretisieren damit die Aussage, dass der L2Erwerb nicht nur als Erwerb sprachlicher Formen und Strukturen anzusehen ist. Eine erhebliche Herausforderung für den Lerner besteht darin, die automatisierten Verarbeitungsmuster, die auf die Strukturen der L1 zugeschnitten sind und sich von L2-Mustern unterscheiden, zu reorganisieren und im Prozess der Sprachverarbeitung zu überschreiben. Die hier dargestellten Studien haben uns einen Blick auf Phänomene des L2Gebrauchs geöffnet, die in der Forschung bisher sehr wenig Berücksichtigung fanden und in Sprachlehrbüchern kaum thematisiert werden. Es geht um diejenige Teilkomponente unseres Sprachwissens, das die Verwendungsbedingungen bestimmter Formen im Kontext komplexerer sprachlicher Strukturen umfasst. Schwierigkeiten beim Gebrauch einer fremden Sprache liegen hier insbesondere im Bereich der grammatischen Ausdrucksmittel. Es ist bekannt, dass beispielsweise das Aspektsystem des Englischen oder des Japanischen in seinen Anwendungsbedingungen kaum je vollständig von Lernern gemeistert werden. Ebenso notorisch sind die Schwierigkeiten, die mit dem Gebrauch von Artikelsystemen verbunden sind oder auch mit Wortstellungsmustern, dort, wo sie nicht grammatisch fest geregelt sind. Das Problem liegt zunächst darin, dass wir die Prinzipien der Sprachverwendung selbst für die sehr gut beschriebenen Sprachen
Sprache und Kognition
351
nicht hinreichend verstanden haben. Fragt ein französischer Deutschlerner danach, warum der Satz Das Auto fährt (zur Beschreibung eines singulären Bewegungsereignisses) im Deutschen unvollständig ist, der Satz Der Mann humpelt dagegen nicht, so wird er letztlich keine befriedigende Antwort bekommen. Gullberg (2011) fasst den gegenwärtigen Stand wie folgt zusammen: „This substantial literature notwithstanding, we know surprisingly little about whether L2 speakers reorganize conceptual representations towards a target, and what the reconceptualization process looks like. That is, it remains unclear whether L2 speakers redirect their attention to different types of information and shift preferences in both what to talk about and how to do it and whether shifts and adjustments are gradual or wholesale. (2011:146)“. Hier weist ein Ansatz, der das sprachliche Produkt auf die erforderlichen Verarbeitungsprozesse und damit auf kognitive Prozesse zurückführt, neue Wege. Die Frage nach den Prozessen erfordert Methoden, die es ermöglichen, Wahrnehmung, Gedächtnis und mentale Sprachverarbeitungsprozesse zu erfassen. Hierfür haben sich experimentelle Methoden aus der Psycholinguistik und der Neurolinguistik als aufschlussreich erwiesen. Wir stehen mit dieser Forschung am Anfang. Die L2-Erwerbsforschung bietet ein interessantes Fenster, insofern als im L2-Gebrauch Prinzipien der Konzeptualisierung, des Thinking for speaking, und der Sprachverarbeitung nicht automatisiert zusammenspielen wie bei einem muttersprachlichen Sprecher. Empirische Studien, wie die oben dargestellten, illustrieren den Weg, der zu beschreiten ist, um besser zu verstehen, welche Lernaufgaben sich dahinter verbergen, wenn man von der Notwendigkeit der konzeptuellen Reorganisation im L2-Erwerb spricht.
Literaturangaben Athanasopoulos, Panos & Emanual Bylund (2013): Does Grammatical Aspect Affect Motion Event Cognition? A Cross-Linguistic Comparison of English and Swedish Speakers. Cognitive Science 37 (2), 286 – 309. Beavers, John, Beth Levin & Shiao W. Tham (2010): The typology of motion expressions revisited. Journal of Linguistics 46 (2), 331 – 377. Benazzo, Sandra, Monique Flecken & Efstathia Soroli (Hrsg.) (2012): Typological perspectives on language and thought: Thinking for speaking in L2. Special issue of Language, interaction and acquisition 3 (2). Berman, Ruth A. & Dan Isaac Slobin (1994): Relating Events in Narrative: A Crosslinguistic Developmental Study. Hillsdale, New Jersey: Lawrence Erlbaum. Bock, J. Kathryn, David E. Irwin & Douglas J. Davidson (2004): Putting first things first. In John M. Henderson & Fernanda Ferreira (Hrsg.), The interface of language, vision, and action: Eye movements and the visual world, 249 – 278. New York: Psychology Press.
352
Monique Flecken und Christiane v. Stutterheim
Bohnemeyer, Jürgen, Nicholas J. Enfield, James Essegbey, Iraide Ibarretxe-Antuñano, Sotaro Kita, Friedrich Lüpke & Felix K. Ameka (2007): Principles of event segmentation in language: The case of motion events. Language 83 (3), 495 – 532. Bowerman, Melissa & Soonja Choi (2003): Space under construction: Language specific spatial categorization in first language acquisition. In Dedre Gentner & Susan Goldin-Meadow (Hrsg.), Language in mind: Advances in the study of language and cognition, 387 – 428. Cambridge: Massachusetts Institute of Technology Press. Bylund, Emanuel (2009): Effects of age of L2 acquisition on L1 event conceptualization patterns. Bilingualism: Language and Cognition 12 (3), 305 – 322. Bylund, Emanuel & Scott Jarvis (2011): L2 effects on L1 event conceptualization. Bilingualism: Language and Cognition 14 (1), 47 – 59. Cadierno, Teresa (2004): Expressing motion events in a second language: A cognitive typological approach. In Michel Achard & Susanne Neimeier (Hrsg.), Cognitive Linguistics, Second Language Acquisition and Foreign Language Pedagogy, 13 – 49. Berlin: de Gruyter. Cadierno, Teresa (2010): Motion in Danish as a second language: Does the learner’s L1 make a difference? In ZhaoHong Han & Teresa Cadierno (Hrsg.), Linguistic relativity in second language acquisition: Thinking for speaking, 1 – 33. Clevedon: Multilingual Matters. Cadierno, Teresa & Lucas Ruiz (2006): Motion events in Spanish L2 acquisition. Annual Review of Cognitive Linguistics 4, 183 – 216. Carroll, Mary (2000): Representing path in language production in English and German: Alternative perspectives on Figure and Ground. In Christopher Habel & Christiane von Stutterheim (Hrsg.), Räumliche Konzepte und sprachliche Strukturen, 97 – 118. Tübingen: Niemeyer. Carroll, Mary, Christiane von Stutterheim & Ralf Nüse (2004): The language and thought debate: A psycholinguistic approach. In Christopher Habel & Thomas Pechmann (Hrsg.), Approaches to Language Production, 183 – 218. Berlin: de Gruyter. Carroll, Mary & Christiane von Stutterheim (2006): The impact of grammaticalised temporal categories on ultimate attainment in advanced L2-acquisition. In Heidi Byrnes (Hrsg.), Educating for advanced foreign language capacities: constructs, curriculum, instruction, assessment, 40 – 53. Washington, DC: Georgetown University Press. Carroll, Mary, Katja Weimar, Monique Flecken, Monique Lambert & Christiane von Stutterheim (2012): Tracing trajectories: motion event construal by advanced L2 French-English and L2 French-German speakers. Language Interaction & Acquisition 3 (2), 202 – 230. Cook, Vivian & Benedetta Bassetti (Hrsg.) (2011): Language and Bilingual Cognition. New York: Psychological Press. Croft, William (2012): Verbs: Aspect and Clausal Structure. Oxford: Oxford University Press. Dahl, Osten (1985): Tense and aspect systems. Oxford: Blackwell. Daller, Michael H., Jeanine Treffers-Daller & Reyhan Furman (2011): Transfer of conceptualization patterns in bilinguals: The construal of motion events in Turkish and German. Bilingualism: Language and Cognition 14 (1), 95 – 119. Flecken, Monique (2011): Event conceptualization by early bilinguals: Insights from linguistic and eye tracking data. Bilingualism: Language & Cognition 14 (1), 61 – 77. Flecken, Monique, Christiane von Stutterheim & Mary Carroll (2014): Grammatical aspect influences motion event perception: evidence from a cross-linguistic, non-verbal recognition task. Language and Cognition 6, 45 – 78.
Sprache und Kognition
353
Flecken, Monique, Mary Carroll, Katja Weimar & Christiane von Stutterheim (2015): Driving along the road or heading for the village? Conceptual differences underlying motion event perception and description in French, German and French-German L2 Users. Modern Language Journal 99 (1), 100‐122. Gennari, Silvia P., Steven A. Sloman, Barbara C. Malt & W. Tecumseh Fitch (2002): Motion events in language and cognition. Cognition 83, 49 – 79. Griffin, Zenzi M. & Kathryn Bock (2000): What the eyes say about speaking. Psychological Science 11 (4), 274 – 279. Gullberg, Marianne (2011): Thinking, speaking and gesturing about motion in more than one language. In Aneta Pavlenko (Hrsg.), Thinking and Speaking in Two Languages, 143 – 169. Bristol: Multilingual Matters. Han, ZhaoHong & Teresa Cadierno (Hrsg.) (2010): Linguistic relativity in SLA: Thinking for speaking. Clevedon: Multilingual Matters. Henderson, John & Fernanda Ferreira (Hrsg.) (2004): The Interface of Language, Vision, and Action: Eye Movements and the Visual World. New York: Psychological Press. Hohenstein, Jill, Ann Eisenberg & Letitia Naigles (2006): Is he floating across or crossing afloat? Cross-influence of L1 and L2 in Spanish–English bilingual adults. Bilingualism: Language and Cognition 9 (3), 249 – 261. Jarvis, Scott & Aneta Pavlenko (2008): Crosslinguistic influence in language and cognition. New York, London: Routledge. Klein, Wolfgang (1994): Time in language. London: Routledge. Langacker, Ronald W. (2007): Cognitive Grammar. In Dirk Geeraerts & Hubert Cuyckens (Hrsg.), The Oxford Handbook of Cognitive Linguistics, 421 – 462. Oxford: Oxford University Press. Levelt, Willem J. M. (1989): Speaking: From intention to articulation. Cambridge: Massachusetts Institute of Technology Press. Levelt, Willem J. M. (1999): Producing spoken language: a blueprint of the speaker. In Peter Hagoort & Colin M. Brown (Hrsg.), The neurocognition of language, 94 – 122. Oxford: Oxford University Press. Loucks, Jeff & Eric Pederson (2011): Linguistic and non-linguistic categorization of complex motion events. In Jürgen Bohnemeyer & Eric Pederson (Hrsg.), Event representations in language and cognition, 108 – 133. Cambridge: Cambridge University Press. Norcliffe, Elisabeth, Agnieszka E. Konopka, Penelope Brown & Stephen C. Levinson (2015): Word order affects the time course of sentence formulation in Tzeltal. Language, Cognition and Neuroscience 30 (9), 1187 – 1208. Odlin, Terence (2005): Crosslinguistic influence and conceptual transfer: What are the concepts? Annual review of applied linguistics 25, 3 – 25. Papafragou, Anna, Christine Massey & Lila Gleitman (2002): Shake, rattle, ’n’ roll: The representation of motion in language and cognition. Cognition 84, 189 – 219. Pavlenko, Aneta (Hrsg.) (2011): Thinking and speaking in two languages. Bristol u. a.: Multilingual Matters. Pederson, Eric (2010): Cognitive Linguistics and Linguistic Relativity. In Dirk Geeraerts & Hubert Cuyckens (Hrsg.), The Oxford Handbook of Cognitive Linguistics, 1012 – 1044. Oxford: Oxford University Press. Pourcel, Stéphanie & Anetta Kopecka (2006): Motion Events in French: Typological Intricacies. http://arslangulthese.free.fr/page_perso_telech/pourcel2c_kopecka_motion_events_in_french_typological_intricacies.pdf (20.04.16).
354
Monique Flecken und Christiane v. Stutterheim
Sasse, Hans Jürgen (2002): Recent activity in the theory of aspect: Accomplishments, achievements, or just non-progressive state? Linguistic Typology 6, 199 – 221. Sauppe, Sebastian, Elisabeth Norcliffe, Agnieszka E. Konopka, Robert D. Van Valin Jr. & Stephen C. Levinson (2013): Dependencies first: Eye tracking evidence from sentence production in Tagalog. In Markus Knauff, Michael Pauen, Natalie Sebanz & Ipke Wachsmuth (Hrsg.), Proceedings of the 35th Annual Meeting of the Cognitive Science Society, 1265 – 1270. Austin, TX: Cognitive Science Society. Schmiedtová, Barbara & Natascha Sahonenko (2008): Die Rolle des grammatischen Aspekts in Ereigniskodierung. In Patrick Grommes & Maik Walter (Hrsg.), Fortgeschrittene Lernervarietäten: Korpuslinguistik und Zweitspracherwerbsforschung, 45 – 71. Tübingen: Niemeyer. Schmiedtová, Barbara, Christiane von Stutterheim & Mary Carroll (2011): Language-specific patterns in event construal of advanced second language speakers. In Aneta Pavlenko (Hrsg.), Thinking and speaking in two languages, 66 – 107. Clevedon: Multilingual Matters. Slobin, Dan I. (1996): Two ways to travel: Verbs of motion in English and Spanish. In Masayoshi Shibatani & Sandra A. Thompson (Hrsg.), Grammatical Constructions: Their Form and Meaning, 195 – 220. Oxford: Clarendon Press. Slobin, Dan I. (2006): What makes manner of motion salient? Explorations in linguistic typology, discourse, and cognition. In Maya Hickmann & Susan Robert (Hrsg.), Space in languages: Linguistic systems and cognitive categories, 59 – 81. Amsterdam: John Benjamins. Smith, Carlota (1991): The Parameter of Aspect. Dordrecht: Kluwer. Soroli, Efstathia & Maya Hickmann (2010): Language and spatial representations in French and in English: evidence from eye-movements. In Giovanna Marotta, Alesandro Lenci, Linda Meini & Francesco Rovai (Hrsg.), Space in Language, 581 – 597. Pisa: Editrice Testi Scientifici. Stutterheim, Christiane von & Ralf Nüse (2003): Processes of conceptualization in language production: Language-specific perspectives and event construal. Linguistics 41 (5), 831 – 881. Stutterheim, Christiane von & Mary Carroll (2006): The impact of grammaticalised temporal categories on ultimate attainment in advanced L2-acquisition. In Heidi Byrnes (Hrsg.), Educating for advanced foreign language capacities: constructs, curriculum, instruction, assessment, 40 – 53. Washington, DC: Georgetown University Press. Stutterheim, Christiane von, Martin Andermann, Mary Carroll, Monique Flecken & Barbara Schmiedtová (2012): How grammaticized concepts shape event conceptualization in language production: Insights from linguistic analysis, eye tracking data and memory performance. Linguistics 50 (2), 833 – 867. Stutterheim, Christiane von, Monique Flecken & Mary Carroll (2013): Principles of information organization in language use: on the L2 acquisition of complex conceptual structures. International Review of Applied Linguistics 51 (2), 229 – 242. Stutterheim, Christiane von & Abassia Bouhaous (2016): Spatial categories in L2 acquisition. Heidelberg: Universität Heidelberg. Stutterheim, Christiane von, Abassia Bouhaous & Mary Carroll (2017): From Time to Space. Linguistics 55.
Sprache und Kognition
355
Talmy, Leonard (1985): Lexicalization Patterns: Semantic Structure in Lexical Forms. In Timothy Shopen (Hrsg.), Language Typology and Syntactic Description, Vol. III: Grammatical Categories and the Lexicon, 57 – 149. Cambridge: Cambridge University Press. Talmy, Leonard (1988): The relation of grammar to cognition. In Brygida Rudzka-Ostyn (Hrsg.), Topics in Cognitive Linguistics, 165 – 205. Amsterdam: John Benjamins. Talmy, Leonard (2000a): Toward a cognitive semantics. Vol. I: Concept structuring systems. Cambridge: Massachusetts Institute of Technology Press. Talmy, Leonard (2000b): Toward a cognitive semantics. Vol. II: Typology and process in concept structuring. Cambridge: Massachusetts Institute of Technology Press. Trueswell, John C. & Anna Papafragou (2010): Perceiving and remembering events cross-linguistically: Evidence from dual-task paradigms. Journal of Memory and Language 63, 64 – 82.