Alter und Input als Hauptfaktoren beim bilingualen Spracherwerb: Artikel und Nullargumente im Deutschen bei zweisprachigen Kindern [1 ed.] 9783737014786, 9783847114789


120 72 11MB

German Pages [323] Year 2022

Report DMCA / Copyright

DOWNLOAD PDF FILE

Recommend Papers

Alter und Input als Hauptfaktoren beim bilingualen Spracherwerb: Artikel und Nullargumente im Deutschen bei zweisprachigen Kindern [1 ed.]
 9783737014786, 9783847114789

  • 0 0 0
  • Like this paper and download? You can publish your own PDF file online for free in a few minutes! Sign Up
File loading please wait...
Citation preview

Interdisziplinäre Verortungen der Angewandten Linguistik

Band 4

Herausgegeben von Sylwia Adamczak-Krysztofowicz, Silvia Bonacchi, Przemysław Ge˛bal, Jarosław Krajka, Łukasz Kumie˛ga und Hadrian Lankiewicz

Die Bände dieser Reihe sind peer-reviewed.

Aldona Sopata

Alter und Input als Hauptfaktoren beim bilingualen Spracherwerb Artikel und Nullargumente im Deutschen bei zweisprachigen Kindern

Mit 19 Abbildungen

V&R unipress

Bibliografische Information der Deutschen Nationalbibliothek Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über https://dnb.de abrufbar. Die Publikation wurde von der Abteilung für Sprache und Literatur der Adam-Mickiewicz-Universität Poznan´ finanziert. Gutachterinnen: Prof. Dr. Britta Hufeisen (Technische Universität Darmstadt), Prof. Dr. Magdalena Olpin´ska-Szkiełko (Universität Warschau) © 2022 Brill | V&R unipress, Theaterstraße 13, D-37073 Göttingen, ein Imprint der Brill-Gruppe (Koninklijke Brill NV, Leiden, Niederlande; Brill USA Inc., Boston MA, USA; Brill Asia Pte Ltd, Singapore; Brill Deutschland GmbH, Paderborn, Deutschland; Brill Österreich GmbH, Wien, Österreich) Koninklijke Brill NV umfasst die Imprints Brill, Brill Nijhoff, Brill Hotei, Brill Schöningh, Brill Fink, Brill mentis, Vandenhoeck & Ruprecht, Böhlau, V&R unipress und Wageningen Academic. Alle Rechte vorbehalten. Das Werk und seine Teile sind urheberrechtlich geschützt. Jede Verwertung in anderen als den gesetzlich zugelassenen Fällen bedarf der vorherigen schriftlichen Einwilligung des Verlages. Umschlagabbildung: Olga und Antoni Sopata, Ein Baum im Zitadellenpark in Poznan´ Vandenhoeck & Ruprecht Verlage | www.vandenhoeck-ruprecht-verlage.com ISSN 2749-0211 ISBN 978-3-7370-1478-6

Inhalt

Danksagung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

9

. . . .

. . . .

11 11 15 19

Kapitel 2: Altersfaktor – Simultaner vs. Sukzessiver Spracherwerb . . . 2.1 Zu den Faktoren des Spracherwerbs . . . . . . . . . . . . . . . . . 2.2 Altersfaktor als einer der wichtigsten Faktoren des Spracherwerbs 2.3 Altersbedingte Unterschiede beim Spracherwerb . . . . . . . . . . 2.4 Hypothesen zur konzeptuellen Verankerung des Altersfaktors . . 2.5 Simultaner Erwerb von zwei Sprachen . . . . . . . . . . . . . . . . 2.5.1 Simultan bilingualer Erwerb als Entwicklung von zwei selbständigen Sprachsystemen . . . . . . . . . . . . . . . . . 2.5.2 Zwischensprachliche Einflüsse beim simultan bilingualen Spracherwerb . . . . . . . . . . . . . . . . . . . . . . . . . . 2.5.3 Sprachdominanz beim simultan bilingualen Spracherwerb . 2.6 Sukzessiver Spracherwerb . . . . . . . . . . . . . . . . . . . . . . 2.6.1 Altersgrenze zwischen simultan und sukzessiv bilingualem Erwerb . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.6.2 Unterschiede zwischen simultan und sukzessiv bilingualem Erwerb . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.7 Zur Interaktion des Altersfaktors mit anderen Faktoren . . . . . .

. . . . . .

23 23 25 26 30 39

.

40

. . .

42 45 48

.

49

. .

52 54

Kapitel 3: Inputfaktor – Mehrheitssprache vs. Herkunftssprache 3.1 Zur Bedeutung des Inputs beim Spracherwerb . . . . . . . 3.2 Begriffsbestimmung . . . . . . . . . . . . . . . . . . . . . . 3.3 Input als Faktorenkomplex . . . . . . . . . . . . . . . . . .

. . . .

57 57 59 60

Kapitel 1: Einleitung . . . . . . . . . . . . . . . . . . . 1.1 Sprache und Zweisprachigkeit . . . . . . . . . . . 1.2 Deutsch-polnische Zweisprachigkeit . . . . . . . . 1.3 Forschungsgegenstand und Zielsetzung der Arbeit

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

6

Inhalt

3.4 Inputmenge . . . . . . . . . . . . . . . . . . . . . . . . . 3.4.1 Messung der Inputmenge . . . . . . . . . . . . . . . 3.4.2 Einfluss der Inputmenge auf den Spracherwerb . . . 3.5 Kontext des Inputs – Herkunftssprache (HS) vs. Mehrheitssprache (MS) . . . . . . . . . . . . . . . . . . . 3.5.1 Begriffsbestimmung . . . . . . . . . . . . . . . . . . 3.5.2 Endzustand des Erwerbs der Herkunftssprache . . . 3.5.3 Erwerb der Herkunftssprache . . . . . . . . . . . . 3.6 Zeitpunkt des Beginns der Mehrheitssprachenexposition

. . . . . . . . . . . . . . . . . .

63 63 67

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

69 69 73 77 81

Kapitel 4: Referenz, Artikel und Nullargumente im Deutschen 4.1 Begriffsbestimmung . . . . . . . . . . . . . . . . . . . . . 4.1.1 Referenz und referentielle Ausdrücke . . . . . . . . 4.1.2 (In)Definitheit . . . . . . . . . . . . . . . . . . . . . 4.1.3 Spezifizität . . . . . . . . . . . . . . . . . . . . . . . 4.1.4 Nullargumente . . . . . . . . . . . . . . . . . . . . . 4.2 Theorie der Referenz . . . . . . . . . . . . . . . . . . . . 4.3 Theorie der syntaktischen Etappe der Referenz . . . . . . 4.4 Artikel im Deutschen . . . . . . . . . . . . . . . . . . . . 4.5 Nullargumente im Deutschen . . . . . . . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

85 85 85 86 88 91 94 101 104 108

. . . . . . . . . .

113 113

. . . . . . . . .

Kapitel 5: Artikel und Nullargumente im Spracherwerb . . . . . 5.1 Erwerb der Referenz . . . . . . . . . . . . . . . . . . . . . 5.1.1 Sprachliche und kognitive Elemente beim Erwerb der Referenz . . . . . . . . . . . . . . . . . . . . . . . . . 5.1.2 Referenz im monolingualen Erwerb . . . . . . . . . . 5.1.3 Referenz im bilingualen Erwerb . . . . . . . . . . . . 5.2 Erwerb der Artikel . . . . . . . . . . . . . . . . . . . . . . . 5.2.1 Artikel im monoligualen Erwerb . . . . . . . . . . . . 5.2.2 Artikel im bilingualen Erwerb . . . . . . . . . . . . . 5.3 Erwerb von Nullargumenten . . . . . . . . . . . . . . . . . 5.3.1 Nullargumente im monolingualen Erwerb . . . . . . 5.3.2 Nullargumente im bilingualen Erwerb . . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

113 115 118 120 120 125 132 132 137

Kapitel 6: Methodologie der empirischen Untersuchungen . . . . . . 6.1 Fragestellung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.2 Probanden . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.3 Untersuchungsmethoden . . . . . . . . . . . . . . . . . . . . . . 6.3.1 Grammatikalitätsurteile (Grammaticality Judgment Task) – GJT . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

. . . .

. . . .

143 143 145 155

. .

157

. . . . . . . . .

7

Inhalt

. . . .

159 161 162 165

. . . . . . . . .

169 169 174 178 186 188 191 195 198

Kapitel 8: Untersuchungsergebnisse – Nullargumente im Deutschen bei zweisprachigen Kindern . . . . . . . . . . . . . . . . . . . . . . . . . . . 8.1 GJT-Ergebnisse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8.2 FCT-Ergebnisse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8.3 SRT-Ergebnisse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8.4 Statistische Analyse der Reaktionszeit . . . . . . . . . . . . . . . . . 8.5 Logistische Regressionsanalyse der Faktoren . . . . . . . . . . . . . 8.6 Zusammenfassung der Ergebnisse zu Nullargumenten . . . . . . . .

201 201 205 212 219 221 223

6.3.2 Aufgabe der erzwungenen Wahl (Forced Choice Task) – FCT 6.3.3 Satzwiederholung (Sentence Repetition Task) – SRT . . . . . 6.3.4 Rezeptive Aufgaben – Bildausmalen und Bildwahl . . . . . . 6.4 Datenauswertungsverfahren . . . . . . . . . . . . . . . . . . . . . Kapitel 7: Untersuchungsergebnisse – Artikel im Deutschen bei zweisprachigen Kindern . . . . . . . . . . . . . . . . . . . . . . 7.1 GJT-Ergebnisse . . . . . . . . . . . . . . . . . . . . . . . . 7.2 FCT-Ergebnisse . . . . . . . . . . . . . . . . . . . . . . . . 7.3 SRT-Ergebnisse . . . . . . . . . . . . . . . . . . . . . . . . 7.4 Ergebnisse der Aufgabe zum Bildausmalen . . . . . . . . . 7.5 Ergebnisse der Aufgabe der Bildwahl . . . . . . . . . . . . 7.6 Statistische Analyse der Reaktionszeit . . . . . . . . . . . . 7.7 Logistische Regressionsanalyse der Faktoren . . . . . . . . 7.8 Zusammenfassung der Ergebnisse zu den Artikeln . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

Kapitel 9: Interpretation der Ergebnisse der Untersuchung zu Artikeln und Nullargumenten im Deutschen bei zweisprachigen Kindern . . . . 9.1 Einschätzung der allgemeinen Sprachkompetenz der Kinder . . . 9.1.1 Allgemeine Korrektheit der Wiederholungen . . . . . . . . . 9.1.2 Allgemeine Exaktheit der Wiederholungen . . . . . . . . . . 9.1.3 Reaktionszeit in den Beurteilungsaufgaben . . . . . . . . . . 9.2 Beantwortung der Forschungsfragen . . . . . . . . . . . . . . . . . 9.3 Diskussion der Ergebnisse zu Artikeln und Nullargumenten im Deutschen bei zweisprachigen Kindern . . . . . . . . . . . . . . . 9.3.1 Diskussion der Ergebnisse zu den Artikeln . . . . . . . . . . 9.3.2 Diskussion der Ergebnisse zu den Nullargumenten . . . . . . 9.3.3 Interpretation der Ergebnisse zu Artikeln und Nullargumenten im Deutschen bei zweisprachigen Kindern vor dem Hintergrund der bisherigen Forschung . . . . . . .

. . . . . .

227 227 228 230 232 234

. . .

242 242 247

.

251

8

Inhalt

9.4 Interpretation der Ergebnisse im Hinblick auf die Rolle der Faktoren Alter und Input . . . . . . . . . . . . . . . . . . . . . . . .

255

Kapitel 10: Zusammenfassung und Ausblick . . . . . . . . . . . . . . . .

261

Summary . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

267

Literaturverzeichnis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

271

Anhänge . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

317

Danksagung

Die vorliegende Monographie ist im Rahmen des Forschungsprojekts Polnischdeutsche Zweisprachigkeit bei Kindern: Die Rolle des Alters bei Erwerbsbeginn für den langfristigen Spracherwerbserfolg (KiBi) entstanden. Auf der polnischen Seite ist das Forschungsprojekt von mir und auf der deutschen Seite von Prof. Dr. Bernhard Brehmer geleitet worden. Das Projekt ist vom Nationalen Forschungszentrum (NCN – 2014/15/G/HS6/04521) und von der Deutschen Forschungsgemeinschaft (DFG – 277135691) im Zeitraum 2016 bis 2020 finanziert worden. An dieser Stelle möchte ich all jenen danken, die an den Projektarbeiten teilgenommen haben. Mein besonderer Dank gilt zuerst Prof. Dr. Bernhard Brehmer für die reibungslose Zusammenarbeit bei der Projektrealisierung und viele unschätzbare wissenschaftliche Diskussionen. Weiterhin möchte ich mich bei allen Mitgliedern des polnischen und deutschen Projektteams, insbesondere bei Dr. Kamil Długosz, Anna Marko und Raina Gielge, bedanken, deren Engagement bei der Datenerhebung die Untersuchung der polnisch-deutsch zweisprachigen Kinder ermöglicht hat. Zu danken ist auch allen am KiBi-Projekt beteiligten Kindern und ihren Eltern in Polen und Deutschland, deren Daten den Grundstein für diese Arbeit gelegt haben. Während der Entstehung der vorliegenden Studie habe ich von vielen Seiten Inspiration bekommen und Unterstützung erfahren. Mein Dank gilt in erster Linie Prof. Dr. Waldemar Pfeiffer, der mich während unserer langjährigen Zusammenarbeit immer unterstützt hat, und Prof. Dr. Jürgen Meisel, der mich für das Thema der Zweisprachigkeit vor vielen Jahren begeistert hat. Für die äußerst gewinnbringende Begleitung bei der Ausarbeitung der letzten Fassung des Manuskripts bin ich den Gutachterinnen Prof. Dr. Britta Hufeisen und Prof. Dr. Magdalena Olpin´ska-Szkiełko dankbar. Für konstruktive Kommentare möchte ich mich ebenfalls bei Prof. Dr. Dominika Skrzypek und Prof. Dr. Bernhard Brehmer bedanken. Mein Dank gilt auch Dr. Nadja Zuzok für ihre unermüdliche Bereitschaft zum Korrekturlesen.

10

Danksagung

Danken möchte ich auch Prof. Dr. Maciej Karpin´ski, Prof. Dr. Narloch, Prof. Dr. Dominika Skrzypek und Prof. Dr. Krzysztof Stron´ski, die Mitglieder des Dekankollegiums der Neuphilologischen Fakultät der Adam-Mickiewicz-Universität in Posen in den Jahren 2016–2020 waren. Nur dank ihrer hervorragender Arbeit konnte ich trotz vieler Verpflichtungen als Dekanin der Fakultät immer noch genug Zeit für meine Forschung aufbringen und meinen eigenen wissenschaftlichen Interessen folgen. Letztendlich verdanke ich meinem Mann und meinen Kindern viel mehr, als sich an dieser Stelle sagen lässt. Ohne ihre Liebe, Geduld und ihren Glauben an mich wäre diese Arbeit nicht entstanden.

Kapitel 1: Einleitung

1.1

Sprache und Zweisprachigkeit

Sprache ist ein selbstverständlicher Bestandteil unseres Lebens. Sprechen ist eine der wesentlichen Fähigkeiten des Menschen und eine allen Menschen gemeinsame Eigenschaft. Bislang ist noch keine menschliche Kultur entdeckt worden, in der keine Sprache gesprochen worden wäre. Eben dadurch, dass Sprache ein nicht wegzudenkender Teil des menschlichen Lebens ist, ist es schwierig, sie zu erforschen und adäquat zu konzeptualisieren. Die Philosophie und die Sprachwissenschaft haben mehrere theoretische Zugänge zur Sprache über Jahrhunderte ausgearbeitet. Für die Spracherwerbsforschung ist die Auffassung der Sprache als Wissen konkreter Menschen, das ihre Fähigkeit zur Generierung von sprachlichen Äußerungen ausmacht, von besonderem Belang (vgl. Grucza, F., 1993, 2007a, 2007b). Schon W. von Humboldt (1963: 430) definiert Sprache als »Arbeit des Geistes«. Der Sprachwissenschaftler betont: »Erst im Individuum erhält die Sprache ihre letzte Bestimmtheit«. Auch J. Baudouin de Courtenay (1903: 334) erfasst Sprache als etwas, was nur innerhalb des menschlichen Gehirns existiere. In der anthropozentrischen Konzeption von Sprache von F. Grucza (1993, 2007a, 2007b, 2012) steht der Mensch mit seinen sprachlichen Fähigkeiten im Zentrum. Grucza lehnt Konzeptionen der Sprache ab, in denen sie als ideales abstraktes System außerhalb des Menschen aufgefasst wird. Dem Sprachwissenschaftler nach sind Sprachen »immer nur interne menschliche Eigenschaften, existieren nur wirklich (real), d. h. nicht ohne den Menschen« (Grucza, F., 2007a, 364). Die reale menschliche Sprache wird als Idiolekt bezeichnet1. Die Sprache ist demzufolge jenes Wissen einer Person, auf Grund dessen sie Strukturen bildet, sie für bestimmte Ziele verwendet, sie identifiziert, differenziert und interpretiert (vgl. Grucza, F., 1993: 31). 1 Im Gegensatz zum Polylekt, der als logische Summe der Idiolektmenge – der Sprache einer Gemeinschaft – aufgefasst wird (Grucza, F., 1993a: 159).

12

Einleitung

Als Konsequenz einer solchen Auffassung der Sprache ergibt sich die Einteilung der Linguistik in Zweige, die sich mit den realen menschlichen Sprachen beschäftigen und jene, die sich mit den intellektuellen Konstrukten befassen (vgl. Grucza, S., 2010: 43). Die Auffassung von Sprache als immanente Eigenschaft von konkreten Menschen hat ihre Folgen für die Überlegungen im Rahmen der angewandten Linguistik, insbesondere für die anthropozentrische Translatorik (Grucza, F., 1981,1984; Z˙mudzki, 2006, 2015, 2017), die Glottodidaktik2 (Grucza, F., 1978, 2004; vgl. auch Grucza, S., 1998, 2007, 2010; Dakowska, 2000; Sadownik, 1997, 1999, 2000; Olpin´ska-Szkiełko, 2008, 2009; Skowronek, 2013) und die Spracherwerbsforschung (Sopata, 2009). Der Forschungsgegenstand der Spracherwerbsforschung ist der Prozess des Erwerbs einer oder mehrerer Sprachen. Dabei wird im Rahmen der Disziplin gefragt, wie Menschen Sprache(n) erwerben, welche Prozesse den Entwicklungsweg bestimmen, und ob die Sprachentwicklung für verschiedene Sprecher und unterschiedliche Sprachen ähnlich verläuft. Zu den Hauptforschungsfragen der Spracherwerbsforschung zählen auch solche nach den Voraussetzungen für die Bewältigung der Erwerbsaufgabe, mit der die Sprecher ausgestattet sind, nach den Zusammenhängen zwischen Sprache und anderen kognitiven Fähigkeiten, nach den möglichen Störungen des Spracherwerbs und nach den Faktoren, die den Spracherwerb beeinflussen (vgl. Schulz & Grimm, 2012). Hinsichtlich der Art des Spracherwerbs wird zwischen dem Erwerb und dem Lernen einer Sprache in der Literatur unterschieden. Unter dem Spracherwerb wird ein natürlicher Prozess verstanden, dem implizite und unbewusste Mechanismen zugrunde liegen, wohingegen Lernen als gesteuerter expliziter Prozess aufgefasst wird. Die strikte Unterscheidung der Prozesse wird von einigen Forschern vorgeschlagen (Krashen, 1981; Zobl, 1995). Die exakte Unterscheidung der mentalen Prozesse ist jedoch sehr schwierig und die Grenze zwischen ihnen oft in der Wirklichkeit nicht zu erkennen. Der Terminus »Spracherwerb« wird daher in der vorliegenden Arbeit als Oberbegriff für jede Form von Aneignung von Sprache verwendet. Die Gegenüberstellung des Spracherwerbs und des Sprachenlernens geht mit dem Gegensatz zwischen Erwerbs- bzw. Lernkontext einher, der mit natürlicher vs. institutioneller Umgebung verbunden ist. Die theoretischen Reflexionen und empirischen Untersuchungen der vorliegenden Arbeit beziehen sich auf den Spracherwerb unter natürlichen Bedingungen, wobei allerdings die Implikatio2 Unter diesem Begriff wird die Wissenschaft von den Lehr- und Lernprozessen verstanden (vgl. Pfeiffer, 2001a). Das Forschungsziel der Glottodidaktik ist die Erforschung der Prozesse und die Herausarbeitung optimaler Systeme des Lehrens und Lernens von Sprache (vgl. Pfeiffer, 2001b: 67). Vgl. auch dazu Zawadzka (2000) und Lewicki (2013). Siehe Szczodrowski (2001, 2004, 2007) zur Glottodidaktik aus kodematischer und Lewicka (2007) aus konstruktivistischer Sicht.

Sprache und Zweisprachigkeit

13

nen für den Spracherwerb in institutioneller Umgebung nicht ausgeschlossen werden3. Das anthropozentrische Herangehen an natürliche Sprachen ist gerade bei Fragestellungen produktiv, die die sprachliche Ontogenese betreffen (vgl. Kotin, 2018)4. Die Erforschung der Entwicklung der Sprachkompetenz eines Kindes erkennt ihm die Rolle des Trägers der Sprache zu. Mit der anthropozentrischen Maxime geht auch die in der vorliegenden Arbeit vertretene Auffassung des Spracherwerbs als graduelle Entwicklung der Sprachstruktur im kindlichen Gehirn einher5. Während sich die allgemeine Linguistik vor allem auf die einsprachigen Sprecher konzentriert, sind in der modernen Spracherwerbsforschung häufig zweisprachige oder mehrsprachige Sprecher der Gegenstand der Forschung. Wenn einerseits die Sprache eines konkreten Menschen im ontologischen Sinne als konkrete Gegebenheit und dadurch als ein konkreter Wirklichkeitsbereich verstanden wird (siehe Grucza, S., 2011: 23), und wenn man andererseits bedenkt, dass vorsichtigen Schätzungen zufolge jeder zweite Mensch zweisprachig oder mehrsprachig ist, dann kann der zwei- oder mehrsprachige Mensch als Gegenstand der empirischen Untersuchungen und der theoretischen Reflexion im Rahmen der Spracherwerbsforschung keine Überraschung sein. Alle Sprachen, die ein Mensch erworben hat, machen ja »den unveräußerlichen Bestandteil seiner »idiolektalen Sprachfähigkeit« aus« (Kotin, 2018: 26)6. Spracherwerbsforscher plädieren daher dafür, dass der Mensch als mehrsprachiges Individuum ins Zentrum der sprachtheoretischen Überlegungen rückt (vgl. Meisel, 2013). Der Erörterung spracherwerblicher Wirklichkeit in der vorliegenden Arbeit wird die Konzeption von Sprache als individuelles sprachliches Wissenssystem im Sinne von Gruczas Idiolekt zugrunde gelegt. Unter der idiolektalen Sprachfähigkeit eines Menschen werden Kompetenzen und Regelsysteme aller Sprachen zusammengefasst, die ein Individuum erwirbt oder erworben hat. Das individuelle sprachliche Wissenssystem kann zwar nicht direkt beobachtet werden, aber es ist indirekt anhand des Sprachverhaltens zu erschließen.

3 Siehe Sadownik (1991, 1997) und Sopata (2009) zur Relation zwischen der Spracherwerbsforschung und Glottodidaktik. 4 Kotin (2018) bezieht sich in seinen Überlegungen zur anthropozentrischen Herangehensweise auf weitere Gebiete, vor allem auf die Sprachontologie und die Entwicklung natürlicher Sprachen, wobei der Phylogenese die größte Aufmerksamkeit geschenkt wird. 5 Vgl. Sopata (2008) zum Erstspracherwerb als sukzessive Ergänzung der Grammatik durch immer weitere Struktureinheiten am Beispiel des Deutschen und Polnischen. 6 Kotins (2018) Überlegungen betreffen jedoch eine Muttersprache und weitere Sprachen, die Fremdsprachen sind.

14

Einleitung

Obwohl Zwei- und Mehrsprachigkeit zunehmend als individuelle, gesellschaftliche und wirtschaftliche Ressource gesehen wird, gibt es keine allgemein gültige Definition der Mehrsprachigkeit. Einige Forscher gehen von sehr engen Definitionen aus, nach denen nur solche Menschen als mehrsprachig gelten, die eine muttersprachliche Kompetenz in mehreren Sprachen entwickelt haben (vgl. beispielweise Bloomfield, 1935). Eine weniger enge Definition, die auch der Auffassung der Zweisprachigkeit in der vorliegenden Arbeit zugrunde liegt, bezeichnet solche Menschen als mehrsprachig oder multilingual, die regelmäßig in mehreren Sprachen kommunizieren, gemäß der in der germanistischen Forschung weit verbreiteten Definition Oksaars (2003: 31): Mehrsprachigkeit ist die Fähigkeit eines Individuums, hier und jetzt zwei oder mehr Sprachen als Kommunikationsmittel zu verwenden und ohne weiteres von der einen in die andere umzuschalten, wenn die Situation es erfordert.

In den 90er Jahren des 20. Jahrhunderts ist eine wissenschaftliche Diskussion in Gang gesetzt worden, inwieweit die Modelle zum Zweitspracherwerb auch den Erwerb einer dritten Sprache oder einer noch weiteren Sprache abbilden können. Während einige Forscher nur eine Erweiterung der auf Zweitspracherwerb bezogenen Modelle um einige Elemente postulieren, die für den Drittspracherwerb spezifisch sind (vgl. z. B. de Bot, 2001), unterstreichen andere Forscher die Unterschiede zwischen dem Erwerb einer Zweitsprache und einer weiteren Sprache. Die Differenzen gehen vor allem mit zahlreicheren zwischensprachlichen Einflussmöglichkeiten einher, die durch das Vorhandensein von mehr als einer Sprache im Gehirn des Menschen verbunden sind, mit einer nachweislich höheren Bewusstheit in Bezug auf die Sprache(n) selbst und auf die eigene Mehrsprachigkeit (vgl. Hufeisen, 2003; Aronin & Hufeisen, 2009). Aus diesen Gründen wird in der vorliegenden Arbeit zwischen einer Zweisprachigkeit, bei der zwei Sprachen von einer Person simultan oder sukzessiv erworben werden, und einer Mehrsprachigkeit, bei der mehr als zwei Sprachen erworben werden, unterschieden. Die Zweisprachigkeit von Kindern ist ein besonders faszinierender Fall, der der Forschung ein breites Feld bietet. Grundlegende Fragen sind hier noch offen. Notwendigerweise müssen bei Kindern die altersspezifischen kognitiven Fähigkeiten, psychologische und emotionale Faktoren in noch stärkerem Maße als bei Erwachsenen berücksichtigt werden. Die Frage nach der Rolle des Alters und des Inputs bei der Entwicklung der Zweisprachigkeit im Kindesalter hat noch keine zufriedenstellende Antwort gefunden. Viele Sprachbereiche, besonders die, die an der Schnittstelle zwischen der Sprache und der Kognition liegen, sind noch nicht hinreichend im Falle der Zweisprachigkeit der Kinder erforscht worden. Die Faktorenbündelung, die bei der Zweisprachigkeit der Kinder zu sehen ist,

Deutsch-polnische Zweisprachigkeit

15

erzwingt eine ganze Reihe theoretischer und empirischer Arbeiten, die es ermöglichen, die Zweisprachigkeit von Kindern besser zu verstehen.

1.2

Deutsch-polnische Zweisprachigkeit

Die deutsch-polnische Zweisprachigkeit ist relativ selten Gegenstand der Untersuchungen im Rahmen der Spracherwerbsforschung. Diese Tatsache kann angesichts der großen Anzahl deutsch-polnisch zweisprachiger Personen und des häufigen deutsch-polnischen Sprachkontakts in Deutschland und in Polen verwundern7. In Deutschland wohnen ca. 2 Millionen Menschen mit Migrationshintergrund, die selbst oder deren Eltern in Polen geboren sind. Nach Angaben des Statistischen Bundesamts im Mikrozensus 2020 sind es genau 2 060 000 Menschen mit polnischem Migrationshintergrund. Damit steht diese Gruppe an zweiter Stelle nach der Bevölkerung mit türkischem Migrationshintergrund, die 2 757 000 zählt. Ca. 20 % der Gruppe mit polnischem Migrationshintergrund ist in Deutschland geboren, gehört also zur zweiten Generation der Migration. Die Gruppe mit polnischem Migrationshintergrund kann in zwei Untergruppen unterteilt werden. Die erste bilden die sog. Spätaussiedler, die auf Grund ihrer deutschen Abstammung früh in den 1950er, 1970er und 1980er Jahren von Polen nach Deutschland übersiedelt sind, oder die nach der Wende 1989 nach Deutschland umgezogen sind (vgl. Brehmer & Mehlhorn 2020). Das Deutsche genoss als Bildungssprache einen hohen Status in dieser Gruppe. Sie legten einen hohen Wert auf Assimilation und auf den Erwerb des Deutschen bei ihren Kindern, was mit dem Sprechen des Polnischen alleinig zuhause (auch eines Dialektes des Polnischen oder des Schlesischen8) oder mit dem Gebrauch des Polnischen und des Deutschen zuhause einherging (Rohfleisch, 2001)9. Der große Drang zur Assimilation in dieser Gruppe wird oft von ihren Kindern kritisiert, die in Interviews das Gefühl ausdrücken, nicht genug Kontakt zu ihrer

7 Im Gegensatz dazu steht eine lange und reiche Tradition der Untersuchungen des polnischdeutschen Sprachkontakts aus der Perspektive der Sprachkontaktforschung. Vgl. Ka˛tny (1990) zur Auswahlbibliographie zum polnisch-deutschen Sprachkontakt, siehe Urban´czyk (1987) zu deutsch-polnischen Sprachkontakten im 19. Jh. und auch später beispielsweise Piotrowski (1981), Lipczuk (2001), Kocyba (2007), Ka˛tny (2012). Siehe auch Wiktorowicz (2001) zur Geschichte der deutsch-polnischen Sprachbeziehungen sowie Wiktorowicz (2002) zur Widerspiegelung der deutsch-ponischen Nachbarschaft im Polnischen. 8 Der Status des Schlesischen steht noch unter Debatte. 9 Über den Gebrauch von Dialekten in den Migrationssituationen wird in der einschlägigen Literatur oft berichtet. Siehe beispielsweise Cieszkowski (2020) zu den Dialekten im wolgadeutschen Sprachgebrauch.

16

Einleitung

polnischen Herkunftssprache (gehabt) zu haben (siehe Beispiele in Brehmer & Mehlhorn, 2020: 419ff.). Die zweite Untergruppe bilden Immigranten, die nach dem Eintritt Polens in die Europäische Union 2004 nach Deutschland aus verschiedenen, oft mit dem Arbeitsmarkt verbundenen, Gründen umgezogen sind. Ihre Einstellung zum Polnischen unterscheidet sich sehr von der der früheren Migrantengruppe aus Polen (vgl. Mehlhorn, 2015). Obwohl Polnisch den Ruf »einer kleinen Sprache« in Deutschland hat, versuchen die meisten Familien dieser Untergruppe ihre Kinder zweisprachig zu erziehen. Die junge Generation gibt oft an, dass sie sich in beiden Sprachen und Kulturen gut zurechtfindet. Sie sieht ihre deutsch-polnische Zweisprachigkeit als persönliche und gesellschaftliche Ressource an (Mehlhorn, 2015; Błaszczak & Z˙ygis, 2018; Krull, 2016). Die Erforschung der Sprachwahl in jungen deutsch-polnischen Familien in Deutschland hat ergeben, dass polnische Mütter dazu neigen, mit ihren Kindern in ihrer Muttersprache zu sprechen, während sie überwiegend Deutsch als Kommunikationssprache mit ihrem Partner wählen (Jan´czak, 2013). Zwei- oder Mehrsprachigkeit ist im Allgemeinen in der Bevölkerungsgruppe mit polnischem Migrationshintergrund in Deutschland sehr verbreitet. Mehr als die Hälfte der Angehörigen der ersten Generation sprechen zu Hause überwiegend oder nur Polnisch, in der zweiten Generation ist dies bei einem Drittel der Fall (vgl. Hufeisen et al., 2018). Die Teilnahme an einem Herkunftssprachunterricht ist in der Gruppe mit polnischem Migrationshintergrund allerdings niedriger als in anderen allochthonen Minderheiten in Deutschland (Brehmer & Mehlhorn, 2020: 401f.). Die Bevölkerung mit polnischem Migrationshintergrund in Deutschland gilt als »unsichtbare« Minderheit, weil sie wenig Anlass zu öffentlichen Debatten gibt und die polnische Sprache im öffentlichen Raum auch wenig präsent ist (vgl. Hufeisen et al., 2018). In Polen bekennen sich nach dem in 2011 durchgeführten Zensus 144 000 Personen zur deutschen Minderheit10. Bei der Frage nach der Familiensprache wählen 96 500 die deutsche Sprache. Das macht Deutsch zu diesem Zeitpunkt zur dritten Minderheitensprache in Polen nach Schlesisch11 und Kaschubisch12,13. Nach eigener Schätzung zählt die deutsche Minderheit in Polen heutzutage 10 Siehe dazu Wyniki Narodowego Spisu Powszechnego Ludnos´ci i Mieszkan´ 2011 – mniejszos´ci narodowe i etniczne oraz je˛zyk regionalny. 11 Der Status des Schlesischen als separate Sprache steht jedoch noch unter Debatte. Vgl. auch Hentschel (2001). 12 Kaschubisch wird als Regionalsprache in der Europäischen Charta der Regional- oder Minderheitensprachen bezeichnet, die 2009 von Polen ratifiziert worden ist. Vgl. auch Breza (1992). 13 2022 wird sich die Reihenfolge zu Gunsten des Ukrainischen geändert haben. Die genauen Angaben liegen jedoch noch nicht vor.

Deutsch-polnische Zweisprachigkeit

17

ca. 300–350.000 Personen14. Die deutsche Minderheit in Polen lebt vor allem in den Woiwodschaften Oppeln, Schlesien und Ermland-Masuren. Kleinere Gruppen dieser Minderheit leben auch in den Woiwodschaften Niederschlesien, Pommern, Westpommern, Lebuser Land und Großpolen. Die Vertreter der deutschen Minderheit nehmen am politischen und kulturellen Leben Polens teil. Die deutsch-polnische Zweisprachigkeit wird bei der deutschen Minderheit in Polen durch Institutionen wie den Verband der sozial-kulturellen Gesellschaften in Polen (VdG) unterstützt15, der als Dachverband für mehrere Organisationen der deutschen Minderheit in Polen fungiert. Darüber hinaus wohnen nach offiziellen Angaben von 2020 ca. 7 500 Deutsche in Polen, die in den letzten Jahren von Deutschland nach Polen gezogen sind. Durchschnittlich wanderten etwa 8.000 Deutsche letztens jährlich von Deutschland nach Polen aus. Innerhalb der letzten 10 Jahre emigrierten 62 000 Deutsche nach Polen und 64 000 zogen nach Deutschland zurück (Auswandern Info)16. Diese Gruppe kann als »Transmigration« bezeichnet werden, weil sie normalerweise nicht auf dauerhafte Residenz ausgelegt ist. Ihre Migrationsmotive sind meistens mit dem Arbeitsmarkt verbunden und ihr Verhältnis zum Herkunftsland ist in der Regel stärker als zum Aufnahmeland. Die Untersuchungen der Entwicklung des Polnischen und des Deutschen bei deutsch-polnisch zweisprachigen Personen sind überraschenderweise nicht zahlreich. In der polnischen Linguistik werden die Varietäten des Polnischen, die in Migrationssituationen gesprochen werden, als »Polonia-Dialekte« (dialekty polonijne, Dubisz, 1997) zusammengefasst. Die Studien zum Polnischen als Herkunftssprache in Deutschland beziehen sich oft auf die Eigenschaften des Lexikons (siehe z. B. Mazur, 1993; Warchoł-Schlottmann, 1996; Nagórko, 1997; Brehmer, 2008). Im syntaktischen Bereich sind es sehr wenige Untersuchungen (aber siehe z. B. Brehmer & Czachór, 2012; Brehmer & Rothweiler, 2012; Rinke et al., 2019; Jachimek et al., 2022). Untersuchungen zur Entwicklung des Deutschen bei deutsch-polnisch zweisprachigen Personen umfassen solche, die sich auf den Spracherwerb des Deutschen als Zweitsprache im allgemeinen (siehe beispielsweise Wegener, 1993, 1998; Ksie˛z˙yk, 2022), auf den Lexikonerwerb (siehe beispielsweise Schaefer et al., 2019), auf ausgewählte morphosyntaktische Bereiche (siehe beispielsweise Sopata, 2009) oder auf die Akkulturationsdimension beziehen (siehe beispielsweise Ogrodzka-Mazur, 2010). Die Identitätsfrage und das Sprachmanagement bei der 14 Angaben sind auf der Webseite des Verbandes der deutschen soziall-kulturellen Gesellschaften in Polen (VdG) https://vdg.pl/ und der Deutschen Vertretungen in Polen zu finden: https://polen.diplo.de/pl-de. 15 Siehe beispielsweise Informationen auf der Webseite des Verbandes: https://vdg.pl/de/bil dung/dwujezycznosc. 16 Siehe https://auswandern-info.com/polen.

18

Einleitung

deutsch-polnischen Zweisprachigkeit wird beispielsweise von Zielin´ska (2013, 2019), Ksie˛z˙yk (2021) und Prawdzic (2021) thematisiert. Angesichts der beschränkten Anzahl dieser Arbeiten zur deutsch-polnischen Zweisprachigkeit sind zwei Forschungsprojekte besonders bemerkenswert, die vom Nationalen Forschungszentrum (Narodowe Centrum Nauki) und der Deutschen Forschungsgemeinschaft (DFG) in den letzten Jahren finanziert worden sind, und die auf die Erforschung des Phänomens abzielen. Eines davon ist das Projekt Generationsbedingte Differenzierung der Sprache: morphosyntaktische Veränderungen durch deutsch-polnischen Sprachkontakt in der Sprache zweisprachiger Personen (LangGener), das seit 2018 am Institut für Slawistik der Polnischen Akademie der Wissenschaften unter der Leitung von Prof. Anna Zielin´ska und am Institut für Slavistik der Universität Regensburg unter der Leitung von Prof. Dr. Björn Hansen realisiert wird. Das andere Projekt, das sich mit der Erforschung von mit deutsch-polnischer Zweisprachigkeit verbundenen Themen befasst, trägt den Titel Polnisch-deutsche Zweisprachigkeit bei Kindern: Die Rolle des Alters bei Erwerbsbeginn für den langfristigen Spracherwerbserfolg (KiBi). Dieses Projekt ist von der Deutschen Forschungsgemeinschaft (DFG) und dem Nationalen Forschungszentrum im Zeitraum 2016 bis 2020 finanziert worden. Auf der polnischen Seite ist das Forschungsprojekt von mir und auf der deutschen Seite von Prof. Dr. Bernhard Brehmer geleitet worden17. Die Ergebnisse des Projekts sind in einer Reihe von Publikationen veröffentlicht worden. Unterschiedliche Aspekte der Entwicklung der Wortstellung im Deutschen bei deutsch-polnisch zweisprachigen Kindern sind in Sopata und Długosz (2020, 2022) sowie in Długosz (2021) beschrieben worden. Der Erwerb von zusammengesetzten Verbalphrasen im Polnischen als Herkunftssprache bei deutsch-polnisch zweisprachigen Kindern ist in Brehmer und Sopata (2021) dargestellt worden. Ein Vergleich der Entwicklung des Deutschen und des Polnischen als Mehrheitssprache bei deutsch-polnisch zweisprachigen Kindern ist in Sopata et al. (2021) präsentiert worden. Auch die vorliegende Arbeit ist im Rahmen des Projekts entstanden.

17 Dabei handelt es sich um ein deutsch-polnisches Projekt, das vom Nationalen Forschungszentrum (Narodowe Centrum Nauki) – Projektnummer 2014/15/G/HS6/04521 – und von der Deutschen Forschungsgemeinschaft – Projektnummer 277135691 – finanziert worden ist.

Forschungsgegenstand und Zielsetzung der Arbeit

1.3

19

Forschungsgegenstand und Zielsetzung der Arbeit

Das übergreifende Ziel der vorliegenden Arbeit ist, zum besseren Verständnis des bilingualen Spracherwerbsprozesses beizutragen, durch die Einsicht in den Aufbau des Referenzsystems bei zweisprachigen Kindern und in das Zusammenspiel des Alters- und Inputfaktors in diesem Prozess. Das Hauptanliegen der Untersuchung ist die Entfaltung des Referenzsystems im Deutschen bei deutsch-polnisch zweisprachigen Kindern, die einerseits Deutsch als eine ihrer Erstsprachen oder ihre frühe Zweitsprache und andererseits das Deutsche als Mehrheits- oder Herkunftssprache erwerben. Die Referenzherstellung setzt mehrere sprachliche und kognitive Fähigkeiten voraus, die es dem Sprecher ermöglichen, auf gegebene Entitäten in der Welt Bezug zu nehmen. Der Gebrauch von referentiellen Ausdrücken verlangt vom Sprecher die Integration von syntaktischen, semantischen und pragmatischen Informationen, was sie zu einem faszinierenden Forschungsgegenstand der Spracherwerbsforschung macht. Den Forschungsgegenstand der vorliegenden Arbeit bilden zwei Bereiche der Sprachstruktur des Deutschen, in denen die Fähigkeit der Herstellung von Referenzbeziehungen besonders deutlich zu sehen ist: – Artikel, die definite/indefinite sowie spezifische/unspezifische Referenz ausdrücken können, und – Nullargumente. Nominalphrasen mit bestimmtem oder unbestimmtem Artikel werden als volle Formen referentieller Ausdrücke aufgefasst, weil sie dem Hörer viele lexikalische Informationen liefern. Im Gegensatz dazu stehen die Nullargumente, die als reduzierte Formen der referentiellen Ausdrücke gelten, weil sie dem Hörer keine lexikalischen Informationen liefern. Obwohl beide Bereiche an der Schnittstelle zwischen Syntax und Diskurs18/Pragmatik19 liegen, weil bei ihrem Gebrauch 18 Der Begriff Diskurs wird in der vorliegenden Arbeit im ursprünglichen Sinne verwendet und zur Bezeichnung einer Einheit benutzt, die größer als ein Satz ist und die die Kriterien der Kohäsion sowie der Kohärenz erfüllt. Auf die Diskussion zu gängigen Diskurskonzepten kann in der vorliegenden Arbeit nicht eingegangen werden (siehe Turowski & Mikfeld, 2013 zum Überblick über die verschiedenen Diskurskonzepte). Zu kritischen Anmerkungen zum Terminus Diskurs in der deutschen und polnischen Linguistik siehe Bilut-Homplewicz (2010). Siehe Wierzbicka und Wawrzyniak (2011) zu unterschiedlichen Einblicken in den Forschungsstand zur Grammatik im Text und Diskurs. Zu Konzeptionen des Diskurses siehe auch Czachur (2013, 2020) und zum diskursiven Untersuchungsrahmen Cieszkowski (2016, 2021). 19 Der Begriff Pragmatik wird in der vorliegenden Arbeit auf die kontextabhängige Verwendung von sprachlichen Ausdrücken bezogen. Eine Diskussion der Definition, Klassifizierung und des Untersuchungsrahmens der (linguistischen) Pragmatik würde über den Rahmen dieser Studie hinausgehen. Siehe aber dazu bespielsweise Prokop (2010) und Kotorova (2013, 2019).

20

Einleitung

syntaktische und pragmatische Informationen integriert werden müssen, unterscheiden sie sich gravierend im Hinblick auf das Ausmaß der lexikalischen Informationen, die sie enthalten. Ihr Gebrauch und die Interpretation der entsprechenden Strukturen von zweisprachigen Kindern wird daher in der vorliegenden Arbeit einer detaillierten Analyse unterzogen. Die Arbeit hat sich zwei Ziele gesteckt. Das erste Haupterkenntnisziel der vorliegenden Arbeit ist ein Vergleich des Erwerbs dieser beiden Sprachbereiche im Deutschen bei deutsch-polnisch zweisprachigen Kindern. Auf Grund der Gemeinsamkeiten beider Bereiche einerseits und der Unterschiede zwischen ihnen andererseits, kann eine Gegenüberstellung des Gebrauchs beider Strukturen dazu beitragen, ein besseres Verständnis von den Mechanismen zu bekommen, die beim Erwerb und Gebrauch der Schnittstellenphänomene involviert sind. Das zweite Ziel ist, einen Einblick in das Zusammenspiel des Alters- und Inputfaktors zu gewinnen, die auf den Erwerb des Artikel- und Nullargumentsbereichs im Deutschen bei zweisprachigen Kindern im Alter von 7–13 Jahren einwirken. Der Spracherwerb wird von mehreren Faktoren determiniert, und das Alter beim Beginn des Spracherwerbs sowie der zugängliche Input, seine Menge und sein Kontext gehören zu den wichtigsten Faktoren, die auf den Prozess des Spracherwerbs einwirken können. Die Rolle dieser Faktoren beim Erwerb der gewählten Bereiche soll daher untersucht werden, um eine Einsicht in Spracherwerbsmechanismen bei zweisprachigen Kindern zu gewinnen. Die Einteilung in zwei Spracherwerbstypen, den simultanen und sukzessiven Spracherwerb, ist auf den Altersfaktor zurückzuführen. Daraus ergibt sich die Betrachtung der zweiten Sprache zweisprachiger Kinder als ihre entweder zweite Erstsprache oder ihre frühe Zweitsprache. Auf den Inputfaktor geht dafür die Bezeichnung der erworbenen Sprache als Herkunftssprache oder Mehrheitssprache zurück. Diese zweifache Einteilung bildet den Ausgangspunkt für die theoretischen Reflexionen der vorliegenden Arbeit sowie die Grundlage für die Gruppenbildung im empirischen Teil. Nach dem ersten einleitenden Kapitel in die Fragestellung der vorliegenden Arbeit folgen zwei Kapitel, in denen die Faktoren, das Alter und der Input dargestellt werden. In Kapitel 2 wird zuerst ein Überblick über die Faktoren des Spracherwerbs gegeben und danach werden altersbedingte Unterschiede im Spracherwerb dargestellt. Das Kapitel behandelt auch das Thema des simultanen und sukzessiven Spracherwerbs, weil die Einteilung mit der Auswirkung des Altersfaktors einhergeht. Im dritten Kapitel wird auf den Inputfaktor eingegangen, wobei die mögliche Auswirkung der Menge an Input, des Inputkontextes und des Zeitpunkts des Beginns der Exposition zur Mehrheitssprache vorgestellt wird. Die mit dem Inputkontext einhergehende Unterscheidung in die Herkunfts- und Mehrheitssprache wird auch in diesem Kapitel thematisiert. In

Forschungsgegenstand und Zielsetzung der Arbeit

21

Kapitel 4 richtet sich das Hauptaugenmerk auf die linguistische Ausarbeitung der untersuchten Phänomene, wobei auf die Begriffsbestimmung die Erörterung der aktuellen Forschung zur Theorie der Referenz und Schilderung ihrer Ausdrucksmittel in der Struktur des Deutschen folgt. Kapitel 5 präsentiert die spracherwerbstheoretische Perspektive und beinhaltet eine kritische Besprechung von bestehenden Studien zum monolingualen und bilingualen Erwerb der Referenz, der Artikel und der Nullargumente. Die theoretischen Überlegungen sind der Ausgangspunkt der im Rahmen der Arbeit durchgeführten empirischen Untersuchungen, die in weiteren Kapiteln dargestellt werden. Ihrer Fragestellung und ihrer Methodologie ist das sechste Kapitel gewidmet, das detaillierte Angaben zu Probanden, Forschungsdesign, Testdurchführung und Datenauswertungsverfahren umfasst. In Kapitel 7 und 8 werden die empirischen Daten der zweisprachigen Kinder in den beiden untersuchten Bereichen aufgeführt, und die Befunde zu jedem Bereich werden am Ende des jeweiligen Kapitels theorieneutral zusammengefasst. Im neunten Kapitel werden die Ergebnisse mit den bereits vorliegenden relevanten Spracherwerbsstudien verglichen, im Lichte relevanter Hypothesen betrachtet und in einen spracherwerbstheoretischen Gesamtkontext eingeordnet. Im zehnten Kapitel der Arbeit werden die Befunde der gesamten Arbeit zusammengefasst.

Kapitel 2: Altersfaktor – Simultaner vs. Sukzessiver Spracherwerb

Eine Sprache kann von Menschen in jedem Alter erworben werden. Der Prozess des Spracherwerbs kann von Geburt an oder etwas später in der Kindheit ansetzen. Der Beginn des Spracherwerbs kann auch in der Jugendzeit oder im Erwachsenenalter stattfinden. Ebenso ist es möglich, eine Sprache unter verschiedenen Umständen zu erwerben, unter natürlichen oder institutionellen Bedingungen. In der vorliegenden Arbeit beschränke ich mich auf den Spracherwerb unter natürlichen Bedingungen, der also im Prinzip ungesteuert in der natürlichen Sprachumgebung stattfindet. Wenn auch eine strikte Unterscheidung in Spracherwerb unter natürlichen und institutionellen Bedingungen nicht immer eindeutig ist, wird das Thema der Arbeit auf den bilingualen Spracherwerb eingeschränkt, der vor allem unter natürlichen Umständen stattfindet und bei dem eine eventuelle institutionelle Unterstützung nur eine zweitrangige Rolle spielt. Im Folgenden wird daher auf jene Faktoren des Spracherwerbs eingegangen, die vor allem den Spracherwerb unter natürlichen Bedingungen beeinflussen.

2.1

Zu den Faktoren des Spracherwerbs

Der Spracherwerb ist ein dynamischer Prozess, der von mehreren Faktoren beeinflusst wird. Die externen Faktoren werden durch die äußeren Bedingungen des Spracherwerbs determiniert, während die internen Faktoren mit den Eigenschaften des Lerners selbst zusammenhängen (vgl. Ellis, 1985, 276; Edmondson und House, 2000: 112). Zu den externen Faktoren gehört vor allem der Input oder die Spracherfahrung, also alle sprachlichen Äußerungen, die vom Lerner gehört werden20. Der Input selbst und der Prozess des Spracherwerbs im allgemeinen wird auch unter anderem vom sozialen Umfeld bestimmt, vom sozioökonomischen Status der Familie und ihrem kulturellen Kapital, von der 20 Siehe Kap. 3.2 zur Diskussion zu diesen Begriffen.

24

Altersfaktor – Simultaner vs. Sukzessiver Spracherwerb

Persönlichkeit der Familienmitglieder, den sozialen Interaktionen in der Familie und auch vom vorherrschenden Erziehungsstil. Auch das weitere soziale Umfeld beeinflusst den Spracherwerb. Zu den externen Faktoren zählen daher auch soziale Gruppen, mit denen die Lerner häufig in Kontakt treten, ihre kulturellen Überzeugungen und die sozialen Interaktionen mit ihnen. Bei den internen Faktoren handelt es sich dagegen um biologische Determinanten, also solche Faktoren, die universell und daher bei allen Lernenden vorhanden sind, und um solche, die individuell ausgeprägt sind und von Individuum zu Individuum variieren können. Die Fähigkeiten und persönlichen Eigenschaften der Lerner tragen in großem Maße dazu bei, wie sich der Spracherwerb entfaltet (de Bot, 2008). Vier interne Faktoren, die schon von Spolsky (1989: 28) als die wichtigsten personenbezogene Merkmale aufgefasst worden sind, beeinflussen zum großen Teil die Art und Weise, mit der die Lerner vom Input und von den vorhandenen Erwerbsmöglichkeiten Gebrauch machen. Es handelt sich dabei um Faktoren wie Alter, Persönlichkeit, kognitive Fähigkeiten und vorheriges Wissen. Im Laufe der Jahre ist der Einfluss der Faktoren und ihre wechselseitige Beeinflussung immer detaillierter untersucht worden. Die individuellen Merkmale von Lernern, also ihre kognitiven und sprachlichen Fähigkeiten, ihre Einstellungen und Persönlichkeitsmerkmale werden als komplexes Zusammenspiel aufgefasst (vgl. Lerner, 2002; Douglas Fir Group, 2016; Truscott & Sharwood Smith, 2019). Beim Einfluss der Persönlichkeit wird auch die Motivation und Einstellung mit berücksichtigt. Die kognitiven Fähigkeiten umfassen unter anderem Faktoren wie das Arbeitsgedächtnis, das phonologische Kurzzeitgedächtnis, die kognitive Kontrolle und die nonverbale Intelligenz. Unterstrichen wird dabei, dass die Zusammenhänge in beiden Richtungen wirken, d. h. nicht nur die kognitive Entwicklung beeinflusst den Spracherwerb, sondern auch der Erwerb von einer oder mehreren Sprachen beeinflusst die kognitive Entwicklung (z. B. Bialystok et al., 2009; Bialystok 2016, 2017; Grundy & Timmer, 2017; Adesope et al., 2010; Nicolay & Poncelet, 2013, 2015; Dörnyei & Ryan, 2015). Auch wenn der Spracherwerb am besten als ein Zusammenspiel von mehreren externen und internen Faktoren dargestellt wird, muss der Gegenstand einer empirischen Untersuchung auf einige Faktoren eingeschränkt werden. Da das Thema der vorliegenden Arbeit der Erwerb des Deutschen als Erst-, Zweit-, Mehrheits- und Herkunftssprache ist, gilt das Hauptinteresse zwei interagierenden Variablen, nämlich dem Faktor des Alters und des Inputs. Der Faktor des Alters wird im vorliegenden Kapitel 2 und der des Inputs im nächsten Kapitel 3 thematisiert. Die Besprechung anderer Faktoren würde den Rahmen der vorliegenden Arbeit sprengen.

Altersfaktor als einer der wichtigsten Faktoren des Spracherwerbs

2.2

25

Altersfaktor als einer der wichtigsten Faktoren des Spracherwerbs

Der bilinguale Erwerb zeigt viel mehr interindividuelle Variation als der monolinguale Erwerb. Diese Variation resultiert aus dem Zusammenspiel mehrerer interagierender Faktoren, die bereits oben erwähnt worden sind. Als einer der wichtigsten Faktoren im bilingualen Spracherwerb wird das Alter zu Beginn des Erwerbs angesehen. Die Erforschung des Zusammenhangs zwischen Alter und Spracherwerb ist eines der wichtigsten Arbeitsgebiete der Spracherwerbsforschung (vgl. Grotjahn, 2003, 2005; Hyltenstam & Abrahamsson, 2003; Birdsong, 2006; DeKeyser & Larson-Hall, 2005; Long, 2005; Moyer, 2004; Singleton, 2005; Iluk, 2006; Stasiak, 2006; Grimm & Schulz, 2016; Paradis & Jia, 2017; Chondrogianni, 2018; Schulz & Grimm, 2019). Die altersbedingten Unterschiede in der Schnelligkeit des Spracherwerbs, in seinem Verlauf und seinem Erfolg, sind eines der spannendsten, aber auch umstrittensten, Themen der Spracherwerbsforschung (vgl. Dimroth & Haberzettl, 2008: 227). Unzweifelhaft gilt, dass es klare Unterschiede zwischen dem Spracherwerb im unterschiedlichen Alter gibt. Die Evidenz für die altersbedingten Unterschiede beim Spracherwerb stammt aus mehreren empirischen Untersuchungen, die vor allem die Entwicklung der Zweitsprache bei Migranten in unterschiedlichem Alter zum Forschungsgegenstand haben. Die klassische Studie auf diesem Gebiet ist die vielzitierte Arbeit von Johnson und Newport (1989), die einen starken Zusammenhang zwischen dem Alter des Ankommens der Probanden in den USA und dem erreichten Zustand in der Englischkompetenz zeigt. Die Autoren untersuchen Grammatikalitätsurteile von 46 Migranten aus China und Korea, die im Alter von 3 bis 39 Jahren in das Zielsprachenland gekommen sind. Die Studie beweist, dass der Beginn des Erwerbs der Zweitsprache vor dem 7. Lebensjahr mit einem höheren Sprachniveau korreliert. Johnson und Newport (1989) finden weiter eine lineare Korrelation zwischen der immer schlechteren Englischkompetenz und dem immer höheren Alter des Erwerbsbeginns von 7 bis 17 Jahren. Die Ergebnisse des Sprachtests jener Migranten, die den Zweitspracherwerb später als mit 17 Jahren begonnen haben, korrelieren aber in der Studie nicht mehr linear mit dem Alter. Die Untersuchungsergebnisse von Johnson und Newport zeigen also ziemlich deutlich einen Zusammenhang zwischen Alter und Spracherwerb. Die Studie wurde zum Gegenstand heftiger Debatten im Rahmen der Spracherwerbsforschung. Sie wurde oft zurecht wegen der angewandten Methodologie, der Auswahl der Testphänomene (Wortfolge, Flexion und Artikelgebrauch), der Zeitbegrenzung und des

26

Altersfaktor – Simultaner vs. Sukzessiver Spracherwerb

Zeitpunkts21 des Tests stark kritisiert22. Die Kritikpunkte wurden in der späteren Forschung berücksichtigt (vgl. u. a. Bialystok & Miller, 1999; DeKeyser, 2000; Birdsong & Molis, 2001). Immerhin haben jedoch diese Studien die empirische Evidenz für die Rolle des Altersfaktors beim Spracherwerb geliefert. Dank dieser Untersuchungen ist das Bestehen der altersbedingten Unterschiede beim Spracherwerb nicht mehr kontrovers, was jedoch nicht bedeutet, dass wir Klarheit darüber haben, wie sie erklärt werden können und wie das Alter präzise den Spracherwerb beeinflusst. Zu den offenen Fragen gehören unter anderem: 1. Auf welche Weise beeinflusst das Alter zu Beginn des Spracherwerbs die Schnelligkeit, den Verlauf und den Erfolg des Spracherwerbs? 2. Welche altersbedingten Unterschiede können beim Erwerb einzelner Sprachbereiche festgestellt werden? 3. Welche spezifische Verlaufsform hat die Funktion, die Erwerbsalter und Erwerbserfolg zueinander in Beziehung setzt? 4. Unterscheiden sich Lernende verschiedener Altersstufen in den Spracherwerbsmechanismen? 5. Unterscheiden sich Lernende verschiedener Altersstufen in den Sprachverarbeitungsprozessen? 6. Wie können altersbedingte Unterschiede theoretisch erklärt werden? Auf einige dieser Fragen, und die auf sie in der Spracherwerbsforschung vorgeschlagenen Antworten, wird in den folgenden Unterkapiteln eingegangen.

2.3

Altersbedingte Unterschiede beim Spracherwerb

Die altersbedingten Unterschiede beim Spracherwerb können am besten erfasst werden, wenn man zwei Erwerbstypen vergleicht, die sich im Faktor des Alters gravierend unterscheiden. Es liegt nahe, dafür den monolingualen Erstspracherwerb und den Zweitspracherwerb Erwachsener heranzuziehen, bei denen der Unterschied im Alter des ersten Kontakts mit der erworbenen Sprache offensichtlich ist. Die Differenzen zwischen dem Erwerb der Erstsprache von Kindern und dem Erwerb der Zweitsprache können oft im Alltag beobachtet werden und werden auch in mehreren Studien nachgewiesen (vgl. als Überblick und zur Diskussion u. a. Abrahamsson & Hyltenstam, 2009; Berndt, 2003; Birdsong & Paik, 2008; de 21 Die von Johnson und Newport angenommene 5-jährige minimale Aufenthaltsdauer kann kaum als Endzustand des Zweitspracherwerbs gelten. 22 Siehe beispielsweise Bialystok und Hakuta (1994).

Altersbedingte Unterschiede beim Spracherwerb

27

Bot, 2008; DeKeyser & Larson-Hall, 2005; Dimroth, 2007, 2008; Edmondson, 2010; Grotjahn, 2003, 2005; Hyltenstam & Abrahamsson 2003; Long 2005, 2007; Molnár & Schlak, 2005; Muñoz, 2006, 2008; Ortega, 2009; Singleton, 2005, 2007; Singleton & Ryan, 2004.) Auf einige Studien, die heutzutage als klassische Arbeiten in der Spracherwerbsforschung gelten, wird im Folgenden eingegangen. Die Erwerbsbereiche, in denen die altersbedingten Unterschiede am besten beobachtet werden können, werden von Meisel (2007a: 35) in folgender Liste zusammengefasst: – Anfangszustand des Spracherwerbsprozesses – Verlauf des Spracherwerbsprozesses – Schnelligkeit des Spracherwerbs – Einheitlichkeit – Endzustand des Spracherwerbsprozesses Der Anfang des Erstspracherwerbs ist durch unzählige Studien dokumentiert worden (vgl. z. B. Guasti, 2002 für eine ausführliche Darstellung der frühen Phasen des Erstspracherwerbs in ihrer Einführung in die Erstspracherwerbsforschung). Ungefähr zu seinem ersten Geburtstag formuliert ein Kind seine ersten Worte. Im zweiten Lebensjahr produziert es Zwei-Wort- und dann Mehrwort-Kombinationen, und im dritten entwickelt es das Hauptgerüst seiner Muttersprache. Die Struktur der Erstsprache wird von den Kindern stufenweise aufgebaut (vgl. die Strukturbildungshypothese von Guilfoyle und Noonan, 1992). In den ersten Phasen des Erwerbs der Erstsprache (L1) werden nur lexikalische Kategorien von den Kindern benutzt. Funktionale Kategorien werden erst sukzessiv in die Grammatik implementiert (siehe Radford, 1990, 1995). Die Struktur der Kindersprache nimmt nach und nach zu, wobei jede Stufe der Sprachentwicklung von universellen Sprachprinzipien bestimmt wird (vgl. Kontinuitätshypothese von Pinker (1984). Unter anderem, auf Basis der kindlichen Sprachdaten zum Erwerb des Deutschen, zeigen Guilfoyle und Noonan (1992), dass Kinder zunächst nur über lexikalische Kategorien wie Nomen oder Verb verfügen, und funktionale Kategorien, wie die Kategorie der Kongruenz oder die der Flexion, erst in späteren Phasen der Sprachentwicklung in den L1-Daten auftauchen. Die Äußerungen der Zweitsprachlerner sind dagegen schon zu Beginn des Erwerbs der Zweitsprache (L2) länger. Es sind nicht nur einzelne Wörter, wie es im Falle des L1-Erwerbs der Fall ist. Die Studien zur frühen L2-Entwicklung zeigen, dass L2-Lerner bereits in der ersten Phase des L2-Erwerbs komplexe Äußerungen mit funktionalen Kategorien produzieren können23 (vgl. den Überblick in Hawkins, 2001).

23 Die funktionalen Kategorien können aus der Erstsprache übernommen werden. In der Li-

28

Altersfaktor – Simultaner vs. Sukzessiver Spracherwerb

Sowohl im L1- als auch im L2-Erwerb treten bestimmte Entwicklungsphasen auf. Kinder, die ihre Erstsprache erwerben, durchlaufen jedoch andere Phasen beim Aufbau der L1-Struktur als erwachsene L2-Lerner, die die mentale Struktur der L2 in ihren Köpfen aufbauen. In der Erstspracherwerbsforschung sind sehr viele Studien zur Reihenfolge des Erwerbs einzelner Phänomene entstanden, die von der vielzitierten Studie von Brown (1973) inspiriert worden sind24. Bestimmte Phasen der Entwicklung der L1-Struktur sind ein charakteristisches Merkmal des Erstspracherwerbs (siehe Tracy, 2002). Der L2-Erwerb verläuft zwar auch systematisch, weil Lerner ziemlich einheitliche Entwicklungsstufen durchlaufen (Ellis, 1989; Towell & Hawkins, 1994)25, aber die Entwicklungsphasen sind anders als im L1-Erwerb. Die Evidenz für die Unterschiede in den Entwicklungsphasen im L1und L2-Erwerb stammt unter anderem aus den Untersuchungen zum Erwerb der Wortfolge im Deutschen. Die Untersuchungen zum L1-Erwerb in diesem Bereich (z. B. Tracy, 1991, 2002; Clahsen & Penke, 1992; Penner et al., 1999; Weissenborn, 2002) und im L2-Erwerb (z. B. Meisel et al., 1981) zeigen, dass Zweitsprachlerner andere Phasen durchlaufen als Kinder beim Erwerb der Wortfolge im deutschen Satz. Der andere Aspekt, bei dem klare Unterschiede zwischen dem Erst- und Zweitspracherwerb beobachtet werden können, ist die Schnelligkeit des Prozesses. Der Erstspracherwerb verläuft sehr schnell, während der Zweitspracherwerb bei den erwachsenen Lernern langsamer vorangeht. Auch wenn der Spracherwerb im Kindesalter langsamer und mühevoller ist als es auf den ersten Blick aussieht, ist er ein einheitlich relativ schnell ablaufender Prozess (siehe Tracy, 2002). Erwachsene L2-Lerner zeigen dagegen viel mehr interindividuelle Varianz als Kinder in Bezug auf die Geschwindigkeit der Aneignung der Zweitsprache. Diese Tatsache wird oft als Beleg interpretiert für die mit zunehmendem Alter wachsende Bedeutsamkeit von kognitiven Fähigkeiten und der Persönlichkeit beim Spracherwerb (vgl. Grotjahn et al., 2010). Beim Aspekt der Einheitlichkeit des Prozesses handelt es sich um die Uniformität des Erstspracherwerbs. Das Merkmal der Gleichförmigkeit des Erstspracherwerbs gilt sowohl auf verschiedene Individuen als auch bezüglich der Reihenfolge der Erwerbsphasen in einer bestimmten Sprache. Der Zweitspracherwerb zeichnet sich dagegen durch eine viel größere Variabilität aus. Die teratur wird das Phänomen des Transfers breit diskutiert (z. B. Kellerman, 1979; Gass & Selinker, 1983; Meisel, 1983; Odlin, 1989; Steinhauer, 2005). 24 Siehe Meisel (2011) zur Darstellung der Untersuchungen, sog. Morpheme order studies, der späteren Kritik an ihnen und zur Diskussion der Ergebnisse, die von den Studien geliefert worden sind und die auch in der jetzigen Spracherwerbsforschung ihren festen Platz haben. 25 Relativ einheitliche Entwicklungsstufen werden auch bei Lernern festgestellt, die unter institutionellen Bedingungen die L2 erwerben und die die L2 in einer anderen Reihenfolge unterrichtet bekamen (Ellis, 1989).

Altersbedingte Unterschiede beim Spracherwerb

29

Variabilität im L2-Erwerb betrifft sowohl die interindividuelle Ebene als auch die individuelle Ebene im Verlauf des Erwerbs (vgl. Meisel, 2011, 2013a, 2019). Der letzte, jedoch sehr wichtige Aspekt, in dem sich der Erst- und Zweitspracherwerb klar unterscheiden, ist der Endzustand des Spracherwerbsprozesses. Alle Kinder, abgesehen von wenigen krankheitsbedingten Ausnahmen, erlangen muttersprachliche Kompetenz in ihrer Erstsprache. Im Falle der Zweitsprachlerner scheint dies nicht der Fall zu sein. Der Endzustand des L2Erwerbs stand und steht immer noch im Zentrum der Debatte der Spracherwerbsforschung. Die These, die auf Grund der Beobachtung in der Spracherwerbsforschung aufgestellt worden ist, lautet, dass nur Lerner, die im Kindesalter den Spracherwerb beginnen, volle muttersprachliche Kompetenz erreichen können. Die These wird von mehreren Studien empirisch überprüft, nach dem Prinzip, dass das Auffinden von Personen, die im späteren Alter den Spracherwerb angefangen haben und muttersprachliche Kompetenz erlangt haben, eine starke Evidenz gegen die determinierende Rolle des Alters beim Spracherwerb liefern würde (vgl. Long, 1990, 1993, siehe auch Long, 2007, 2013 zur ausführlichen Darstellung des Gedankengangs). Das Ziel dieser Untersuchungen ist es, den Endzustand des Erwerbs der L2-Lerner in mehreren Sprachbereichen unter die Lupe zu nehmen (vgl. Abrahamsson & Hyltenstam, 2009; DeKeyser, 2012; Granena & Long, 2013; Veríssimo, 2018; Veríssimo et al., 2018 zur Diskussion des Problems). Die Ergebnisse können im gegebenen Rahmen der Arbeit nur punktuell dargestellt werden. Als Paradebeispiel sollen hier die Resultate des Stockholmer Projekts dienen, die von Abrahamsson und Hyltenstam (2008, 2009), Bylund et al. (2012) und Stölten et al. (2014, 2015) dargestellt sind. Die Autoren untersuchen 195 Probanden, die L2-Lerner des Schwedischen sind und im Alter von 1–47 Jahren den L2-Erwerb begonnen haben. Obwohl alle im Alltag als Muttersprachler wahrgenommen werden, werden nur 41 von ihnen im Rahmen der Studie als nativelike klassifiziert. Die weitere detaillierte Untersuchung zeigt, dass alle diejenigen Probanden aus der Gruppe, die nach dem elften Lebensjahr den Erwerb begonnen haben, nicht ganz muttersprachliche Kompetenz erreicht haben. Die Ergebnisse der Analyse zur Phonologie, Morphosyntax und Lexik bei den Probanden zeigen, dass keiner der erwachsenen Lerner mit den Muttersprachlern aus der Kontrollgruppe gleichzusetzen ist. Eine andere Richtung in den Untersuchungen zum determinierenden Einfluss des Alters auf den Endzustand des Spracherwerbs bilden die Untersuchungen der Sprachentwicklung von gehörlosen Kindern. Sie zeigen, dass sogar kleinere Verzögerungen zu Beginn des Spracherwerbs ernste Konsequenzen mit sich ziehen können (siehe Mayberry & Kluender, 2018 zu Konsequenzen des verzögerten Anfang des Erwerbs von der Gebärdensprache und Werker & Hensch, 2015 zum Überblick über Studien zum Spracherwerb von Kindern, die im ersten Lebensjahr an einer Mittelohrentzündung erkranken).

30

Altersfaktor – Simultaner vs. Sukzessiver Spracherwerb

Als Fazit kann man festhalten, dass die Existenz substantieller Unterschiede zwischen dem Erst- und Zweitspracherwerb unter den Forschern unbestritten ist. Ihr Ausmaß, ihre genaue Platzierung, und vor allem ihre konzeptuelle Verankerung sowie Erklärung, stehen nach wie vor im Zentrum der wissenschaftlichen Debatte.

2.4

Hypothesen zur konzeptuellen Verankerung des Altersfaktors

Der Einfluss des Alters zu Beginn des Spracherwerbs auf die Sprachentwicklung wird in der relevanten Literatur, wie oben erwähnt, nicht kontrovers diskutiert. Kein Konsensus herrscht jedoch beim Versuch, die Gründe dieses Einflusses festzulegen. Ursprünglich bezog sich die Erklärung für die determinierende Rolle des Alters in der Sprachentwicklung auf die Idee einer kritischen Periode für den Spracherwerb. Diese wurde schon von Penfield und Roberts (1959: 236) indirekt vorgeschlagen. Die Autoren behaupten, dass das menschliche Gehirn nach dem Alter von 9 Jahren für den Zweck des Sprachlernens zu unelastisch wird. Lenneberg, der eigentliche Autor der Hypothese der kritischen Periode (critical period hypothesis), bestimmt den Zeitraum zwischen 2 Jahren und der Pubertät als jene Lebensphase, in der die Sprache erworben werden soll, damit der Spracherwerb erfolgreich sein kann (Lenneberg, 1967). Er begründet seine These mit der Lateralisierung des Gehirns26. Lennebergs Hypothese über die kritische Periode bedeutet, dass Kinder während dieser Zeit eine Sprache, ohne bewusste Anstrengung, auf muttersprachlichem Niveau, nur auf Grund des natürlichen Inputs, erwerben können (Lenneberg, 1967: 176). Lennebergs Hypothese hatte einen immensen Einfluss auf die Spracherwerbsforschung, sie wurde aber nach einiger Zeit modifiziert. Spätere empirische Untersuchungen zeigen, dass im Spracherwerb nicht nur eine, sondern mehrere kritische Perioden (multiple critical periods Seliger 1978) oder mehrere sensible Perioden (siehe u. a. Schachter, 1996; Locke, 1997) zu sehen sind. Reifungsprozesse scheinen nicht die Sprache als Ganzes zu betreffen, sondern eher einzelne Sprachbereiche, wie Phonologie oder Morphosyntax (siehe Eubank & Gregg, 1999). Empirische Untersuchungen zeigen darüber hinaus, dass sogar der Erwerb einzelner sprachlicher Phänomene unterschiedlich verlaufen kann, was als Beweis für mehrere sensible Phasen gilt, die einzelne grammatische Phänomene betreffen. Während der sensiblen Phasen ist das menschliche Sprachvermögen optimal dafür vorbereitet, neue Informationen aus dem gegebenen grammatischen Gebiet in die sich entwickelnde Grammatik zu integrieren (Meisel, 2011, 2013a, 2019).

26 Siehe Long (1990: 278) für eine eingehende Diskussion der These.

Hypothesen zur konzeptuellen Verankerung des Altersfaktors

31

Die Änderungen im Sprachvermögen scheinen auch nicht abrupt, sondern stufenweise aufzutreten, daher wird der Terminus »kritisch« durch »sensitiv« oder »sensibel« in der relevanten Literatur nach Lenneberg ersetzt. Es herrscht kein Konsensus darüber in der betreffenden Literatur, wie der Verlauf der sensiblen Phasen genau aussieht. Der Verlauf der sensiblen Phase ist auch nicht direkt beobachtbar. Man kann nur auf die Dauer und den Verlauf der sensiblen Phase für den Spracherwerb schließen, wenn man genau den Zusammenhang zwischen dem Alter zu Beginn des Spracherwerbs und dem Erwerbsverlauf sowie -erfolg untersucht. Der Begriff der sensiblen Phase beinhaltet ja die Annahme, dass der Erwerb des gegebenen Sprachbereichs oder des grammatischen Phänomens im Zeitraum der sensiblen Phase bei ausreichendem Input erfolgreich und dem L1-Verlauf ähnlich sein soll, da das menschliche Sprachvermögen eben optimal für die Integration der relevanten Informationen aus diesem Gebiet in dieser Zeit vorbereitet ist. Der Zusammenhang zwischen dem Alter zu Beginn des Spracherwerbs und dem Erfolg des Spracherwerbs wird in der Literatur auf vierfache Weise dargestellt (vgl. Birdsong, 2006): Erstens kann es sich um eine einfache lineare Korrelation handeln, bei der mit zunehmendem Alter des ersten Kontakts mit einer Sprache der Erwerbserfolg graduell abnimmt. Zweitens kann der Zusammenhang bis zu einem gewissen Zeitpunkt nicht vorhanden sein, d. h. der Erwerbserfolg kann bei jüngeren Kindern bis zu einem gewissen Alter gleich sein, und erst der Erwerbsbeginn nach diesem gewissen Alter kann mit einem immer kleineren Erwerbserfolg zusammenhängen. Ein drittes mögliches Szenario wäre, dass bei kleinen Kindern das Alter zu Beginn des Spracherwerbs mit dem Erwerbserfolg korreliert, d. h. der Erwerbserfolg nimmt mit zunehmendem Alter zu Beginn des Spracherwerbs ab, und nach einem gewissen Punkt des Alters zu Beginn des Spracherwerbs hat das Alter keinen Einfluss mehr auf den Spracherfolg, und die gleichen sprachlichen Leistungen werden von den Lernern, unabhängig vom Alter, erbracht. Die vierte logische Möglichkeit wäre eine Verbindung der zweiten und der dritten Variante. Der Erwerbserfolg könnte bis zu einem gewissen Alter bei jüngeren Kindern gleich hoch sein, dann könnte eine Phase erfolgen, in der mit zunehmendem Alter des ersten Kontakts zu einer Sprache der Erwerbserfolg graduell abnimmt. Auf diese Phase könnte wiederum eine Periode folgen, in der der Erwerbserfolg bei älteren Kindern gleich schlecht wird und mit zunehmendem Erwerbsalter nicht mehr abnimmt. Keine dieser logischen Möglichkeiten für die spezifische Verlaufsform der Funktion, die Erwerbsalter und Erwerbserfolg miteinander in Beziehung setzt, ist bis jetzt eindeutig empirisch bewiesen worden. Ein Vorschlag zur Beschreibung des genauen Verlaufs der sensiblen Phase, der in der Literatur viel Aufmerksamkeit erweckt, wird von Meisel (2007a) gemacht. Die optimale Phase für den Erwerb eines sprachlichen Phänomens setzt nach

32

Altersfaktor – Simultaner vs. Sukzessiver Spracherwerb

Meisel relativ schnell ein (onset), erreicht rasch den Höhepunkt (peak) und klingt dann über einen längeren Zeitraum aus (offset) (vgl. Meisel, 2007a: 103). Der Prozess wird in Abbildung 2–1 dargestellt.

onset

peak

offset

Abb. 2–1: Entwicklungsverlauf einer sensiblen Phase (nach Meisel, 2007a: 103)

Eine andere Erklärung für den Altersfaktor, also für den unterschiedlichen Verlauf und Erfolg des Spracherwerbs, abhängig vom Alter, in dem der Prozess beginnt, wird von Bley-Vroman (1990, 2009) vorgeschlagen. Der Grund dafür, dass der Spracherwerb in der Kindheit und im Erwachsenenalter unterschiedlich sind, sieht Bley-Vroman darin, dass ihnen fundamental unterschiedliche Erwerbsmechanismen zugrunde liegen. Nach seiner Hypothese des fundamentalen Unterschieds (Fundamental Difference Hypothesis) wird der Erstspracherwerb der Kinder durch die angeborene Sprachlernfähigkeit und sprachspezifische Erwerbsmechanismen determiniert, während im Zweitspracherwerb der Erwachsenen der Transfer aus der Erstsprache und allgemeine kognitive Mechanismen eine entscheidende Rolle spielen. Der Zeitraum, in dem die menschliche Sprachfähigkeit darauf vorbereitet ist, relevante neue Informationen in die sich entwickelnde Grammatik zu integrieren, wird also von Bley-Vroman (1990, 2009) als jener Zeitraum verstanden, in dem die sprachspezifischen Erwerbsmechanismen den Lernern zugänglich sind. Die Zweitsprachenkompetenz wird auch von Bley-Vroman (1990, 2009) als fundamental verschieden von der Kompetenz in der Erstsprache aufgefasst. Die Hypothese von Bley-Vroman wird im Rahmen der Spracherwerbsforschung kontrovers diskutiert ( vgl. u. a. Epstein et al. 1996; Eubank, 1991; Eubank et al. 1997; Hoekstra & Schwartz, 1994; Ritchie & Bhatia, 1996). Kritiker der Hypothese weisen zurecht darauf hin, dass bei weitem nicht alle Unterschiede zwischen dem Erstspracherwerb von Kindern und dem Zweitspracherwerb von

Hypothesen zur konzeptuellen Verankerung des Altersfaktors

33

Erwachsenen, mit ihren unterschiedlichen zugrunde liegenden Erwerbsmechanismen, zu erklären sind27. Die ursprüngliche Hypothese des fundamentalen Unterschieds, nach der erwachsene Lerner gar keine Möglichkeit mehr hätten, die angeborene menschliche Spracherwerbsfähigkeit zu nutzen, muss auf Grund späterer Untersuchungen modifiziert werden. Empirische Studien zeigen, dass möglicherweise nur ein Teil der Sprachlernfähigkeit der Reifung unterliegt, und dass grammatische Prinzipien, die in allen natürlichen Sprachen gleich sind, erwachsenen Sprachlernern prinzipiell zugänglich sind (Smith & Tsimpli, 1995; Eubank & Gregg, 1999; Sopata, 2004). Die ursprüngliche Hypothese von Bley-Vroman (1990) wird auch im Hinblick auf die Altersgrenze revidiert, worauf noch in den nächsten Unterkapiteln näher eingegangen wird. Die Hypothese des fundamentalen Unterschieds von Bley-Vroman (1990) steht im Zentrum der Diskussion der generativen Spracherwerbsforschung in den 90-er Jahren des 20. Jhs. (Epstein et al., 1996; Eubank, 1991; Eubank et al., 1997; Hoekstra & Schwartz, 1994; Ritchie & Bhatia, 1996). Im Rahmen der generativen Spracherwerbsforschung wird die Aneignung einer Sprache als Erwerb einer komplexen kognitiven Fähigkeit angesehen. Bei der Beantwortung der Frage nach dem Ursprung der altersbedingten Unterschiede zwischen dem L1und dem L2-Erwerb greift der generative Ansatz auf die nativistische These zurück. Den Nativisten nach verfügen Menschen über eine angeborene Sprachfähigkeit, die sog. Universalgrammatik (UG)28. Die Uniformität des Verlaufs des L1-Erwerbs und der generelle Erwerbserfolg als Endzustand des Prozesses werden damit erklärt, dass der Erstspracherwerb durch die universellen Prinzipien der UG sowie die Setzung der UG-Parameter bestimmt würde29. Mehrere empirische Studien des generativen Ansatzes zeigen, dass L2-Grammatiken auch von der UG beeinflusst werden30. Die L1-L2-Unterschiede werden daher mit dem Ausmaß der Auswirkung der UG auf die Grammatik des L2-Lerners in Zusam27 Siehe Belikova und White (2009) sowie Song und Schwartz (2009) zur Kritik an der Hypothese. Siehe Montrul (2009) zum Überblick über die Untersuchungen, die diese Hypothese unterstützen. 28 Die Universalgrammatik besteht aus universellen Prinzipien, die allen Sprachen gemeinsam sind (Chomsky, 1981, 1986). Der Anfangszustand der Sprachfähigkeit wird in dem generativen Modell als eine Reihe von universalen Prinzipien charakterisiert, die determinieren, was eine mögliche Grammatik einer Sprache ist. Auch in den kognitiven Ansätzen wird angeborene kognitive Kapazität angenommen, die nur für Menschen charakteristisch ist (O’Grady, 2008). Der Unterschied zwischen dem generativen und kognitiven Ansatz ergibt sich daraus, dass die angeborene Kapazität im Kognitivismus nicht spezifisch sprachlich ist. 29 Siehe Uriagereka (2007) für die Darstellung des Begriffs »Parameter« vor dem Hintergrund der linguistischen Forschungen. 30 Siehe Dekydtspotter und Sprouse (2003) für eine ausführliche Liste von Studien zu diesem Thema. Siehe auch Sopata (2004), die die Möglichkeit der Anwendung der aus der L1 bekannten UG-Prinzipien in den neuen Bereichen der Zweitsprache zeigt.

34

Altersfaktor – Simultaner vs. Sukzessiver Spracherwerb

menhang gebracht. Viele Forscher nehmen an, dass die UG beim L2-Erwerb nicht mehr die gleiche Rolle spielt wie beim L1-Erwerb31. Die Debatte konzentriert sich dabei seit Jahren auf die Rolle und den Status der Merkmale funktionaler Kategorien im Verlauf des Zweitspracherwerbs. Eben diese unterschiedlichen Merkmale der funktionalen Kategorien verursachen in den einzelnen Sprachen verschiedene grammatische Phänomene, beispielsweise eine unterschiedliche Wortfolge im Satz, oder das Vorkommen der Nullsubjekte. Die L1-L2-Unterschiede können in bestimmtem Maße schon auf den Anfangszustand des Zweitspracherwerbs zurückgeführt werden (Schwartz & Sprouse, 1994, 1996 – Full Transfer/Full Access Hypothesis; Vainikka & YoungScholten, 1994, 1996 – Hypothese der »minimalen Bäume«; Eubank, 1993/94, 1994, 1996 – die sog. Hypothese der unspezifizierten Merkmale – Valueless Features Hypothesis; Meisel, 2000 – Hypothese des Null-Transfers). Die Hypothesen zum Ausgangspunkt des L2-Erwerbs implizieren in hohem Grade Hypothesen über den späteren Verlauf der L2-Entwicklung, den Endzustand des Zweitspracherwerbs sowie über die Erklärung der L1-L2-Differenzen. Die Befürworter der Hypothese des vollen Zugangs zur UG führen die Evidenz dafür an, dass das L2-Wissen der Lerner Aspekte beinhaltet, die nicht durch allgemeine kognitive Fähigkeiten erworben werden könnten32, was als Beweis für die Möglichkeit gilt, dass L2-Lerner ihre Spracherwerbsfähigkeit sowohl im L2Erwerb als auch im L1-Erwerb anwenden können33. Diese Annahme verlangt jedoch, dass die Forscher des Ansatzes die L1-L2-Unterschiede anders als mit fehlendem Zugang zur UG erklären. Forscher setzen sich mit dieser Aufgabe unterschiedlich auseinander. Smith und Tsimpli (1995) argumentieren, dass die Merkmale der funktionalen Kategorien nicht mit anderen Werten als in der L1 im Laufe des L2-Erwerbs besetzt werden könnten. Tsimpli und Dimitrakopoulou (2007) sowie Tsimpli und Mastropavlou (2007) spezifizieren weiter im Rahmen der sog. Failed functional features-Hypothese, dass nicht-interpretierbare Merkmale34 im Verlauf des L2-Erwerbs nicht mehr modifiziert werden können. Der Unterschied zwischen der L1- und der L2-Entwicklung, der u. a. in der Op31 Siehe White (2003) für eine gründliche Zusammenfassung der Debatte »UG or not UG«. 32 Siehe Slabakova (2006a) für die detaillierte Zusammenstellung solcher Studien. 33 Siehe beispielsweise White (2008), die argumentiert, dass die Prozesse nicht fundamental unterschiedlich sind. 34 In der generativen Sprachtheorie wird angenommen, dass lexikalische und funktionale Kategorien aus Bündeln unterschiedlicher Merkmale bestehen (Chomsky, 1995, 2000). Semantische, phonologische und formale Merkmale werden dabei unterschieden. Die formalen Merkmale werden in interpretierbare und nicht-interpretierbare eingeteilt. Während interpretierbare Merkmale für die Interpretation auf der Bedeutungsebene relevant sind, ist das bei den nicht-interpretierbaren Merkmalen nicht der Fall. Als interpretierbare Merkmale gelten inhärente semantische Eigenschaften. Nicht-interpretierbare Merkmale übernehmen diese Eigenschaften erst in Relationen, z. B. in Kongruenzrelationen.

Hypothesen zur konzeptuellen Verankerung des Altersfaktors

35

tionalität in der L2-Lernersprache zu sehen ist, wird auch durch die Verneinung einer engen Verbindung von Morphologie und abstrakter Merkmalebene im L2Erwerb erklärt (Haznedar & Schwartz, 1997; Lardiere, 1998a, b, 2007 – Hypothese der fehlenden Oberflächenflexion – Missing Surface Inflection Hypothesis). Als andere Quellen der morphologischen Optionalität im L2-Erwerb werden phonologische Einschränkungen aus der Erstsprache (Goad & White, 2004) oder Verarbeitungsprobleme der L2-Lerner (u. a. McDonald, 2006; Hopp, 2006) vorgeschlagen. Eine andere Richtung vertreten Forscher, die einen anderen Ausgangspunkt des L2-Erwerbs postulieren. Während die Merkmale der funktionalen Kategorien für die oben genannten Forscher der Ausgangssprache entstammen, argumentiert beispielsweise Beck (1998), dass L1-Merkmalwerte nicht dem Transfer unterliegen. Die Werte der Merkmale können der Autorin nach nicht weiter spezifiziert werden, was zu einer permanenten Optionalität in den L2-Grammatiken führt35. Dem gegenüber vertritt Meisel (1997, 2000, 2011, 2013a) eine Hypothese, der zufolge die UG-Beeinflussung des Spracherwerbs nach der sensiblen Phase eingeschränkt ist. Dies ähnelt der Annahme der Reifungshypothese, die ja besagt, dass die Spracherwerbsfähigkeit dem Menschen nur für einen begrenzten Zeitraum vollständig zugänglich sei. Da L2-Lerner die parametrisierten UG-Prinzipien nicht mit neuen Werten besetzen können, müssen sie nach Meisel (1997, 2000, 2011, 2013a) in den Fällen, in denen sich die L1- und L2-Werte unterscheiden, auf andere kognitive Wissensquellen zurückgreifen. Während Tsimpli und Dimitrakopoulou (2007) eine Kompensation der fehlenden zielsprachlichen nicht-interpretierbaren Merkmale durch interpretierbare Merkmale nicht ausschließen, schlägt Meisel (2011) vor, dass L2-Lerner in diesen Fällen induktiv vorgehen, und sich auf Strukturfragmente, oder einfach auf die oberflächliche Wortfolge, verlassen. Die Hypothese von anderen kognitiven Fähigkeiten, die den L2-Erwerb ermöglichen, wird auch von Ullman (2001), DeKeyser, (2003) und Paradis (2004) vertreten. Die Hypothesen der generativen Zweitspracherwerbsforschung können im Hinblick auf die Erklärung der L1-L2-Unterschiede zusammenfassend in zwei Richtungen unterteilt werden: in jene, die Differenzen mit dem L1-Transfer erklären, und in solche, die sie als Resultat der altersbedingten Reifung sehen, die mit dem partiellen oder völligen Verlust des UG-Zugangs einhergeht. Man muss betonen, dass, obwohl diese Hypothesen recht unterschiedliche Interpretation

35 Auch Ergebnisse zu fortgeschrittenen L2-Lernern des Deutschen bestätigen diese Hypothese (siehe Sopata, 2005).

36

Altersfaktor – Simultaner vs. Sukzessiver Spracherwerb

des Zweitspracherwerbs postulieren, sie alle zeigen36, dass die UG beim L2-Erwerb nicht mehr dieselbe Rolle wie beim L1-Erwerb spielt. Eine genauere Erklärung des Zusammenspiels des L2-Inputs, des L1-Einflusses, der Sprachlernfähigkeit und der kognitiven Lernmechanismen steht zwar noch aus, aber eine theoretisch zusammenhängende und empirisch gut fundierte Erklärung für die L1-L2-Differenzen wird von der generativen Spracherwerbsforschung geliefert. Eine andere Erklärung für die Unterschiede zwischen dem L1- und L2-Erwerb wird von Paradis (2004, 2009) und Ullman (2004, 2015) vorgeschlagen. Die Autoren argumentieren, dass die Unterschiede mit der altersbedingten Umstellung der Arbeitsweise des Gedächtnisses zusammenhängen. Während jüngere Lerner sich in der Sprachentwicklung vor allem auf die impliziten und prozeduralen Prozesse verlassen, beziehen sich ältere Lerner meistens auf das explizite und deklarative Gedächtnis beim Spracherwerb. Die oben dargestellten Hypothesen, die versuchen, altersbedingte Unterschiede beim Spracherwerb zu erklären und in einen größeren theoretischen Rahmen zu setzen, beziehen sich auf die postulierten Veränderungen im Gehirn. Diese Veränderungen werden von der hirnphysiologischen Perspektive aus unterschiedlich dargestellt. Ursprünglich wurde vorgeschlagen, dass die Veränderungen darin bestehen, dass das Gehirn mit zunehmendem Alter an Flexibilität und Plastizität verliert. Schon Lenneberg (1967) hat festgestellt, dass das Gehirn eines jungen Aphasie-Patienten eine Umlegung der Sprachzentren in einer frühen Phase der Krankheit zulässt. So eine Umlegung der Sprachzentren ist bei älteren Patienten nicht mehr möglich. Der kausale Zusammenhang, den Lenneberg zwischen seinen Beobachtungen und der Lateralisierung vermutete, konnte durch spätere Untersuchungen jedoch nicht bestätigt werden. Heutzutage wird in der Neurolinguistik angenommen, dass der Prozess der Reifung mit der Bildung von Synapsen und Netzwerken synaptischer Verbindungen zusammenhängt. Die Stärkung der neuronalen Netzwerke stellt einerseits die neurobiologische Basis des Lernens dar, aber andererseits trägt sie zum Verlust an Plastizität bei (Pulvermüller & Schumann, 1994: 691). Nach diesen Autoren gehen unterschiedliche Entwicklungswege verschiedener Sprachbereiche mit dem Prozess der Myelinisierung einher. Hierbei handelt es sich um einen Prozess, bei dem die neuronalen Axone von einer Myelinschicht umschlossen werden. Die Myelinschicht soll zu einer schnelleren Erregungsleitung des Aktionspotentials, und dadurch zu einer schnelleren Informationsbeförderung beitragen37. 36 Vom isolierten Standpunkt von Flynn (1996), und einigen wenigen anderen Forschern, abgesehen. 37 Siehe Hyltenstam und Abrahamsson (2003) für eine ausführliche Darstellung der Studie von Pulvermüller und Schumann 1994.

Hypothesen zur konzeptuellen Verankerung des Altersfaktors

37

Wiederum andere Forschungs- und Erklärungsrichtungen vertreten jene Studien, die altersbedingte Unterschiede beim Spracherwerb hirnphysiologisch erklären wollen. Sie gehen von der Annahme aus, dass Änderungen im Gehirn Unterschiede in Gehirnaktivierungsbildern und eine unterschiedliche räumliche Aktivierung des Gehirns im EKP- oder fMRI-Verfahren verursachen (siehe Friederici, 2002). Viele EKP-Studien zeigen, dass sich die Gehirnaktivierungsbilder bei den Probanden mit dem zunehmenden Alter des Beginns des Zweitspracherwerbs verändern. Die Aktivierung der linken Hemisphäre wird geringer und die rechte Hemisphäre wird immer mehr involviert (siehe Weber-Fox & Neville, 1999). Die altersbedingten Unterschiede beim Erwerb unterschiedlicher Sprachbereiche, beispielsweise bei der Syntax vs. Semantik, wird auch in anderen neurolinguistischen Studien bestätigt (siehe Hahne & Friederici, 2001). Die größere Aktivierung der rechten Hemisphäre bei älteren Lernern einer Zweitsprache wird auch von fMRI-Studien aufgezeigt38. Bei der Sprachverarbeitung sind, im Falle der älteren Zweitsprachenlerner, mehr Netzwerke als im Falle der jüngeren Erstsprachenlerner involviert. Zusammenfassend ist zu bemerken, dass, obwohl der konzeptuelle Rahmen für die biologische neurophysiologische Erklärung der L1-L2-Unterschiede vielversprechend zu sein scheint, die neurolinguistische Forschung noch keine eindeutige neurophysiologische Korrelate für die Alterseffekte beim Spracherwerb vorgestellt hat. Neben den biologischen Erklärungen werden auch zahlreiche alternative Versuche unternommen, altersbedingte Unterschiede beim Spracherwerb zu erklären (vgl. Birdsong, 2006; DeKeyser & Larson-Hall, 2005; Dimroth, 2007; Grotjahn, 2005; Long, 2007; Singleton & Ryan, 2004). Diskutiert werden Erklärungsansätze, die die altersbedingten Unterschiede beim Spracherwerb nicht mit der neuronalen Reifung oder anderen biologischen Faktoren in Zusammenhang bringen, sondern die die Unterschiede auf den Einfluss der externen, d. h. der soziologischen, psychologischen oder kognitiven Faktoren zurückführen. Die vorgeschlagenen Alternativen reichen von der Qualität des Inputs (Flege & MacKay, 2011; Flege, 2018), über die determinierende Rolle affektiv-motivationaler oder sozio-kultureller Faktoren (Pagonis, 2009) bis hin zum entscheidenden Einfluss der unvermeidlichen Interaktion zwischen den Sprachen im Gehirn eines mehrsprachigen Sprechers (siehe z. B. Pérez-Leroux et al., 2008; Pirvulescu et al., 2014; Pérez-Leroux et al., 2017)39. In den letzten Jahren hat vor allem der Ansatz an Bedeutung in der Spracherwerbsforschung gewonnen, der den Grund für die L1-L2-Unterschiede in der 38 Siehe Franceschini et al. (2003), Müller (2003) und Herschensohn (2007: 183–209) für einen Überblick über die Studien. 39 Siehe Long (1990) zur Diskussion der Einwände gegen diese Erklärungsversuche.

38

Altersfaktor – Simultaner vs. Sukzessiver Spracherwerb

Bilinguität per se und nicht im zunehmenden Alter des ersten Kontakts mit der Sprache sieht (z. B. Birdsong, 2018; Birdsong & Quinto-Pozos, 2018; de Leeuw, 2014; Ortega, 2010, 2013; Pfenninger & Singleton, 2017). Die Befürworter der Hypothese unterstreichen, dass in den meisten Studien, die den L1- mit dem L2Erwerb vergleichen, L2-Lerner, also bilinguale Personen, monolingualen L1Sprechern gegenübergestellt werden. Angesichts jener Studien, die zeigen, dass bilinguales Sprachverhalten von einem monolingualen Verhalten inhärent zu unterscheiden ist (u. a. Cook, 1999, 2016; Flege, 1999; Grosjean, 1998), sind die Vergleiche zwischen L1-Daten von monolingualen Sprechern und L2-Daten von bilingualen Sprechern, im Hinblick auf die Erklärung der Alterseffekte, in der Tat wenig aufschlussreich. Forscher schlagen im Rahmen des Ansatzes eigentlich zwei Erklärungen für L1-L2-Unterschiede vor. Einerseits werden die Unterschiede als Resultat jener Tatsache gesehen, dass immer zwei Sprachsysteme bei zweisprachigen Personen erworben werden, was häufig zu einem reduzierten und variableren Input in beiden Sprachen führt (siehe z. B. Pérez-Leroux, Pirvulescu, & Roberge, 2008; Pirvulescu, Pérez-Leroux, Roberge, Strik, & Thomas, 2014; Pérez-Leroux, A. T., Pirvulescu, M., & Roberge, Y., 2017). Darüber hinaus bieten zwei Sprachsysteme im Gehirn Gelegenheit zu zwischensprachlichen Einflüssen, was im Fall des monolingualen Erwerbs offensichtlich nicht der Fall ist. Andererseits wird im Rahmen des Ansatzes die Aufmerksamkeit auf die Tatsache gelenkt, dass der Gebrauch der Sprache von bilingualen Sprechern immer in gewissem Maße beide Sprachen involviert, was wiederum in krassem Kontrast zur Sprachproduktion von monolingualen Personen steht. Obwohl die Bilinguität per se ganz bestimmt eine Rolle bei der Erklärung der L1-L2-Unterschiede spielt, haben Forscher noch keine ausreichende Evidenz dafür geliefert, dass sie alle Unterschiede zwischen den Erwerbstypen überzeugend erklären kann. Starke Gegenargumente für den determinierenden Einfluss der Bilinguität per se werden beispielsweise von den Untersuchungen von Bylund et al. (2021) geliefert, die sprachliche Daten sog. sequentieller monolingualer L2Sprecher, also international adoptierter Kinder, erforschen, die ihre L1 quasi verloren haben. Den Forschern gelingt es also, den Faktor des Alters und der Bilinguität auseinanderzuhalten. Die Ergebnisse zeigen einen einheitlichen Effekt des Altersfaktors auf den Spracherwerbserfolg. Die andere Richtung der Forschung, die im Zusammenhang Altersfaktor vs. Bilinguität von besonderer Bedeutung ist, sind die Untersuchungen bilingualer Lerner, die zwei Sprachen in unterschiedlichem Alter erwerben. Sie werden in den zwei nächsten Unterkapiteln thematisiert. Im Rahmen des kognitiven Ansatzes zur Spracherwerbsforschung werden bei den Erklärungen der altersbedingten Unterschiede beim Spracherwerb Veränderungen in den Verarbeitungsprozessen und bei der Verarbeitungsgeschwindigkeit erörtert (vgl. Grotjahn et al, 2010). Schon Birdsong (2005) zeigt bei-

Simultaner Erwerb von zwei Sprachen

39

spielsweise, dass der langsame Ausklang der sensiblen Phase im Spracherwerb durch größere Einschränkungen in der Sprachverarbeitung bei älteren Lernern verursacht werden kann. Eine überzeugende Alternative für jene Studien, die nur einen Faktor als determinierend auffassen, und den anderen Faktoren gar keine Rolle zuschreiben, bilden Erklärungsansätze, die die altersbedingten Unterschiede beim Spracherwerb in einen komplexen Rahmen setzen, und den Spracherwerb als Zusammenspiel von, sowohl internen als auch externen, Faktoren auffassen. Schon DeKeyser (2000) stellt fest, dass kognitive Faktoren mit biologischen Faktoren bei den altersbedingten Unterschieden beim Spracherwerb gekoppelt sind. Eine höhere verbale Fähigkeit bei älteren Lernern kann beispielsweise den normalerweise im höheren Alter niedrigeren Kompetenzzustand ausgleichen. Erwachsene Lerner einer Zweitsprache, die über eine hohe verbale Fähigkeit verfügen, können daher trotz des späten Erwerbsbeginns eine sehr hohe Zweitsprachenkompetenz erreichen. Eine immer größere Rolle beim Spracherwerb wird in der relevanten Literatur dem Input zuerkannt. Viele Studien zeigen, dass der Input, zusammen mit dem Alter, für altersbedingte Unterschiede beim Spracherwerb verantwortlich sein kann. Auf die Rolle des Inputs, die für den Forschungsgegenstand der vorliegenden Arbeit von besonderer Bedeutung ist, wird in Kapitel 3 ausführlich eingegangen. Zusammenfassend lässt sich sagen, dass die Ansätze, altersbedingte Unterschiede beim Spracherwerb in einem größeren konzeptuellen Rahmen zu verankern, zur Zeit noch kein einheitliches Bild ergeben. Viele empirische Studien liefern überzeugende Beweise für die biologische Interpretation der Unterschiede zwischen dem Verlauf, der Schnelligkeit und dem Endzustand des Spracherwerbs unter den Lernenden verschiedener Altersstufen. Sie liefern überzeugende Belege für die sensiblen Phasen beim Erwerb der jeweiligen Sprachbereiche. Die Erklärung der altersbedingten Unterschiede wird jedoch erst restlos überzeugend, wenn sie um die äußeren Faktoren ergänzt wird, die offensichtlich auch eine wichtige Rolle beim Spracherwerb spielen.

2.5

Simultaner Erwerb von zwei Sprachen

Der simultane Erwerb von zwei (oder mehreren) Sprachen ist zu einem häufigen Untersuchungsgegenstand der Spracherwerbsforschung in den letzten Jahrzehnten geworden40. Der Grund dafür liegt zweifellos auch darin, dass die

40 Siehe die zusammenfassenden Darstellungen der älteren Untersuchungen in de Houwer

40

Altersfaktor – Simultaner vs. Sukzessiver Spracherwerb

Konsequenzen des Altersfaktors von den Folgen der Mehrsprachigkeit bei diesem Erwerbstyp gut auseinandergehalten werden können. Beim simultanen Erwerb von zwei Sprachen eignen sich die Lerner mehr als eine Sprache gleichzeitig an. Im Gegensatz zu monolingualen Kindern verarbeiten, speichern und benutzen simultan bilinguale Kinder zwei Sprachen. Was den simultanen Erwerb von zwei (oder mehreren) Sprachen jedoch mit dem monolingualen Erstspracherwerb gleichstellt, ist das Alter, in dem der Erwerb beginnt. Vom simultanen Erwerb von zwei Sprachen sprechen wir, wenn der Beginn des Erwerbs in der frühen Kindheit vonstattengeht41.

2.5.1 Simultan bilingualer Erwerb als Entwicklung von zwei selbständigen Sprachsystemen Im Gegensatz zu den Ansichten vieler Linguisten aus den 60er Jahren des 20. Jhs., die behaupteten, dass der Erwerb von zwei Sprachen einen gemeinsamen Prozess darstelle, bei dem zwei Sprachen vermischt werden42, zeichneten empirische Untersuchungen der zweiten Hälfte des 20. Jhs. ein ganz anderes Bild des simultanen Erwerbs von zwei Sprachen. Vor allem in den 80er und 90er Jahren des 20. Jhs. haben einige Studien die damals weit verbreitete Ansicht falsifiziert, dass simultan bilinguale Kinder ihren Spracherwerb mit einem linguistischen System beginnen. Nach der Hypothese des unitären Sprachsystems (Unitary System Language Hypothesis) von Volterra und Taeschner (1978) sollten Kinder, die zwei Sprachen simultan erwerben, nicht in der Lage sein, zwischen phonologischen, morphosyntaktischen und lexikalischen Aspekten in den zwei zu lernenden Sprachen zu unterscheiden43. Die Hypothese des unitären Sprachsystems wird durch empirische Beweise aus einer Studie von De Houwer (1990), die ein deutsch-englisch zweisprachiges Kind (2;7–3;4) untersucht, und durch die Ergebnisse des DUFDE-Projekts (Meisel, 1990, 1994) widerlegt, in dem 13 deutsch-französisch und deutsch-italienisch bilinguale Kinder im Alter von 1;6 bis 6 Jahren untersucht werden. Die Hypothese der getrennten Sprachentwicklung bei den simultan zweisprachigen Kindern (Separate Development Hypothesis) wird auch empirisch und methodologisch von Genesee (1989), Nicoladis (1994) sowie von Genesee et al. (1995) unterstützt. De Houwer (2009) stellt eine Liste von Untersuchungen zusammen, (1995), Meisel (2004), Genesee und Nicoladis (2007) sowie der neueren Untersuchungen in Grimm und Schulz (2016) sowie Müller (2017). 41 Siehe Kap. 2.6.1 zu den Vorschlägen der Altersgrenze zwischen dem simultan und sukzessiv bilingualen Erwerb. 42 Siehe beispielsweise dazu Weisgerber (1966). 43 Siehe auch Arnberg (1987) und Taeschner (1983), die auch Befürworter dieses Ansatzes sind.

Simultaner Erwerb von zwei Sprachen

41

in denen insgesamt die sprachlichen Daten von 50 simultan zweisprachigen Kindern erforscht werden, bei denen insgesamt 17 verschiedene Sprachkombinationen vorliegen. Die Ergebnisse all dieser Studien liefern eine klare Unterstützung für den getrennten Verlauf der Sprachentwicklung in beiden Sprachen bei jenen Kindern, die gleichzeitig zwei Sprachen von Geburt an erwerben. Heutzutage herrscht Konsensus unter den Spracherwerbsforschern darüber, dass bilingual aufwachsende Kinder schon von früh an in der Lage sind, die internalisierten Sprachsysteme ihrer zwei Sprachen voneinander zu trennen. Studien zeigen, dass diese Kinder in ihrem Gehirn zwei getrennte Wissenssysteme von ihren Sprachen aufbauen (siehe Meisel, 2007a). Der andere Befund der empirischen Studien zum Verlauf des simultanen Spracherwerbs, bei dem eine relativ breite Übereinstimmung unter den Forschern herrscht, ist die Beobachtung, dass zweisprachige Kinder dieselben Erwerbssequenzen durchlaufen wie monolinguale Kinder in den jeweiligen Sprachen. Diese Ähnlichkeit in der Erwerbsreihenfolge betrifft unterschiedliche grammatische Phänomene. Darüber hinaus sind sich die meisten Forscher (wenn auch nicht alle) darüber einig, dass simultan bilinguale Kinder eine muttersprachliche Kompetenz erreichen, die sich qualitativ von der Kompetenz der monolingualen Sprecher nicht unterscheidet (vgl. De Houwer, 1995, 2021; Meisel, 2007, 2011, 2013a). In den wichtigsten Punkten, die die L1-L2-Differenzen erfassen, nämlich im Anfangszustand, im Verlauf und im Endzustand des Erwerbs, unterscheiden sich simultan zweisprachige Kinder nicht (oder nur wenig) von monolingualen Kindern, die nur eine Sprache von Geburt an erwerben. Daher wird beim simultan bilingualen Spracherwerb oft vom Erwerb von zwei Erstsprachen (2L1-Erwerb) gesprochen, weil er als eine Form des doppelten Erstspracherwerbs verstanden wird. Die frühe Trennung von beiden Sprachen bei simultan zweisprachigen Kindern zeigt sich in einer funktionalen Unterscheidung der Sprachen bereits im Alter von etwa 1;10 Jahren (d. h. 1 Jahr; 10 Monate). Die Trennung ist dadurch nachweisbar, dass Kinder schon ab diesem Alter bei der Sprachwahl nach der angesprochenen Person entscheiden (Genesee et al., 1996). Darüber hinaus zeigen Untersuchungen zur Interaktion der Kinder mit ihrer Umgebung, dass simultan bilinguale Kinder selten mit monolingualen Gesprächspartnern in die andere Sprache wechseln (Quay, 1995). Im Alter von ca. 2 Jahren können Belege für die Trennung der syntaktischen Systeme gefunden werden, die im Gehirn der zweisprachigen Kinder aufgebaut werden (vgl. Meisel, 1986, 1994, 2001; Genesee, 1989; De Houwer, 1990; Genesee et al., 1995; Paradis & Genesee, 1996; Paradis, 2001)44. 44 Aus offensichtlichen Gründen ist das der früheste Zeitpunkt, zu dem nach solchen Belegen gesucht werden kann. Die durchschnittliche Äußerungslänge beträgt in der Entwicklungsphase 2 Morpheme. In der früheren Phase, in der der Mittelwert darunter liegt, also weniger

42

Altersfaktor – Simultaner vs. Sukzessiver Spracherwerb

Als Fazit dieser Erwägungen soll hiermit festgehalten werden, dass der simultane Erwerb von zwei Sprachen als Erwerbstyp gilt, in dem zwei Sprachen als Erstsprachen von Kindern in der Kindheit erworben werden. Simultan zweisprachige Kinder bauen getrennte Sprachsysteme auf, und die Sprachentwicklung ähnelt in beiden Sprachen weitgehend dem monolingualen Erwerb der jeweiligen Sprache.

2.5.2 Zwischensprachliche Einflüsse beim simultan bilingualen Spracherwerb Obwohl im Gehirn der simultan zweisprachigen Kinder zwei getrennte phonologische und morphosyntaktische Systeme existieren, heißt dies nicht unbedingt, dass jede Interaktion zwischen den Systemen ausgeschlossen ist. Die Trennung des Systems impliziert ja nicht, dass es für externe Einflüsse ganz unzugänglich ist. Simultan bilinguale Kinder erwerben parallel zwei Sprachen mit ihren phonologischen, morphosyntaktischen und lexikalischen Aspekten, aber sie müssen sich auf ein kognitives System und ein Reservoir von Sprachverarbeitungsmechanismen verlassen. Sie müssen universale Prinzipien in der jeweiligen Sprache erfassen, und in beiden Sprachen entsprechend die Parameter setzen. Obwohl in den Studien gezeigt worden ist, dass die Kinder zwei voneinander unabhängige Systeme aufbauen, zeigen viele Untersuchungen, dass es Sprachbereiche gibt, in denen sich die Sprachen beeinflussen können. In den letzten zwei Jahrzehnten wird die Möglichkeit der zwischensprachlichen Einflüsse (cross linguistic influence) intensiv untersucht. Den Ausgang für die Untersuchungen der zwischensprachlichen Einflüsse bildet die Beobachtung, dass die individuelle Variabilität beim 2L1-Erwerb viel größer als beim L1-Erwerb ist. Die Beeinflussung einer Sprache durch die andere bei simultan zweisprachigen Kindern wird jedoch nicht in demselben Grad bei allen Kindern und in allen Sprachbereichen beobachtet. Dieser Befund wird mit der Annahme einiger Faktoren erklärt, von denen das Vorkommen der Beeinflussung, ihre Stärke und ihre Richtung abhängen. Die Beeinflussung einer Sprache durch die andere kann sich im simultan bilingualen Erwerb auf unterschiedliche Weise widerspiegeln. Eine Konsequenz der Beeinflussung kann eine andere Schnelligkeit des Erwerbs im Vergleich zum monolingualen Erwerb sein, und zwar kann es sich hierbei sowohl um die Verzögerung als auch um die Beschleunigung des Erwerbs eines gegebenen Phänomens handeln (siehe z. B. Bernardini & Schlyter, 2004; Gawlitzek-Maiwald & Tracy, 1996). Als Verzögerung in der Sprachentwicklung wird sowohl ein späteres als 2 Morpheme pro Äußerung beträgt, kann keine Rede von syntaktischen Regularitäten sein.

Simultaner Erwerb von zwei Sprachen

43

Auftauchen einer grammatischen Struktur (Kupisch, 2007) als auch eine spätere zielsprachige Anwendung einer gegebenen Struktur (Austin, 2009) verstanden. Ein anderer Effekt zwischensprachlicher Einflüsse kann ein Transfer einer gegebenen Struktur aus einer Sprache in die andere sein (siehe Döpke, 2000; Yip & Matthews, 2000). Der zwischensprachliche Einfluss kann sich auch als Übergebrauch einer Struktur, die in beiden Sprachen ähnlich ist, manifestieren. Andererseits kann es auch in Folge der Beeinflussung einer Sprache durch die andere zur sog. Überkorrektur (overcorrection) kommen, d. h. zum Übergebrauch einer Struktur, die in der jeweils anderen Sprache gerade unterschiedlich ausfällt (siehe Kupisch, 2014; Anderssen et al., 2018). Einige Forscher plädieren dafür, dass es sich bei der zwischensprachlichen Beeinflussung nur um quantitative Unterschiede handelt, wie eben Verzögerung (siehe z. B. Pirvelescu et al., 2014) oder Beschleunigung des Verlaufs des 2L1Erwerbs (siehe beispielsweise Meisel, 2007a, 2009, 2010). Andere Autoren führen jedoch Argumente dafür an, dass unter spezifischen Bedingungen auch qualitative Unterschiede im simultan bilingualen Erwerb im Vergleich zum monolingualen Erwerb möglich sind (siehe z. B. Strik & Pérez-Leroux, 2011; Rodina & Westergard, 2017). Die Identifizierung jener Faktoren, die zur Beeinflussung einer Sprache durch die andere im bilingualen Erwerb beitragen, steht im Zentrum der Spracherwerbsforschung der letzten 20 Jahre. Einen dieser Faktoren bilden die sprachinternen Bedingungen, die mit der Struktur der erworbenen Sprachen und den spezifischen Bereichen der Sprachen zusammenhängen. Den anderen Faktor bilden die sprachexternen Bedingungen, die mit der Dominanz einer Sprache bei bilingualen Kindern oder mit der Häufigkeit einer gegebenen Struktur im Input in der jeweiligen Sprache verbunden sind. Eine der wichtigsten sprachinternen Bedingungen für die zwischensprachliche Beeinflussung ist die Lokalisierung des gegeben Phänomens in der Sprachstruktur. Wenn sich das Phänomen an der Schnittstelle zwischen Syntax und Pragmatik (Hulk & Müller, 2000; Paradis & Navarro, 2003; Serratrice & Sorace, 2003; Sorace, 2011) oder zwischen Syntax und Semantik (Montrul & Ionin, 2010; Sorace & Serratrice, 2009) befindet, ist es ein Gebiet, auf dem es zu zwischensprachlichen Einflüssen kommen kann45 – es gehört dann zu den sog. vulnerable domains. Die andere Bedingung ist die Existenz der syntaktischen Ambiguität oder einer partiellen strukturellen Überlappung auf der Oberfläche (Döpke, 1998; Müller, 1998). Mit der syntaktischen Ambiguität haben wir es zu tun, wenn eine Sprache nur eine Option oder nur eine Konstruktion in einem Sprachbereich 45 Die C-Domäne wird als Bereich potentieller sprachlicher Probleme beim L1-Erwerb, L2Erwerb oder beim Spracherwerb von Kindern mit einer spezifischen Sprachentwicklungsstörung angesehen (Platzack, 2001).

44

Altersfaktor – Simultaner vs. Sukzessiver Spracherwerb

zulässt, und die andere Sprache lässt in dem Bereich zwei Konstruktionen zu, wobei eine der beiden der Konstruktion in der ersten Sprache entspricht46. Hulk und Müller (2000) argumentieren, dass beide Faktoren, d. h. die Lokalisierung an der Schnittstelle und die partielle Überlappung, notwendige Bedingungen für das Vorkommen zwischsprachlicher Einflüsse sind. Jakubowicz (2002) sowie Strik und Pérez-Leroux (2011) schlagen noch eine dritte Bedingung vor, nämlich die der syntaktischen Komplexität. Wenn ein Phänomen also an der Schnittstelle liegt, ambig und syntaktisch komplex ist, wird es als Gebiet angesehen, auf dem zwischensprachliche Einflüsse wahrscheinlich sind. Einige Forscher argumentieren jedoch, dass sich die zwischensprachlichen Einflüsse nicht auf die Phänomene an der Schnittstelle Syntax-Pragmatik einschränken lassen. Darüber hinaus wird in Frage gestellt, ob die zwischensprachlichen Einflüsse auf der Ebene der Sprachkompetenz, und nicht auf der Ebene der Sprachverarbeitung, platziert werden sollten (Meisel, 2007a; Sorace et al., 2009; Pérez-Leroux et al., 2011). Als die wichtigste Bedingung für das Vorkommen zwischensprachlicher Einflüsse, die nicht mit der Struktur der erworbenen Sprachen, sondern mit dem Zustand des Erwerbs verbunden ist, ist die Sprachdominanz. Viele Forscher vertreten die Meinung, dass die stärkere Sprache des Kindes die schwächere beeinflussen kann (z. B. Kupisch, 2007; Serratrice et al., 2009; Yip & Matthews, 2007). Diese Bedingung bezieht sich also auf die ganze Sprache, und nicht, wie es im Falle der sprachinternen Bedingungen ist, auf spezifische Strukturen, die komplexer oder ambig sind. Auf das Phänomen der Sprachdominanz, die für den 2L1-Erwerb von großer Bedeutung ist, wird noch im nächsten Unterkapitel eingegangen. Zu weiteren Bedingungen, die zwischensprachliche Einflüsse determinieren können, wird die Häufigkeit des Vorkommens einer Struktur im Input gezählt. Die Rolle der Frequenz wird als zentral in der konstruktivistischen Spracherwerbstheorie betrachtet (vgl. Tomasello, 2003). Andererseits beweist beispielsweise Roeper (2007), dass der Häufigkeitsfaktor nicht den ganzen Verlauf des Spracherwerbs zu erklären vermag. Zusammen mit anderen Faktoren, wie die oben genannte Komplexität oder strukturelle Ambiguität, spielt die Frequenz jedoch eine wichtige Rolle bei den zwischensprachlichen Einflüssen (Westergaard & Bentzen, 2007; Anderssen et al., 2018). Zusammenfassend soll unterstrichen werden, dass die Argumente für unterschiedliche Faktoren, die zu zwischensprachlichen Einflüssen führen, sich nicht gegenseitig ausschließen (vgl. Kupisch, 2007, 2012). Die in der Literatur vorge46 Zum Beispiel kann eine NP eine feste Reihenfolge Nomen+Adjektiv in einer Sprache aufweisen, und in der anderen Sprache können zwei Reihenfolgen in der NP möglich sein: Nomen+Adjektiv und Adjektiv+Nomen.

Simultaner Erwerb von zwei Sprachen

45

legte Evidenz für die einzelnen Bedingungen können als komplementär betrachtet werden. Es ist allerdings in der Spracherwerbsforschung noch nicht eindeutig entschieden worden, ob alle oben angeführten Unterschiede zwischen simultan bilingualem Erwerb und monolingualem Erwerb, hierbei vor allem die Erwerbsverzögerung, ganz auf die Beeinflussung einer Sprache durch die andere zurückgeführt werden soll, oder ob ein ganz anderer Faktor, nämlich der Input, eine determinierende Rolle dabei spielt47.

2.5.3 Sprachdominanz beim simultan bilingualen Spracherwerb Zweisprachige Kinder, auch die, die simultan zwei Sprachen erwerben, weisen oft eine unbalancierte Zweisprachigkeit auf, bei der eine der Sprachen als stärkere oder dominante Sprache und die andere als schwächere oder nicht-dominante Sprache bezeichnet wird. Im Alltag wird sogar oft beobachtet, dass die unbalancierte Zweisprachigkeit häufiger als die balancierte vorkommt. Diese Termini bedürfen jedoch zuerst einmal einer Klärung. Meisel (2007b) schlägt vor, zwischen Sprachdominanz und Sprachpräferenz zu unterscheiden. Der Autor weist zurecht darauf hin, dass der Begriff »nichtdominante Sprache« oder »schwächere Sprache« für diejenige Sprache in der Literatur verwendet wird, die weniger in der sprachlichen Umgebung des Kindes benutzt wird, oder die vom Kind eine Zeitlang nicht bevorzugt wird oder noch für die, deren Entwicklung verzögert ist. Obwohl all diese Phänomene meistens in einem Zusammenhang stehen48, sind sie unterschiedliche Bestandteile eines Gesamtbildes und als solche sollen sie auseinandergehalten werden. Meisel (2007b) argumentiert für die Verwendung des Begriffs Dominanz bei der Bezeichnung jener Sprache, die in der gegebenen sprachlichen Umgebung dominant ist. Im Fall der Bevorzugung einer Sprache bei der Sprachwahl eines bilingualen Kindes schlägt Meisel den Terminus »Sprachpräferenz« vor. Der enge Zusammenhang zwischen den beiden Faktoren wird dabei vom Forscher nicht geleugnet. Es wird jedoch zurecht unterstrichen, dass, obwohl die Dominanz einer Sprache in der Umgebung des Kindes zu ihrer Präferenz vom Kind führt, sie nicht der einzige Faktor ist, der die Sprachwahl der Kinder beeinflusst. Im Hinblick auf das Sprachwissen der Kinder schlägt Meisel die Begriffe stärkere und schwächere Sprache vor. Obwohl die Unterscheidung gut fundiert ist, werden in der Spracherwerbsforschung die Termini stärker und dominant als auch 47 Der Inputfaktor wird in Kap. 3 thematisiert. 48 Siehe beispielsweise dazu Grosjean (1982: 189): »the main reason for dominance in one language is that the child has had greater exposure to it and needs it more to communicate with people in the immediate environment«.

46

Altersfaktor – Simultaner vs. Sukzessiver Spracherwerb

schwächer und nicht-dominant abwechselnd benutzt und auf die Sprachkompetenz bezogen (siehe z. B. Kupisch, 2012). Darüber hinaus wird in vielen Studien die dominante Sprache auf Grund des Kriteriums der Inputmenge definiert, der das Kind ausgesetzt ist (siehe z. B. Argyri & Sorace, 2007; Les´niewska & Pichette, 2018), obwohl sich ihre Schlussfolgerungen auf die zugrunde liegende Sprachkompetenz bilingualer Kinder beziehen. Einen Schritt weiter geht noch Unsworth (2016), die vorschlägt, die Inputmenge, der das Kind ausgesetzt ist, als Sprachdominanz zu operationalisieren und den Sprachgebrauch der Kinder als Sprachdominanz in den Studien zum bilingualen Erwerb zu betrachten49. Angesichts der Unklarheiten in der Literatur werden die Termini stärker und dominant sowie schwächer und nicht-dominant in der vorliegenden Arbeit abwechselnd benutzt. Sie werden jedoch, einheitlich auf die Sprachkompetenz bezogen, verwendet. Die Unterscheidung in stärkere und schwächere Sprache wird in der Literatur aber auch in Bezug auf die Frage diskutiert, inwieweit der Erwerb zweier Sprachen unausgeglichen sein soll, damit man von der Entwicklung einer stärkeren oder einer schwächeren Sprache sprechen kann. Viele qualitative und quantitative Kriterien werden mittlerweile als Antwort auf diese Frage vorgeschlagen. Die am häufigsten angewendeten Kriterien sind der MLU-Wert (mean length of utterance), der Erwerb funktionaler Kategorien, die Lexikongröße und die Mischrichtung (vgl. Birdsong, 2014). Die Erforschung schwächerer Sprachen zweisprachiger Kinder ist in letzten Jahren ins Zentrum der Spracherwerbsforschung gerückt. Dafür gibt es zwei Gründe: Erstens ist die schwächere Sprache oft die Herkunftssprache von Kindern aus Familien mit Migrationshintergrund. Auf diesen Sachverhalt wird in Kap. 3.5 näher eingegangen. Zweitens, wenn die schwächere Sprache eine der Sprachen simultan bilingualer Kinder ist, gilt sie als Erstsprache, da sie von Geburt an oder in der frühen Kindheit erworben wird. Das wirft die Frage auf, ob der Erwerb einer Sprache, dessen Beginn in der sensitiven Phase liegt, zur Entwicklung einer mentalen Grammatik führen kann, die sich von der Zielsprache gravierend unterscheidet. Die Studien zur Erforschung dieser Frage bringen widersprüchliche Erkenntnisse hervor. Die meisten Forscher argumentieren dafür, dass die Entwicklung der schwächeren Sprache zwar verzögert sei, aber immer noch dem L1Erwerb gleiche. Von diesem Standpunkt aus gesehen sind die Unterschiede zwischen dem Erwerb der schwächeren Sprache und dem monolingualen Erstspracherwerb quantitativer, und nicht qualitativer Natur (vgl. Meisel, 2007b; Cantone et al., 2008; Bonnesen, 2009). Einige Forscher stellen jedoch Parallelen 49 Siehe dazu Unsworth (2016: 173): »children’s language use may also have potential as a proxy for language dominance in future studies on bilingual language development«.

Simultaner Erwerb von zwei Sprachen

47

zum Zweitspracherwerb fest (siehe Schlyter, 1993; Pfaff 1994; Schlyter & Håkansson, 1994; Bernardini & Schlyter, 2004). In der Entwicklung der schwächeren Sprache kommt es häufig zur Verzögerung des Erwerbs spezifischer Phänomene, zu einer erhöhten Fehlerquote (z. B. Schlyter, 1993) oder zum Einführen einer Struktur aus einer Sprache in die andere (z. B. Yip & Matthews, 2000). Als Grund für diese Beobachtungen werden oft zwischensprachliche Einflüsse angegeben, die angesichts der zwei erworbenen Sprachsysteme bilingualer Kinder eine plausible Erklärung darstellen. Ohne zu hinterfragen. wird dabei oft angenommen, dass die stärkere immer die schwächere Sprache beeinflusst, während die umgekehrte Richtung der möglichen Beeinflussung außer Acht gelassen wird. Obwohl die Sprachdominanz eine wichtige Rolle bei den zwischensprachlichen Einflüssen spielt, ist sie jedoch nicht der einzige Faktor50. Die Unterschiede zwischen dem Erwerb der schwächeren und stärkeren Sprache werden von einigen Forschern mit den Unterschieden in der Sprachkompetenz erklärt (so z. B. Schlyter, 1993). Die Unterschiede können jedoch auch auf spezifische Verarbeitungsmechanismen beim bilingualen Sprachgebrauch zurückgeführt werden, bei dem eine Sprache bei der Aktivierung der anderen nur teilweise ausgeschaltet wird (Meisel 2007b). Green (1998) argumentiert dafür, dass im Gehirn zweisprachiger Personen immer beide Sprachen aktiviert werden, auch, wenn Bilinguale zu einem Zeitpunkt nur eine ihrer Sprachen benutzen. Während die eine Sprache gebraucht wird, muss die Aktivierung der anderen Sprache gehemmt werden. Je stärker diese Sprache ist, desto mehr Energie muss das Gehirn einer zweisprachigen Person dazu aufwenden, die Aktivierung der nicht gerade benutzten Sprache zu unterdrücken. Die Sprache, die stärker ist, beeinflusst in diesem Fall den Gebrauch der schwächeren Sprache der Kinder. Eine Beeinflussung in die andere Richtung kann aber auch nicht ausgeschlossen werden. Nicoladis (2006), Meisel (2007b), Pérez-Leroux et al. (2009) sowie Nicoladis et al. (2010) sehen in der Ko-Aktivierung beider Sprachen den Grund für die Unterschiede beim Sprachgebrauch einsprachiger und zweisprachiger Kinder. Vorschläge für die Erklärung der Unterschiede zwischen monolingualem und bilingualem Sprachgebrauch mit der Ko-Aktivierung beider Sprachen bei zweisprachigen Personen sind mit der Verarbeitungsebene und nicht mit der Repräsentationsebene verbunden (vgl. Argyri & Sorace, 2007; Serratrice, 2007; Persici et al., 2019). Sie beziehen sich daher nicht auf den Altersfaktor. Die Entwicklung einer Sprache von simultan bilingualen Kindern zu einer Sprache, die schwächer ist, wird meistens mit dem eingeschränkten Input in der 50 Die Diskussion zum Thema der Faktoren der zwischensprachlichen Einflüsse wurde in Kap. 2.5.2 dargestellt.

48

Altersfaktor – Simultaner vs. Sukzessiver Spracherwerb

Sprache begründet. Es ist eine offensichtliche Begründung. Der Einfluss des Faktors des Inputs auf den Spracherwerb ist jedoch ein gewichtiges Thema, daher wird es ausführlich in Kap. 3 behandelt.

2.6

Sukzessiver Spracherwerb

Während der simultane Erwerb von zwei Sprachen unstrittig als Erwerb von zwei Erstsprachen gilt, ist das beim sukzessiven Erwerb nicht mehr der Fall. Als sukzessiver Erwerb einer Sprache wird ein Prozess verstanden, in dem eine Sprache als zweite (oder dritte usw.) Sprache der gegebenen Person erworben wird. Die Aneignung der zweiten Sprache kann schon in der Kindheit geschehen. Unter dem sukzessiven Zweitspracherwerb im Kindesalter, wird in der Spracherwerbsforschung ein Prozess der Aneignung einer zweiten Sprache verstanden, der noch in der Kindheit beginnt, aber bereits nachdem die Grundzüge der Erstsprache vom Kind erworben worden sind. Die Erforschung des sukzessiven Spracherwerbs in der Kindheit ist für die Erforschung der menschlichen Sprachlernfähigkeit hochrelevant. Erstens kann sie dazu beitragen, dass die Rolle des Alters zu Beginn des Spracherwerbs geklärt wird. Sie betrifft nämlich den Spracherwerb zu jenem Zeitpunkt, an dem Kinder womöglich noch einen offenen Zugriff auf ihre angeborene Sprachlernfähigkeit haben, wie es mehrere Forscher behaupten (siehe Kap. 2.4). Andererseits werden Kinder untersucht, die schon ihre Erstsprache größtenteils erworben haben. Das im Gehirn der Kinder etablierte L1-System ist eine potentielle Quelle des Transfers, was wiederum viele Forscher als Hauptgrund für die altersbedingten L1-L2-Unterschiede sehen (siehe Kap. 2.4). Zweitens können die Untersuchungen des Erwerbsverlaufs der zweiten Sprache in der Kindheit besonders aufschlussreich im Hinblick auf die Festlegung der Dauer der sensitiven Phasen für den Erwerb spezifischer Phänomene sein. So behauptet beispielsweise Schwartz (2004), dass Untersuchungen des sukzessiven Spracherwerbs im Kindesalter zur Beantwortung der grundlegenden Frage beitragen können, ob das sprachliche Wissen der L2-Lerner und der L1Lerner epistemologisch äquivalent ist. Wenn sich die Sprachentwicklung im sukzessiven Spracherwerb in der Kindheit und im Zweitspracherwerb von Erwachsenen als ähnlich, und vom L1-Erwerb unterschiedlich, erweisen sollte, muss der Sachverhalt auf den L1-Einfluss zurückgeführt werden. Laut Schwartz wäre es ein Beweis für die typologische Äquivalenz zwischen dem sprachlichen Wissen in der Erstsprache und in der Zweitsprache (siehe Schwartz, 2004: 99). Obwohl die Spracherwerbsforschung in den letzten Jahrzehnten immer intensiver betrieben worden ist, sind noch viele, den sukzessiven Erwerb der zweiten Sprache im Kindesalter betreffende, Fragen offen geblieben. Zu den

Sukzessiver Spracherwerb

49

wichtigsten gehört die Festlegung der Grenze zwischen dem simultanen und sukzessiven bilingualen Erwerb, auf die in Kap. 2.6.1 eingegangen wird, und die Unterschiede zwischen dem simultanen und sukzessiven bilingualen Erwerb in der Kindheit in den einzelnen Sprachbereichen. In Kap. 2.6.2 wird ein kurzer kritischer Überblick über die Literatur zur zweiten Frage gegeben.

2.6.1 Altersgrenze zwischen simultan und sukzessiv bilingualem Erwerb Auf den ersten Blick scheint die Grenze zwischen dem simultan und sukzessiv bilingualen Erwerb klar zu sein. Beim simultanen Erwerb handelt es sich um einen parallelen Prozess, und beim sukzessiven Erwerb wird eine Sprache nach der anderen erworben. Mit einer wirklich eindeutigen Situation haben wir es aber nur dann zu tun, wenn Kinder beide (oder mehr) Sprachen von Geburt an erwerben. Häufig ist es der Fall, dass die zweite Sprache etwas später, aber immer noch sehr früh erworben wird. Sollte der Erwerb einer Sprache, der mit 6 Monaten oder einem Jahr beginnt, als L2-Erwerb und nicht mehr als L1-Erwerb gelten? Zu diesem Zeitpunkt ist die Struktur der Erstsprache im Gehirn des Kindes noch nicht etabliert worden. Die meisten Spracherwerbsforscher (obwohl nicht alle) würden in diesem Fall immer noch von L1 sprechen. Wann ist jedoch der kritische Punkt, an dem wir sagen können, dass die mentale L1-Struktur so weit entwickelt ist, dass die nächste Sprache als L2 gelten soll? Dies gilt es zu beantworten. In der Spracherwerbsforschung wird auch oft implizit oder explizit angenommen, dass die Grenze zwischen dem simultan und sukzessiv bilingualen Erwerb mit der Dauer der sensitiven Phase für den Spracherwerb einhergeht. Solange der Erwerb innerhalb der sensitiven Phase beginnt, kann er als L1Erwerb betrachtet werden. Die Unterscheidung in simultan und sukzessiv bilingualen Erwerb kann auch mit den anderen Hypothesen zum Altersfaktor zusammenhängen, die in Kap. 2.4 dargestellt worden sind. Bei der Annahme unterschiedlicher Verarbeitungsmechanismen in L1 und L2 müsste die Grenze zwischen dem simultan und sukzessiv bilingualen Erwerb auch mit ihnen einhergehen. Angesichts der hochrelevanten theoretischen und empirischen Konsequenzen, die der Festlegung der Grenze zwischen dem simultanen und sukzessiven Bilingualismus folgen, kann es nicht verwundern, dass die Frage seit Jahrzehnten intensiv diskutiert wird, die Antwort aber noch nicht gefunden worden ist. Schon in der Mitte des 20. Jhs. gehen Penfield und Roberts (1959: 236) von einer Altersgrenze von 9 Jahren aus, die für das Sprachenlernen gelten sollte. Sie sind der Ansicht, dass nach diesem Zeitpunkt das menschliche Gehirn zu unelastisch für das Lernen von Sprachen wäre. Lenneberg (1967) schlägt die Zeit-

50

Altersfaktor – Simultaner vs. Sukzessiver Spracherwerb

spanne vom 2. Lebensjahr bis zur Pubertät vor als jene, in der ein erfolgreicher Spracherwerb lediglich auf Grund des Kontakts mit dem sprachlichen Input möglich sei. Bei der Annahme, dass jeder Erwerb innerhalb der kritischen Periode als L1 gilt, müsste die Grenze zwischen dem simultanen und sukzessiven Erwerb nach Lenneberg auf die Zeit der Pubertät festgelegt werden. McLaughlin (1978:9) setzt die Grenze im Alter von 3 Jahren mit der Begründung an, dass die Erstsprache in diesem Alter schon erworben worden sei. Seliger (1978) argumentiert, dass die Pubertät der Zeitpunkt sei, an dem die phonologischen Aspekte der Sprache im Gehirn lokalisiert werden. Daher sei dieser Zeitpunkt laut Seliger der Endpunkt der kritischen Periode für den phonologischen Bereich. Der syntaktische Bereich kann aber nach Seligers Auffassung auch später erfolgreich erworben werden. Johnson und Newport (1989) schlussfolgern aus ihren empirischen Untersuchungen zum Endzustand des L2-Erwerbs, dass die Zeit bis zum 7. Lebensjahr für den Spracherwerb besonders günstig sei, der Zeitraum zwischen dem 7. Lebensjahr und der Pubertät mit einem graduellen Abstieg der Sprachlernfähigkeit einhergehe und in der Zeit nach der Pubertät die Sprachlernerfolgsrate abrupt sinken würde. Wie in Kap. 2.4 schon dargestellt, wird die Auffassung der kritischen Periode in den späteren Jahren modifiziert, indem man nicht mehr von einer Periode, sondern von mehreren sensiblen Phasen für verschiedene Sprachbereiche spricht. Der Spracherwerbsforscher Long (1990) schlägt vor, das Ende der sensiblen Phase für den phonologischen Bereich im 12. Lebensjahr, und für den morphologischen und syntaktischen Bereich im 15. Lebensjahr anzusetzen. Long (1990: 280) zufolge ist das Erreichen muttersprachlicher Kompetenz in den Aspekten der Sprache bis zu den genannten Zeitpunkten möglich. Im 21. Jh. wird die Grenze der sensitiven Phase meistens früher in der Kindheit angesetzt. So schlagen Hyltenstam und Abrahamsson (2003) vor, dass die sensible Phase für den phonologischen Bereich nach dem 12. Lebensmonat endet. Die Forscher gehen von der Annahme aus, dass bis zum 6. oder 7. Lebensjahr beim Erwerbsanfang das Erreichen der L1-Kompetenz möglich ist (Hyltenstam & Abrahamsson, 2003: 575)51. Meisel (2007a) geht bei der Unterscheidung zwischen dem simultan und sukzessiv bilingualen Erwerb von den empirischen Untersuchungen zur Sprachentwicklung aus. Er argumentiert, dass die Grenze zwischen dem 3. und 4. Lebensjahr anzusetzen ist, weil beim späteren Beginn des Erwerbs gravierende Unterschiede zum Erstspracherwerb auftauchen. Der Erwerb nach dem 8. Lebensjahr wird von Meisel (2007a) als Zweitspracherwerb von Erwachsenen aufgefasst. Chilla (2008: 112) geht wiederum davon aus, dass man von einem sukzessiven Spracherwerb sprechen kann, wenn das Alter zu Beginn des Erwerbs 51 Siehe Hyltenstam & Abrahamsson (2003) für eine ausführliche Darstellung.

Sukzessiver Spracherwerb

51

zwischen 3 und 6 Jahren liegt. Nicholas und Lightbown (2008) argumentieren dafür, dass die Unterschiede beim Spracherwerb schon beim Alter von 2 Jahren zu Beginn des Erwerbs beobachtet werden können. Dieser Argumentation folgend klassifizieren Schulz und Tracy (2011) als simultan zweisprachige Kinder nur solche, die bis zum 2. Lebensjahr mit dem Erwerb der zweiten Sprache begonnen haben. Sie begründen die Einteilung auch dadurch, dass Kinder nach diesem Alter schon substantielles lexikalisches und grammatisches Wissen in der L1 erworben hätten. Meisel (2018) präzisiert seine frühere Annahme zur L1-L2Grenze zwischen dem 3. und 4. Lebensjahr und setzt sie im Alter von 3;6 Jahren an. Dabei basiert er auf mehreren empirischen Studien zum bilingualen Erwerb von unterschiedlichen Sprachbereichen, die zeigen, dass ab diesem Alter zu Beginn des Spracherwerbs der Verlauf der Sprachentwicklung von der L1-Entwicklung abzuweichen beginnt. Das Alter zwischen 3 und 4 Jahren zu Beginn des Spracherwerbs wird auch als Grenze zwischen dem simultan und sukzessiv bilingualen Spracherwerb von Kroffke und Rothweiler (2006), Rothweiler (2006) und Sopata (2009, 2011) auf Grund der Untersuchungen von Sprachentwicklung vorgeschlagen. Ein anderes methodologisches Herangehen an das Thema trifft man bei Sopata und Długosz (im Druck). In einer empirischen Studie werden die sprachlichen Daten von 58 polnisch-deutsch zweisprachigen Kindern untersucht. Die statistische Analyse der Ergebnisse liefert eine Evidenz dafür, dass der optimale Punkt, der die Probanden am besten in Hinsicht auf den Erwerbserfolg nach einigen Jahren unterscheidet, das Alter von 36,5 Monaten zu Beginn des Spracherwerbs ist. Aus diesem Grund wird das Alter von 3 Jahren als Grenze zwischen L1 -und L2-Erwerb, also dem simultan und sukzessiv bilingualen Erwerb der Kinder von den Autoren vorgeschlagen. Die Debatte über die exakte Grenze zwischen den unterschiedlichen Spracherwerbstypen kann nicht als abgeschlossen gelten. Auf der Basis von zugänglichen empirischen Untersuchungsergebnissen ist es immer sehr schwierig, eine fixe Grenzlinie zu setzen. In der einschlägigen Literatur wird allerdings allgemein angenommen, dass die L1-L2-Grenze viel früher als in der Pubertät anzusetzen ist, welche ursprünglich von Lenneberg als Ende der kritischen Periode vorgeschlagen worden ist. Es häufen sich die Argumente, dass die Grenze um das 3. Lebensjahr zu setzen ist. Diese stützen sich sowohl auf die konzeptuellen Erwägungen als auch auf die empirische Evidenz zum L1-Erwerb sowie zum Verlauf der Sprachentwicklung in der frühen und späteren Erwerbsphase und zum Endzustand des Erwerbs der zweiten Sprache der Kinder mit verschiedenem Alter zum Erwerbsbeginn.

52

Altersfaktor – Simultaner vs. Sukzessiver Spracherwerb

In der vorliegenden Arbeit wird daher das Alter von 3 Jahren als Grenze zwischen dem L1- und L2-Erwerb angenommen, und es wird davon ausgegangen, dass: – Kinder, die ihren ersten Kontakt mit ihrer zweiten Sprache bis zum 3. Lebensjahr hatten, als simultan zweisprachige Kinder zu verstehen sind (2L1), und – Kinder, die in Kontakt mit ihrer zweiten Sprache später als mit 3 Jahren und vor dem 8. Lebensjahr getreten sind, als sukzessiv zweisprachige Kinder und dadurch auch als frühe L2-Lerner einzuordnen sind (cL2 – child second language acquisition).

2.6.2 Unterschiede zwischen simultan und sukzessiv bilingualem Erwerb Ein Vergleich der Ergebnisse unterschiedlicher Studien zum bilingualen Erwerb ist schwierig, weil die untersuchten Gruppen, d. h. simultan und sukzessiv zweisprachige Kinder, oft auf verschiedene Weise definiert werden. Darüber hinaus betreffen sie eine ganze Reihe von unterschiedlichen Sprachbereichen, und aus den Ergebnissen zum Erwerb eines Sprachbereichs kann man nur bedingt auf den Verlauf des Erwerbs eines anderen Sprachbereichs schließen. Um die Untersuchungen zum bilingualen Erwerb einordnen zu können, ist daher eine Präzisierung der Grundkonzepte, die den Studien zugrunde liegen, notwendig. Insbesondere ist zu klären, wie simultane und sukzessive Lerner in Hinsicht auf das Alter zu Beginn des Erwerbs in einzelnen Studien definiert worden sind. Weiterhin muss darauf geachtet werden, auf welche Sprachbereiche sich die Untersuchungen beziehen. Außerdem ist von großer Bedeutung, unter welchen Umständen der Spracherwerb vonstattengeht. Vor allem aber muss bei jeder Diskussion der Ergebnisse der Studien zum Vergleich zwischen simultan und sukzessiv bilingualem Erwerb präzisiert werden, ob sich die jeweilige Untersuchung mit der Sprachentwicklung, mit der Schnelligkeit des Erwerbs, mit der erreichten Sprachkompetenz oder mit den Verarbeitungsprozessen beschäftigt. Angesichts der methodologischen Schwierigkeiten des Vergleichs unterschiedlicher Studien zum frühen Bilingualismus, der relativ hohen individuellen Variabilität und dessen, dass der Verlauf verschiedener Sprachphänomene mit zeitlich unterschiedlichen sensiblen Phasen verbunden sein kann, ist das Bild des sukzessiv bilingualen Erwerbs in der Kindheit sehr komplex. Der sukzessive Erwerb einer zweiten Sprache in der Kindheit gilt auch als besonderer Spracherwerbstyp in der Forschung, weil er sowohl Unterschiede und Ähnlichkeiten zum Erstspracherwerb als auch zum Zweitspracherwerb Erwachsener aufweist (vgl. Unsworth, 2005; Meisel, 2008, 2011; Sopata, 2009).

Sukzessiver Spracherwerb

53

Im Vergleich zum Erstspracherwerb wird von mehreren Forschern auf den unterschiedlichen Anfangsstand des sukzessiven Erwerbs hingewiesen. Während in monolingualen Daten aus den frühen Phasen der Sprachentwicklung nur lexikalische Kategorien oder nur eine nicht vollständig spezifizierte funktionale Kategorie vorkommt, taucht in den frühen Daten jener Kinder, die sukzessiv die zweite Sprache erwerben, Evidenz für funktionale Kategorien auf (Grondin & White, 1996; Haznedar, 2001, 2003). Untersuchungen zum Gebrauch sog. root infinitives zeigen wiederum gewisse Ähnlichkeiten zwischen dem L1- und cL2Erwerb (vgl. Prevost, 2003). In einigen Arbeiten werden jedoch Unterschiede in der Distribution der Konstruktionen im Vergleich zum L1-Erwerb gefunden (siehe Schwartz & Sprouse, 2002; Riedel, 2008). In den Studien zur Platzierung der Verben zeigen Prevost (2003), Blom (2006), Blom und Polisenska (2006), Rothweiler (2006) sowie Thoma und Tracy (2006), dass der Verlauf des sukzessiven Erwerbs einer Zweitsprache von Kindern im Alter von 3 bis 4 zu Beginn des L2-Erwerbs dem Erstspracherwerb ähnelt. Blom (2006) untersucht den cL2-Erwerb im Alter von 4 Jahren zu Beginn des Erwerbs, Rothweiler (2006) analysiert die Daten von drei Kindern mit L1 Türkisch, die L2Deutsch im Alter zwischen 2,10 und 4,5 Jahren begonnen haben. Thoma und Tracy (2006) untersuchen den cL2-Erweb des Deutschen bei Kindern mit Arabisch, Russisch und Türkisch als L1, deren Alter zu Beginn des Zweitspracherwerbs 3 bis 4 Jahre betrug. Kritisch ist hier anzumerken, dass die Erhebung der Daten in den meisten hier genannten Studien zu einem Zeitpunkt begonnen wurde, zu dem der Erwerb der Zweitsprache schon relativ fortgeschritten war, was zur Verzerrung des Bildes der Sprachentwicklung beigetragen haben kann. Darüber hinaus zeigen einige Forscher, dass die sukzessiv zweisprachigen Kinder doch Konstruktionen benutzen, die im L1-Erwerb so gut wie nie vorkommen (siehe z. B. Tran, 2005). Der sukzessive Erwerb einer zweiten Sprache in der Kindheit weist auch einige Ähnlichkeiten mit dem Zweitspracherwerb der Erwachsenen (aL2) auf. Im morphologischen Bereich werden solche Parallelen zwischen cL2 und aL2 bei der Markierung von Person und Tempus an Verben (Granfeldt et al., 2007; Meisel, 2008, 2009; Schlyter, 2011) und Genuserwerb beobachtet (Granfeldt et al., 2007; Meisel, 2018). Der sukzessive Erwerb der zweiten Sprache in der Kindheit ähnelt auch dem der Erwachsenen in der Platzierung von Verben. Hierbei sind vor allem die Untersuchungen der V2-Eigenschaft des L2-Deutschen aufschlussreich. Rothweiler (2006), Chilla (2008) und Sopata (2009, 2011) zeigen, dass Kinder, die sukzessiv Deutsch erwerben, V3-Konstruktionen und nicht-finite Verbformen an der V2-Position wie erwachsene Lerner benutzen. Diese Beobachtung wird auf die höhere Intensität der zwischensprachlichen Einflüsse im sukzessiven als im simultanen Bilingualismus zurückgeführt (vgl. Sopata, 2009, 2021; Sopata et al., 2021). Darüber hinaus zeigt die Studie von Granfeldt et al. (2007) zum L2-

54

Altersfaktor – Simultaner vs. Sukzessiver Spracherwerb

Französisch, dass sukzessiv zweisprachige Kinder klitische Elemente an falschen Positionen, so wie erwachsene Lerner, gebrauchen. Als Fazit der oben dargestellten Untersuchungen soll festgehalten werden, dass der sukzessive Erwerb einer zweiten Sprache in der Kindheit als separater Spracherwerbstyp gilt, der einige Ähnlichkeiten mit der L1 und einige mit der aL2 aufzeigt. Der Verlauf des cL2-Erwerbs ist jedoch bis jetzt noch nicht richtig geklärt worden. Da die sensiblen Phasen für einzelne Sprachbereiche graduell abklingen, ist zu erwarten, dass einige Sprachbereiche bei einem früheren Alter zu Beginn des Erwerbs vom Altersfaktor und andere bei einem etwas späteren Alter betroffen sind. Einen zusätzlichen Faktor bildet die individuelle Variabilität, die im sukzessiven Spracherwerb deutlich zu sehen ist, und die auch zur Komplexität der Dateninterpretation im sukzessiv bilingualen Erwerb in der Kindheit beiträgt.

2.7

Zur Interaktion des Altersfaktors mit anderen Faktoren

Wie in Kap. 2.1 kurz skizziert, interagieren mehrere Faktoren beim Spracherwerb miteinander, und bei der Erklärung des Verlaufs sowie des Endstands des Erwerbs müssen mehrere Faktoren berücksichtigt werden. Neben dem Altersfaktor determiniert der Inputfaktor bestimmt auch die Schnelligkeit, den Verlauf und den Erfolg des Spracherwerbs. Auf den Faktor des Inputs wird in Kap. 3 eingegangen. Ein anderer Faktor, der beim frühen Bilingualismus eine vorrangige Rolle spielt, ist eine linguistische Variable, die von Tsimpli (2014) beschrieben worden ist. In ihrem einflussreichen vielzitierten Artikel lenkt sie die Aufmerksamkeit auf die Interaktion des Altersfaktors (und Inputs) mit dem Zeitpunkt, an dem ein jeweiliges sprachliches Phänomen während der L1-Entwicklung erworben wird. Tsimpli (2014) teilt die unterschiedlichen Aspekte der Grammatik in früh, spät und sehr spät erworbene Phänomene ein. Diese Einteilung wird linguistisch begründet, indem die früh erworbenen Phänomene mit der Kernsyntax und den Parametern verbunden sind, und die spät sowie sehr spät erworbenen die syntax- oder sprachexternen Ressourcen involvieren. Der Zeitpunkt, an dem das jeweilige Phänomen im L1-Erwerb angeeignet wird, hat einen enormen Einfluss darauf, wie das Phänomen im bilingualen Erwerb erworben wird. Zu den früh erworbenen Phänomenen, die vor dem 5. Lebensjahr erworben werden, gehören beispielsweise die V2-Eigenschaft, die Subjekt-Verb-Kongruenz und die Objekt-Verb-Folge (vgl. Clahsen, 1986; Tracy, 1991) sowie die Nebensätze im Deutschen (vgl. Rothweiler, 1993). Als Beispiel für spät, d. h. um das 5. Lebensjahr, erworbene Phänomene, kann das Passiv gelten. Zu den sehr spät erworbenen Phänomenen gehört beispielsweise nach Tsimpli das grammatische

Zur Interaktion des Altersfaktors mit anderen Faktoren

55

Genus im Niederländischen. Die Forscherin argumentiert dafür, dass die früh erworbenen Phänomene zwischen den simultan und sukzessiv bilingualen Kindern unterscheiden können. Beim Erwerb dieser Phänomene haben 2L1Kinder einen Vorteil gegenüber den cL2-Lernern. Es ist zu erwarten, dass der simultane Erwerb der Phänomene dem L1-Erwerb ähnelt, und der cL2-Erwerb Parallelen zum aL2-Erwerb aufzeigen wird. Bei den spät und sehr spät erworbenen Phänomenen argumentiert Tsimpli dafür, dass simultan und sukzessiv zweisprachige Kinder sich ähnlich verhalten und sich gleichzeitig von monolingualen Kindern unterscheiden. Tsimplis These ist von einigen empirischen Untersuchungen überprüft und verifiziert worden (Unsworth et al., 2014; Roesch & Chondrogianni, 2016; Schulz & Grimm, 2019). Zusammenfassend soll hervorgehoben werden, dass der Faktor des Alters als einer der wichtigsten Faktoren in der Spracherwerbsforschung, die den Spracherwerb beeinflussen, aufgefasst wird. Das Alter zu Beginn des Spracherwerbs determiniert die Klassifizierung des Prozesses bei zweisprachigen Kindern als simultanen oder sukzessiven Spracherwerb. Der Altersfaktor interagiert dabei mit anderen internen und externen Faktoren. Während die wesentliche Rolle des Altersfaktors beim Spracherwerb in der Forschung einheitlich anerkannt wird, stehen noch Antworten auf einige wichtige Fragen aus. Mit der Annahme von unterschiedlichen sensitiven Phasen für einzelne Sprachbereiche wird die Frage nach dem Einfluss des Altersfaktors auf den Verlauf des Erwerbs unterschiedlicher Sprachbereiche aufgeworfen. Sein Einfluss auf den Erwerbsverlauf kann auch in verschiedenen Stadien unterschiedlich ausgeprägt sein. Die Erforschung des Erwerbs von zwei Sprachbereichen von Kindern, die simultan oder sukzessiv bilingual sind, und die in ihrem Erwerbsprozess fortgeschritten sind, ist der erste wichtige Bestandteil der Forschungsfragen der vorliegenden Arbeit.

Kapitel 3: Inputfaktor – Mehrheitssprache vs. Herkunftssprache

3.1

Zur Bedeutung des Inputs beim Spracherwerb

Der Input ist nicht einfach ein zusätzlicher Faktor beim Spracherwerb, sondern eine notwendige Grundlage für diesen Prozess. Kinder erwerben ihre Erstsprache dadurch, dass sie der Sprache im Kindesalter ausgesetzt sind. Es ist selbstverständlich, dass der Prozess nicht beginnen oder fortgesetzt werden könnte, wenn Kinder keinen Zugang zum Input in der gegebenen Sprache hätten. Der Input ist also eine Bedingung sine qua non des Spracherwerbs. Kinder entwickeln ihre muttersprachliche Kompetenz in einer oder in zwei (oder mehreren) Sprachen, wenn sie von Geburt an oder bis zu 3–4 Jahren danach den Spracherwerb beginnen und wenn sie einen ausreichenden Zugang zum Input in den jeweiligen Sprachen haben. Mehrere Studien innerhalb der Spracherwerbsforschung zeigen, dass es bei vielen simultan bilingualen Kindern der Fall ist, dass beide Bedingungen erfüllt werden. Simultan bilinguale Kinder beginnen erstens mit dem Spracherwerb beider Sprachen so früh, dass der Prozess innerhalb der sensitiven Phase angesetzt wird. Zweitens ist der Input in zwei Sprachen genügend intensiv, dass das Erreichen der muttersprachlichen Kompetenz in beiden Sprachen von simultan bilingualen Kindern nicht nur möglich, sondern sogar häufig der Fall ist. Das beweist, dass die Bedingung eines ausreichenden Zugangs zum Input nicht bedeutet, dass 100 % der vom Kind gehörten Äußerungen in einer Sprache sein müssen, damit sie erfolgreich erworben wird. Offensichtlich reicht es auch aus, wenn es weniger als 100 % ist. Es entsteht jedoch die Frage, welche quantitativen und womöglich qualitativen Bedingungen beim Input erfüllt werden sollten, damit der Spracherwerb mit der muttersprachlichen Kompetenz endet oder damit die Sprachentwicklung als L1Erwerb bezeichnet werden könnte (vgl. Meisel, 2013). Neben simultan bilingualen Kindern, die beide Sprachen auf muttersprachlichem Niveau erworben haben, gibt es auch Kinder, bei denen eine Sprache sehr viel schwächer ist. Viele Spracherwerbsforscher sind sich darüber einig, dass der Inputfaktor dafür verantwortlich ist, wenn das grammatische Wissen der Kinder von dem monolin-

58

Inputfaktor – Mehrheitssprache vs. Herkunftssprache

gualer L1-Sprecher oder bilingualer balancierter Sprecher der jeweiligen Sprache abweicht. Nun sind die Fragen noch offen, wann der Input nicht ausreichend ist, um eine sprachliche Entwicklung zu ermöglichen, die der monolingualen Entwicklung gleicht. Die Antwort auf die Frage, welche qualitativen oder quantitativen Aspekte des Inputs für das Erreichen muttersprachlicher Kompetenz durch bilinguale Kinder wesentlich sind, steht auch noch aus. Die andere fundamentale Frage, die mit dem Input verbunden ist, ist jene, wie der Inputfaktor mit dem Altersfaktor beim Spracherwerb zusammenhängt. Die Erklärung des Einflusses des Inputs auf den Spracherwerb ist sowohl aus empirischen und pragmatischen Gründen als auch aus theoretischen Gründen sehr wichtig. Ein gutes Verständnis der Rolle des adäquaten Inputs beim Spracherwerb ist eine Voraussetzung für die Entwicklung guter Fördermaßnahmen für Kinder, die beispielsweise mit mangelnden Sprachkenntnissen ihre Schulausbildung beginnen. Es ist auch notwendig, um Kinder mit verzögerter Sprachentwicklung, die auf eine kleinere Sprachexposition zurückzuführen ist, von jenen mit einer spezifischen Sprachentwicklungsstörung zu unterscheiden. Mehrere Studien berichten über ein hohes Risiko einer Fehldiagnose bei bilingualen Kindern, bei denen der durch die eingeschränkte Sprachexposition bedingte Verzug in der Sprachentwicklung als Indikator der Sprachstörung diagnostiziert wird (vgl. Armon-Lotem et al., 2015; Kohnert, 2010; Peña & Bedore, 2011; Hoff, 2013; Rothweiler, 2013; Czaplewska et al., 2014; Gathercole, 2017; Schulz et al., 2017). Die Frage nach dem Zusammenspiel des Alters- und Inputfaktors ist auch für die linguistische Theorie von höchstem Belang. Sie steht im Zentrum der fundamentalen Diskussion zwischen der nativistischen und nicht-nativistischen Perspektive der Spracherwerbstheorie52. Auch im engeren Rahmen der Spracherwerbsforschung steht die Natur des Einflusses des Inputs auf den Spracherwerb, ähnlich wie die Natur des Einflusses des Alters auf den Spracherwerb, unter Debatte. Während das Kapitel 2 dem Altersfaktor und den mit ihm in der Spracherwerbsforschung verbundenen Fragen gewidmet war, ist das vorliegende Kapitel 3 dem Inputfaktor und den aus ihm resultierenden Phänomenen im Spracherwerb gewidmet.

52 Siehe Kap. 1 und Kap. 6 zur eingehenden Darstellung der Fragestellung.

Begriffsbestimmung

3.2

59

Begriffsbestimmung

Als Input wird von vielen Forschern die Gesamtheit der Sprache verstanden, die das Kind hört. Andere Termini tauchen jedoch auch in der Literatur zur Spracherwerbsforschung in diesem Zusammenhang auf. Es wird auch von Sprachexposition oder Spracherfahrung (siehe z. B. Grüter & Paradis, 2014) gesprochen, um die Interaktionen des Kindes mit seiner Umgebung zu erfassen. Viele Autoren benutzen die Begriffe Input und Sprachexposition abwechselnd. Carrol (2017) kritisiert diese, zugegeben etwas vereinfachende, Auffassung eines komplexen Phänomens. Sie unterscheidet zwischen Input, der als abstraktes Konstrukt für die Lösung des Lernproblems notwendig ist, und Sprachexposition (exposure). Mit diesem Begriff bezeichnet Carroll (2017) all das, was beobachtbar und messbar im gegebenen Lernkontext ist, was beispielsweise in den Aufnahmen von der an Kinder gerichteten Sprache gefunden werden kann. Bei Untersuchungen, die auf Experimenten basieren, bei denen Stimuli kontrolliert werden, können die einzelnen Expositionen zu den jeweiligen Stimuli gezählt werden (Carroll, 2012, 2014). Aus diesen Daten können dann Schlussfolgerungen darüber gezogen werden, was die Sprachlerner wahrgenommen haben und was sie in ihre mentale Repräsentationen integriert haben. Im Gegensatz zur Sprachexposition ist der Input nach Carrolls Auffassung ein abstraktes Konstrukt, das nicht direkt beobachtbar in den an Kinder gerichteten Sprachäußerungen ist. Es ist Teil der mentalen Repräsentation, der aus der Perspektive der Erlernbarkeitstheorie relevant für das Erlernen eines gegebenen Sprachphänomens ist. Aufbauend auf Fodors Theorie (Fodor, 1998a, 1998b) teilt Carroll den Input in zwei Typen ein: Erstens argumentiert sie für die Einführung des Inputs zur Sprachverarbeitung (Input to Language Processor), der die Eingangseinheiten für den Sprachverarbeitungsmechanismus liefert, die von ihm analysiert werden, wenn der Zustand der mentalen Grammatik im gegebenen Moment es ermöglicht. Zweitens schlägt Carroll vor, den Terminus Input für den Spracherwerbsmechanismus (Input to Language Acquisition Mechanismus) einzuführen, der sich darauf bezieht, was der Mechanismus braucht, um neue mentale Repräsentationen zu schaffen. Carroll (2017) unterstreicht zurecht, dass der Input in ihrer Auffassung nicht einfach auf die Menge der Sprachexposition zurückgeführt werden kann, weil zum Erlernen einiger Phänomene manchmal sehr wenig Input gebraucht wird. Carrolls Vorschlag, den Input im Hinblick auf die Erlernbarkeitstheorie zu definieren, geht zum Teil mit der von Wijnen (2000) vorgeschlagenen Dichotomie einher, nämlich Input vs. Intake. Nach Wijnen soll der zweite Terminus jene Daten bezeichnen, auf deren Grundlage Kinder ihre Hypothesen zur Struktur der erworbenen Sprache aufbauen (siehe auch De Houwer, 2017). Nicht alles, was Kinder hören, wird von ihnen verarbeitet und trägt automatisch zum Sprach-

60

Inputfaktor – Mehrheitssprache vs. Herkunftssprache

erwerb bei. Einerseits kann ein Teil der gehörten Sprachäußerungen, die nicht an Kinder gerichtet sind, gar nicht von ihnen wahrgenommen werden. Kuhl (2007) zeigt beispielsweise, dass Kinder Sprache nicht nur auf Grund von Videofilmen oder Audioaufnahmen allein erwerben können. Andererseits sind Kinder nicht imstande, zum gegebenen Zeitpunkt der Sprachentwicklung alle Sprachinformationen zu verarbeiten. Der Grad dessen, was sie verarbeiten können, hängt vor allem vom Entwicklungszustand der Sprache zu diesem Zeitpunkt (Wijnen, 2000), und möglicherweise auch von anderen Faktoren ab. Obwohl die von Carroll (2017) vorgeschlagene Perspektive der Erlernbarkeitstheorie bei der Präzisierung der Begriffe Input und Sprachexposition überzeugend ist, werden die Termini in der vorliegenden Arbeit gleichbedeutend benutzt. Die präzise Unterscheidung dieser Begriffe ist in den Studien, die die Sprachverarbeitung oder die Lernbarkeit als Untersuchungsgegenstand haben, notwendig. Da dies in der vorliegenden Arbeit aber nicht der Fall ist, und angesichts der langen Tradition in der Spracherwerbsforschung, diese Termini abwechselnd zu benutzen, wird auf ihre Unterscheidung in der vorliegenden Arbeit verzichtet.

3.3

Input als Faktorenkomplex

Die Erforschung des Inputs und seines Einflusses auf den Spracherwerb hat gezeigt, dass man beim Input eigentlich nicht von einem Faktor, sondern von einem komplexen Phänomen sprechen soll, dessen verschiedene Aspekte eine unterschiedliche Rolle in der bilingualen Entwicklung spielen. Die Schnelligkeit und der Verlauf des Spracherwerbs sowie das Niveau der erworbenen Sprachkompetenz können von der Menge, der Qualität und dem Kontext des Inputs abhängig sein. Darüber hinaus sind solche Aspekte des Inputs wie die Quelle des Inputs, ob das Kind der Sprache monolingualer oder bilingualer Sprecher ausgesetzt ist, oder welchen Anteil unterschiedliche Sprachgemeinschaften an der Sprachexposition beim gegebenen Kind haben, wichtig. Eine wesentliche Rolle spielt auch die Sprachsituation in der Familie und die Familiensprachenpolitik. Die Aspekte, die die Menge und die Qualität der Sprachexposition im bilingualen Spracherwerb determinieren, sind von Gathercole (2014) in folgender Liste zusammengefasst worden: 1. Quelle des Inputs a. Eltern? b. Freunde?/Schulfreunde? c. Geschwister? i. älter, im Schulalter? ii. jünger?

Input als Faktorenkomplex

61

d. Muttersprachler? e. Mehrere unterschiedliche Inputquellen? 2. Art der Sprachgemeinschaft a. Welche Sprache ist die meist benutzte Sprache? b. Wie häufig werden beide Sprachen in der Gemeinschaft gebraucht? c. Haben die Kinder einen Zugang zu den Sprechern der Minderheitssprache außerhalb ihres Zuhauses? 3. Sozial-ökonomischer Status der Familie Darüber hinaus nennt Gathercole (2014) auch Aspekte, die mit der Sprache verbunden sind, und natürlich im Input eine Rolle spielen, beispielsweise die vorhandene oder nicht vorhandene phonologische/semantische/morphosyntaktische Ähnlichkeit zwischen beiden Sprachen. Da jedoch diese Aspekte eher Sprachen als solche, und nicht direkt die Sprachexposition des Kindes, betreffen, werden sie in diesem Kapitel nicht weiter behandelt. In Kap. 4 wird auf die spezifischen Sprachbereiche eingegangen, die im Rahmen der Arbeit untersucht werden. Der Einfluss der oben genannten Aspekte der Sprachexposition auf den bilingualen Erwerb ist in mehreren empirischen Studien zum phonologischen, lexikalischen und morphosyntaktischen Bereich gezeigt worden. Place und Hoff (2011) untersuchen beispielsweise die Sprachexposition, der zweijährige bilinguale Kinder mit dem Sprachpaar Englisch/Spanisch ausgesetzt sind, und wie ihre Performanz im lexikalischen Bereich aussieht. Diese Studie beweist, dass die Performanz in der gegebenen Sprache mit dem Input in der jeweiligen Sprache korreliert. Zu einem höheren Niveau von Sprachleistungen tragen den Forschern nach auch Aspekte wie unterschiedliche Quellen der Sprache oder Input von Muttersprachlern bei. Diese Resultate stehen in Einklang mit anderen Studien zu englisch-spanisch zweisprachigen Kindern in den USA (siehe Perez-Tattam et al., 2013) oder zu walisisch-englisch bilingualen Kindern in Großbritannien (siehe Gathercole et al., 2014). Der Einfluss der Inputmenge auf die Schnelligkeit der lexikalischen Verarbeitung (Hurtado et al., 2014) und auf die grammatische Entwicklung ist auch in der Literatur veranschaulicht worden (Paradis et al., 2014; Thordardottir, 2015). Die verschiedenen Aspekte des Inputs beeinflussen nicht immer direkt den Spracherwerb, sie können auch einen indirekten Einfluss auf den Spracherwerb dadurch haben, dass sie einander bedingen. Bronfenbrenner und Ceci (1994) sowie De Houwer (2018) sprechen dabei von proximalen Aspekten des Inputs, die den Spracherwerb auf direkte Weise beeinflussen, und von distalen Aspekten des Inputs, die den Erwerb auf indirekte Weise beeinflussen. Zur ersten Gruppe gehören beispielsweise Eigenschaften der an Kinder gerichteten Sprache, Elternreaktionen auf die von den Kindern benutzte Sprache oder das Niveau der

62

Inputfaktor – Mehrheitssprache vs. Herkunftssprache

Lesefähigkeit in der gegebenen Sprache bei Kindern (Kibler et al., 2016). Bei den indirekten Faktoren handelt es sich um die psychosozialen und kulturellen Umstände, wie beispielsweise um den sozialen Status der Sprachen (siehe Pearson, 2007), den sozio-ökonomischen Status der Familie (siehe Weisleder & Fernald, 2014) um die Sprachideologien der Eltern oder ferner um ihre Meinungen und Einstellungen (siehe De Houwer, 1999, 2009; Nakamura, 2016). In der Forschung wird auch die wichtige Rolle der Wahl der Familiensprache auf die Inputmenge und –qualität hervorgehoben, d. h. die Komplexität sowie die Vielfalt der Eltern-Kind-Interaktionen (vgl. King & Fogle, 2006; King et al., 2008; Anstatt, 2009; Blom, 2010; Jan´czak, 2013; Mehlhorn, 2014; Brehmer & Mehlhorn, 2015; Sopata & Putowska, 2020). De Houwer (2007) zeigt, dass der Gebrauch der Sprache von zweisprachigen Kindern vom Sprachgebrauch in der Familie in hohem Grade abhängig ist. Während in den Familien, in denen beide Eltern die Minderheitssprache, d. h. die Herkunftssprache53 sprechen, 97 % der zweisprachigen Kinder ihre beiden Sprachen benutzen, liegt diese Prozentzahl bei nur 34 % in jenen Familien, in denen ein Elternteil nur die Mehrheitssprache und der andere Elternteil beide Sprachen spricht. Die verschiedenen Aspekte des Inputs interagieren auch mit anderen Faktoren, die Sprachsituationen im allgemeinen beeinflussen. Die Inputmenge und -qualität ist beispielsweise vom Sprachgebrauch der Kinder selbst abhängig und er geht mit mehreren emotionalen Faktoren einher. Die Wahl einer Sprache zu gegebener Interaktion ist letztendlich die Wahl der Kinder, und sie spiegelt ihre Einstellungen und Wertesysteme wider (siehe O’Riagáin, 2008; Carroll, 2017; Perez-Leroux, 2017). Der Einfluss des Inputs auf den Spracherwerb wird auch durch andere Faktoren, z. B. Alter bei Erwerbsbeginn, bestimmt. So zeigen Thordardottir und Brandeker (2013), dass simultan zweisprachige Kinder im Sentence RepetitionTest die monolinguale Norm, unabhängig von der Inputmenge, in beiden Sprachen erreichen können. Bei sukzessiv zweisprachigen Kindern werden jedoch Einflüsse sowohl des Alters als auch der Dauer der Sprachexposition, wie beispielsweise in einer russisch-hebräisch bilingualen Gruppe in der Studie von Chiat et al. (2013), entdeckt. Ein solcher Einfluss tritt bei den in derselben Studie untersuchten türkisch-englisch und russisch-deutsch bilingualen Gruppen jedoch nicht auf. Zusammenfassend kann man sagen, dass ein Konsensus unter den Spracherwerbsforschern herrscht, dass der Input den Spracherwerb beeinflusst; allerdings wird das Ausmaß des Einflusses kontrovers diskutiert. Die Fragen danach, welche Folgen unterschiedliche Variablen des Inputkomplexes für den Spracherwerb mit sich bringen, werden immer noch intensiv erforscht. Wie einerseits 53 Siehe Kap. 3.5 zur Herkunftssprache.

Inputmenge

63

die einzelnen Aspekte des Inputs untereinander und andererseits mit anderen Faktoren interagieren, steht im Fokus der Debatte in der Spracherwerbsforschung. Im folgenden Unterkapitel wird auf die drei Schlüsselaspekte des Inputs eingegangen, die für den Untersuchungsgegenstand der vorliegenden Arbeit von besonderer Relevanz sind: auf die Menge des Inputs (siehe Kap. 3.4), seinen Kontext (siehe Kap. 3.5) und auf den Zeitpunkt des Beginns der Exposition zur zweiten Sprache (siehe Kap. 3.6).

3.4

Inputmenge

3.4.1 Messung der Inputmenge Es herrscht die allgemeine Überzeugung, dass zweisprachige Kinder im Vergleich zu monolingualen Kindern weniger Input in einer Sprache bekommen. Dieser Meinung, die intuitiv überzeugend ist, sind auch viele Forscher (siehe beispielsweise Paradis & Genesee, 1996; Paradis et al., 2008; Pirvulescu et al., 2012). Viele Spracherwerbsforscher stellen auch die These auf, dass zweisprachige Kinder die Hälfte des Inputs einsprachiger Kinder bekommen, wenn man sie miteinander vergleicht (vgl. Hyams, 1991; Sorace, 2005; Ameel et al., 2007). Die These, dass zweisprachige Kinder in jedem Fall weniger einer Sprache als einsprachige Kinder ausgesetzt sind, wird jedoch von De Houwer (2014, 2018) überzeugend in Frage gestellt. De Houwer (2014, 2018) argumentiert, dass die Annahme des reduzierten Inputs bei bilingualen Kindern zu einem Axiom geworden ist. Sie weist zurecht darauf hin, dass diese Annahme zuerst bewiesen werden sollte, und erst dann mit hinreichender Vorsicht generalisiert werden könnte. De Houwer (2014) untersucht die Inputmenge einer Gruppe von bilingualen und monolingualen Kindern im Niederländischen. Die Ergebnisse dieser Studie zeigen, dass es erstaunlicherweise keine Unterschiede zwischen den Gruppen in Hinsicht auf die Inputmenge im Niederländischen gibt54. Die Analyse der individuellen Ergebnisse zeigt darüber hinaus, dass einige zweisprachige Kinder mehr Input im Niederländischen bekommen als einige einsprachige Kinder. Die Studie demonstriert also, dass man nicht einfach bei jedem bilingualen Kind davon ausgehen kann, dass sein Input im Vergleich zu einsprachigen Kindern reduziert sei (siehe auch Marchman et al., 2016).

54 Die Inputmenge in der anderen Sprache der bilingualen Gruppe wird von De Houwer (2014) nicht untersucht.

64

Inputfaktor – Mehrheitssprache vs. Herkunftssprache

Die Inputmenge, der monolinguale und bilinguale Kinder ausgesetzt sind, scheint also sehr variabel zu sein. De Houwer (2009, 2018) unterstreicht, dass das Konstrukt einer »monolingualen Norm« im Hinblick auf die Inputmenge, die die einsprachigen Kinder durchschnittlich bekommen sollen, keine gute Lösung ist. Angesichts der immensen Variabilität zwischen den verschiedenen Kulturen in Hinsicht darauf, wie oft Kinder angesprochen werden (siehe Hoff & Tian, 2005), und der Variabilität in der Häufigkeit der Interaktionen mit Kindern innerhalb einer Kultur (siehe Hart & Risley, 1995), ist der durchschnittliche Wert keine Größe mehr, mit der man bilinguale Daten vergleichen könnte. Das ist umso wichtiger, als die Variabilität in dem den zweisprachigen Kindern zugänglichen Input gewiss nicht kleiner ist. Wenige Studien untersuchen die Menge des Inputs, die bilingualen Kindern zugänglich ist. De Houwer (2014) zeigt, dass Mütter zweisprachiger Kinder ähnlich viel wie Mütter monolingualer Kinder, unter vergleichbaren Umständen, sprechen. Marchmann et al. (2016) untersuchen die absolute Inputmenge, d. h. die Anzahl der Wörter, die kleine bilinguale Kinder pro Stunde hören, und stellen fest, dass sie sich von monolingualen Kindern in dieser Hinsicht nicht unterscheiden. Ähnlich wie unter einsprachigen Kindern ist die absolute Inputmenge, die den zweisprachigen Kindern zugänglich ist, von Kind zu Kind sehr unterschiedlich. Die unterschiedliche Menge des Inputs ist nicht nur mit interindividueller Variabilität verbunden, sondern auch mit zeitbedingten Veränderungen in den Interaktionen zwischen dem Kind und seiner Umgebung. Song et al. (2012) zeigen, dass sich die Menge des Inputs, die von einem Elternteil dem Kind zugänglich gemacht wird, mit der Zeit sehr verändern kann. Mütter zeigen auch eine allgemeine Tendenz dazu, mit Kleinkindern mehr zu sprechen als es mit größeren Kindern der Fall ist (Wells, 1986; De Houwer, 2009, 2014). Allerdings bedeutet dies nicht unbedingt, dass Kinder dadurch weniger Sprachexposition bekommen, weil die geringeren Interaktionen mit der Mutter durch die mit anderen Gesprächspartnern, wie mit den Freunden, Lehrern usw., ausgeglichen werden können. Die absolute Menge des Inputs, die Kindern zugänglich ist, wird auch durch andere Faktoren determiniert, wie zum Beispiel die Zeit, die ein Kind mit unterschiedlichen Gesprächspartnern verbringt, wie seine Freizeitgestaltung aussieht, wie lange es schläft usw. Nach all diesen Komponenten der Inputsituation werden meistens die Eltern in unterschiedlichen Fragebögen befragt, die zum Ziel haben, die Inputmenge einzuschätzen, der das Kind ausgesetzt worden ist (z. B. Language Input Diary – De Houwer & Bornstein, 2003; The bilingual language experience calculator – Unsworth, 2013; Quantifying Bilingual Experiance – https://q-bex.org/ De Cat et al., 2021).

Inputmenge

65

Die absolute Inputmenge bei bilingualen Kindern muss zwar nicht kleiner als bei den monolingualen Kindern sein, aber die Variabilität im Zugang zum Input bei bilingualen Kindern kann als höher eingeschätzt werden. Der Input in einer Sprache kann bei zweisprachig erzogenen Kindern mit der Zeit sehr variieren, er kann sogar für eine Zeitlang ganz aufhören. Man kann also nicht annehmen, dass die Inputmenge bei bilingualen Kindern einfach halbiert werden kann. Um einerseits die Tatsachen über die Inputhäufigkeit in der sprachlichen Erfahrung zweisprachiger Kinder zu berücksichtigen, und um die Vergleichbarkeit der Angaben zum Input in verschiedenen Studien sicherzustellen, hat Unsworth (2013) die Messung der kumulativen Sprachexposition vorgeschlagen. Diese Messung baut auf Fragebögen für Eltern auf, in denen sie die sprachlichen Interaktionen ihrer Kinder einschätzen. Die Schätzungen werden dann in absoluten, sozusagen virtuellen, Summen von Jahren ausgedrückt, in denen die Kinder nur jeweils einer Sprache ausgesetzt worden sind. Obwohl die Messung nicht perfekt ist, da sie ja auf den subjektiven Einschätzungen der Eltern basiert, spiegelt die Messung der kumulativen Sprachexposition besser als das chronologische Alter die Inputmenge wider, die dem gegebenen Kind in der jeweiligen Sprache zugänglich war. Darüber hinaus ermöglicht die Messung der kumulativen Sprachexposition einen Vergleich der Ergebnisse unterschiedlicher Studien, die allein den Input, oder den Input zusammen mit anderen Variablen, beim Spracherwerb untersuchen. Einige Forscher basieren ihre Angaben zur Sprachexposition der Kinder weder auf den absoluten Zahlen der Inputmenge noch auf der Messung der kumulativen Sprachexposition, sondern auf der relativen Häufigkeit des Gebrauchs der gegebenen Sprache bilingualer Kinder. Hierbei wird die Häufigkeit des Gebrauchs einer Sprache mit der Häufigkeit der Benutzung der anderen verglichen und als Prozentzahl dargestellt. Obwohl so eine Messung ziemlich ungenau ist, und offensichtlich die wichtigen Bestandteile der Inputsituation außer Acht lässt (vgl. Grüter et al., 2014), haben einige Forscher einen Zusammenhang zwischen dem so gemessenen Input und der Schnelligkeit sowie dem Endzustand des Spracherwerbs bewiesen (vgl. Schlyter, 1993; Blom, 2010). Aus der oben angeführten Debatte soll ersichtlich werden, dass die Messung des Inputs keine einfache Aufgabe ist. Eine offensichtliche Schwäche der meisten Messungen liegt darin, dass ihre Grundlage die Schätzungen der Eltern bilden. Ob Eltern zuverlässige Quellen solcher Angaben sein können, wird oft in Frage gestellt (vgl. Grüter et al., 2014; Carroll, 2017). Darüber hinaus zeigen jene Studien, die die von den Forschern angewandten Fragebögen zur Erforschung der Sprachexposition der Kinder miteinander vergleichen, dass das ihnen gemeinsame Konstrukt der Sprachexposition unterschiedlich operationalisiert wird, und dass oft auf unterschiedliche Bestandteile der bilingualen Spracherfahrung

66

Inputfaktor – Mehrheitssprache vs. Herkunftssprache

in den Fragebögen fokussiert wird (siehe De Cat et al., 2022). Das stellt die Vergleichbarkeit der Ergebnisse der Studien in Frage. Die andere Schwäche ist, dass die Angabe zur Inputmenge uns wenig über die Qualität des Inputs sagt. Studien zeigen, dass es systematische Unterschiede zwischen den Eltern gibt, wenn es um ihre Fähigkeit geht, die Identifizierung der Wortbedeutungen durch ihre Kinder einfacher zu machen. Cartmill et al. (2013) beweisen, dass es eine Korrelation zwischen solchen Unterschieden und der lexikalischen Entwicklung der Kinder gibt. Carroll (2017) argumentiert auch, dass die Zeit keine gute Größe bei der Inputmessung ist. Sie plädiert dafür, dass die Sprachäußerungen der Eltern und Geschwister oder anderer Personen, von denen Kinder sprechen lernen, direkt untersucht werden. Während die von Carroll (2017) erhobenen Einwände gegen die in der Spracherwerbsforschung angewandten Methoden der Inputmessung plausibel sind, muss hier unterstrichen werden, dass in vielen Studien die Messung der absoluten oder relativen Inputhäufigkeit aufgrund der Schätzungen der Eltern die einzig mögliche Methode ist. Bei älteren Kindern, die mehrere Inputquellen zu Hause, im Kindergarten, in der Schule und in der Freizeit haben, ist es kaum möglich, die ganze Sprachexposition der Kinder zu dokumentieren und zu analysieren. Eine vollständige Kontrolle über die Sprachexposition kann man letztendlich nur in einem Sprachlabor haben, in dem man einzelne Experimente durchführt. Bei einer Untersuchung bilingualer Kinder, die über mehrere Jahre unter natürlichen Bedingungen zwei Sprachen erworben haben, muss man sich auf die Angaben der Eltern verlassen, die vielleicht nicht perfekt sind, aber sich meistens als zuverlässig erwiesen haben (vgl. Paradis & Jia, 2017; Perez-Leroux, 2017). Zusammenfassend soll hier unterstrichen werden, dass die Messung der Sprachexposition zweisprachiger Kinder eine große Herausforderung für Spracherwerbsforscher bedeutet. Die Messungen der absoluten Menge der Sprachexposition, ihrer absoluten oder relativen Häufigkeit, sowie der kumulativen Sprachexposition bilingualer Kinder zu der jeweiligen Sprache sind alles ziemlich allgemeine Größen. Bei der Interpretation der Ergebnisse müssen sich die Forscher dessen bewusst sein, dass diese Angaben uns wenig über den Input im engeren Sinn des Wortes (siehe Carroll, 2017) sagen. Inputmessungen können nicht zur Untersuchung dessen dienen, welchen Gebrauch Kinder vom Input genau machen, und auf welchem Weg sie den Input nutzen, um spezifische Sprachphänomene zu erwerben (vgl. Weisleder, 2017). Die allgemeinen Angaben zur Inputmenge und –häufigkeit können jedoch dazu genutzt werden, die Rolle der Sprachexposition der Kinder, also des Sprachinputs im weiteren Sinne, beim Spracherwerb zu untersuchen.

Inputmenge

67

3.4.2 Einfluss der Inputmenge auf den Spracherwerb Mehrere empirische Studien zeigen, dass der Input nicht nur eine notwendige Grundlage des Spracherwerbs ist, sondern auch seinen Verlauf deutlich beeinflusst. Die Häufigkeit der Sprachexposition wird als Faktor betrachtet, mit dem mehrere Aspekte der Sprachentwicklung der Kinder einhergehen. Mit der Sprachexposition der Kinder hängt ihre lexikalische Entwicklung (Place & Hoff, 2011) und grammatische Entwicklung (Paradis et al., 2014; Thordardottir, 2015) sowie die Schnelligkeit der lexikalischen Verarbeitung (Hurtado et al., 2014) zusammen. Auch Studien, in denen Daten unter natürlichen Bedingungen als Aufnahmen von allen Interaktionen der Kinder über eine Zeitperiode gesammelt worden sind, bestätigen diesen Zusammenhang. Die Ergebnisse der Untersuchungen von Weisleder und Fernald (2013) sowie Marchman et al. (2017) veranschaulichen, dass die Häufigkeit der Sprachexposition mit der Lexikongröße und der Schnelligkeit der lexikalischen Verarbeitung sowohl bei einsprachigen als auch bei zweisprachigen Kindern einhergeht. Bei der Entwicklung der grammatischen Kompetenz scheint die Inputmenge vor allem in solchen Fällen eine wichtige Rolle zu spielen, wo der Kontakt zur Sprache reduziert ist. Schlyter (1993) und Blom (2010) zeigen auf, dass bilinguale Kinder, deren Exposition gegenüber zwei Sprachen sehr unausgewogen ist, eine ihrer Sprachen als die sog. schwächere Sprache entwickeln55. In der schwächeren Sprache kommt es demnach häufiger zum Transfer von Strukturen aus der stärkeren Sprache56. Ein enger Zusammenhang zwischen der Inputmenge und der Sprachentwicklung wird in den Untersuchungen zur Herkunftssprache veranschaulicht57, bei deren Erwerb die Sprachexposition oft reduziert ist. Die Häufigkeit der Sprachexposition in der Familie hat direkten Einfluss auf mehrere Aspekte der Entwicklung der Herkunftssprache, was für verschiedene Sprachen und unterschiedliche Sprachbereiche aufgezeigt worden ist (z. B. Gagarina & Klassert, 2018; Rodina et al., 2020 für Russisch als Herkunftssprache; Daskalaki et al., 2019; Chondrogianni & Schwartz, 2020 für Griechisch als Herkunftssprache; Sun & Verspoor, 2020 für Mandarin als Herkunftssprache). Die eingeschränkte Sprachexposition zu Herkunftssprachen wird als Erklärung für die langsamere Sprachentwicklung vorgeschlagen, weil Kinder, die einen erschwerten Zugang zum Input haben, mehr Zeit dafür brauchen, die positive Evidenz für den Erwerb der gegebenen Strukturen zu sammeln (z. B. Flores et al., 2017).

55 Siehe Kapitel 2.5.3 zum Begriff der schwächeren Sprache. 56 Siehe Kapitel 2.5.2 zu den zwischensprachlichen Einflüssen. 57 Siehe die Unterkapitel 3.5 und 3.6 zu näheren Informationen zur Herkunftssprache.

68

Inputfaktor – Mehrheitssprache vs. Herkunftssprache

Interessanterweise wird ein solcher Zusammenhang zwischen der Sprachexposition zur Mehrheitssprache in der Familie und ihrem Erwerb nicht aufgezeigt58. Im Gegenteil, mehrere Studien beweisen, dass es keinen oder nur einen sehr schwachen Einfluss der Inputmenge in der Familie auf den Erwerb der Mehrheitssprache gibt (z. B. Chodrogianni & Marinis, 2011; Paradis & Jia, 2017). Diese Asymmetrie in der Beeinflussung des Erwerbs der Herkunfts- und Mehrheitssprache durch die Sprachexposition in der Familie wird auch in Untersuchungen bestätigt, die gleichzeitig beide Sprachen der Kinder erforschen (siehe Rodina & Westergaard, 2017 für Russisch als Herkunftssprache und Norwegisch als Mehrheitssprache; Papastefanou et al., 2019 für Griechisch als Herkunftssprache und Englisch als Mehrheitssprache). Kinder, die eine Zweitsprache als Mehrheitssprache erwerben, müssen natürlich auch einen Zugang zum Sprachinput haben, damit der Prozess erfolgreich ist. Diese Kinder können im Falle der Mehrheitssprache auch außerhalb des Hauses Kontakt zur Sprache haben. Wenn frühe Zweitsprachlerner nicht ausreichend Exposition zur Zweitsprache haben, kann es durchaus dazu kommen, dass die Entwicklung der Zweitsprache gestört wird. Schulz et al. (2017) zeigen für Deutsch als Zweitsprache auf, dass Kinder vor allem in einigen Sprachbereichen der Zweitsprache im Vergleich zum monolingualen Erwerb zurückliegen können. Sie argumentieren dafür, dass es sich hierbei um Sprachbereiche handelt, die komplex sind, und deswegen auch den einsprachigen Kindern Schwierigkeiten bereiten. Obwohl der Zusammenhang zwischen der Inputmenge und dem Spracherwerb im allgemeinen offensichtlich ist, bleiben mehrere Fragen in diesem Forschungsbereich noch offen. Forschungsfragen, die noch nicht eindeutig beantwortet werden konnten, schließen unter anderem ein: Ist der Einfluss der Inputmenge auf die grammatische Entwicklung auf der fortgeschrittenen Erwerbsstufe ähnlich wie auf der Anfangsstufe? Wird die Entwicklung spezifischer grammatischer Phänomene in einem ähnlichen Grad durch die Inputmenge beeinflusst? Ist die Inputmenge beim Erwerb unterschiedlicher Sprachkonstellationen gleich wichtig? Kann der Faktor der Inputmenge durch andere Inputfaktoren bei der Erklärung der Sprachentwicklung ersetzt werden? Auf einige dieser Fragen wird in den nächsten Unterkapiteln eingegangen.

58 Siehe Kap. 3.5 und 3.6 zum Begriff Mehrheitssprache.

Kontext des Inputs – Herkunftssprache (HS) vs. Mehrheitssprache (MS)

3.5

69

Kontext des Inputs – Herkunftssprache (HS) vs. Mehrheitssprache (MS)

Ein sehr wichtiger Aspekt des Inputs ist der Kontext, in dem die Sprachexposition des Kindes zustande kommt. Es hat einen enormen Einfluss auf die quantitativen und qualitativen Eigenschaften des Sprachinputs, ob Kinder eine Sprache erwerben, die nur in der Familie von einer oder mehreren Personen gesprochen wird, oder die von der ganzen Umgebung als einzige oder meist gesprochene Sprache gebraucht wird. Dieser Unterschied wird in der vorliegenden Arbeit als Inputkontext bezeichnet59.

3.5.1 Begriffsbestimmung Wenn eine Sprache unter natürlichen Bedingungen hauptsächlich im häuslichen Kontext erworben wird, während eine andere Sprache von der übrigen Gemeinschaft gebraucht wird, wird sie als Herkunftssprache (HS) bezeichnet. Die Sprache, die von der Mehrheit der Gemeinschaft gebraucht wird, wird Mehrheitssprache (MS) genannt. Diese allgemeine Formulierung lässt jedoch viele Facetten der Herkunftssprache ungeklärt, und eine genauere Definition der Herkunftssprache ist ganz bestimmt vonnöten. Obwohl die Entwicklung und der Endzustand der Herkunftssprache in den zwei letzten Jahrzehnten im Zentrum der Debatte der Spracherwerbsforschung steht, wird die Herkunftssprache von verschiedenen Forschern unterschiedlich definiert. Fishman (2001: 81) beschreibt Herkunftssprachen aus der soziolinguistischen Perspektive der USA und bezeichnet sie als solche, die anders als Englisch und von besonderer Relevanz für die Lerner sind. Als Sprecher der Herkunftssprache (HSS) sieht er die Gruppe der einheimischen Bevölkerung und die Immigrantengruppen. Fishmans Definition ist eine sehr allgemeine und sehr viele Fälle umfassende Definition. Noch breiter wird die Gruppe der Sprecher der Herkunftssprache von Van Deusen-Scholl (2003: 222) aufgefasst, weil er zu diesen Sprechern auch Menschen dazuzählt, die eine Beziehung zu ihrer Herkunft später im Leben wieder aufnehmen wollen, auch wenn die Verbindung zur Sprache über Generationen verloren gegangen ist60.

59 In der Literatur wird in diesem Zusammenhang der Begriff Inputkontext oder Inputumgebung (input enviroment) gebraucht. 60 Van Deusen-Scholl (2003: 222) formuliert seine Auffassung der Sprecher der Herkunftssprache in folgenden Worten: es sind Menschen, die »seek to reconnect with their family’s heritage through language, even though the linguistic evidence of that connection may have been lost for generations«.

70

Inputfaktor – Mehrheitssprache vs. Herkunftssprache

Beide oben angeführten Definitionen schenken den Umständen, in denen der Erwerb der Herkunftssprache stattfindet, wenig Aufmerksamkeit. Dies ist anders bei den Definitionen, die im Rahmen der Spracherwerbsforschung formuliert worden sind, was jedoch nicht bedeutet, dass die Definition der Herkunftssprache im Rahmen des linguistischen Ansatzes eindeutig ist. Ortega (2020) vergleicht die soziolinguistische, pädagogische und linguistische Perspektive bei der Definierung der HSS und kommt auf 10 Merkmale, die in verschiedenen Definitionen der HS auftauchen: – enge Beziehung zur Sprache durch die sprachlichen Interaktionen mit Familienmitgliedern, die die HS sprechen – entfernte Beziehung zur Sprache durch Vorfahren, ohne Zugang zu den Sprechern der HS – produktiver Gebrauch der Sprache im Kindesalter beim bilingualen Erwerb – früher Beginn des Spracherwerbs (0–5 Jahre) – Wandel der Dominanzrelation – von der stärkeren Sprache im Kindesalter zur schwächeren Sprache in späteren Jahren; unbalancierte Bilingualität – niedriges Niveau der Alphabetisierung in der HS – Endzustand der HS, der nicht der muttersprachlichen Norm entspricht – variabler Grad des Anfangs- und Endzustands der Entwicklung der HS – Erfahrungen der Einheimischen oder der Immigranten – hierarchische Beziehung zwischen der Mehrheits- und Minderheitssprache Die Eigenschaften der HS aus Ortegas Liste kommen nicht gleich häufig in den drei Forschungsperspektiven vor. Nur die erste und letzte Eigenschaft kommt in allen von Ortega untersuchten Definitionen der HS vor. All die anderen Eigenschaften werden entweder nur in der soziolinguistischen, pädagogischen oder linguistischen Forschung benutzt. Beim psycholinguistischen Ansatz wird aus offensichtlichen Gründen die soziolinguistische Perspektive durch die psycholinguistische ergänzt oder zumindest teilweise ersetzt (vgl. Polinsky & Kagan, 2007; Montrul, 2008, 2016; Rothman, 2009a; Benmamoun et al., 2013; Kupisch & Rothman, 2018). Eine der häufig zitierten Definitionen stammt von Benmamoun et al. (2013: 133), nach der als HSS bilinguale Menschen zu bezeichnen sind, die im frühen Kindesalter, d. h. bis zu 5 Jahren, die Sprachexposition zu zwei Sprachen – Herkunftssprache und Mehrheitssprache – erfahren haben, entweder simultan oder sukzessiv, und für die die Mehrheitssprache irgendwann in der Kindheit die primäre Sprache werden kann. In Folge des Dominanzwandels wird die Herkunftssprache nach Benmamoun et al., (2013) zur schwächeren Sprache, und die Mehrheitssprache zur stärkeren Sprache bei den Sprechern der HS im frühen Erwachsenenalter. In der Definition von Benmamoun et al. (2013) werden also drei Kriterien für HSS vorgeschlagen: frühe Zweisprachigkeit, Dominanz der Mehrheitssprache

Kontext des Inputs – Herkunftssprache (HS) vs. Mehrheitssprache (MS)

71

und Status der HS als schwächere Sprache. Die zwei letzten Kriterien sind natürlich eng miteinander verbunden. Darüber hinaus schließt jedoch, wie Meisel (2013b) zurecht in seinem Kommentar zum Artikel von Benmamoun et al. (2013) bemerkt, so eine Definition eine große Gruppe von bilingualen balancierten Sprechern aus. Diese zwei Kriterien scheinen daher etwas arbiträr zu sein. Die von Benmamoun et al. (2013) angenommene Definition von HS ist auch dahingehend irreführend, wenn sie impliziert, dass balancierte Bilingualität ein ganz seltener Fall beim Erwerb der Herkunftssprache sei, wobei mehrere empirische Studien das Gegenteil beweisen. Kupisch (2013) zeigt auf, dass Benmamoun et al. (2013) mehrere Studien, die außerhalb der USA entstanden sind, nicht berücksichtigen, die aber die Möglichkeit ausgewogener Zweisprachigkeit beweisen. Eine andere Definition wird von Rothman (2009a) vorgeschlagen, der einerseits eine breite, liberale Definition diskutiert, und andererseits eine präzise Definition der Herkunftssprache formuliert, die als Grundlage empirischer Forschungen mit unterschiedlicher linguistischer Zielsetzung dienen kann. Nach der breiten, sehr liberalen, Definition könnte man nach Rothman annehmen, dass alle Sprachen Herkunftssprachen seien, und zwar in allen Kontexten. Alle einsprachigen Kinder lernen ja ihre Erstsprache zu Hause, unter natürlichen Bedingungen, und die Sprache ist untrennbar mit ihrer Kultur verbunden. Wie er selbst bemerkt, könnte so eine allumfassende Definition jedoch für die Spracherwerbsforschung wenig Wert haben. Rothamns (2009a: 156) präzise Definition der Herkunftssprache lautet daher: A language qualifies as a heritage language if it is a language spoken at home or otherwise readily available to young children, and crucially this language is not a dominant language of the larger (national) society. Like the acquisition of a primary language in monolingual situations and the acquisition of two or more languages in situations of societal bilingualism/multilingualism, the heritage language is acquired on the basis of an interaction with naturalistic input and whatever in-born linguistic mechanisms are at play in any instance of child language acquisition. Differently, however, there is the possibility that quantitative and qualitative differences in heritage language input and the introduction, influence of the societal majority language, and differences in literacy and formal education can result in what on the surface seems to be arrested development of the heritage language or attrition in adult bilingual knowledge. [Hervorhebung AS]

Das erste Kriterium der Herkunftssprache bei Rothman lautet also, ähnlich wie bei Benmamoun et al. (2013), und anders als in einigen Definitionen der soziolinguistischen Forschung (z. B. Valdés, 2005), dass die HS die zu Hause oder in der nächsten Umgebung gesprochene Sprache ist. Damit eng verbunden ist das nächste Kriterium, dass die HS unter natürlichen Bedingungen, d. h. in natürlichen Interkationen mit Gesprächspartnern erworben wird. Diese zwei Kriterien

72

Inputfaktor – Mehrheitssprache vs. Herkunftssprache

sind für die psycholinguistische Forschung von großem Belang. Während in den soziolinguistischen und soziokulturellen Untersuchungen die Erforschung von Sprechern, die als Erwachsene eine Beziehung zum kulturellen Erbe ihrer Vorfahren aufnehmen wollen, indem sie ihre Sprache lernen wollen, durchaus sinnvoll und wichtig ist, ist ihre Situation aus der psycholinguistischen Perspektive gleich der der erwachsenen L2-Lerner. Es mag sein, dass sie als Sondergruppe unter den erwachsenen L2-Lernern, wegen, beispielsweise anderer Motivation und womöglich einer engeren Beziehung zur Kultur, behandelt werden sollten, aber sie können in der Spracherwerbsforschung nicht mit Kindern als gleich betrachtet werden, die ihre HS als ihre Erstsprache in der Familie erwerben. Das andere Kriterium, das von Rothman angeführt worden ist, grenzt seine Definition von der breiten, alle Sprachen umfassenden Definition ab. Die HS sei eine Sprache, die nicht die dominante Sprache in der Gemeinschaft oder der Gesellschaft eines Landes sei61. Diese Definition schließt also sowohl die autochthonen als auch allochthonen Minderheitensprachen eines Landes ein. Es kann sich hierbei um ganz große Sprachgruppen (wie zum Beispiel Türkisch in Deutschland) aber auch ganz kleine oder sogar individuelle Familien handeln. Rothman (2009a) sagt darüber hinaus, dass der Erwerb einer HS in einem Endzustand resultieren kann, der vom Endzustand des L1-Erwerbs abzuweichen scheint. Es wird jedoch nicht über die Natur der Unterschiede zwischen dem Endzustand des monolingualen Erwerbs und der HS entschieden, und die Unterschiede werden als möglich und nicht notwendig dargestellt. Vor allem aber schließt Rothman die möglichen Unterschiede im Endzustand nicht als Kriterium für die HS mit ein. Dadurch betrifft diese Definition der HS die unbalancierten ebenso wie die balancierten zweisprachigen Sprecher. Man muss hier anmerken, dass während alle HSS bilingual aufwachsen, nicht alle zweisprachigen Kinder als HSS betrachtet werden können. Das Hauptkriterium der HS ist ja die soziolinguistische Situation, in der Kinder Kontakt zu zwei Sprachen haben, zu einer zu Hause und zu der anderen in der weiteren Umgebung, meistens im Kindergarten oder in der Schule. Nach Rothmans Auffassung, ähnlich wie bei Benmamoun et al. (2013), wird die HS als Erstsprache definiert, die von Geburt an erworben wird. Der Kontakt zur Mehrheitssprache kann zusammen mit der HS, also im Rahmen des simultan bilingualen Erwerbs – 2L1, beginnen, oder er kann etwas später im Kindesalter, d. h. beim sukzessiven Spracherwerb – cL2, aufgenommen werden. In einem späteren viel zitierten Artikel unter dem aussagekräftigen Titel Terminology matters! Why difference is not incompleteness and how early child bilinguals are heritage speakers, unterstreichen Kupisch und Rothman (2018) 61 Siehe Kap. 2.5.3 zum Begriff der dominanten Sprache.

Kontext des Inputs – Herkunftssprache (HS) vs. Mehrheitssprache (MS)

73

zurecht, dass das Finden eines Konsensus über die Kriterien der Zuordnung der Sprachlerner zur Kategorie HSS eine wichtige Aufgabe für jene Forscher ist, die sich mit der Erforschung der Herkunftssprache und deren Sprecher aus unterschiedlichen Perspektiven befassen. Der Begriff HS wurde erstmals in der Forschung in den USA vor mehreren Jahren erwähnt. In den letzten Jahren wird er auch immer häufiger in der europäischen Forschung benutzt. In der relativ kurzen, aber immerhin an empirischen Untersuchungen reichen Tradition der Forschung über HS haben sich meistens die Forscher aus den USA auf den Endzustand der HS konzentriert, und auf die Unterschiede zwischen dem von HSS erreichten Sprachniveau und dem monolingualer Sprecher. Dabei werden meistens junge Erwachsene in ihrer HS untersucht (vgl. Kupisch & Rothman, 2018). Im Gegensatz dazu hat sich die Spracherwerbsforschung in Europa und Kanada auf den simultanen, und später auch sukzessiven, bilingualen Erwerb konzentriert (vgl. Kupisch & Rothman, 2018). Das bedeutet, dass die Forscher dieses Ansatzes meistens die Sprachentwicklung untersucht haben, indem sie zweisprachige Kinder zu ihrem Forschungsgegenstand gemacht haben. Kupisch und Rothman (2018) plädieren zurecht dafür, dass die Forschungstraditionen geeinigt werden sollten. Viele simultan oder sukzessiv bilinguale Kinder sind HSS, und alle HSS sind oder waren einmal bilinguale Kinder. In der vorliegenden Arbeit werden als HSS Personen verstanden, die zweisprachig aufwachsen, und die mit einer Sprache durch ihre Eltern oder einen Elternteil in Kontakt sind. Hierbei handelt es sich um die Herkunftssprache, die die Erstsprache oder eine der Erstsprachen der Kinder ist. Sie ist nicht die Hauptsprache der Gemeinschaft. Die Sprache, die in der Gemeinschaft hauptsächlich gesprochen wird, wird in der vorliegenden Arbeit als Mehrheitssprache bezeichnet. Der Mehrheitssprache können HSS zu unterschiedlichen Zeitpunkten in ihrer Kindheit, spätestens aber beim Schuleintritt, ausgesetzt sein.

3.5.2 Endzustand des Erwerbs der Herkunftssprache Auf Grund der Tatsache, dass der Endzustand des HS-Erwerbs eine wesentliche Rolle bei der Begriffsbestimmung in der Forschung zu den Herkunftssprachen spielt (siehe Kap. 3.5.1), wird in der Arbeit zuerst auf den Endzustand im Unterkapitel 3.5.2 eingegangen, bevor der Erwerb der HS im Kap. 3.5.3 diskutiert wird. Heutzutage sind sich die meisten Spracherwerbsforscher darüber einig, dass die Grammatiken der HSS kohärente Systeme sind, die auf systematische Weise beschrieben werden können (vgl. Polinsky & Scontras, 2020b). Einige HSS sind balancierte bilinguale Sprecher der HS und MS, bei vielen HSS wird jedoch die MS im Laufe der Zeit zur stärkeren, und die HS zur schwächeren Sprache. Einige

74

Inputfaktor – Mehrheitssprache vs. Herkunftssprache

Forscher betrachten diesen Sachverhalt als eine der Haupteigenschaften der HSS. Herkunftssprachen zeichnen sich oft dadurch aus, dass auf unregelmäßige Paradigmen verzichtet wird. HSS neigen auch dazu, Ambiguitäten auf unterschiedlichen Ebenen der sprachlichen Repräsentation zu vermeiden, indem sie eindeutige Formen bevorzugen und Nullargumente meiden (vgl. Polinsky & Scontras, 2020a,b). Polinsky (2006) und Montrul (2008) bezeichnen den Endzustand des Erwerbs der Herkunftssprache als unvollständigen Erwerb (incomplete acquisition). Montrul (2008) definiert den unvollständigen Erwerb als Endzustand jenes Erwerbs, der nicht vollständig verlaufen ist oder Ergebnis der Attrition im Kindesalter ist. Zum unvollständigen Erwerb kommt es nach Montrul (2008) im Kindesalter, wenn es für HSS unmöglich wird, einige spezifische Spracheigenschaften der HS erfolgreich zu erwerben, d. h. sie auf dem ihrem Alter entsprechenden Sprachniveau zu gebrauchen, nachdem sie einem intensiven Input in der Mehrheitssprache und einem nicht ausreichenden HS-Input ausgesetzt worden sind. Als Attrition im Kindesalter betrachtet Montrul (2008) den Verlust einer gegebenen Spracheigenschaft der HS, nachdem die Eigenschaft auf dem muttersprachlichen Niveau von HSS erworben worden war, und eine Zeitlang stabil wie in der Erwachsenensprache war. Der Terminus unvollständiger Erwerb ist von mehreren Forschern kritisiert worden. Pires und Rothman (2009) wenden hierzu zuerst zurecht ein, dass es ein sehr breiter Begriff ist, der ganz viele verschiedene Phänomene beschreiben soll, denn er wird für den defizienten Zustand der HS-Kompetenz im Vergleich zur monolingualen Kompetenz für eine beliebige Eigenschaft in jeder möglichen Herkunftssprache vorgeschlagen. Darüber hinaus werden im Rahmen des Begriffs zwei verschiedene mögliche Gründe für die von der monolingualen Norm abweichende HS miteinander vermischt – der unterbrochene Erwerb einer Struktur, die nicht erfolgreich beendet worden ist, und der Verlust einer Struktur, die vorher erfolgreich erworben worden ist. Eine solche Verbindung von zwei unterschiedlichen Prozessen mag für Forscher manchmal bequem sein, weil man sich nicht zwischen den beiden als Erklärung für gegebene Ergebnisse der empirischen Untersuchungen entscheiden muss, aber aus methodologischen Gründen ist ein solches Vorgehen nicht empfehlenswert. Pires und Rothman (2009) plädieren daher dafür, zwischen dem unvollständigen, oder besser abweichenden, Erwerb eines Phänomens und seinem Verlust zu unterscheiden. Kupisch und Rothman (2018) erheben darüber hinaus einen, meines Erachtens prinzipiellen, Einwand gegen den Begriff unvollständiger Erwerb. Das Adjektiv unvollständig impliziert, dass die erworbene Grammatik nicht von den

Kontext des Inputs – Herkunftssprache (HS) vs. Mehrheitssprache (MS)

75

Prinzipien der natürlichen Sprachen eingeschränkt wird62, und als System nicht imstande ist, die Kodierung und Dekodierung aller sprachlichen Informationen, die für die erfolgreiche Kommunikation notwendig sind, zu garantieren. Kupisch und Rothman (2018) unterstreichen zurecht, dass dies bei Herkunftssprachen nicht der Fall sei. Die möglichen Unterschiede zwischen den HS und den monolingualen Sprachsystemen zeugen nicht davon, dass die HS-Grammatiken unvollständig sind. Abgesehen von dem fehlerhaften theoretischen Konstrukt, das die Grundlage des Begriffs unvollständiger Erwerb ist, argumentieren Pires und Rothman (2009) auch dafür, dass die Einschätzung des Endzustands des HS-Erwerbs präziser sein muss. Wenn sich die HS-Endgrammatik von der Grammatik der monolingualen Sprecher unterscheidet, kann es sich um zwei sehr unterschiedliche Situationen handeln. Erstens kann der HS-Erwerb mit einem Sprachzustand enden, in dem einige Eigenschaften sich von der monolingualen Grammatik unterscheiden, obwohl sie eindeutig im HS-Input den HS-Lernern zugänglich sind. Zweitens können die Unterschiede zwischen der HS und der monolingualen Grammatik damit zusammenhängen, dass die spezifischen Phänomene im den HS-Lernern zugänglichen Input anders realisiert werden oder gar nicht vorkommen. Wir haben es dann mit der sog. missing-input competence divergence zu tun (Rothman, 2007; Pires & Rothman, 2009). Dabei kann es sich einerseits darum handeln, dass die Eltern der Kinder einen Dialekt sprechen, und die Kinder wegen der nicht vorhandenen oder sehr eingeschränkten schulischen HS-Bildung keinen Zugang zur Standardversion der HS haben. Andererseits kann es zu so einer Situation kommen, wenn die erwachsenen HSS eine Sprache benutzen, die sich schon von der/den im Heimatland gesprochenen Sprachvariante(n) unterscheidet. Der Erwerb der Eigenschaften der HS- Standardversion kann dann in beiden Situationen kaum von Kindern erwartet werden. Die Unterschiede zwischen der HS und der monolingualen Grammatik, die auf Input-Absenz zurückgeführt werden, müssen deutlich von anderen Fällen unterschieden werden. Heutzutage wird in der Literatur meistens, auch von den Autoren des Begriffs unvollständiger Erwerb, der Terminus abweichender Endzustand (divergent attainment) benutzt (vgl. Scontras et al., 2015; Polinsky & Scontras, 2020a,b). Scontras et al. (2015) geben als Beispiel des abweichenden Endzustands des Spanischen als HS den Konjunktiv an. Während monolinguale Kinder den Gebrauch des Konjunktivs im Spanischen bis zum 10. Lebensjahr erwerben (Blake, 1983), haben Kinder, die Spanisch als HS erwerben, andauernde Schwierigkeiten mit dem nuancierten Gebrauch des Konjunktivs und womöglich gebrauchen sie 62 Schachter (1990) schlägt für die L2-Grammatik die Hypothese der Unvollständigkeit (Incompleteness Hypothesis) vor.

76

Inputfaktor – Mehrheitssprache vs. Herkunftssprache

ihn nie auf eine Weise, die sich von der Grammatik der monolingualen Sprecher nicht unterscheiden würde (siehe Silva-Corvalán, 1994, 2003, 2014; Montrul, 2009; Potowski et al., 2009). Ein anderes Phänomen, das mit dem Endzustand des HS-Erwerbs oft verbunden ist, das aber vom abweichenden Endzustand des Erwerbs auseinanderzuhalten ist, ist die Attrition. Traditionellerweise ist sie bei älteren Sprechern untersucht worden, die eine Sprache ursprünglich erfolgreich erworben hatten, bevor Änderungen in ihrer Sprache zum Vorschein kamen. Im Kontext der Migration kommt es oft zur Attrition bei der ersten Generation der Migranten und im allgemeinen bei den Erwachsenen (Levine, 2001; Köpke et al., 2007; Schmid, 2011). Zur Attrition kann es aber auch in der Sprache der Kinder kommen, wenn sie beispielsweise das Land verlassen, in dem sie aufgewachsen sind und in das Heimatland ihrer Eltern ziehen. Die Attrition der ehemaligen Mehrheitssprache hängt dann mit dem Alter zusammen, in dem der Umzug stattfindet, und der Häufigkeit der Exposition zu der Sprache nach dem Umzug (siehe Daller, 1999; Flores, 2010, 2012, 2015 zum Deutschen und Seliger, 1991; Hansen, 2001; Snape et al., 2014; Kubota, 2019 zum Englischen). Wenn es um die Entwicklung der HS geht, haben einige Forscher in longitudinalen Studien auch einen Verlust einiger Sprachfähigkeiten bei den HSS im Kindesalter gezeigt, die ursprünglich bereits erworben worden waren (Silva-Corvalán, 2003, 2014). In den Untersuchungen zum Endzustand des HS-Erwerbs zeigen auch einige Forscher Evidenz für einen Transfer auf. Polinsky und Scontras (2020a) geben als Beispiele jener Domänen, in denen die HS von der stärkeren MS häufig beeinflusst wird, folgende Sprachphänomene: Wortfolge, Gebrauch der funktionalen Elemente sowie spezifische lexikalische Elemente und Strukturen, die selten im Input vorkommen (vgl. Perez-Cortes, 2016; Polinsky & Scontras, 2020a,b). Brehmer und Sopata (2021) zeigen beispielsweise auf, dass erwachsene Sprecher des Polnischen als HS in Deutschland eine diskontinuierliche Wortfolge in komplexen Verbalphrasen bevorzugen. Dieser Sprachgebrauch steht im Gegensatz zu den Präferenzen monolingualer Sprecher des Polnischen, aber in Einklang mit der Wortfolge der komplexen Verbalphrasen in der Mehrheitssprache Deutsch. Der Endzustand des HS-Erwerbs muss jedoch nicht immer von der monolingualen Norm abweichen. Der Grad der HS-Abweichung hängt von der Quantität und Qualität des Inputs, vom Zugang zur Schulausbildung in der HS und von weiteren Faktoren ab. Kupisch et al. (2013) sowie Kupisch et al. (2014) untersuchen Sprecher des Französischen als HS, die 20–42 Jahre alt sind, in Deutschland. Was die Probanden der Studien von den untersuchten Personen in vielen anderen Studien unterscheidet, ist, dass sie eine französische Schulausbildung hinter sich haben. Die Studien veranschaulichen durch einen Vergleich zu französisch-deutsch bilingualen Personen, die in Frankreich wohnen, dass die

Kontext des Inputs – Herkunftssprache (HS) vs. Mehrheitssprache (MS)

77

HS-Sprecher des Französischen in Deutschland nicht viel von den ersteren abweichen. Die gefundenen Unterschiede betreffen das lexikalische Wissen und vor allem die Aussprache. Keine Unterschiede werden zwischen den Sprechern des Französischen als HS in Deutschland und den französisch-deutsch Bilingualen in Frankreich im morphosyntaktischen Bereich festgestellt. Andere Forscher liefern darüber hinaus Evidenz dafür, dass sogar in Fällen, bei denen die relative Häufigkeit der Sprachexposition bei zweisprachigen Kindern unter 30 % liegt, der Endzustand des Erwerbs der schwächeren Sprache, also der HS, von der monolingualen Norm nicht abweichen muss (siehe Meisel, 2019 für eine Zusammenstellung der Studien). Als Fazit dieser Erwägungen soll festgehalten werden, dass der Endzustand des Erwerbs der Herkunftssprache relativ oft mit einem Sprachgebrauch endet, der vom Sprachgebrauch der monolingualen Sprecher abweicht. Der Grad der Abweichung ist von mehreren Faktoren abhängig, in denen aber die Qualität und Quantität des Inputs während des Erwerbsvorgangs eine herausragende Rolle spielt. Das Erreichen einer nicht abweichenden HS-Kompetenz ist aber durchaus möglich und unter günstigen Bedingungen wird sie auch erreicht. Im folgenden Unterkapitel wird auf den Verlauf des Erwerbs der Herkunftssprache eingegangen.

3.5.3 Erwerb der Herkunftssprache Als Herkunftssprache wird eine Sprache bezeichnet, die als Erstsprache (L1), gleichzeitig mit der Mehrheitssprache, erworben wird, somit haben wir es mit simultan bilingualem Erwerb (2L1) zu tun. Der Kontakt mit der Mehrheitssprache kann auch etwas später im Kindesalter aufgenommen werden, dann wird der bilinguale Erwerb als sukzessiv bezeichnet. In beiden Fällen ist es die Herkunftssprache, die Erstsprache des Kindes, deren Erwerb mit den ersten Interaktionen des Kindes mit der Umgebung begonnen wird63. Im Hinblick auf den Altersfaktor ist der Erwerb der HS einfach der Erwerb einer Erstsprache. Der Erwerb der HS ist jedoch komplexer dadurch, dass eine andere Bedingung des erfolgreichen Spracherwerbs, die des ausreichenden Inputs, nicht immer im Falle der HS erfüllt wird. Dadurch ist der Erwerb der Herkunftssprache von großer Relevanz für die Spracherwerbstheorie und er ist in den letzten Jahren zum häufigen Gegenstand der Untersuchungen des Spracherwerbs geworden. Der Verlauf des HS-Erwerbs zeichnet sich dadurch aus, dass die HS zuerst meistens die stärkere Sprache des Kindes ist, weil die HS sehr oft die Familiensprache ist, d. h. die Sprache, die am häufigsten zu Hause gesprochen wird. Es 63 Siehe aber Kap. 3.5.1 zu anderen Auffassungen der HS.

78

Inputfaktor – Mehrheitssprache vs. Herkunftssprache

kann sich dabei um die Sprache eines oder beider Elternteile handeln. Charakteristisch für die Entwicklung der HS ist, dass im Alter der Einschulung des Kindes der sog. Dominanzwandel (dominance shift) stattfindet64, d. h. die Mehrheitssprache, die typischerweise auch die Schulsprache ist, wird zur stärkeren Sprache des Kindes (vgl. Rothman, 2009a; Benmamoun et al, 2013; Flores, 2015; Kupisch & Rothman, 2016, 2018; Dubiel & Guilfoyle, 2017; Rinke et al., 2019). Chondrogianni und Schwartz (2020) zeigen auf, dass die HS von der MS zu diesem Zeitpunkt beeinflusst werden kann. Der HS-Erwerb muss jedoch nicht notwendigerweise zu diesem Zeitpunkt angehalten werden (Oppenheim et al., 2020). Die Studien bringen eher eine Evidenz dafür, dass das HS-Niveau bei Grundschulkindern mit dem Input zu Hause und mit der Zahl der HSS im Familienkontext korreliert (Gathercole & Thomas, 2009; Mayr & Montanari, 2015). Die klassische Methode, einen Vorgang zu untersuchen, ist, ihn mit einem anderen zu vergleichen. Im Falle des HS-Erwerbs ist diese Methodologie mit der offensichtlichen Schwierigkeit verbunden, dass es ein ganz spezifischer, an die Umstände gebundener Prozess ist. Nichtsdestotrotz wird der Erwerb einer Herkunftssprache mit ganz vielen unterschiedlichen Gruppen in der Forschung verglichen. Als Vergleichsgruppen dienen in unterschiedlichen Spracherwerbsstudien monolinguale Kinder und monolinguale Erwachsene, die die gegebene Sprache im einsprachigen Kontext erwerben bzw. sprechen; bilinguale Kinder, die die gegebene Sprache als Mehrheitssprache simultan erwerben; bilinguale Kinder, die die gegebene Sprache als ihre schwächere Sprache (aber nicht die HS) erwerben; L2-Lerner der gegebenen Sprache; erwachsene HSS, d. h. Immigranten der ersten Generation. Der Vergleich der Kinder, die ihre HS erwerben, mit monolingualen Kindern steht seit Jahrzehnten im Zentrum des Interesses der Forschung zum 2L1-Erwerb (siehe Kap. 2.5). Auch wenn der Begriff der Herkunftssprache in den Studien selten auftaucht, betreffen sie sehr häufig eine Situation des Erwerbs von zwei Sprachen, von denen eine als HS betrachtet werden muss. Die Studien zeigen, dass die möglichen Unterschiede beim Erwerb der zwei Sprachen eher quantitativer und nicht qualitativer Natur sind (siehe Kap. 2.5.3), obwohl die Debatte darüber ganz bestimmt nicht als beendet gelten kann65. Die Entwicklung der HS, die oft die schwächere Sprache des Kindes ist, ist oft verzögert, die Fehlerquote beim Erwerb spezifischer Phänomene liegt oft höher und es kommt zu zwischensprachlichen Einflüssen. Viele Studien zum bilingualen Erwerb von Sprachen, die als HS klassifiziert werden können, veranschaulichen, dass in der 64 Siehe Kap. 2.5.3 zum Begriff Dominanz. 65 Siehe Lleó und Cortés (2013) für ein Beispiel der qualitativen Unterschiede im phonologischen Bereich zwischen dem 2L1- und L1-Erwerb.

Kontext des Inputs – Herkunftssprache (HS) vs. Mehrheitssprache (MS)

79

Sprachentwicklung jüngerer Kinder (siehe Meisel, 2007b, 2011) oder älterer Kinder (Argyri & Sorace, 2007) Unterschiede zum monolingualen Erwerb auftreten, aber sie können nicht als qualitativ angesehen werden. In einer neueren Untersuchung zum Russischen als HS zeigen jedoch Rodina und Westergaard (2017), dass in der HS-Entwicklung von Kindern, die sehr wenig Input bekommen, qualitative Unterschiede im Bereich des Genus auftreten können. Einige Forscher vergleichen sogar die Entwicklung der schwächeren Sprache (die oft die HS der untersuchten Kinder ist) mit der L2-Entwicklung, was auch mit qualitativen Unterschieden einhergeht (Schlyter, 1993; Bernardini, 2017). Beim Vergleich der Sprache der älteren HS-Sprecher mit Daten monolingualer Kinder kommen einige Forscher zum Schluss, dass die Sprachentwicklung der HS in manchen Bereichen zu einem Zeitpunkt eingefroren zu sein scheint, weil die HS-Daten der Erwachsenen den Daten monolingualer Kinder zu ähneln scheinen (vgl. Sekerina & Sauermann, 2015; Polinsky & Scontras, 2020a,b). Der Erwerb der Herkunftssprache wird auch von einigen Forschern mit dem L2-Erwerb verglichen. Ein solcher Vergleich ist aus spracherwerbstheoretischen Gründen sehr strittig, weil das Gros der Forscher die beiden Erwerbtypen als fundamental unterschiedlich sehen (siehe dazu Kap. 2.3). Immerhin veranschaulichen einige Studien, dass es Sprachbereiche gibt, in denen sowohl HS erwerbende Kinder als auch L2-Lerner ähnliche Probleme haben, wie beispielsweise Wortfolge oder Nullargumente (Perez-Cortes, 2016; Lustres, 2018; Sanz & Torres, 2018; Polinsky & Scontras, 2020a,b). Beim Vergleich der Daten aus unterschiedlichen Erwerbstypen muss man im Auge behalten, dass, auch wenn einige Phänomene in den Daten von unterschiedlichen Populationen gleich zu sein scheinen, es noch lange nicht bedeutet, dass sie immer auf dieselben Spracherwerbsmechanismen zurückgeführt werden können. Die anderen Faktoren, wie beispielsweise das Alter der Probanden oder die Sprachentwicklungsetappe, in der sie sich befinden, müssen bei der Interpretation der Ergebnisse auch berücksichtigt werden. Alle Forscher sind sich aber darüber einig, dass der reduzierte Input eine der wichtigsten Eigenschaften des HS-Erwerbs ist. Verschiedene grammatische Bereiche scheinen während des HS-Erwerbs von den Folgen des reduzierten Inputs in unterschiedlichem Grad betroffen zu sein. Aus spracherwerbstheoretischen Gründen ist so eine Situation zu erwarten, weil das Vorhandensein des entsprechenden Inputs für den Erwerb einer spezifischen Spracheigenschaft, vor allem in der entsprechenden Entwicklungsphase, unabdingbar ist. In Folge dessen kann das Resultat des reduzierten Inputs unterschiedlich für den Erwerb der spezifischen Sprachphänomene sein, abhängig davon, welches Phänomen es ist, wie stark der Input reduziert wird und wann es zur Reduzierung kommt (vgl. Carroll, 2017; Meisel, 2020). Einige Forscher argumentieren auch, dass für den

80

Inputfaktor – Mehrheitssprache vs. Herkunftssprache

Erwerb einiger Bereiche die häufige Sprachexposition wichtiger als für den Erwerb anderer Bereiche sei (siehe z. B. Granfeldt, 2018). Zu den morphosyntaktischen Phänomenen, die in der HS-Entwicklung von den Folgen des womöglich reduzierten Inputs weniger oder gar nicht betroffen sind, gehören das Tempus im verbalen Bereich (siehe Montrul, 2016; Silva-Corvalán, 1994) und Determinierer im nominalen Bereich (Polinsky, 2018). Der Erwerb des Tempus wird oft mit dem Erwerb des Aspekts verglichen, mit dem HSS mehrere Probleme haben (siehe Silva-Corvalán, 1994; Montrul, 2016). Polinsky und Scontras (2020a) erklären diese Beständigkeit der Phänomene mit ihrer Salienz und ihrer primären Rolle für die Interpretation der Äußerungen (mehr dazu im Kap. 4). An der Schnittstelle von Syntax und Semantik scheinen auch die mit den Bindungsprinzipien verbundenen Phänomene vom reduzierten Input während der HS-Entwicklung weniger betroffen zu sein, wenn die Entfernung zwischen dem Binder und der Anapher nicht groß ist (Polinsky, 2018; Polinsky & Scontras, 2020a). Phänomene, die besonders stark vom reduzierten Input während des HSErwerbs betroffen werden, sind vor allem mit der Morphologie und der Syntax verbunden. Im morphologischen Bereich ist das die Kongruenzmorphologie (siehe Benmamoun et al., 2013; Polinsky, 2018 für eine Zusammenstellung der relevanten Studien). Die syntaktischen Phänomene, die besonders den Folgen des reduzierten Inputs ausgesetzt sind, werden von Polinsky und Scontras (2020a) in drei Gruppen zusammengefasst. Es handelt sich dabei erstens um Phänomene, bei denen strukturelle Abhängigkeiten zwischen voneinander entfernten Elementen zustande kommen, wie beispielsweise in Relativsätzen oder bei der Anapherinterpretation (siehe Polinsky, 2011). Zweitens sind es Phänomene der Nullelemente im Satz, wie Nullsubjekte oder Ellipsen. HSS neigen dazu, Nullelemente phonetisch doch zu realisieren, sogar dann, wenn die Nullsubjekte sowohl in der HS als auch in der MS erlaubt sind (siehe u. a. Pérez-Leroux & Glass, 1999; Rothman, 2007, 2009a; Serratrice et al., 2004; Sorace, 2011; Sorace & Filiaci, 2006; Tsimpli, 2007, 2014; Sopata et al., 2021). Drittens haben HSS Probleme mit Mehrdeutigkeit im syntaktischen Bereich. Die Studien zeigen auf, dass in jenen Fällen, in denen monolinguale Sprecher zwei unterschiedliche Interpretationen, beispielsweise bei der Topikidentifizierung, zulassen, HSS oft nur eine Interpretation erlauben (siehe Laleko & Polinsky, 2013, 2016, 2017). Insgesamt gesehen überwiegen in den Studien zu Herkunftssprachen solche, die Evidenz für Unterschiede zwischen der HS und MS liefern und Differenzen zwischen dem HS-Erwerb und dem monolingualen Erwerb der gegebenen Sprache in mehreren Bereichen aufzeigen. Die interindividuelle Variation ist jedoch bei HS-Sprechern ziemlich groß. Spracherwerbsforscher suchen heutzutage danach, den HS-Erwerb und HS-Endzustand adäquat zu erklären, und die

Zeitpunkt des Beginns der Mehrheitssprachenexposition

81

Rolle der Faktoren des Alters, des Inputs sowie anderer Faktoren in der HS herauszufinden.

3.6

Zeitpunkt des Beginns der Mehrheitssprachenexposition

Das Alter, in dem Kinder Kontakt zu einer Sprache aufnehmen, ist ein sehr wichtiger Faktor, der auf den Verlauf, die Schnelligkeit und den Endzustand des Erwerbs der Sprache einen enormen Einfluss hat (siehe dazu Kap. 2). Die Tatsache, wann der Erwerb der Mehrheitssprache (MS) beginnt, kann aber nicht nur ihren Erwerb sondern auch die Entwicklung der Herkunftssprache (HS) beeinflussen. Der Zeitpunkt des Beginns des MS-Erwerbs ist für die MS-Entwicklung relevant, weil abhängig von ihm findet der MS-Erwerb entweder in der sensitiven Phase oder nicht mehr in der sensitiven Phase statt. Für die HS-Entwicklung ist das Alter zu Beginn des MS-Erwerbs auch von Belang, weil es die Sprachexposition der Kinder enorm beeinflusst. Simultan zweisprachige Kinder sind schon früh dem Input in beiden Sprachen ausgesetzt. Es wird von vielen Forschern angenommen, dass dadurch der Input in jeder der beiden Sprachen reduziert wird. Bei der großen interindividuellen Variabilität muss das auf keinen Fall immer so sein (siehe Kap. 3.4.1), aber immerhin kann man annehmen, dass zumindest in manchen Fällen der Input in einer Sprache bei simultan zweisprachigen Kindern reduziert ist. Allerdings muss das nicht bedeuten, dass die Entwicklung jener Sprache, in der der Input etwas reduziert ist, nicht erfolgreich sein wird. Wie schon in Kap. 3.5.2 diskutiert, kann der Endzustand des Erwerbs auch dann mit der monolingualen Norm einhergehen, wenn die relative Häufigkeit der Sprachexposition zu einer Sprache bei bilingualen Kindern unter 30 % liegt (vgl. Meisel, 2019). Im Falle des sukzessiven Erwerbs der MS wird die HS in den ersten Lebensjahren als einzige Sprache vom Kind erworben. Da die Meilensteine des Erwerbs des morphosyntaktischen Bereichs in den Jahren 0–4 zu setzen sind, ist diese Lebensphase ausschlaggebend für die Entwicklung der Syntax. Wenn Kinder keinen Kontakt zur MS in dieser Zeit haben, sind sie zu diesem Zeitpunkt in einer Inputsituation, die monolingualen Kindern gleicht, d. h. der ganze, ihnen zugängliche, Input erfolgt in der HS. Wenn man die Sprachexposition von Kindern der HS und der MS gegenüber über einen längeren Zeitraum beobachtet, ist zu sehen, dass es in beiden Szenarien meistens dazu kommt, dass der MS-Input mit den Jahren zunimmt und der HS-Input abnimmt. Die Veränderung in der Input-Situation, die sehr häufig beim Schuleintritt stattfindet, resultiert in dem schon oben erwähnten Sprachdominanzwandel (siehe Kap. 3.5.3). Der Dominanzwandel kann zur Verzögerung des Erwerbs jener Phänomene beitragen, die noch nicht vollständig erworben

82

Inputfaktor – Mehrheitssprache vs. Herkunftssprache

worden sind. Er kann auch, einigen Forschern nach, den Erwerb einiger Phänomene verhindern oder gar den Verlust schon erworbener Phänomene verursachen (siehe Montrul, 2008, 2016). Welche der zwei oben beschriebenen Szenarien für den HS- und MS-Erwerb sowie für die kognitive Entwicklung der Kinder günstiger ist, wird seit Jahrzehnten in der Forschung, und vor allem in Familien mit Migrationshintergrund, heiß diskutiert. Montrul (2002, 2008) stellt die These auf, dass es Kindern, die sukzessiv zweisprachig sind, leichter fällt, die Phänomene der HS erfolgreich zu erwerben und sie normgerecht zu benutzen. Sie argumentiert, dass die Zeitperiode vor der MS-Exposition Kindern die Festigung des HS-Wissens ermöglicht. Im Gegensatz zu Montruls These erbringen mehrere Forscher die Nachweise dafür, dass der simultan bilinguale Erwerb auch beim unbalancierten Input nicht unbedingt qualitativ von der monolingualen Norm abweicht. Auch wenn der Erwerb der HS, die sehr oft die schwächere Sprache der Kinder ist, im Vergleich zum monolingualen Erwerb verzögert oder von der MS beeinflusst werden mag, wird er von vielen Forschern, qualitativ gesehen, als L1-Erwerb aufgefasst (vgl. Meisel, 2007b, 2011, 2019; Meir, 2018). Fest steht jedoch, dass die Tatsache, ob HSS simultan oder sukzessiv zweisprachige Kinder oder Erwachsene sind, ein wichtiger Teil des Gesamtbilds ist, wenn man die HSS untersucht. Kupisch (2013) kritisiert also zurecht viele HSStudien, die zwischen simultan und sukzessiv bilingualen HS-Sprechern nicht unterscheiden. Studien, die den Einfluss des Zeitpunkts, wann der MS-Erwerb begonnen wird, auf die HS-Entwicklung untersuchen, liefern keine eindeutigen Ergebnisse. Armon-Lotem et al. (2011) sowie Gagarina et al. (2014) zeigen für die HS-Russisch in Kontakt mit der MS-Deutsch und der MS-Hebräisch auf, dass es keine Korrelation zwischen dem lexikalischen und grammatischen HS-Wissen einerseits und dem Zeitpunkt des Beginns des MS-Erwerbs gibt. Für Portugiesisch als HS liefern jedoch Lein et al. (2017) Evidenz dafür, dass es so eine Korrelation zwischen dem Zeitpunkt des Beginns des Erwerbs der MS Deutsch und der morphosyntaktischen Korrektheit in der HS-Produktion gibt. Auch Janssen et al. (2015) zeigen, dass der Zeitpunkt des Beginns des MS-Erwerbs die einzige Variable ist, die die Korrektheit der Verarbeitung in der HS vorhersagt. Studien, die systematisch HSS miteinander vergleichen, die simultan oder sukzessiv Bilinguale sind, legen auch keine einheitlichen Ergebnisse vor. Während mehrere Studien den Vorteil der sukzessiv bilingualen Kinder im HSWissen veranschaulichen (Montrul, 2002, 2008: 60; Schwartz & Minkov, 2014; Gagarina & Klassert, 2018; Montrul & Silva-Corvalán, 2019), zeigen andere Studien, dass sich die Ergebnisse simultan und sukzessiv Bilingualer im HS-Wissen nicht immer unterscheiden (siehe Kupisch 2013: 209ff für eine Zusammenfassung solcher Studien).

Zeitpunkt des Beginns der Mehrheitssprachenexposition

83

Die widersprüchlichen Ergebnisse dieser Studien können zumindest teilweise dadurch erklärt werden, dass der Spracherwerb im Allgemeinen und der Erwerb der Herkunftssprache im Besonderen ein sehr dynamischer Prozess ist. Auch wenn Unterschiede zwischen simultan und sukzessiv bilingualen HS-Sprechern zu einem Zeitpunkt festgestellt werden können, heißt es noch lange nicht, dass dieselben Unterschiede zu einem anderen Zeitpunkt gefunden werden können. Brehmer und Sopata (2021) zeigen in einer Untersuchung von mehreren Altersgruppen, die Polnisch als HS und Deutsch als MS erwerben, dass die Unterschiede zwischen simultan und sukzessiv Bilingualen vom Alter zum Testzeitpunkt abhängen. Während der Faktor des Zeitpunkts des Beginns des MSErwerbs im Kindesalter für die HS-Entwicklung von Belang ist, veranschaulichen die Ergebnisse der jungen Erwachsenen in der Studie, dass sich sowohl simultan als auch sukzessiv bilinguale HSS von den monolingualen Sprechern des Polnischen auf gleiche Weise unterscheiden. Als Fazit der Diskussion über die Rolle des Zeitpunkts des Beginns des MSErwerbs für die HS-Entwicklung soll festgehalten werden, dass der Faktor von hoher Relevanz ist. Die Spracherwerbsforschung hat jedoch noch kein einheitliches Bild davon geschaffen, wann und wie dauerhaft, sowie in welchem Ausmaß der Erwerb der Herkunftssprache vom Zeitpunkt des Anfangs der Exposition der Kinder zur Mehrheitssprache beeinflusst wird. Das Kapitel zum Inputfaktor zusammenfassend soll betont werden, dass in der Spracherwerbsforschung Konsensus über die enorme Rolle dieses Faktors für den Spracherwerb herrscht. Eine gewisse Menge des Sprachinputs ist unabdingbar, damit der Erwerb überhaupt stattfindet. Der Inputkontext ist die Grundlage für die Klassifizierung der erworbenen Sprache als Mehrheits- oder Herkunftssprache. Der Ansatz des Erwerbs der zweiten Sprache bei Bilingualen entscheidet weitgehend darüber, wie intensiv der Input in der ersten Sprache über Jahre hin ist. Untersuchungen des Spracherwerbs, der unter verschiedenen Bedingungen im Hinblick auf den Input stattfindet, können uns Einblick in die Natur des Sprachwissens und der Prozesse geben, durch die dieses Wissen erworben wird. Die Erforschung des Erwerbs von zwei Bereichen einer Sprache, die als Mehrheits- oder Herkunftssprache von zweisprachigen Kindern angeeignet wird, ist der zweite wichtige Bestandteil der Forschungsfragen der vorliegenden Arbeit.

Kapitel 4: Referenz, Artikel und Nullargumente im Deutschen

4.1

Begriffsbestimmung

Die Begriffe Referenz, (In)Definitheit, Spezifizität, die für die Darstellung der Artikel und Nullargumente im Deutschen von höchster Relevanz sind, sowie das Konzept der Nullargumente selbst werden in der Literatur uneinheitlich verwendet. Um terminologische Verwirrung zu vermeiden, werden die Termini im folgenden Unterkapitel zuerst erläutert. Eine einheitliche theoretische Basis für die Datenanalyse und –interpretation in den nächsten Kapiteln soll dadurch sichergestellt werden.

4.1.1 Referenz und referentielle Ausdrücke In der Literatur wird unter Referenz die Bezugnahme auf Referenten verstanden, d. h. auf konkrete oder abstrakte Entitäten in der äußeren Welt oder in der Vorstellung der Gesprächspartner (vgl. Prince, 1981; Schwarz, 1992; Vater, 2005). Das Entscheidende ist, dass die Entitäten in einem relationalen System (Raum, Zeit, Wissens- und Wertesystem) in Beziehung zueinander, ebenso wie zum Sprecher sowie Hörer der Äußerung gesetzt werden (vgl. Blühdorn, 2002). In Anlehnung an Lehmann (2015: 2) wird unter Referenz in der vorliegenden Arbeit eine Operation verstanden, die eine Entität im Redeuniversum durch einen Ausdruck in einem Text evoziert, sowie auch die Relation des Ausdrucks zur Entität. Die evozierte Entität, Referent genannt, ist ein mentales Objekt und nicht ein Gegenstand in der physikalischen Welt, das als Denotat bezeichnet wird. Ein Referent kann ein Individuum oder eine Menge sein. Das Redeuniversum ist ein mentaler, von den Gesprächspartnern in einer bestimmten Sprechsituation geschaffener Raum, der im Laufe des Gesprächs weiterentwickelt wird. Man kann das Redeuniversum als die Schnittmenge des Bewusstseinsinhalts der Gesprächspartner auffassen (Lehmann, 2015: 7).

86

Referenz, Artikel und Nullargumente im Deutschen

Als referentielle (referential) bzw. referierende (referring) Ausdrücke werden in der vorliegenden Arbeit Ausdrücke verstanden, die zum Referieren benutzt werden66. Mit einer referentiellen Nominalphrase (NP) wird ein neuer Referent in den Diskurs eingeführt oder es wird auf einen bereits eingeführten Referenten Bezug genommen. Im Gegensatz zu den referentiellen Ausdrücken stehen die nicht-referentiellen Ausdrücke, die auf keine Entität referieren. Vater (2005) bezeichnet als nicht-referierende Ausdrücke solche, die eine Eigenschaft (Qualität) denotieren und zur Beschreibung des Referenten beitragen. Sie werden deshalb auch qualitative NPn genannt. Nach Vater (2005) ist die prädikative NP ein prototypisches Beispiel für nicht-referierende Ausdrücke (vgl. auch Lambrecht, 1994: 75). Es gibt allerdings auch nicht-referentielle Argument-NPn. In der relevanten Literatur werden unterschiedliche Kriterien zur Identifizierung von nicht-referentiellen NPn dargestellt. Nicht-referentielle NPn können nicht durch eine Anapher aufgegriffen werden (Kuno, 1970). Der Numerus von nichtreferentiellen NPn kann nicht verändert werden (Bausewein, 1990: 63). In der Literatur werden auch weitere Kriterien vorgeschlagen, um die nicht-referentiellen NPn von den referentiellen NPn zu unterscheiden, auf die im Rahmen der Arbeit nicht näher eingegangen werden kann. Es soll an dieser Stelle allerdings festgehalten werden, dass es kein Kriterium gibt, das eine eindeutige Entscheidung in diesem Bereich erlaubt.

4.1.2 (In)Definitheit Im Allgemeinen wird als Definitheit eine universelle Kategorie bezeichnet, die als Oberbegriff für das gesamte Kontinuum von Ausdrücken gilt. Die allgemeine Kategorie wird in der relevanten Literatur auch Identifizierbarkeit genannt (vgl. Lei, 2017). Im engeren Sinne wird unter Definitheit eine grammatische Kategorie verstanden, die in Artikelsprachen durch den definiten Artikel geäußert wird. (In)Definitheit ist dadurch eine Eigenschaft der Nominalphrase67. In der sprachwissenschaftlichen Tradition gibt es zwei Hauptansätze zur Charakterisierung der Definitheit, die einerseits auf der Analyse der Einzigartigkeit (uniqueness) basieren (Russell, 1905; Strawson, 1950), andererseits sich auf den Begriff der Bekanntheit (familiarity) beziehen (Christophersen, 1939; Kamp, 66 Dadurch wird auf die Unterscheidung zwischen den Begriffen verzichtet, die von Thrane (1980) vorgeschlagen worden ist. Nach Thrane soll ein Ausdruck als referentiell bezeichnet werden, wenn er zum Referieren benutzt werden kann. Referierend soll dagegen ein Ausdruck genannt werden, wenn er dazu tatsächlich gebraucht wird. 67 In der vorliegenden Arbeit wird aus Platzgründen nicht auf die Debatte eingegangen, ob die deutsche Nominalphrase als Determinansphrase analysiert werden soll. Siehe dazu beispielsweise Olsen (2012).

Begriffsbestimmung

87

1981; Heim, 1982). Die Theorien der Definitheit, die sich auf Russells Auffassung (1905) stützen, gehen davon aus, dass die definite Nominalphrase das Vorhandensein eines einzigartigen Referenten signalisiert (z. B. Strawson, 1950; Lewis, 1979; Neale, 1990). Die Theorien der Definitheit, die auf Christophersens Auffassung zurückgehen, stellen den Begriff der Bekanntheit und nicht der Einzigartigkeit bei der Interpretation der Definitheit in Vordergrund. Nach diesen Theorien müssen die definiten NPn schon in den Diskurs-Kontext eingeführt worden sein und daher dem Hörer bekannt sein (z. B. Kamp, 1981; Heim, 1982). Nach diesen Theorien unterscheiden sich die definiten NPn von den indefiniten NPn dadurch, dass die indefiniten NPn einen neuen Referenten einführen, und die definiten NPn den schon eingeführten Referenten aufgreifen, ähnlich wie es auch anaphorische Pronomina tun68. Die Theorien der Definitheit, die auf dem Begriff der Einzigartigkeit aufbauen, werden von Löbner (1985) kritisiert, der seine Theorie der Definitheit auf den Begriff der eindeutigen Referenz stützt. Eine NP ist nach seiner Auffassung definit, wenn sie zur eindeutigen Referenz benutzt wird. Löbner (1985) verzichtet darauf, die Definitheit entweder durch die Einzigartigkeit oder die Bekanntheit des Referenten zu definieren und unterscheidet zwischen semantisch und pragmatisch definiten NPn. Im Falle der semantisch definiten NPn wird der Referent unabhängig von der Sprechsituation und vom Kontext der Äußerung etabliert und bei pragmatisch definiten NPn ist eine Abhängigkeit von der Situation und dem Kontext für die eindeutige Referenz zu sehen (Löbner, 1985: 298). Auch Lyons (1999: 198) schlägt zwei Typen der Definitheit vor, und unterscheidet zwischen dem textsituativen und anderem Gebrauch der definiten NPn. Nach Lyons (1999: 5–6) kann die (In)Definitheit mithilfe von Identifizierbarkeit und Inklusivität charakterisiert werden. Unter Identifizierbarkeit (identifiability) wird von Lyons (1999) der Ausdruck dessen verstanden, ob ein Referent bekannt oder schon im Diskurs etabliert worden ist. Der Begriff der Inklusivität (inclusivity) bezieht sich dagegen nach Lyons (1999) darauf, dass die Referenz die Gesamtheit der denotierten Objekte wie Massennomina umfasst. Der Identifizierbarkeit wird von Lyons (1999) die übergeordnete Relevanz zugeschrieben, weil sie eine zentrale Rolle bei der Artikelverwendung spielt (vgl. auch Leiss, 2000). Im Gegensatz zu Lyons (1999) führt von Heusinger (1996, 2006) die Effekte der Definitheit auf eine Grundfunktion zurück. Eine definite Markierung gibt nach von Heusinger (1996, 2006) an, dass auf den in einer gegebenen Situation hervorstechendsten (salientest) Vertreter der Kategorie referiert wird, die durch die NP denotiert wird. In der relevanten Literatur scheint jedoch die Auffassung 68 Siehe Piotrowska und Skrzypek (2021) zu einem Überblick über die Debatte zur Einzigartigkeit und Bekanntheit als Hauptbestandteile der Definitheit.

88

Referenz, Artikel und Nullargumente im Deutschen

zu überwiegen, dass die Definitheit nicht auf eine Grundfunktion zurückzuführen ist, und dass es zwei Definitheitstypen gibt. So baut Schwarz (2013) sein Konzept der Definitheit auf der Opposition Bekanntheit vs. Einzigartigkeit auf, und schlägt vor, zwischen starker und schwacher Definitheit zu unterscheiden. Als empirische Evidenz für zwei Definitheitstypen gelten Sprachen oder Dialekte, in denen es mehr als einen definiten Artikel gibt (z. B. im Nordfriesischen und im Rheinischen Ebert 1971, Hartmann 1982). In der vorliegenden Arbeit wird die Definitheit als Eigenschaft der Nominalphrase aufgefasst, die lexikalisch durch Determinative realisiert wird. Es wird davon ausgegangen, dass eine NP definit ist, wenn sie zur eindeutigen Referenz benutzt wird (Löbner, 1985). Wichtig für die weitere Analyse ist jedoch auch die Abgrenzung der Definitheit von der Spezifizität, auf die im nächsten Unterkapitel eingegangen wird.

4.1.3 Spezifizität Die Abgrenzung der Definitheit von der Spezifizität wird von mehreren Forschern postuliert (siehe z. B. von Heusinger, 2011). Traditionell wird ein Ausdruck für spezifisch gehalten, wenn er sich auf einen Referenten bezieht, den der Sprecher kennt oder meint. Charakteristisch für spezifische Ausdrücke ist es, dass sie sich auf Referenten beziehen, bei denen die zu ihrer Identifizierung notwendige Informationen dem Hörer nicht zugänglich sein müssen. Das unterscheidet sie von den definiten Ausdrücken, bei denen die notwendigen Informationen für ihre Identifizierung sowohl dem Sprecher als auch dem Hörer zugänglich sind. In der sprachphilosophischen Literatur wird die Opposition definit vs. spezifisch als Gegensatz zwischen referentiellen NPn und attributiven NPn aufgefasst (Donnellan, 1966: 285). Ob eine definite NP referentiell oder attributiv verwendet wird, ist nach Donnellan (1966: 297) eine Funktion der Intentionen des Sprechers in einem gegebenen Fall. Donellan (1966) bezeichnet die attributiven NPn als nicht-referentiell, was von Vater (2005: 101) kritisiert wird, weil auch bei attributiven NPn die Existenz präsupponiert wird, obwohl die Existenz nicht der realen Welt sondern einer möglichen Welt zuzuschreiben ist. Der Begriff Spezifizität wird heutzutage in ihrer Relation zu anderen Faktoren definiert. Die Spezifizität wird in Beziehung auf Referentialität und Skopus (Farkas, 1994) sowie Partitivität (partitivity), Topikalität (topicality), Beachtenswertigkeit (noteworthiness) und Diskursprominenz (discourse prominence) (von Heusinger, 2011, 2019) charakterisiert. Die Relevanz der Beachtenswertigkeit kann durch den Gebrauch des Determinativs this im Englischen verdeutlicht werden, der nur in jenen Fällen benutzt werden kann, wenn die gegebene NP eine

Begriffsbestimmung

89

beachtenswerte, interessante Information darstellt. Die Relevanz der Topikalität und der Diskursprominenz für die Spezifizität ist unverkennbar. Eine indefinite NP, die das Topik der Äußerung ist, kann nur spezifisch interpretiert werden. Oft wird Spezifizität zur Erklärung unterschiedlicher Varianten der Indefinitheit gebraucht (vgl. Enç 1991; von Heusinger 2011). Ionin et al., (2004) definieren Spezifizität und Definitheit jedoch auf eine Weise, bei der auch definite NPn als unspezifisch bezeichnet werden können. Sie beziehen beide Begriffe auf den Diskurs und auf das Wissen, sowie den Bewusstseinsstand des Sprechers und des Hörers im Rahmen des Diskurses. Bei definiten NPn präsupponieren sowohl der Sprecher als auch der Hörer die Existenz eines einzigartigen Individuums in der Menge der Denotate, auf die die gegebene NP hinweist. Für spezifisch werden NPn gehalten, bei denen der Sprecher es beabsichtigt, auf ein einzigartiges Individuum in der Menge der Denotate zu referieren, auf die die gegebene NP hinweist, und das Individuum oder seine Eigenschaft als beachtenswert betrachtet. Nach der Definition von Ionin et al. (2004) spiegelt also die Definitheit den Stand des Wissens sowohl des Sprechers als auch des Hörers wider, während die Spezifizität den Stand des Wissens nur des Sprechers zum Ausdruck bringt. Nach Ionin et al. (2004) können Sprachen die Definitheit und/oder die Spezifizität mit Determinativen markieren. Das Englische und das Deutsche sind Beispiele von Sprachen, die Definitheit, aber nicht Spezifizität, mit einem Artikel markieren. Ein Beispiel einer NP, die indefinit und spezifisch ist, ist in 4–1 zu sehen, in dem der Sprecher B auf einen gegebenen Jungen zu referieren beabsichtigt, der aus der Perspektive des Sprechers von Bedeutung ist: 4–1 Auf dem Spielplatz: A: Warum weinst du? Was ist mit deinem Ball passiert? B: Ein Junge hat ihn kaputt gemacht und ist weggelaufen.

In 4–2 wird ein Beispiel einer NP angegeben, die indefinit und unspezifisch ist, in dem der Sprecher B nicht beabsichtigt, auf ein bestimmtes Buch zu referieren: 4–2

A: Was wünschst du dir zu Weihnachten? B: Ich würde gerne ein Buch über Hunde bekommen.

Nach der Auffassung von Ionin et al. (2004) ist die Opposition spezifisch vs. unspezifisch unabhängig von der Opposition definit vs. indefinit. Daher können die definiten NPn auch spezifisch oder unspezifisch sein. Ein Beispiel einer definiten und spezifischen NP wird in 4–3 angegeben:

90

Referenz, Artikel und Nullargumente im Deutschen

4–3

A: Ich habe einen Kuli und Buntstifte, mit den Buntstiften zeichne ich aber gerade. B: Komm schon, du kannst mir wenigstens den Kuli leihen.

Sprecher B in Beispiel 4–3 beabsichtigt, mit der definiten NP den Kuli auf einen bestimmten Gegenstand zu referieren, der aus seiner Perspektive beachtenswert ist. Das sieht anders in Beispiel 4–4 aus, in dem die definite NP zu sehen ist, die unspezifisch ist: 4–4

A: Das Autorennen war toll! Ein Fahrer aus Frankreich hat alle anderen überholt und das Rennen gewonnen. Wo ist dein Vater? B: Er ist kurz zu den Fahrern gegangen. Er will mit dem Gewinner des Autorennens sprechen.

In Beispiel 4–4 beabsichtigt der Sprecher B nicht, auf eine bestimmte Person zu referieren. Er meint die Person, die das Rennen gewonnen hat. Die Auffassung der Opposition spezifisch vs. unspezifisch von Ionin et al. (2004) unterscheidet sich von einigen anderen Referenzhierarchien. So schlägt Dryer (2014)69 folgende Referenzhierarchie vor: anaphorische definite NP > nicht-anaphorische definite NP > pragmatisch (und semantisch) spezifische indefinite NP > pragmatisch unspezifische (aber semantisch spezifische) indefinite NP > semantisch unspezifische NP. Eine anaphorisch definite NP bezieht sich auf einen Referenten, der schon im Diskurs aufgetreten ist, während die nicht-anaphorische definite NP sich auf das gemeinsame Wissen der Gesprächspartner bezieht (z. B. der König oder die Sonne) 70. Semantisch spezifisch sind nach Dryer solche indefinite NPn, die auf eine Existenz der Entität hinweisen, auf die sie sich beziehen. In diesem Rahmen unterscheidet Dryer pragmatisch spezifische NP, d. h. NPn, die auf Referenten hinweisen, auf die im späteren Diskurs noch einmal Bezug genommen wird, und pragmatisch unspezifische NPn, d. h. indefinite NPn, deren Referent weiter nicht mehr im Diskurs erwähnt wird. Die letzte Kategorie bilden bei Dryer (2014) semantisch unspezifische indefinite NPn, die nicht auf die Existenz des Referenten hinweisen (z. B. Der Gärtner sucht nach einer blauen Rose). Der Wert von Dryers Hierarchie für die Vergleiche der Markierung der (In)Definitheit in verschiedenen Sprachen ist offensichtlich. In der vorliegenden Arbeit wird jedoch, wenn nicht anders angegeben, die Spezifizität nach der Auffassung von Ionin et al. (2004) verstanden. Die empirische Evidenz für die Unabhängigkeit der Oppositionen spezifisch vs. unspezifisch und definit vs. 69 Dryer (2014) gibt an, dass seine Hierarchie auf das sog. Referenzkreis (wheel of reference) von Givón (1978) basiert. Dryer gebraucht aber eine andere Terminologie und kürzt es ab. 70 Vgl. Hawkins (1978) und Lyons (1999), die auch zwischen dem textsituativen und anderen Gebrauch von definiten NPn unterscheiden. Siehe Kap. 4.1.2.

Begriffsbestimmung

91

indefinit, die von Ionin et al. (2004) vorgeschlagen wird, kommt auch aus den Sprachen, die im Gegensatz zu Englisch oder Deutsch nicht die Definitheit, aber doch die Spezifizität mit den Artikeln markieren. Das Samoanische ist ein Beispiel für eine Sprache, die nach Ionin et al. (2004) die Spezifizität, aber nicht die Definitheit markiert. Vor allem aber ist die Spezifizität nach Ionin et al. (2004) der Ausgangspunkt einiger Untersuchungen in der Spracherwerbsforschung. Um die Vergleichbarkeit der Untersuchungsergebnisse der vorliegenden Arbeit mit den Ergebnissen anderer Studien zum Spracherwerb der Nominalphrasen zu garantieren, wird die Auffassung der Spezifizität nach Ionin et al. (2004) in der vorliegenden Arbeit angenommen.

4.1.4 Nullargumente Referentielle Ausdrücke können in der Form von Nominalphrasen, Pronomina oder eben auch als Null realisiert werden. In mehreren Sprachen kann das Subjekt ausgelassen werden. Dazu gehören z. B. Spanisch, Italienisch, Polnisch u. a. Es handelt sich dabei um die sog. Nullsubjektsprachen, in denen das Subjekt nur dann lexikalisch realisiert wird, wenn es aus pragmatischen Gründen hervorgehoben werden soll. Es wird beispielsweise fokussiert oder betont. In solchen Sprachen tritt kein Expletivum auf, also ein Element, das als Subjekt gilt, jedoch keine semantisch-pragmatische Funktion erfüllt. In den Nicht-Nullsubjektsprachen können Subjekte hingegen nicht ausgelassen werden (z. B. im Französischen). Unabhängig von den pragmatischen Umständen werden die Subjekte in den Nicht-Nullsubjektsprachen immer realisiert. Die Regel betrifft sowohl die thematischen als auch die expletiven Subjekte. Sowohl in Nullsubjektsprachen als auch in Nicht-Nullsubjektsprachen sind allerdings diesbezüglich zahlreiche Abweichungen zu beobachten. Der in der Literatur häufig diskutierte Fall ist der des Deutschen (siehe Tomaselli, 1986; Jaeggli & Safir, 1989; Cardinaletti, 1997), worauf in Kap. 4.4 näher eingegangen wird. Die ausgelassenen Subjekte oder genauer Subjektpronomina in Nullsubjektsprachen werden im Rahmen der generativen Grammatik als leere Pronomen – pro – aufgefasst und daher werden Nullsubjektsprachen auch als prodrop-Sprachen und Nicht-Nullsubjektsprachen als Nicht-pro-drop-Sprachen bezeichnet. Dieser Gegensatz wird auf morphologische Eigenschaften der Sprachen zurückgeführt (vgl. Rizzi, 1986). In den Nullsubjektsprachen tritt eine reiche Flexion am Verb auf, die eine eindeutige Markierung der Kongruenzkategorien erlaubt. Die Einteilung der Sprachen in solche mit reicher Flexion und Nullsubjekten und in solche ohne die beiden Merkmale ist jedoch nicht eindeutig. Das Japanische und das Chinesische, in denen Person-Numerus-Kongruenz nicht mar-

92

Referenz, Artikel und Nullargumente im Deutschen

kiert wird, und in denen Nullsubjekte auftreten, sind ein Paradebeispiel gegen eine Eins-zu-eins Beziehung zwischen reicher Flexion und Nullsubjekten (siehe Huang, 1989; Jaeggli & Safir, 1989). Es gibt auch Sprachen, die trotz reicher Flexionsmorphologie keine thematischen Nullsubjekte zulassen (z. B. das Isländische, vgl. Haider, 2001). In einigen Sprachen ist die Auslassung der Subjekte oder Objekte mit der Topik-Position verbunden. Zu solchen Sprachen gehört das Deutsche, auf das in Kap. 4.4 näher eingegangen wird. Die Argumente, die auch als Null realisiert werden können, sind Objekte. In der Literatur werden zwei Haupttypen von Nullobjekten unterschieden (siehe Huang, 1984; Cummins & Roberge, 2004, 2005; Tsimpli & Papadopoulou, 2006): – Nullobjekte mit einem indefiniten oder mit keinem Antezedens im Diskurs, die nicht-spezifisch interpretiert werden – sog. nicht-anaphorische, indefinite oder nicht-referentielle Nullobjekte – Nullobjekte mit einem spezifischen Referenten, der schon im Diskurs aufgetreten ist oder durch die Sprechsituation festgelegt werden kann – sog. definite oder referentielle Nullobjekte. In vielen Sprachen können Objekte bei einigen Verben nicht realisiert werden, wie es im Englischen oder im Deutschen bei den Verben essen oder trinken der Fall ist. Zum Beispiel: 4–5

a. Die Gäste essen den Braten. b. Die Gäste essen.

Im Beispiel 4–5a kommt die transitive Variante des Verbs essen vor, und das Objekt wird realisiert. In Beispiel 4–5b haben wir es mit der intransitiven Variante des Verbs essen zu tun, in der das Objekt durch das Verb impliziert wird. Cummis und Roberge (2005: 61) sprechen in solchen Fällen wie bei 4–5b von einem Null Cognate Object. Viele Forscher sprechen in diesem Zusammenhang von nicht-anaphorischen ausgelassenen Objekten. Sie sind an spezifische Verben und bestimmte Kontexte gebunden und treten bei Verben auf, die in einer Bedeutungsvariante einfach eine Aktivität ausdrücken und in der anderen Variante mit dem spezifizierenden Objekt vorkommen (vgl. Allerton, 1975: 217; Fillmore, 1986: 96; Levin, 1993; Cote, 1996: 148–150) 71. In der Literatur werden auch generische Nullobjekte (z. B. Rizzi, 1986) und indefinite Nullobjekte (z. B. Bresnan, 1978; Cote, 1996; Ruda, 2017; Dvorak, 2021) unterschieden. Da diese Arten von Objekten für die vorliegende Arbeit nicht relevant sind, wird auf sie hier nicht weiter eingegangen.

71 Siehe Kuchenbrandt (2012) zur Diskussion des Themas im Rahmen der Dependenzgrammatik.

Begriffsbestimmung

93

Im Gegensatz zu den nicht-anaphorischen und indefiniten ausgelassenen Objekten stehen die ausgelassenen Objekte, deren Referenz auf Grund des sprachlichen Kontexts oder der Sprechsituation festgelegt werden kann. Sie können als anaphorische Nullobjekte bezeichnet werden. Nullobjekte können auf Basis der Informationen aus dem Kontext oder der Sprechsituation durch definite Ausdrücke ersetzt werden. In Nullobjektsprachen können Objekte ausgelassen werden, ohne dass der Satz ungrammatisch wird, oder dass die Interpretation des Verbs sich ändert. Da im Zentrum der Debatte innerhalb der Spracherwerbsforschung und im Zentrum des Interesses der vorliegenden Arbeit vor allem die Nullobjekte stehen, deren Referenz eindeutig festgelegt werden kann, und die daher als definit zu betrachten sind, werde ich mich im weiteren auf diese Art der Objektauslassungen konzentrieren, und, wenn nicht anders angedeutet, nur sie unter dem Terminus Nullobjekte verstehen. Die Nullobjekte sollen auch von einem anderen sprachlichen Phänomen abgegrenzt werden, und zwar von der Ellipse72. In Nullobjektsprachen können Objekte in Kontexten ausgelassen werden, die durch die Annahme einer Ellipse nicht erklärt werden können. Zu diesen Kontexten gehören solche, in denen sich das Verb im Satz mit dem Antezedens vom Verb im Satz mit dem Nullobjekt unterscheidet, und solche, in denen das Nullobjekt kein Antezedens hat, weil seine Referenz in Bezug auf die Sprechsituation und nicht auf den sprachlichen Kontext festgelegt wird73. In der vorliegenden Arbeit werden als Nullargumente Subjekte und Objekte verstanden, deren Referenz eindeutig bestimmt werden kann, die aber ausgelassen werden, d. h. sie werden phonetisch nicht realisiert. Es kann sich dabei um Elemente handeln, deren Referenz auf Grund des sprachlichen Kontextes, der Sprechsituation oder der Flexionsmerkmale am Verb festgelegt werden kann. Da Nullargumente seit Jahren im Zentrum des Interesses der linguistischen Forschung stehen, sind zahlreiche Vorschläge für ihre theoretische Auffassung entstanden (Bresnan, 1978; Fodor & Fodor, 1980; Rizzi, 1986; Huang, 1984; Raposo, 1986; Jackendoff, 1990; Cummins & Roberge, 2005; Tsimpli & Papadopoulou, 2006; Pérez-Leroux et al., 2008; 2013, Landau, 2010; Sigurðsson, 2011; Barbosa, 2019). Eine kritische Auseinandersetzung mit den Vorschlägen zur syntaktischen Analyse von Nullargumenten kann im Rahmen der vorliegenden Arbeit nicht geleistet werden. An einigen Stellen der linguistischen Untermauerung der Arbeit wird jedoch auf relevante theoretische Ansätze Bezug genommen.

72 Siehe Prokop (1984) zur Ellipse in deutschen und polnischen Dialogen. 73 Siehe Costa, Martins & Pratas (2012), Martins (2013), Landau (2006) und Ruda (2017) für eine Diskussion der Unterschiede zwischen Ellipsen und Nullobjekten.

94

Referenz, Artikel und Nullargumente im Deutschen

4.2

Theorie der Referenz

Der Gebrauch referentieller Ausdrücke, u. a. der Nominalphrasen und der Nullargumente, verlangt von einem Sprecher, die von ihnen ausgedrückten Informationen in einen adäquaten Diskursrahmen zu integrieren. Referenz ist ein komplexer Akt, der aus mehreren Teilen besteht. Lehmann (2015) unterscheidet im Rahmen des Referenzaktes zwei Operationen: die Verankerung und die Individuation. Bei der Verankerung wird der Referent in mentalen Räumen, die im Bewusstsein der Gesprächspartnern geschaffen werden, und in der Sprechsituation, verankert. Ein Referent wird von Lehmann (2015) als Schnittmenge des Bewusstseins der Gesprächspartner aufgefasst. Das Schaffen eines Referenten, der in der vorliegenden Arbeit als mentales Objekt verstanden wird (siehe Kap. 4.1.1), veranlasst das Entstehen seiner Vorstellung im Bewusstsein der Gesprächspartner. Um eine Vorstellung des Referenten beim Hörer zu erwecken, muss sich der Sprecher auf etwas beziehen, was er mit dem Hörer schon gemeinsam hat, nämlich den Anker des Referenten (vgl. Lehmann, 2015). Die Verankerung von Referenten kann nach Lehmann (2015) im Rahmen von drei mentalen Räume und durch die Sprechsituation erfolgen. Abbildung 4–1 veranschaulicht Lehmanns Auffassung der Verankerung von Referenten. Enzyklopädisches Wissen

gemeinsame Erfahrung

R

Redeuniversum

R

Sprechsituation

Zeit

jetzt

Abb. 4–1: Verankerung von Referenten (nach Lehmann, 2015, vereinfacht von AS)

In der Abbildung 4–1 steht der schwarze Buchstabe R für den Referenten, der als Teil des Redeuniversums von Lehmann aufgefasst wird. Die Pfeile zeigen die Möglichkeiten der Verankerung des Referenten auf. Ein Referent kann mental oder physikalisch verankert sein. Die physikalische Verankerung erfolgt in der Sprechsituation vor allem durch die Deixis. Bei der mentalen Verankerung

Theorie der Referenz

95

kommen drei mentale Räume in Betracht: das enzyklopädische Wissen, die gemeinsame Erfahrung der Gesprächspartner und das Redeuniversum. Die drei mentalen Räume können überlappen, was in der Abbildung zu sehen ist. Die vier Anker der referentiellen Ausdrücke schließen einander nicht aus, weil ein Referent in mehr als einem der mentalen Räume, sowie in der Sprechsituation, verankert sein kann (vgl. Lehmann, 2015). Als Sprechsituation wird allgemein eine Situation verstanden, in der der Sprechakt abläuft. Lehmann (2015) unterstreicht, dass sie ein Teil der physikalischen Welt sei und daher eine komplexe raumzeitliche Entität zweiter Ordnung im Sinne von Lyons’ (1977) Ontologie des naiven Realismus ist. Sie besteht aus dem dreidimensionalen Raum, der zeitlichen Ausdehnung und umfasst eine Menge physikalischer Objekte, sowie den Sprecher, den Hörer und die Nachricht. Die Verankerung eines Referenten in der Sprechsituation, oder genauer in einer Komponente der Sprechsituation, erfolgt durch die Deixis. Lehmann (2015) unterstreicht, dass wenn der Referent in der Sprechsituation präsent ist, und den Gesprächspartnern das bewusst ist, muss die Referenz nicht einmal explizite sprachliche Mittel verwenden, was im Beispiel 4–6 zu sehen ist: 4–6

Stellen Sie es auf den Schreibtisch!

Im Beispiel 4–6 weist der Sprecher mit dem definiten Artikel darauf hin, dass er annimmt, dass der Hörer weiß, welchen Schreibtisch er meint. Da der Tisch ein physikalisches Objekt ist, das eine Komponente der Sprechsituation ist, braucht der Sprecher kein zusätzliches sprachliches Mittel zu benutzen. Wenn der Referent in der Sprechsituation präsent ist, kann häufig auch ein Nullargument verwendet werden, zum Beispiel: 4–7

Schmeckt gut.

Im Beispiel 4–7 benutzt der Sprecher ein referentielles Nullargument, und zwar ein Nullsubjekt. Wenn die Gesprächspartner sich in einem Café befinden und Kaffee trinken, ist die Referenz des Nullsubjekts im Beispiel 4–7 eindeutig, obwohl das Wort Kaffee nicht vom Sprecher benutzt wird. Das Referieren auf gegebene Komponenten der Sprechsituation kann von entsprechenden Gesten begleitet sein. Die Verankerung von Referenten kann auch mental und nicht physikalisch erfolgen. Als erster mentaler Raum, der dazu dienen kann, wird von Lehmann (2015) das enzyklopädische Wissen aufgelistet. Als enzyklopädisches Wissen wird hier nach Lehmann jegliches den Mitgliedern einer Sprachgemeinschaft gemeinsame, und in ihrem Lexikon gespeicherte, Wissen verstanden. Die im enzyklopädischen Wissen verankerte Referenz wird von Lehmann (2015) deskriptive Referenz genannt, ein Beispiel davon ist in 4–8 zu sehen:

96

Referenz, Artikel und Nullargumente im Deutschen

4–8

Führen Sie englische Rosen?

Im Beispiel 4–8 muss der Hörer auf sein enzyklopädisches Wissen zurückgreifen, um sich eine Vorstellung vom Gemeinten zu bilden. Der zweite mentale Raum, der zur Verankerung von Referenten dienen kann, ist die gemeinsame Erfahrung der Gesprächspartner. Es ist ein Wissen, das sie gemeinsam haben, weil sie bestimmte Erfahrungen gemeinsam gemacht haben. Die gemeinsamen Erfahrungen können zur Entstehung eines Wissens führen, das nicht notwendigerweise das enzyklopädische Wissen der ganzen Sprachgemeinschaft darstellt. Die gemeinsame Erfahrung der Gesprächspartner ist Teil ihrer Biographie, woran sie sich erinnern können. Die Referenz auf Komponenten der gemeinsamen Erfahrung der Gesprächspartner wird anamnestische Referenz genannt (Himmelmann, 1997; Lehmann, 2015). Der Sprecher ruft in diesem Fall die gemeinte Entität aus dem Gedächtnis ab, und meistens insinuiert er sie dem Hörer, so dass er sich auch daran erinnern kann, wie es in Beispiel 4–9 zu sehen ist: 4–9

Können wir den Film sehen, den wir gestern nicht zu Ende geschafft haben?

Der dritte mentale Raum, der zur Verankerung von Referenten nach Lehmann (2015) dienen kann, ist das Redeuniversum. Unter dem Redeuniversum wird eine intensionale Welt verstanden, die die Gesprächspartner in einer bestimmten Sprechsituation schaffen und entwickeln. Es ist ein komplexes mentales Objekt, das als Schnittmenge des Bewusstseins der Gesprächspartner zu sehen ist. Es hängt von der Sprechsituation ab und ist mit ihr synchron. Von Lyons (1977: 670) wird der mentale Raum als Diskursuniversum bezeichnet, das vom Text geschaffen wird74. Der Bezug auf einen Referenten, der schon im Redeuniversum präsent ist, wird als Endophora bezeichnet. In Abbildung 4–1 wird er durch einen Pfeil zum grauen R angedeutet, der das Vorbestehen des Referenten im Redeuniversum bezeichnet. Die Identifizierung des Referenten erfolgt durch einen Ausdruck, der mit einem anderen Ausdruck im Text koreferentiell ist. Die Relation eines Ausdrucks zum koreferentiellen Ausdruck kann in Form einer Anapher oder Katapher erfolgen, wobei als Anapher bekanntlich der Rückwärtsbezug und als Katapher der Vorwärtsbezug bezeichnet wird. Die Referenz kann auch in der Form einer indirekten Anapher erfolgen75.

74 Lyons (1977: 670) fasst es folgendermassen auf: »the universe of discourse … is created by the text and has a temporal structure imposed upon it by the text«. 75 Das Phänomen der indirekten Anapher wird heutzutage von mehreren Forschern aus synchroner oder diachroner Perspektive untersucht (z. B. Fraurud, 1990; Schwarz-Friesel, 2007; Skrzypek, 2020).

Theorie der Referenz

97

Der Bezug auf einen Referenten, der im Redeuniversum schon etabliert ist, involviert den Zugriff auf ihn. Der Zugriff kann leichter oder schwieriger sein, weil sich die im Redeuniversum vorhandenen Referenten in ihrer Präsenz im Bewusstsein der Gesprächspartner unterscheiden. Einige Referenten können mehr und andere weniger zugänglich sein. Viele Faktoren tragen zur Zugänglichkeit eines Referenten bei. Der Hauptfaktor ist die Entfernung von der letzten Erwähnung und die Häufigkeit der Erwähnung des gegebenen Referenten. Auch die strukturelle Position und grammatische Funktion des Antezedenten im vorangehenden Diskurs sind für die Zugänglichkeit des Referenten relevant. Die Diskursprominenz des Referenten, d. h. die Tatsache, ob sich der Referent im Fokus der Aufmerksamkeit der Gesprächspartner oder eben nicht befindet, und die Präsenz von potentiellen Konkurrenten im vorangehenden Diskurs spielen auch eine wichtige Rolle. Die Zugänglichkeit des Referenten wird auch durch Faktoren determiniert, die mit Komponenten anderer mentaler Räume in Lehmanns (2015) Auffassung zusammenhängen. So trägt der Grad, in dem der gegebene Referent für eine gegebene Gruppe identifizierbar ist, zur Zugänglichkeit des Referenten bei, obwohl die Identifizierbarkeit des Referenten oft von der gemeinsamen Erfahrung der Gruppe abhängig ist. Auch das Vorhandensein des Referenten in einer physikalischen Sprechsituation steigert die Zugänglichkeit des Referenten im Redeuniversum (Ariel, 1990; Arnold & Griffin, 2007; Fukumura et al., 2010; Fukumura & van Gompel, 2011; Gundel et al., 1993). Empirische Studien zeigen, dass unter den vielen erwähnten Faktoren als die wichtigsten jener der Entfernung von der letzten Erwähnung und der der Zahl der potentiellen Konkurrenten gehalten werden sollen. Darauf folgen die syntaktische Position und die grammatische Funktion des Antezedens im vorangehenden Diskurs (siehe Torregrossa et al., 2019). In Abhängigkeit von den oben aufgelisteten Faktoren unterscheiden sich Referenten in ihrer Zugänglichkeit. In der Literatur werden mehrere Vorschläge für eine Hierarchie der Zugänglichkeit von Referenten vorgeschlagen, die auf die sog. Giveness-Hierarchie von Gundel et al. (1993) aufbauen. In der Hierarchie von Gundel et al. (1993) werden die Möglichkeiten des kognitiven Status eines Referenten geordnet, der die Wahl der entsprechenden Form der referentiellen Ausdrücke determiniert (vgl. auch Givón (Hrsg.), 1983; Lambrecht, 1994). Lehmann (2015) setzt folgende Skala von Diskursstatus und Zugänglichkeit von Referenten zusammen, die in Abbildung 4–2 wiedergegeben wird. Die Skala in Abb. 4–2 gibt den Diskursstatus von Referenten wieder, der von Lambrecht (1994: 165) als zunehmende Akzeptabilität von Referenten für die Rolle als Topik aufgefasst wird. Wenn ein Referent im Redeuniversum nicht aufgetreten ist, dann ist er bezugslos nagelneu. Wenn ein Referent bezogen nagelneu ist, heißt es, dass er zwar nicht im Redeuniversum direkt aufgetreten ist, aber er hat eine Kontiguitätsrelation zu einem anderen Referenten, der gerade

98

Referenz, Artikel und Nullargumente im Deutschen

Diskursstatus

Zugänglichkeit

bezugslos nagelneu

unzugänglich

bezogen nagelneu unbenutzt parat aktiv

zugänglich

Abb. 4–2: Diskursstatus und Zugänglichkeit von Referenten (nach Lehmann, 2015)

aktiv ist76. Der Status des Referenten wird als unbenutzt bezeichnet, wenn er im Redeuniversum aufgetreten ist, aber für einige Zeit nicht aktiv gewesen ist. Die Zugänglichkeit steigt beim paraten Diskursstatus, in dem der Referent eben noch aktiv war. Er ist im Vergleich zu den aktiven Referenten jedoch im Hintergrund. Der aktive Referent ist dafür im Fokus der Aufmerksamkeit der Gesprächspartner, d. h. er ist das, worauf sich die Gesprächspartner im Moment der Äußerung konzentrieren (vgl. Lehmann, 2015). Der Diskursstatus eines Referenten wird mit lexikalischen und grammatischen Mitteln markiert. Je zugänglicher ein Referent ist, desto weniger informativ kann der referentielle Ausdruck sein, der sich auf ihn bezieht. Ariel (1991) fasst Informativität als semantischen Inhalt referentieller Ausdrücke auf. So können beispielsweise Nullargumente nur für die Bezeichnung von Referenten gebraucht werden, die in hohem Grade zugänglich, also aktiv sind. Phonetisch realisierte Pronomen sind informativer als Nullargumente, daher können sie auch für Referenten benutzt werden, die weniger zugänglich sind. Ariel (1991) gibt auch zwei weitere Merkmale referentieller Ausdrücke an, die mit der Zugänglichkeit ihrer Referenten einhergehen. Es sind die Rigidität (rigidity), d. h. die Einzigartigkeit oder potentielle Ambiguität der referentiellen Ausdrücke, und die Abschwächung (attenuation), d. h. die Aussprache der referentiellen Ausdrücke. So sind Pronomen der 1. und 2. Person rigider/weniger ambig als das Pronomen der 3. Person, weil der Sprecher und der Hörer durch die Sprechsituation determiniert sind. Volle betonte Pronomen unterscheiden sich von Klitika, die mehr abgeschwächt sind. Die hochinformativen, rigiden, betonten und längeren Formen referentieller Ausdrücke werden für Referenten gebraucht, die im gegebenen Moment des Gesprächs weniger zugänglich sind (vgl. Ariel, 1991). Lehmann (2015) spricht in diesem Zusammenhang von der Explizitheit referentieller Ausdrücke. Je expliziter der Ausdruck sei, desto weniger zugänglich sei ihr Referent. Außer der Explizitheit gebrauchen viele Sprachen Determinantien, um den Diskursstatus referentieller Ausdrücke zu markieren. Ein indefiniter Determinativ wird in NPn benutzt, die sich auf weniger zugängliche Referenten 76 Die Referenz erfolgt in diesem Fall in Form einer indirekten Anapher.

Theorie der Referenz

99

beziehen, während ein definiter Determinativ den zugänglicheren Diskursstatus des Referenten markiert. In Abbildung 4–3 wird die Hierarchie der referentiellen Ausdrücke von Ariel (1988, 1990) und Lehmann (2015) in einer vereinfachten und abgekürzten Form wiedergegeben. Niedrige Zugänglichkeit Nominalphrase mit Modifizierer Nominalphrase Eigenname Demonstrativpronomen Betontes Pronomen Unbetontes Pronomen Nullargument Hohe Zugänglichkeit Abb. 4–3: Hierarchie der referentiellen Ausdrücke (nach Ariel, 1988, 1990 und Lehmann, 2015 vereinfacht und abgekürzt von AS)

Die Theorie der Verankerung zusammenfassend, soll unterstrichen werden, dass jeder Referent irgendwo verankert sein muss. Darüber hinaus unterscheiden sich Referenten in ihrer Zugänglichkeit, was die Wahl von referentiellen Ausdrücken determiniert. Referentielle Ausdrücke liefern mehr oder weniger lexikalische Informationen, die zur Festlegung der Identität des Referenten beitragen, und werden dadurch als »voll« oder »reduziert« bezeichnet (vgl. Hickman et al., 2015). An einem Ende des Kontinuums stehen Nominalphrasen mit unbestimmtem Artikel, die ganz neue Referenten in den Diskurs einführen, und die daher dem Hörer viele lexikalische Informationen liefern. Am anderen Ende des Kontinuums stehen reduzierte Formen wie Pronomen oder Nullargumente, die nur hochzugängliche Entitäten bezeichnen können, deren Existenz und Identität durch den Kontext bestimmt werden können. Solche reduzierten Formen liefern keine oder wenige lexikalische Informationen. Im Deutschen werden Genus, Numerus und Kasus vom Pronomen markiert. Nominalphrasen mit bestimmtem Artikel stehen in der Mitte des Kontinuums. Sie werden als volle Formen bezeichnet (vgl. Hickman et al., 2015), weil sie viele lexikalische Informationen liefern, die dazu dienen können, die Identität des Referenten eindeutig zu machen. Beim Gebrauch definiter Nominalphrasen wird die Existenz des Referenten jedoch vorausgesetzt.

100

Referenz, Artikel und Nullargumente im Deutschen

Jeder Referent muss auch zu einem gewissen Grade individuiert sein, was nach Lehmann (2015) im Rahmen der zweiten fundamentalen Referenzoperation, nämlich der Individuation, erfolgt. Die Individuation ist eine sprachliche Operation, die von einer Einheit des Sprachsystems zu einer Einheit des Diskurses führt. Sie ist sozusagen die Aktualisierung einer virtuellen Einheit (siehe Lehmann, 2015). Die mentale Repräsentation einer Entität kann mehr oder weniger konkret sein. Bei der generischen Referenz wird auf die von einem gegebenen Begriff umfasste Menge der Spezies Bezug genommen, und es wird keine Teilmenge der Menge von Elementen gebildet. Referentielle Ausdrücke können sich auf echte Teilmengen der Extension der involvierten Begriffe beziehen, ohne dass einzelne Individuen, die gemeint sind, identifiziert werden. Ihre Identität ist den Gesprächspartnern eher gleichgültig und sie ist zudem austauschbar. Lehmann (2015) benutzt in diesem Zusammenhang den Terminus der unspezifischen Referenz, z. B.: 4–10

Ich züchte englische Rosen.

Der nächste Schritt der Individuation bei Lehmann ist die spezifische Referenz. Hierbei wird nicht nur eine echte Teilmenge der Extension eines Begriffs gebildet, sondern es wird auch die Identität des gegebenen Referenten festgelegt. Im Beispiel 4–11 sind Rosen gemeint, deren Identität identifizierbar ist: 4–11

Dieses Jahr sind zwei englische Rosen in meinem Garten eingegangen.

Der letzte Schritt der Individuation bei Lehmann ist die unikale Referenz, bei der nur ein einziges Individuum als Referent in Frage kommt, unikale Referenz haben etwa Eigennamen. Auch die deskriptive Referenz kann unikal sein, wenn aus logischen Gründen nur ein einziges Individuum als Referent möglich ist, zum Beispiel der König oder die Sonne. Die Individuation wird also nach Lehmann (2015) als Bildung von Mengen und Teilmengen beschrieben. Die Opposition spezifisch vs. unspezifisch wird in diesem Ansatz als Unterschied im Individuationsgrad des Referenten verstanden, wobei der Referent als Schnittmenge des Bewusstseins der Gesprächspartner aufgefasst wird. Die Auffassung der Opposition spezifisch vs. unspezifisch unterscheidet sich gravierend von der Definition der Opposition bei Ionin et al. (2004), nach der die Spezifizität/Unspezifizität den Stand des Bewusstseins nur des Sprechers zum Ausdruck bringt (siehe Kap. 4.1.3). Wie in Kap 4.1.3 erklärt, wird in der vorliegenden Arbeit die Auffassung der Spezifizität nach Ionin et al. (2004) als Grundlage für die empirischen Untersuchungen angenommen.

Theorie der syntaktischen Etappe der Referenz

4.3

101

Theorie der syntaktischen Etappe der Referenz

Die in Kap. 4.2 beschriebene Referenztheorie erklärt die Wahl der referentiellen Ausdrücke. Der Grad der Aktivierung eines Referenten im Gehirn der Gesprächspartner determiniert die Form des referentiellen Ausdrucks, der vom Sprecher gewählt wird. Mehrere Forscher argumentieren jedoch dafür, dass pragmatische Merkmale auch in der Syntax ihren Platz haben (Sigurðsson, 2004; Speas, 2004; Haegeman & Hill, 2013) 77. Der Gebrach von referentiellen Ausdrücken ist ein Paradebeispiel für das Zusammenspiel von pragmatischen und diskursbedingten Faktoren mit den syntaktischen Bedingungen, die die Wahl des entsprechenden referentiellen Ausdrucks mit determinieren. Sigurðsson (2011), basierend auf Frascarelli (2007), schlägt vor, dass mehrere mit Topik verbundene Merkmale, wie aboutness-shift topics, contrastive topics und familiar topics in der erweiterten C-Domäne generiert werden, die als Schnittstelle an Syntax/Diskurs/Pragmatik fungiere.78. Sigurðsson schlägt auch vor, dass die C-Domäne Merkmale des Sprechers (agent – ΛA) und des Hörers (patient – ΛP) enthält, die stumm, aber syntaktisch aktiv, sind. Die Merkmale des Sprechers, des Hörers und des Topiks (Top) werden als C/edge-Binder (C/edge linkers) bezeichnet. Die C-Domäne eines beliebigen Satzes enthält eine Menge von C/edge-Bindern, die gewertet werden. Die Wertung der C/edge-Binder sieht beispielsweise wie in 4–12 (nach Sigurðsson, 2011) aus: 4–12

Ichl mag dichm [CP…{ΛA}l …{ΛP}m …[TP… Ichl … dichm …

Das Pronomen ich bezieht sich im prototypischen Satz in Beispiel 4–12 auf das Merkmal des Sprechers (ΛA) und das Pronomen dich auf das Merkmal des Hörers (ΛP). Das muss aber nicht in jedem Satz der Fall sein. Die C/edge-Binder werden in Bezug auf den vorhergehenden sprachlichen Kontext gewertet, was Sätze in der direkten Rede veranschaulichen (siehe Beispiel 4–13, nach Sigurðsson, 2011): 4–13

Tyroni sagte zu Antonj: »Ichi mag dichj«. [CP…{ΛA}l …{ΛP}m …[TP…Tyroni…Antonj… [CP…{ΛA}i …{ΛP}j … [TP…Ichi…dichj …

77 Siehe auch Z˙ebrowska (2017) zu einem Vorschlag der Pragmatisierung der Syntax. 78 C-Domäne, die sog. CP, ist eine Struktureinheit in der generativen Linguistik, die eine durch Merge entstandene Einheit auf Satzebene ist. Die ursprünglich »atomare« C-Domäne wurde im Rahmen des sog. kartographischen Ansatzes in verschiedene funktionale Projektionen gesplittet (Rizzi, 1997; Cinque, 2002; Belletti, 2004).

102

Referenz, Artikel und Nullargumente im Deutschen

Im Beispiel 4–13 beziehen sich die Personalpronomen ich und dich vom Satz in der direkten Rede auf die Merkmale des Sprechers und des Hörers …{ΛA}i … {ΛP}j, sie werden aber nicht unabhängig gewertet, sondern sie erben ihre Referenz von den Argumenten im vorangehenden Satz. Das Subjekt des Satzes in der direkten Rede entspricht also nicht dem Sprecher, dem Merkmal Agens des Hauptsatzes. Das Objekt des Satzes in der direkten Rede entspricht auch nicht dem Hörer, also dem Merkmal Patiens des Hauptsatzes. Das steht im Gegensatz zum Beispiel 4–12, in dem das Subjekt und das Objekt den Merkmalen des Sprechers und des Hörers des Satzes entsprechen. In einer gegebenen Sprechsituation mit dem entsprechenden Stand des Redeuniversums sowie der gemeinsamen Erfahrung und dem Wissen der Gesprächspartner können die Argumente einer Äußerung normalerweise auf mehrere Entitäten referieren, aber ihre ϕ-Merkmale müssen innerhalb des Satzes verarbeitet werden, und sie müssen den C/edge-Bindern entsprechen, um interpretiert werden zu können. Der Wechsel der Deixis-Interpretation in der direkten Rede veranschaulicht, dass die Bindung an Kontext nicht nur ein pragmatisches sondern auch ein syntaktisches Phänomen ist79. Die Merkmale des Sprechers und des Hörers im Satz in der direkten Rede deuten die Referenz des Subjekts und Objekts des Satzes um. Andere Beweise für die C/edge-Binder kommen aus Bereichen wie Person- und Tempusmarkierung oder Genuskongruenz über Satz- und Phrasengrenzen. Die Untersuchung der Phänomene in diesen Bereichen zeigt, dass die Referenz der nominalen Ausdrücke weitgehend auch syntaktischer Natur ist (vgl. Sigurðsson, 2011, 2014). Um die pragmatischen und syntaktischen Aspekte der Referenz auseinander zu halten, schlägt Sigurðsson (2011) vor, die Referenz in zwei Etappen einzuteilen: Referenzfestlegung durch freie Kontextdurchsuchung und C/edge-Bindung. Unter freier Kontextdurchsuchung wird in der vorliegenden Arbeit die Verankerung des Referenten in der Sprechsituation und in mentalen Räumen verstanden, die im Bewusstsein der Gesprächspartner geschaffen werden, sowie die Individuation von Referenten, wie in Kap. 4.2 dargestellt. Die zweite – syntaktische – Etappe wird als Herstellung der C/edge-Bindung nach Sigurðsson (2011, 2014) aufgefasst. Sigurðsson behauptet, dass alle definiten Argumente, sowohl die, die phonetisch realisiert werden, als auch die Nullargumente, an einen sog. C/edge-Binder gebunden sein müssen, um interpretiert zu werden. Definite Argumente der 1., 2. oder 3. Person beziehen sich auf die Merkmale des Sprechers, des Hörers oder des Topiks in der C-Domäne, und werden dadurch als [+ΛA,…], [+ΛP,…], [Top,…] gewertet. Indefinite Argumente brauchen sich nicht 79 Siehe auch Berdychowska (2002) zur Typologie und Interpretation der Personaldeixis im Deutschen und im Polnischen. Darüber hinaus zeigt Berdychowska (2013) auf, wie die deiktische Bezugnahme auf Person in der Translation gehandhabt wird.

Theorie der syntaktischen Etappe der Referenz

103

auf die C/edge-Binder zu beziehen. Wenn eine Entität noch nicht in das Redeuniversum eingeführt worden ist, und diese im Kopf der Gesprächspartner nicht aktiviert ist, wird die Referenz des Arguments durch die freie Kontextdurchsuchung festgelegt, ohne dass das Argument sich auf einen C/edge-Binder bezieht. In der vorliegenden Arbeit wird davon ausgegangen, dass die C/edge-Bindung von Sigurðsson (2011, 2014) die syntaktische Etappe der Verankerung definiter Argumente ist. Die Verankerung definiter Argumente in einer Sprechsituation oder im Sprachkontext erfolgt via C-Domäne. Bei den anaphorisch definiten NPn (Dryer, 2014), Pronomen oder Nullargumenten ist es die syntaktische Etappe der Operation, die von Lehmann (2015) als Bezug auf einen Referenten, der im Redeuniversum schon etabliert ist, also als Endophora, aufgefasst wird. In Abbildung 4–1 wird die Art der Verankerung als Pfeil zwischen dem grauen (dem vorher etablierten Referenten) und dem schwarzen R (dem aktuellen Referenten) symbolisiert. Bei den nicht-anaphorischen definiten NPn (Dryer, 2014) ist die C/ edge-Bindung die syntaktische Etappe der Referenzbestimmung neben der Verankerung in den anderen mentalen Räumen, wie dem enzyklopädischen Wissen oder der gemeinsamen Erfahrung der Gesprächspartner. Auch bei der Verankerung referentieller Ausdrücke in der Sprechsituation wird eine syntaktische Etappe der Operation in Form einer C/edge-Bindung angenommen. Wie schon erwähnt brauchen die indefiniten Ausdrücke nicht an die C/edge-Binder gebunden zu sein. Das Zusammenspiel der C/edge-Bindung mit der Kontextdurchsuchung bei der Referenzherstellung der definiten NPn wird in Abbildung 4–4 gezeigt.

Kontextdurchsuchung

[CP... {ΛA} … {ΛP} … Top …… definiter Ausdruck (z.B. definite NP/Null)… C/edge-Bindung Abb. 4–4: Zusammenspiel der C/edge-Bindung mit der Kontextdurchsuchung bei der Referenzherstellung der definiten NPn

Die C/edge-Bindung ist bei allen definiten Argumenten notwendig, unabhängig davon, ob es sich um phonetisch realisierte Ausdrücke oder Nullargumente handelt. Zusammenfassend soll hier das Fazit gezogen werden, dass die Bezugnahme auf Referenten bei referentiellen Ausdrücken aus zwei Etappen besteht. Eine Etappe wird hier als syntaktische Einbettung in den Diskurs, in Form der C/edge-

104

Referenz, Artikel und Nullargumente im Deutschen

Bindung, aufgefasst. Die andere Etappe wird als Verankerung und Individuation von Referenten verstanden. Im weiteren Teil der vorliegenden Arbeit werden zwei Typen referentieller Ausdrücke im Deutschen, die eine zentrale Rolle in der empirischen Untersuchung der Arbeit spielen, dargestellt: Nominalphrasen mit bestimmten und unbestimmten Artikeln sowie Nullargumente. Auf andere referentielle Ausdrücke kann im Rahmen der Arbeit aus Platzgründen nicht weiter eingegangen werden.

4.4

Artikel im Deutschen

Der bestimmte und unbestimmte Artikel werden als prototypische Determinative im Deutschen aufgefasst. Im Deutschen überführen die Determinative ein Nomen, d. h. eine lexikalische Kategorie, in eine Nominalphrase, eine syntaktische Kategorie, und verleihen ihr einen Wirklichkeitsbezug80. Das Nomen hat die Aufgabe, etwas zu benennen, einer Größe einen Namen zu geben. Erst die Nominalphrase ordnet aber diese Größe in die Realität ein (siehe Engel, 1988: 603). Der Artikel markiert auch im Deutschen das Genus, den Kasus und den Numerus des Substantivs, das den Kern der Nominalphrase bildet81. Er kommt selten mit anderen Determinativen zusammen vor. Beim autonomen Gebrauch von der und einer werden sie als Demonstrativpronomen und Indefinitpronomen mit je eigener Flexion aufgefasst (vgl. Engel, 1988: 526)82. Außer dem bestimmten Artikel und dem unbestimmten Artikels fungiert als Determinativ im Deutschen auch der von vielen Forschern postulierte Nullartikel83. Darüber hinaus werden im Inventar der Determinative des Deutschen einige Gruppen von Pronomina aufgelistet: Demonstrativ-, Possessiv-, Interrogativ- und Indefinitpronomen (vgl. Engel, 1988, 2004; IDS Grammatik, 1997; Eroms, 2000; Helbig & Buscha, 2001)84. Die Hauptfunktion der Determinative liegt im Deutschen darin, die Größen »als Ausschnitt aus der Wirklichkeit auszuweisen« (Engel, 1988: 523). Darüber hinaus bringen Determinative eigene Bedeutungen in die Nominalphrasen ein. Sie modifizieren jedoch nicht die Be80 So kann auch nach Eisenberg (2006: 144) nicht mit einem Nomen referiert werden, erst mit einer Nominalphrase könne Referentialität hergestellt werden. 81 Im Laufe der Zeit ist es zu einem Kasussynkretismus gekommen, wobei Substantiv und Artikel Flexionsmerkmale zeigen können. 82 Siehe u. a. Gunkel (2006) zum betonten Gebrauch von der. 83 Der Begriff »Nullartikel« tritt beispielsweise bei Helbig und Buscha (2001: 338ff.) und Engel (2004: 313) auf. Eisenberg (2006: 143f, 154) spricht dafür von der Artikellosigkeit. Siehe auch Bisle-Müller (2011) für eine kritische Betrachtung des Begriffs »Nullartikel«. 84 Bei Eisenberg (2006) zählen zu den Determinativen die Artikel, das possessive Determinativ und das negierende Determinativ kein. Das Demonstrativpronomen wird nicht als Determinativ sondern als Determinativpronomen aufgefasst.

Artikel im Deutschen

105

deutung des Nomens, sondern stiften einen Bezug. Sie setzen die Größen, die vom gegebenen Nomen genannt werden, in Beziehung zu anderen Größen und zu Gesprächspartnern (siehe Engel, 1988: 523)85. Bei Kempcke et al. (1984) umfasst das Nomen alle nominalen Wortarten, d. h. auch Adjektive, Numerale und Pronomen. Engel versteht dagegen unter Nomina nur Substantive (vgl. Engel, 1988, 2004), und so wird dieser Terminus auch im Rahmen dieser Arbeit verstanden. Jede Nominalphrase enthält im Deutschen als Minimalbestand ein Nomen als Kern und ein Determinativ als dessen Satelliten86. Sie kann durch Adjektive, durch präpositionale und andere Attribute erweitert werden (vgl. Engel, 1988: 603)87. Eine NP gilt in der vorliegenden Arbeit nach Löbner (2015) als definit, wenn sie zur eindeutigen Referenz benutzt wird. Folgende Ausdrücke sind im Deutschen definit (vgl. Löbner, 2015): – NPn mit bestimmtem Artikel (die Rose) – NPn mit Demonstrativum (diese Rose) – NPn mit Possessivpronomen (meine Rose) – NPn mit vorangestelltem Genitiv (Olgas Rose) – Personalpronomen (sie) – Pronominale Demonstrative (dies) – Eigennamen (Rosamunde) Eine NP wird in der vorliegenden Arbeit nach Löbner (2015) als indefinit angesehen, wenn sie für eine (potenziell) nicht eindeutige Referenz verwendet wird. Die Indefinitheit kann in einer Sprache explizit markiert werden oder unmarkiert bleiben. Beide Möglichkeiten sind im Deutschen vorhanden. Die explizite Markierung der Indefinitheit erfolgt im Deutschen vor allem durch den unbestimmten Artikel. Mit der explizit nicht markierten Indefinitheit haben wir es im Deutschen bei den Massennomen und Plural-NPn88 zu tun (siehe Löbner, 2015). Folgende Ausdrücke sind im Deutschen indefinit (vgl. Löbner, 2015): – Einfache indefinite NPn: – zählbare Nomen im Singular mit unbestimmtem Artikel (eine Rose) 85 Eine ausführliche Darstellung der Form und Funktion von Determinativen bietet Hoffmann (2009). 86 In der IDS-Grammatik (1997: 1927ff.) ist von minimalen Nominalphrasen die Rede. Dies sind entweder Einwort-Nominalphrasen, z. B. Eigennamen, oder Nominalphrasen mit Determinativ. 87 Die Auffassung des Substantivs als Kern und des Artikels als »Begleiter des Substantivs« (Duden, 1984: 314) wird von vielen Forschern geteilt (Grundzüge, 1984: 541; ähnlich Engel, 2004: 312; Weinrich, 2007: 406ff.). Alternativ wird die These der sog. Gruppenflexion vertreten (Ágel, 1996: 22f.; Eisenberg, 2006). 88 Wie oben erwähnt wird von vielen Forschern in diesem Zusammenhang ein Nullartikel angenommen.

106 – bloße Plurale – bloße Massennomen – NPn mit Quantitätsangaben – Indefinite Pronomen

Referenz, Artikel und Nullargumente im Deutschen

(Rosen) (Obst) (viele/drei Rosen; 20 g Salz/etwas Salz) ( jemand, etwas, niemand u. a.)

Die für die vorliegende Arbeit besonders relevanten Determinative sind Artikel. Wie in vielen anderen Sprachen entwickelte sich der unbestimmte Artikel im Deutschen aus dem Zahlwort »eins« (vgl. Bittner, 2006: 356ff.). Der Herausbildung des unbestimmten Artikels ging die des bestimmten Artikels aus dem Demonstrativpronomen voran (Sommerfeldt & Starke, 1992: 112)89. Der Gebrauch der Artikel im Deutschen wird nach unterschiedlichen Gesichtspunkten beschrieben. Nach der Artikeltheorie von Weinreich (1969) sind Artikelwörter ein Mittel zur Kommunikationssteuerung. Der unbestimmte Artikel signalisiert nach Weinreich, dass der Hörer seine Aufmerksamkeit auf die Nachinformation lenken soll. Der bestimmte Artikel bedeutet hingegen, dass der Hörer seine Aufmerksamkeit auf die Vorinformation zu lenken hat, wobei als Vorinformation auch der semantische Rahmen verstanden werden kann. Nach Eisenberg (2006: 154) besteht die semantische Leistung von Artikeln und Pronomina darin, dass sie die Bedeutung definit oder nicht-definit markieren. Die Unterscheidung gilt nach ihm auch für Nominale im Plural. Eisenberg (2006: 155) weist darauf hin, dass der Unterschied definit/nicht-definit auch in generischen Sätzen erhalten bleibe90. Nach Hawkins (1978) und Himmelmann (1997: 36f.) können die Gebrauchskontexte des bestimmten Artikels in vier Gruppen eingeteilt werden: unmittelbar-situativer Gebrauch, anaphorischer Gebrauch, abstrakt situativer Gebrauch (der König, die Sonne) und assoziativ-anaphorischer Gebrauch. Wenn man die Einteilung im Lichte der Theorie der Verankerung von Referenten nach Lehmann (2015) betrachtet91, dann kann man feststellen, dass sich die erste Gruppe der Gebrauchskontexte auf die Sprechsituation bezieht, der anaphorische Gebrauch des bestimmten Artikels mit dem Redeuniversum zusammenhängt, der abstrakt situative Gebrauch auf das gemeinsame Wissen der Gesprächspartner eingeht und der assoziativ-anaphorischer Gebrauch sich weitgehend mit der indirekten Anapher deckt, die im Redeuniversum verankert ist. Nach Eisenbergs Auffassung (2006) liegt der spezifizierende, d. h. spezifische vs. unspezifische Gebrauch von bestimmtem und unbestimmtem Artikel, quer 89 Im Gesprochenen scheint sich heutzutage als dritter Artikel son herauszubilden, entstanden aus so ein (Hole & Klump, 2000; Eisenberg, 2006: 151). 90 In Sätzen mit bestimmtem Artikel wird direkt auf die ganze Gattung Bezug genommen, und in Sätzen mit Nullartikel wird die Gattung über »beliebige Teilmengen« erfasst (siehe Eisenberg, 2006). 91 Siehe Kap. 4.2.

Artikel im Deutschen

107

zur Unterscheidung von definiten und nicht-definiten Kennzeichnungen im Deutschen92. Eisenberg (2006: 155) führt folgende Beispiele an: 4–14

a. Ich habe das Feuerzeug (endlich) gefunden. b. Ich habe ein Feuerzeug gefunden. c. Karl hat ein Feuerzeug gefunden. d. Ich suche ein Feuerzeug. e. Das Feuerzeug, das Karl als nächstes findet, behält er.

In den Beispielsätzen 4–14a, b bezieht sich die NP das Feuerzeug/ein Feuerzeug auf ein bestimmtes Objekt, für das der Sprecher »eine kognitive Adresse hat« (Eisenberg, 2006: 155). In 4–14a haben sowohl der Sprecher als auch der Hörer diese »kognitive Adresse«, und in 4–14b hat sie nur der Sprecher. In beiden Sätzen haben wir es mit dem spezifischen Gebrauch des bestimmten und unbestimmten Artikels zu tun. Die Beispielsätze 4–14c, d haben jeweils zwei Lesarten. In der spezifischen Lesart wird der Artikel spezifisch gebraucht (Karl hat ein bestimmtes schwarzes Feuerzeug gefunden; Ich suche ein bestimmtes Feuerzeug, das Esther mir letztes Jahr geschenkt hat). In der unspezifischen Lesart weiß weder der Sprecher noch der Hörer etwas über das Feuerzeug. (Karl hat zufällig ein/irgendein Feuerzeug gefunden; Ich suche ein/irgendein Feuerzeug, um mir eine Zigarette anzuzünden). Das Beispiel 4–14e zeigt, dass auch mit dem bestimmten Artikel eine unspezifische Lesart möglich ist, da weder der Sprecher noch der Hörer »eine kognitive Adresse« des Objekts haben, das Karl in der Zukunft findet. Nach Eisenberg (2006) muss die Unterscheidung spezifisch vs. unspezifisch im Deutschen satzsemantisch rekonstruiert werden, weil sie nicht an der Form der NP hängt93. Im Bereich der Markierung der (In)Definitheit unterscheidet sich das Deutsche gravierend vom Polnischen, also jener Sprache, die für die vorliegende Arbeit auch relevant ist (vgl. Grucza, S., 1995)94. Polnisch ist eine artikellose Sprache, in der die Definitheit keine grammatische Kategorie ist. Im Polnischen können jedoch morphologisch-syntaktische, lexikalische und prosodische Mittel zum Ausdruck der (In)Definitheit verwendet werden. Zu diesen gehören u. a. Demonstrativa, Indefinita, Nullargumente, Thema-Rhema-Gliederung, Aspektopposition und Betonung (vgl. Klemesiewicz, 1962; Miodunka, 1974; Brooks, 1975; Topolin´ska, 1981; Gaca, 1989; Sadzin´ski, 1996; Mendoza, 2004; Plucin´ska, 92 Eisenberg (2006: 155f.) spricht von nicht-definiten Kennzeichnungen und nicht von indefiniten, weil einige Autoren nur solche Ausdrücke als indefinit benennen, die gleichzeitig nichtdefinit und nicht-spezifisch sind (Bierwisch, 1972: 74f.). 93 Siehe Kap. 4.1.3 zu alternativen Auffassungen der Spezifizität, in denen nur indefinite NPn unspezifisch sein können. 94 S. Grucza (1995) stellt eine konfrontative Untersuchung der Referenz von Nominalphrasen im Deutschen und Polnischen dar.

108

Referenz, Artikel und Nullargumente im Deutschen

2016; Czardybon, 2017)95. Die erhöhte Frequenz der Determinative im Polnischen wird in letzten Jahren in Hinsicht darauf untersucht, ob die Tendenz zur Entstehung der expliziten Definitheitsmarkierung im Polnischen führt (Piskorz, 2011; Plucin´ska, 2016)96. Die Frage danach, ob das häufigere Auftreten des Demonstrativums in der gesprochenen Variante des Polnischen als erstes Anzeichen der Grammatikalisierung aufgefasst werden kann, wird von Forschern nicht einheitlich beantwortet (vgl. Piskorz, 2011; Plucin´ska, 2016). Zusammenfassend soll als Fazit festgehalten werden, dass im Deutschen, im Gegensatz zum Polnischen, die (In)Definitheit explizit markiert wird. Die Markierung der Nominalphrasen als definit oder indefinit erfolgt im Deutschen durch den Gebrauch des Determinativs. Der bestimmte und unbestimmte Artikel können dabei als prototypische Determinative im Deutschen bezeichnet werden. Die Opposition Spezifizität vs. Nicht-Spezifizität hängt dafür im Deutschen mit der Form der Nominalphrasen nicht zusammen.

4.5

Nullargumente im Deutschen

In Nullsubjektsprachen, wie zum Beispiel im Polnischen und anderen westslavischen Sprachen, sowie in vielen romanischen Sprachen, müssen Subjekte phonetisch nicht realisiert werden. Im Deutschen aber kann das Subjekt im Mittelfeld eines Hauptsatzes (siehe Beispiel 4–15), in einem eingebetteten Satz (siehe Beispiel 4–16) oder im Fragesatz (siehe Beispiel 4–17), nicht ausgelassen werden: 4–15 4–16 4–17

Heute kommt *(er) nach Hause. Dzis´ przyjedzie _ do domu. Martin sagte, dass *(er) es nicht versteht. Martin powiedział, z˙e _ nie rozumie tego. Wohin ist *(er) gegangen? Doka˛d poszedł?

Deutsch Polnisch Deutsch Polnisch Deutsch Polnisch

Auf Grund dieser Eigenschaft wird das Deutsche den Nicht-Nullsubjektsprachen, oder genauer, den nicht Nicht-pro-drop-Sprachen zugeordnet. Die Zuordnung findet eine zusätzliche Begründung darin, dass im Deutschen ein Expletivum auftritt, das in vielen Kontexten obligatorisch ist. Siehe Beispiel 4–18:

95 In einer Einzelsprache, in der die (In)Definiheit explizit markiert wird, müssen nicht zwingend Determinative die einzigen Marker von Definitheit sein. Leiss (2000) beschreibt das Althochdeutsche, wo Artikel und Aspekt Allomorphe derselben grammatischen Kategorie »Definitheit« waren (Leiss, 2000: 194). 96 Siehe Kotin (2019a,b) zum Einfluss der Sprachkontakte auf den Sprachwandel.

Nullargumente im Deutschen

4–18

*(Es) regnet. _Pada.

109 Deutsch Polnisch

Der Kontrast zwischen den Nullsubjekt- und Nicht-Nullsubjektsprachen wird in der Generativen Linguistik auf die grammatische Eigenschaft der Identifizierung und der Lizensierung leerer Subjektpronomina zurückgeführt (Rizzi, 1986)97. Im gesprochenen Deutsch treten jedoch Nullsubjekte und Nullobjekte auf, deren Referenz durch den Sprachkontext bestimmt werden kann98. Ihr Vorkommen ist jedoch an die Topik-Position gebunden. Das Deutsche wird daher den sog. Topik-drop-Sprachen zugeordnet (siehe z. B. Fries, 1988; Grewendorf, 1989; Sigurðsson, 2011 u. a.), d. h. die Nullelemente können nur am Satzanfang auftauchen, wo die in der Satzstruktur hervorgehobenen Elemente vorkommen. Auf die Frage eines Gesprächspartners im Beispiel 4–19 kann der andere Gesprächspartner mehrere Antworten geben (4–19a-d). Er kann eine volle NP oder ein Pronomen benutzen (siehe 4–19a). Das Subjekt in Form einer vollen NP oder eines Pronomens kann im Mittelfeld erscheinen (siehe 4–19b). Wenn das Subjekt sich jedoch in der Topik-Position befindet, kann die Nullform benutzt werden (siehe 4–19c). Im Satzinneren kann das Subjekt nicht ausgelassen werden, auch wenn es im Gehirn des Hörers aktiviert ist, weil es in der vorausgehenden Frage vorgekommen ist (siehe 4–19d): 4–19

Person 1: Person 2: a. b. c. d.

Wo war denn Martin gestern? Martin/Er ist gestern zu Hause geblieben. Gestern ist er/Martin zu Hause geblieben. _ ist gestern zu Hause geblieben. * Gestern ist _ zu Hause geblieben.

Ähnlich sieht die Situation mit Nullobjekten aus. Auf die Frage eines Gesprächspartners in Beispiel 4–20 können mehrere Antworten in einem Gespräch gegeben werden (4–20a-d). Eine NP oder ein Pronomen kann benutzt werden (siehe 4–20a). Das Objekt, in Form einer vollen NP oder eines Pronomens, kann an den Satzanfang bewegt werden (siehe 4–20b). Wenn das Objekt sich am Satzanfang befindet, kann die Nullform benutzt werden (siehe 4–20c). Im Satzinneren kann das Objekt jedoch, ähnlich wie das Subjekt, nicht ausgelassen werden, auch wenn es im Gehirn des Hörers durch den Sprachkontext aktiviert ist (siehe 4–20d). 97 Siehe auch Iluk und Iluk (2019) zu den Problemen bei der deutsch-polnischen und polnischdeutschen Übersetzung von Subjektpronomina. Siehe Bilut-Homplewicz (2001) zu den Untersuchungen im Rahmen der Gesprächslinguistik im slawischen Sprachraum. 98 Für die Merkmale der gesprochenen deutschen Sprache im Verbalbereich siehe Wierzbicka und Schlegel (2008).

110 4–20

Referenz, Artikel und Nullargumente im Deutschen

Person 1: Person 2: a. b. c. d.

Wo ist dein Auto? Ich habe das Auto/es verkauft. Das Auto/Das hab ich verkauft. _hab ich verkauft. *Ich hab _ verkauft.

Die Nullformen in 4–19c und in 4–20c werden entsprechend als Nullsubjekt und Nullobjekt in der vorliegenden Arbeit bezeichnet (vgl. auch in der Hinsicht Hamann, 1996; Volodina, 2011; Trutkowski, 2016 u. a.). Man muss hier jedoch unterstreichen, dass das Nullsubjekt im Deutschen ein Fall des Topik-drops ist, und nicht als pro in der Auffassung der generativen Theorie gelten kann. Die Nullobjekte im Deutschen unterscheiden sich auch gravierend von den klassischen Nullobjekten in den Nullobjekt-Sprachen, weil sie im Deutschen nur in der Topik-Position auftreten können. Wegen der Topik-drop Eigenschaft wird das Deutsche auch als »quasi Nullsubjekt-Sprache« bezeichnet (siehe Grewendorf (1989) für eine detaillierte Diskussion des Themas). Beim Topik-drop spielt die Informationsstruktur eine wichtige Rolle im Deutschen. Wenn topikale Elemente einen Kontrastfokus haben, können sie nicht mehr ausgelassen werden. Topik-drop unterliegt aber keinen morphologischen oder semantischen Einschränkungen. Unabhängig davon, ob das Antezedens belebt oder unbelebt ist, welche Person es ist oder welchen Numerus es hat, kann das topikale Element ausgelassen werden (siehe Fries (1988) für eine detaillierte Darstellung der Bedingungen für Topik-drop). Im gesprochenen Deutsch tritt auch ein Unterschied zwischen Nullobjekten und Nullsubjekten der 3. Person einerseits und Nullsubjekten der 1. und 2. Person andererseits auf. Trutkowski (2016) argumentiert dafür, dass die Nullsubjekte der 1. und 2. Person im Deutschen nicht unbedingt ein Antezedens im Sprachkontext zu haben brauchen. Siehe Beispiel 4–21: 4–21

Komme etwas später.

Trutkowski (2016) schlussfolgert daraus, dass die Nullsubjekte der 1. und 2. Person im Deutschen von Flexionsmarkern am Verb lizensiert werden. Da die Diskurs-Abhängigkeit eine typische Eigenschaft von Topik-drop ist, kommt Trutkowski zum Schluss, dass die Nullsubjekte der 1. und 2. Person im Deutschen keine Fälle echten Topik-drops sind. Sie sind jedoch auch nicht gleich den Nullsubjekten, die beispielsweise im Polnischen auftreten, und als pro analysiert werden, da sie im Deutschen immer noch an die Topik-Position gebunden sind. Die Nullsubjekte der 3. Person und Nullobjekte sind dagegen durch das Auftreten eines Antezedens im Sprachkontext bedingt. Da sie auch nur in der

Nullargumente im Deutschen

111

Topik-Position vorkommen können, sind sie der Grund, warum das Deutsche als Topik-drop-Sprache bezeichnet wird. Nullargumente werden im Rahmen der linguistischen Theorie unterschiedlich analysiert (siehe Kap. 4.1.4). Eine Analyse, die als eines der Hauptziele die Erklärung der Topik-drop-Eigenschaft von Sprachen wie Deutsch oder Isländisch hat, ist der Vorschlag von Sigurðsson (2011, 2014). Nullargumente werden von Sigurðsson (2011, 2014) als Bündel von Merkmalen verstanden, die zwar still, aber syntaktisch aktiv sind. ϕ-sichtbare Argumente, d. h. solche deren Person-, Numerus- und Genus-Merkmale durch die Kongruenzmerkmale am Verb sichtbar sind – z. B. Nullsubjekte im Polnischen – oder schwache Pronomen, werden (wie alle definiten Argumente) an C/edge-Binder gebunden, um interpretiert zu werden. Ihre Bindung kann unabhängig davon erfolgen, ob in der CDomäne ein lexikalisches Element vorkommt oder nicht. Im Gegensatz dazu müssen ϕ-stille Argumente, d. h. solche deren Person-, Numerus- und GenusMerkmale nicht sichtbar sind – z. B. die sog. null topics, also Nullsubjekte und Nullobjekte in Topik-drop-Sprachen wie das Deutsche, in die C-Domäne bewegt werden, um interpretiert zu werden (vgl. Sigurðsson, 2011). Das ist nur unter der Bedingung möglich, dass kein lexikalisches Element in Spec,C auftritt. Wenn die Position in Spec,C belegt ist, d. h. wenn ein anderes Satzglied am Satzanfang vorkommt, ist das Nullargument ungrammatisch (siehe Beispiel 4–20d). Die Argumente, die an den Diskurs gebunden sind, wie etwa Nullargumente im Chinesischen oder Nullobjekte im Polnischen, brauchen nicht in die C-Domäne bewegt zu werden, um an C/edge-Binder gebunden zu sein (vgl. Sigurðsson, 2011, 2014). Die Theorie der C/edge-Bindung von Sigurðsson (2011, 2014) sowie auch andere Analysen von Nullargumenten (z. B. Raposo, 2004) unterstreichen, dass Nullargumente innerhalb des Satzes an ein Element in der linken Peripherie gebunden sein und auch referentiell im Rahmen der Sprechsituation und/oder des Redeuniversums gewertet werden müssen (siehe Kap. 4.2 und 4.3). Das Deutsche ist wegen seiner Topik-drop-Eigenschaft aus sprachtheoretischer Perspektive ein sehr interessanter Bereich, dessen Erforschung zum besseren Verständnis von Nullargumenten beiträgt. Zusammenfassend kann festgestellt werden, dass bei der Bezugnahme auf Referenten Sprecher unterschiedliche Formen von referentiellen Ausdrücken benutzen können, die ein Kontinuum, in Hinsicht auf den Diskursstatus des Referenten, darstellen. Abhängig vom Grad der Zugänglichkeit des Referenten können unterschiedliche referentielle Ausdrücke von Sprechern gebraucht werden, um auf gegebene Entitäten in der Welt Bezug zu nehmen (vgl. Kap. 4.2). Referentielle Ausdrücke können dabei mehr oder weniger lexikalische Informationen liefern, die zur Festlegung der Identität des Referenten beitragen. Volle Formen, wie Nominalphrasen, liefern viele lexikalische Informationen und

112

Referenz, Artikel und Nullargumente im Deutschen

können dadurch die Identität des Referenten eindeutig machen. Die reduzierten Formen, wie Pronomen oder Nullargumente, liefern keine oder wenige lexikalische Informationen und können daher nur hochzugängliche Entitäten bezeichnen. Als volle Formen der referentiellen Ausdrücke gelten im Deutschen Nominalphrasen mit bestimmtem oder unbestimmtem Artikel, die die Opposition definit vs. indefinit markieren. Die Opposition Spezifizität vs. NichtSpezifizität wird im Deutschen nicht in der Form der Nominalphrasen markiert. Als reduzierte Formen gelten im Deutschen Nullsubjekte und Nullobjekte, die in Folge der Topik-drop-Eigenschaft in der Sprache auftauchen.

Kapitel 5: Artikel und Nullargumente im Spracherwerb

Im vorliegenden Kapitel wird der Erwerb von zwei Arten referentieller Ausdrücke dargestellt, und zwar der (in)definiten Nominalphrasen und der Nullargumente. Der Erwerb von (in)definiten Nominalphrasen und von Nullargumenten ist eng mit dem Erwerb der Referenz im allgemeinen verbunden, und kann nicht ohne allgemeine Perspektive dargestellt werden. Im Unterkapitel 5.1 wird daher zuerst auf die Grundzüge des monolingualen und bilingualen Erwerbs der Referenz im Allgemeinen eingegangen, ehe in den Unterkapiteln 5.2 und 5.3 der Erwerb von Nominalphrasen mit bestimmtem oder unbestimmtem Artikel und von Nullargumenten vorgestellt wird.

5.1

Erwerb der Referenz

5.1.1 Sprachliche und kognitive Elemente beim Erwerb der Referenz Im Laufe des Erwerbs der Referenz müssen Kinder mehrere komplexe Operationen erlernen, die das Evozieren einer Entität im Redeuniversum durch einen referentiellen Ausdruck zum Ziel haben. Um die richtigen Referenzbeziehungen aufzustellen, müssen Kinder im Stande sein, vor allem zwei Operationen des Referenzaktes, nämlich die Verankerung und die Individuation, durchzuführen. Wie in Kap. 4.2 dargestellt, muss der Referent in den mentalen Räumen, die im Bewusstsein der Gesprächspartner geschaffen werden, oder auch in der Sprechsituation verankert sein, damit die Referenzbeziehung aufgestellt wird (siehe Abb. 4–1 im Unterkap. 4.2). Darüber hinaus kann die Präsenz der Referenten im Bewusstsein der Gesprächspartner unterschiedlich intensiv sein, was zum unterschiedlichen Grad der Zugänglichkeit der Referenten führt. Die Einschätzung des Grades der Zugänglichkeit und der Individuation des Referenten determiniert die Wahl der referentiellen Ausdrücke. Die Fähigkeit, den Zusammenhang zu erfassen, muss von einem Kind im Lauf seiner Sprachentwicklung erworben werden.

114

Artikel und Nullargumente im Spracherwerb

Aus der linguistischen Perspektive involviert der Erwerb der Fähigkeit, die Referenz auszudrücken, die Aneignung der entsprechenden Formen der referentiellen Ausdrücke und ihren Einsatz in den Satz- und Diskursrahmen. Die Informationen aus den folgenden Bereichen der Sprache müssen beim Erwerb der Referenz integriert werden: Phonologie, Morphosyntax und Diskurs/Pragmatik. Nicht zuletzt verlangt der Erwerb der Referenz, dass Kinder die C/edgeBindung zwischen den definiten Argumenten und ihrer C/edge-Binder herstellen können (Sigurðsson, 2011, 2014), worauf im Kap. 4.3 eingegangen worden ist. Der Erwerb der C/edge-Bindung, also der syntaktischen Etappe der Aufstellung des Referenzbezugs im Diskurs, ist keine triviale Aufgabe für ein Kind (vgl. Sopata, 2016). Der Erwerb der Referenz ist eng mit der kognitiven Entwicklung der Kinder verbunden, da die Fähigkeit, auf gegebene Entitäten in der Welt Bezug zu nehmen, einige kognitive Fähigkeiten voraussetzt99. Die Verankerung der Referenten in mentalen Räumen, die als Schnittmenge des Bewusstseins der Gesprächspartner aufgefasst werden können, verlangt vom Sprecher, dass er den Stand des Wissens des Hörers einschätzt. Der Sprecher muss während des Gesprächs annehmen, welche Referenten für den Hörer ganz neu, und welche leicht zugänglich sind100, um für sie entsprechende Ausdrücke zu wählen. Kinder müssen daher außer der linguistischen Kompetenz auch die kognitive Fähigkeit entwickeln, zwischen der eigenen Perspektive und der Perspektive des Gesprächspartners zu unterscheiden101. Die kognitive Fähigkeit, mentale Zustände der anderen einzuschätzen, ist ein wichtiger Aspekt der kognitiven Entwicklung und wird als eines der Hauptelemente der sog. Theory of Mind aufgefasst (Premack & Woodruff, 1978; O’Neill et al., 1992; de Villiers, 2007). Bei der Entwicklung der Fähigkeit, die Referenzbeziehungen aufzustellen, muss daher der Erwerb der sprachlichen Mittel, durch die die Referenz ausgedrückt wird, mit der Entwicklung von außersprachlichen Bereichen, wie unter anderem der Theory of Mind, einhergehen. Einen großen Einfluss auf die Wahl der referentiellen Ausdrücke hat auch in einem realen Gespräch die Kapazität des Arbeitsgedächtnisses des Sprechers, weil die Informationen zum gegebenen Referenten (z. B. Genus, Numerus) im Arbeitsgedächtnis des Sprechers in der Zeit zwischen der letzten und der aktuellen Erwähnung gespeichert werden müssen (Hendriks, 2016). Die linguistischen Merkmale und Diskursfunktionen des Referenten werden zum Zeitpunkt der neuen Erwähnung aufgerufen und 99 Siehe Z˙ebrowska (2013) zur Beziehung zwischen Sprachlichkeit und Kognitionsinhalten. 100 Vgl. Abb. 4–2 in Kap. 4.2 zur Zugänglichkeit der Referenten. 101 Zur erfolreichen Kommunikation gehören auch weitere Elemente, auf die in der vorliegenden Arbeit nicht eingegangen werden kann. Siehe beispielsweise Bartoszewicz (2010) zu rhetorischen Fehlern, die die Verständigung zwischen den Gesprächspartnern beeinträchtigen können.

Erwerb der Referenz

115

aktualisiert, wofür exekutive Funktionen102 zuständig sind (Lewis et al., 2006; De Cat, 2015; Torregrossa et al. 2021). Die exekutiven Funktionen werden in drei Bereiche eingeteilt: Hemmung von ungewollten Reaktionen, Flexibilität, also die Fähigkeit zwischen mentalen Zuständen umzuschalten, und Aktualisierung sowie Überwachung von Repräsentationen des Arbeitsgedächtnisses (Friedman et al., 2006; Miyake et al., 2000). Empirische Studien zeigen, dass die exekutiven Funktionen in großem Maße die Fähigkeit determinieren, Perspektiven einzunehmen (z. B. Brown-Schmidt, 2009). Die sprachliche Entwicklung muss daher mit der kognitiven einhergehen, so dass Kinder die Referenzbezüge in einem Gespräch aufstellen können. Zusammenfassend können nach de Cat (2015) folgende kognitive Voraussetzungen für den Erwerb der Referenz genannt werden: 1. Ressourcen der Aufmerksamkeit 2. Arbeitsgedächtnis 3. Fähigkeit, zwischen der eigenen Perspektive und der des Gesprächspartners zu unterscheiden 4. Inhibition, d. h. Fähigkeit, die eigene Perspektive zu blockieren 5. Fähigkeit, visuelle und verbale Informationen in ein kohärentes Situationsmodell zu integrieren 6. Fähigkeit, dieses Modell aufrechtzuerhalten und zu aktualisieren

5.1.2 Referenz im monolingualen Erwerb Die Bezugnahme auf Entitäten aus der Umwelt des Kindes ist ein wichtiger Teil seiner Kommunikation mit der Umgebung zu jeder Zeit. Die Benennungen von Gegenständen erscheinen in ganz frühen Äußerungen von Kindern in allen Sprachen (Gentner, 1982; Kauschke & Hofmeister, 2002). Auch in der Phase, in der Kinder noch keine Wörter artikulieren, können sie Referenten von gehörten Ausdrücken identifizieren, was durch ihre Gesten oder Augenbewegungen sichtbar ist (siehe z. B. Gliga & Csibra, 2009). Zwischen dem 2. und 5. Lebensjahr entwickeln sich einzelne exekutive Funktionen bei Kindern, und es kommt zu ihrer Integration in ein effizientes System (De Cat, 2015). Als erste Komponente wird das Arbeitsgedächtnis bei einem Kind entwickelt (Garon et al., 2008: 49). Die Koordination von mehreren einfachen Fähigkeiten im Bereich der exekutiven Funktionen wird zwischen dem 3. und 5. Lebensjahr erworben (Garon et al., 2008). Die wesentliche Komponente ist dabei die Aufmerksamkeitskapazität, die die Entwicklung der exekutiven 102 Exekutive Funktionen sind Bündel an Fähigkeiten, die auch mit dem Begriff kognitive Kontrolle in der Neuropsychologie bezeichnet werden.

116

Artikel und Nullargumente im Spracherwerb

Funktionen determiniert (vgl. De Cat, 2015). Ihre Reifung ist in den Zeitraum von 2 bis 6 Jahren zu setzen (Garon et al., 2008). Bis zum 6. Lebensjahr wird von einem Kind auch die Fähigkeit entwickelt, ihre Aufmerksamkeit umzulenken (Rueda et al., 2005). Im 3. Lebensjahr kann ein Kind Verstecken spielen, es ist also dazu fähig, die visuelle Perspektive der anderen zu verstehen (Moll et al., 2014). Diese Fähigkeit macht jedoch noch nicht die Theory of Mind aus, die das kognitive Vermögen präsentiert, mentale Zustände wie Meinungen, Gefühle, Absichten der anderen als mögliche Ursache des Verhaltens zu verstehen. Mehrere Studien zeigen, dass Kinder dieses Vermögen mit ca. 4 Jahren entwickeln (Wimmer & Perner, 1983). Obwohl eine gewisse Sensitivität für die Perspektive des Gesprächspartners in den sprachlichen Daten von 3-jährigen Kindern gefunden werden kann (Matthews et al., 2006), sind einige Schwierigkeiten mit der Berücksichtigung der Perspektive des Gesprächspartners im Referenzbereich auch bei 4- und 5-jährigen Kindern zu sehen (Maratsos, 1974; Trueswell et al., 2011). Auch die Entwicklung narrativer Fähigkeiten von Kindern nimmt etwas Zeit in Anspruch. Die zeitliche Abfolge von Ereignissen wird von Kindern im Alter von 3 bis 5 Jahren aufgefasst. Die Kausalität und logische Abfolge kann im Alter von 5 Jahren beobachtet werden (vgl. De Cat, 2015). In mehreren Sprachen erscheint die narrative Kohäsion bei Kindern mit 6 Jahren (Hickmann, 2000). Der Verlauf der kognitiven Entwicklung beeinflusst in großem Maße den Erwerb der Referenz. Die noch nicht vollständig entwickelten kognitiven Voraussetzungen für die Referenzherstellung bei kleinen Kindern verursachen, dass ihre sprachlichen Daten Fehler in Bezug auf Referenzbeziehungen aufweisen können, obwohl die entsprechenden sprachlichen Kategorien wie Definitheit oder Topiksein erworben worden sind. De Cat (2015) führt die Schwierigkeiten von Vorschulkindern mit der Salienzeinschätzung und mit der Aufrechterhaltung des Diskursmodells auf die unvollständig entwickelten kognitiven Voraussetzungen zurück. Viele linguistischen Studien zeigen daher einerseits, dass Kinder in ihren Äußerungen volle referentielle Ausdrücke, die mehrere lexikalische Informationen liefern, zur Bezeichnung der Referenten gebrauchen, die dem Gesprächspartner weniger zugänglich sind, und reduzierte referentielle Ausdrücke dann benutzen, wenn die Referenten dem Gesprächspartner zugänglich sind (z. B. Allen et al., 2008). Auch bei der Interpretation referentieller Ausdrücke verhalten sich Kinder oft wie Erwachsene (vgl. Serratrice, 2015). Schon im Alter von 1;6 können Kinder die entsprechenden referentiellen Ausdrücke wählen, was in ihren spontanen Daten zu sehen ist, in denen meistens von ihnen bekannten Themen die Rede ist (z. B. Clancy, 1993; Serratrice, 2005). In experimentellen Aufgaben oder in Erzählungen, in denen öfter unbekannte Themen und Gegenstände auftauchen können, kommt die normgerechte Referenzherstellung

Erwerb der Referenz

117

allerdings etwas später vor (z. B. Wittek & Tomasello, 2005; Serratrice, 2008; Theakston, 2012). Andererseits können Kinder jedoch, bis ca. zum 5. Lebensjahr oder auch länger, die Referenzbeziehungen nicht immer eindeutig aufstellen. In den sprachlichen Daten der Kinder können mehrere Fälle gefunden werden, in denen definite Artikel oder Pronomen übergeneralisiert werden, d. h. sie werden in Kontexten benutzt, in denen der Referent nicht vorher erwähnt worden ist. Solche Fehler gelten als Beweis für die sog. egozentrische Phase in der kognitiven Entwicklung der Kinder (Karmiloff-Smith, 1979) oder als Fehlen von pragmatischen Prinzipien (Schaeffer & Matthewson, 2005). Ein noch ganz anderer Vorschlag für die Erklärung der Fehler stammt von De Cat (2015), die darauf hinweist, dass eine direkte Korrelation zwischen den »egozentrischen« Fehlern und der Theory of Mind nicht unbedingt stimmen muss. Die Forscherin führt die Übergeneralisierung der definiten Artikel und Pronomen auf die noch nicht vollständig bei den Vorschulkindern entwickelten exekutiven Funktionen zurück103. Empirische Studien belegen auch, dass noch im Lebensalter von 6 bis 11 Jahren Kinder in manchen Situationen mit der angemessenen Einführung von neuen Referenten in den Diskurs, oder mit ihrer erneuten Einführung sowie mit den speziellen Fällen der Referenzkontinuität, Probleme haben können (vgl. Hickmann et al., 2015). Aus der sprachübergreifenden Perspektive kann man im monolingualen Erwerb der Referenz Bereiche sehen, die in allen Sprachen ähnlich erworben werden, und solche, die gewisse Unterschiede aufweisen. In mehreren Sprachen brauchen Kinder mehr Zeit, um die Fähigkeit zu entwickeln, angemessen neue Referenten in den Diskurs einzuführen. Obwohl schon kleine Kinder, die verschiedene Sprachen erwerben, reduzierte Formen der referentiellen Ausdrücke in Kontexten der Kontinuität von Topik bevorzugen, nimmt es in allen Sprachen den Kindern mehr Zeit in Anspruch, zwischen Kontexten zu unterscheiden, in denen ein Topik wieder eingeführt oder betont wird (vgl. Hickmann et al., 2015). Kinder sind jedoch auch für die Eigenschaften des ihnen zugänglichen Inputs in der gegebenen Sprache sensibel, und sie orientieren sich, abhängig von den Eigenschaften der erworbenen Sprache, in unterschiedlichem Maße an verschiedenen Markern für den Diskursstatus der Referenten104. Zusammenfassend kann man sagen, dass sowohl die sprachliche als auch die kognitive Entwicklung bei der Untersuchung des Erwerbs der Referenz berück103 Siehe Kap. 5.2.1 zu den Erklärungsvorschlägen in Hinsicht auf den Gebrauch der (in)definiten Nominalphrasen im monolingualen Erwerb. 104 Siehe Hickmann und Hendriks (1999), Hickmann et al. (1996) und Hickmann (2003) zur Entwicklung der narrativen Fähigkeit im Deutschen, Französischen, Englischen und Chinesischen sowie Smoczyn´ska (1992) im Polnischen. Für eine Zusammenfassung der Ergebnisse der Studien siehe Hickmann et al. (2015).

118

Artikel und Nullargumente im Spracherwerb

sichtigt werden muss. Obwohl Kinder ganz früh eine Sensitivität für die unterschiedliche Zugänglichkeit des Referenten zeigen, neigen sie dazu, einige sprachlichen Formen überzugeneralisieren. Trotz mehrerer empirischer Studien zu diesem Thema, von denen nur einige hier erwähnt werden können, wissen wir noch wenig über die individuellen Differenzen in der für die Referenz relevanten, kognitiven und sprachlichen Entwicklung (siehe aber Hendriks, 2016). Wie Serratrice (2015) zurecht feststellt, hat die Forschung noch keine Antwort auf die grundlegende Frage geliefert, ob die sprachliche Entwicklung von Kindern im Bereich der Referenz besser durch ein für Kinder spezifisches Diskursmodell erklärt werden kann, das sich von dem eines Erwachsenen unterscheidet, oder ob ein für unterschiedliche Altersgruppen einheitliches Modell angenommen werden soll.

5.1.3 Referenz im bilingualen Erwerb Die Komplexität der Referenzherstellung führt dazu, dass in denselben Diskursbedingungen unterschiedliche referentielle Ausdrücke von verschiedenen Sprechern gebraucht werden. Die individuelle Variation unter Sprechern einer Sprache kann groß sein, da die kognitiven Voraussetzungen wie Arbeitsgedächtnis oder exekutive Funktionen (vgl. Kap. 5.1.1) bei einem Sprecher in einer gegebenen Situation unterschiedlich effektiv sein können (vgl. Hendriks, 2016). Darüber hinaus können Unterschiede zwischen den Sprachen beim Ausdruck der Referenz beträchtlich sein (siehe beispielsweise Kap. 4.4 und 4.5 zu den Unterschieden zwischen dem Deutschen und dem Polnischen). Angesichts der beträchtlichen individuellen Variation unter monolingualen Sprechern einer Sprache ist es nicht verwunderlich, dass die Variation auch bei bilingualen Sprechern zu sehen ist. Zu den in Kap. 5.1.1 angeführten, kognitiven und sprachlichen, Faktoren, die für die Entwicklung der Referenz im monolingualen Spracherwerb relevant sind, kommen beim bilingualen Erwerb noch zumindest zwei Faktoren hinzu, die bei der Zweisprachigkeit eine besonders große Rolle spielen können, nämlich Unterschiede in dem den Kindern zugänglichen Sprachinput in beiden Sprachen (siehe auch Kap. 3), sowie die Koexistenz von zwei Sprachen, in denen Referenzbeziehungen auf unterschiedliche Weise hergestellt werden können, im Gehirn zweisprachiger Kinder und die daraus womöglich resultierenden zwischensprachlichen Einflüsse. Die Unterschiede zwischen bilingualen und monolingualen Sprechern bei der Bezugnahme auf Referenten können als Überspezifizierung und Unterspezifizierung zusammengefasst werden (vgl. Torregrossa et al., 2019). Mit dem Begriff Überspezifizierung werden Fälle bezeichnet, in denen eine volle Form zur Be-

Erwerb der Referenz

119

zugnahme auf einen zugänglichen Referenten benutzt wird. Der referentielle Ausdruck liefert dann mehrere Informationen, die im Diskurs redundant sind, weil der Referent im Bewusstsein der Gesprächspartner aktiviert ist. Als Unterspezifizierung wird der Gebrauch von reduzierten Formen in Kontexten bezeichnet, in denen der Referent nicht leicht zugänglich ist. Da solche Formen wenig Informationen liefern, führt ihr Gebrauch zur Mehrdeutigkeit in Hinsicht auf die Identifizierung des Referenten. Die Überspezifizierung bei der Bezugnahme auf Referenten in bilingualen Sprachdaten wird oft als Ergebnis des Einflusses einer Sprache auf die andere erklärt. Eine solche Erklärung liegt nahe bei zweisprachigen Kindern, die eine Nullsubjektsprache und eine Nicht-Nullsubjektsprache erwerben, und die Pronomen oder volle Nominalphrasen zum Ausdruck des Subjekts in der Nullsubjektsprache in Kontexten benutzen, in denen ein Nullsubjekt oder ein klitisches Element angemessener wäre (z. B. Serratrice et al., 2004; Tsimpli & Sorace, 2006; Belletti et al., 2007; siehe auch Sorace, 2016 für eine Zusammenstellung der hier relevanten Studien und Otwinowska et al., 2022 zu solchen Ergebnissen bei den englisch-polnisch zweisprachigen Kindern). Studien zum bilingualen Erwerb von zwei Nullsubjektsprachen liefern jedoch ein Gegenargument für die Erklärung der Überspezifizierung mit zwischensprachlichem Einfluss, weil auch bei einer solchen Sprachkombination überspezifizierte referentielle Ausdrücke gebraucht werden (z. B. Torregrossa et al., 2017). Die Überspezifizierung der referentiellen Ausdrücke in bilingualen Daten wird daher auch mit Inputfaktoren in Verbindung gebracht (Torregrossa et al., 2017; Torregrossa et al., 2019). Eine mögliche Erklärung bietet auch die Hypothese der Syntax-Diskurs/Pragmatik-Schnittstelle (Sorace, 2011). Angesichts dessen, dass reduzierte Formen in Hinsicht auf das Syntax-Diskurs-Zusammenspiel relativ komplex sind, werden sie von zweisprachigen Kindern vermieden. Volle Nominalphrasen können aus der pragmatischen Perspektive als sicherere Option erscheinen. Die Unterspezifizierung bei der Bezugnahme auf Referenten in bilingualen Sprachdaten wird mit dem verzögerten Zugriff auf das mentale Lexikon in Zusammenhang gebracht (Torregrossa et al., 2019). Reduzierte Formen referentieller Ausdrücke, wie Pronomen oder Klitika, erfordern einen Zugriff auf eine kleinere Menge von Informationen als volle Formen, sie sind also einfacher zu gebrauchen (vgl. Burzio, 1998; Jescheniak et al., 2001; Hendriks, 2014). Dieser Unterschied mag eine besondere Rolle bei bilingualen Sprechern spielen, die oft langsamer und weniger korrekt als monolinguale gleichaltrige Kinder im Hinblick auf den lexikalischen Zugriff sind (siehe z. B. Bialystok et al. (2008) oder Bialystok et al. (2010), die den rezeptiven Wortschatz bei Kindern im Alter von 3 bis 10 Jahren untersuchen). Der verzögerte lexikalische Zugriff bei zweisprachigen Kindern im Vergleich zu gleichaltrigen monolingualen Sprechern wird

120

Artikel und Nullargumente im Spracherwerb

mit der geringeren Häufigkeit des Sprachgebrauchs (Gollan et al., 2008) oder mit der erforderlichen Inhibition der im Moment nicht gebrauchten Sprache bei bilingualen Sprechern erklärt (z. B. Bialystok et al., 2010). Da der lexikalische Zugriff bei Bilingualen oft etwas langsamer ist, scheint ihre Wahl der reduzierten Formen bei der Bezugnahme auf Referenten eine ökonomische Lösung zu sein, was jedoch zur Unterspezifizierung der referentiellen Ausdrücke führen kann. Als Fazit dieser Erwägungen soll festgehalten werden, dass mehrere Faktoren den Gebrauch referentieller Ausdrücke im Verlauf des monolingualen und des bilingualen Spracherwerbs beeinflussen. Auf der einer Seite stehen die kognitiven und sprachlichen Faktoren, die den einsprachigen und zweisprachigen Kindern gemeinsam sind (Kap. 5.1.1). Auf der anderen Seite stehen jene Faktoren, die für bilinguale Sprecher besonders relevant sind (Kap. 5.1.3). Darüber hinaus muss an dieser Stelle unterstrichen werden, dass individuelle Differenzen beim Erwerb der Fähigkeit, sich auf Referenten im Diskurs zu beziehen, eine wichtige Rolle spielen.

5.2

Erwerb der Artikel

5.2.1 Artikel im monoligualen Erwerb Der Erwerb von (in)definiten Nominalphrasen, und insbesondere der Erwerb des bestimmten und unbestimmten Artikels, ist der Gegenstand von unzähligen Untersuchungen in der Spracherwerbsforschung. Einige davon konzentrieren sich auf den Zeitpunkt des Auftauchens der Artikel in der Sprache der Kinder, und andere auf die spätere Entwicklung des Systems der Artikel und anderer Determinierer, d. h. auf die Aneignung der Regeln für den morphologisch korrekten Einsatz der Determinierer und für ihren angemessenen Gebrauch, der es ermöglicht, die entsprechenden Referenzbeziehungen aufzustellen. Der Erwerb des Artikels und anderer Determinierer ist einer der Schlüsselbereiche in der Entwicklung der Syntax und der Diskurs/Pragmatik-Ebene der Sprache. Der Gebrauch der Determinierer zeugt davon, dass Kinder Nominalphrasen aufbauen können. Hier muss unterstrichen werden, dass das bloße Auftauchen eines Artikels eine Nominalphrase nicht immer gleich wohlgeformt macht. Kinder müssen noch die Fähigkeit erwerben, Artikel und andere Determinierer in Hinsicht auf Genus, Numerus und Kasus entsprechend zu markieren. Darüber hinaus müssen sie erlernen, den bestimmten und den unbestimmten Artikel sowie andere Determinierer in den Diskursrahmen entsprechend einzusetzen, und Referenzbeziehungen aufzustellen. Obwohl Artikel im monolingualen Erwerb relativ früh auftauchen, nimmt es den Kindern viel mehr Zeit in

Erwerb der Artikel

121

Anspruch, den morphologisch korrekten und pragmatisch angemessenen Gebrauch der Artikel zu meistern. In der ersten Phase des Erwerbs von Nominalphrasen beginnen Kinder meist im Alter von 12 Monaten isolierte Nomen zu gebrauchen. Im Laufe des zweiten Lebensjahres beginnen sie, erste Artikel mit einem Nomen zu benutzen (Bittner, 1997: 258; Schlipphak, 2008: 46f.). Im Deutschen zeigen die meisten Studien, dass der unbestimmte Artikel vor dem bestimmten Artikel erworben wird, oder dass sie gleichzeitig in der Sprache eines Kindes auftauchen (Mills, 1985; Koehn, 1994; Bittner, 1997: 258; Schlipphak, 2008). Mehrere Studien haben in den letzten Jahren gezeigt, dass der Zeitpunkt des Auftauchens der Determinierer in unterschiedlichen Sprachen variiert (Lleó & Demuth, 1999; Lleó, 2001; Kupisch 2006, 2007; Guasti et al., 2008; Rozendaal & Baker, 2008; Bassano et al., 2011; Bassano et al., 2013; siehe Bassano (2015) für eine Zusammenfassung der Studien). Empirische Untersuchungen belegen den Kontrast zwischen germanischen und romanischen Sprachen. Determinierer tauchen in germanischen Sprachen (Deutsch, Niederländisch) ca. sechs Monate später als in romanischen Sprachen (Französisch, Italienisch, Katalanisch, Spanisch) im Laufe des monolingualen Erwerbs auf; das Weglassen der Determinierer geschieht häufiger und dauert länger in germanischen Sprachen an. Kupisch et al. (2009) zeigt darüber hinaus, dass Artikel im Deutschen und Englischen auch später als in skandinavischen Sprachen auftauchen, was die Autoren auf postnominale Artikel zurückführen, die relativ früh im Erwerb der skandinavischen Sprachen erscheinen. Die Unterschiede werden unter anderem mit der verschiedenen morphologischen Komplexität der Determinierer in den Sprachgruppen erklärt, weil das Artikelsystem im Deutschen drei Genera, vier Kasus und viele homophone Formen aufweist, während im Französischen Kinder ein transparenteres Artikelsystem mit zwei Genera und zwei Kasus erwerben (Bassano et al., 2013). Andere Forscher begründen den Kontrast im Zeitpunkt des Erwerbs der Artikel mit unterschiedlichen prosodischen Eigenschaften von Determinierern in den Sprachen (Lleó, 2001; Lleó & Demuth, 1999). Eine andere Erklärung für das Phänomen wird von Rozendaal und Baker (2008) vorgeschlagen, die die unterschiedliche Häufigkeit des Vorkommens von Determinierern im den Kindern zugänglichen Input als Grund für die Unterschiede hinsichtlich des Zeitpunkts des Auftauchens der Determinierer in verschiedenen Sprachen nennen105. Obwohl Artikel und andere Determinierer im Laufe der Sprachentwicklung relativ früh auftauchen, nimmt der Erwerb ihres einheitlichen morphologisch 105 Z. B. Kupisch (2004) vergleicht den von Eltern an Kinder gerichteten Input im Deutschen und im Französischen. Sie demonstriert, dass im Deutschen weniger definite NPn und häufiger artikellose NPn als im Französischen von den Eltern benutzt werden.

122

Artikel und Nullargumente im Spracherwerb

korrekten und diskursangemessenen Gebrauchs mehr Zeit in Anspruch. Nach der ersten Phase der Auslassung von Artikeln kommt die sog. Variationsphase, in der Kinder Determinierer verwenden, aber es kommt noch zu Auslassungen in obligatorischen Kontexten. Erst darauf folgt die zielsprachliche Phase, in der Kinder Determinierer in allen obligatorischen Kontexten verwenden (vgl. Müller et al., 2007: 138)106. Brown (1973) zeigt, dass bei den von ihm untersuchten Kindern, die Englisch erwerben, das Artikelsystem im Alter von 2;8 bis 3;5 als erworben gelten kann, wenn man das Kriterium von 90 % des Einsatzes der Artikel in obligatorischen Kontexten annimmt. Die Verbindung der Determinierer mit den entsprechenden Diskursfunktionen dauert jedoch länger, und wird stufenweise erworben, was schon die Studie von Karmiloff-Smith (1979) nachweist. Sie zeigt auch auf, dass unbestimmte Artikel zuerst in der Funktion des Benennens, und die bestimmten Artikel in der Funktion der Lenkung der Aufmerksamkeit auf ein Objekt auftauchen. Brown (1973) demonstriert, dass im Alter von 3 Jahren der Gebrauch von indefiniten NPn in den Kontexten des Benennens und der unspezifischen Referenz im Englischen korrekt sein kann. Der Status des Referenten als neu vs. alt im Diskurs wird noch nicht eindeutig in den Sprachdaten der untersuchten Kinder mit dem Kontrast zwischen dem bestimmten und dem unbestimmten Artikel wiedergegeben. Rozendaal und Baker (2008), die die Fähigkeit von Kindern untersuchen, zwischen definiten und indefinten NPn in den Kontexten der spezifischen/unspezifischen Referenz, Topik/Fokus und des vorhandenen/nicht vorhandenen gemeinsamen Wissens der Gesprächspartner zu unterscheiden, weisen eine frühe Sensibilität der Kinder für diese Faktoren nach. Die in der Studie untersuchten Kinder, die Englisch, Französisch und Niederländisch erwerben, sind vor allem von früh an für die Spezifizität- und Topik/Fokus-Unterschiede sensibel. Mehrere Studien demonstrieren, dass Kinder über einen längeren Zeitraum hinweg Probleme mit der Aufstellung der Referenzbeziehungen mit Hilfe von bestimmten und unbestimmten Artikeln haben, wenn ein Referent in den Diskurs eingeführt oder im Diskurs erhalten werden soll. Hickmann (2003: 103) unterstreicht, dass sich Studien, die länger andauernde Probleme mit dem angemessenen Artikelgebrauch aufweisen, auf jene Konstruktionen konzentrieren, die diskursinterne Kohäsion herstellen. Nach den unzähligen Studien, die ab den 70-er Jahren des 20. Jahrhunderts entstanden sind, können zwei Haupttypen von den in den Sprachdaten der Kinder belegten Fehlern aufgezeigt werden (vgl. de Cat, 2011):

106 Für weitere Untersuchungen zum Erwerb der Determinierer im Deutschen siehe auch Penner und Weissenborn (1996), Eisenbeiss (2000) und Kupisch (2008).

Erwerb der Artikel

123

– Inkohärenz-Fehler (incoherence errors), bei denen Kinder indefinite NPn benutzen, um auf die schon in den Diskurs eingeführten Entitäten zu referieren (siehe Emslie & Stevenson, 1981 zum Begriff, siehe zur Evidenz für den Fehlertyp z. B. Karmiloff-Smith, 1979; Schafer & de Villiers, 2000; Schaeffer & Matthewson, 2005) – Egozentrische Fehler (egocentric errors), bei denen Kinder definite NPn statt indefinite NPn bei der Einführung des neuen spezifischen Referenten in den Diskurs benutzen, der dem Hörer nicht bekannt ist (siehe Maratsos, 1974 zum Begriff, siehe zur Evidenz für den Fehlertyp z. B. Karmiloff-Smith, 1979; Emslie & Stevenson, 1981; Power & Dal Martello, 1986; Schafer & de Villiers, 2000; Schaeffer & Matthewson, 2005; van Hout et al., 2010) Einige für diese Fehler vorgeschlagene Erklärungen sind mit den pragmatischen Aspekten der Sprache verbunden. Schaeffer und Matthewson (2005) argumentieren dafür, dass der Grund für egozentrische Fehler das bei Kindern fehlende pragmatische Konzept der nicht gemeinsamen Annahmen der Gesprächspartner (Concept-of-Non-Shared-Assumptions) ist. Wenn Kinder über dieses Konzept nicht verfügen, können sie als Sprecher eigenes Wissen automatisch dem Hörer in manchen Sprechsituationen zuschreiben, was im Gebrauch von definiten NPn in den Kontexten resultiert, in denen Erwachsene indefinite NPn benutzen würden. De Cat (2011, 2013, 2015) erklärt dagegen egozentrische Fehler und Fehler bei der Diskursintegration mit den kognitiven Einschränkungen der Kinder. Der häufige richtige Einsatz der definiten und indefiniten NPn im Diskurskontext zeugt davon, dass Kinder über sprachliches Wissen verfügen, das dem der Erwachsenen ähnelt. Jene egozentrischen Fehler, die Kinder in manchen Sprechsituationen begehen, resultieren nach de Cat (2011, 2013) daraus, dass Kinder generell ein breiteres gemeinsames Wissen als Erwachsene bei ihren Gesprächspartnern annehmen. Infolge dessen nehmen sie nicht immer das Bedürfnis wahr, ihre Rede der Perspektive des Gesprächspartners anzupassen. Darüber hinaus nehmen Kinder bei narrativen Aufgaben ein breiteres gemeinsames Wissen bei Gesprächspartnern nach De Cat (2013) vor allem dann an, wenn die physische Sprechsituation den visuellen Kontext für die Verankerung des Referenten liefert. Einen zusätzlichen Grund für egozentrische Fehler kann die Schwierigkeit bei der Wahrnehmung der Perspektive des Gesprächspartners durch ein Kind darstellen. De Cat (2015) bringt Fehler beim Einsatz der bestimmten Artikel auch mit den noch nicht vollständig bei Kindern entwickelten exekutiven Funktionen zusammen, auf die die Fähigkeit des Perspektivenwechsels zurückgeführt werden kann (Nilsen & Graham, 2009). Obwohl Kinder eine gewisse Sensitivität für die Perspektive des Gesprächspartners schon im Alter von 3 Jahren zeigen (siehe

124

Artikel und Nullargumente im Spracherwerb

Matthews et al., 2006), können sie auch noch im Alter von 4–6 Jahren damit Probleme haben, die eigene Perspektive zu unterdrücken (siehe Trueswell et al., 2011). Kinder haben wahrscheinlich zwar die referentiellen Funktionen von definiten NPn schon zu dem Zeitpunkt erworben und sie verstehen daher, dass definite NPn auf die dem Gesprächspartner zugänglichen Entitäten referieren können. Die Implementierung der sprachlichen Kompetenz setzt jedoch kognitive Mechanismen voraus, die bei den Kindern noch nicht vollständig entwickelt sein können. De Cat (2015) erklärt Fehler der Referenzherstellung mit diesen noch nicht zur Gänze entwickelten kognitiven Mechanismen, wie die Lenkung der Aufmerksamkeit oder exekutive Funktionen, Schwierigkeiten von Vorschulkindern mit der Evaluierung der Salienz der Referenten, mit der Aufrechterhaltung des Diskursmodells und der integrierten Repräsentation von nicht kompatiblen Regeln, was dazu führt, dass Kinder etwas anderes als Erwachsene wissen und tun können. All diese Schwierigkeiten können in manchen Situationen dazu führen, dass Kinder nicht dem Diskurs angemessene Referenzbeziehungen aufstellen. Auch beim Verstehen des bestimmten und unbestimmten Artikels weisen Kinder in manchen Situationen Unterschiede zu Erwachsenen auf. Van Hout et al. (2010) demonstrieren, dass Kinder im Alter von 3 bis 5 Jahren indefiniten NPn eine Interpretation zuschreiben können, die der Interpretation definiter NPn entspricht. Die Forscher erklären in ihren Studien solche Ergebnisse mit der fehlenden Fähigkeit der Kinder, skalare Implikaturen zu verarbeiten107. Zusammenfassend soll hier unterstrichen werden, dass definite und indefinite Nominalphrasen früh in der sprachlichen Entwicklung der Kinder auftauchen. Die frühe Sensibilität von Kindern für mehrere sprachliche und kognitive Faktoren, die den Gebrauch von Artikeln determinieren, ist in mehreren Studien nachgewiesen worden. Gleichzeitig haben viele Untersuchungen auch die Verwendung von definiten und indefiniten Nominalphrasen von Kindern, die von der Erwachsenensprache abweichen, belegt. Diese Abweichungen werden mit noch nicht erworbenen pragmatischen Prinzipien oder mit unvollständig entwickelten kognitiven Voraussetzungen für die Implementierung der sprachlichen Kompetenz in Verbindung gebracht. An dieser Stelle soll auch darauf hingewiesen werden, dass angesichts der Unmenge an Untersuchungen zum Erwerb der (in)definiten Nominalphrasen kein vollständiger Überblick über die relevante Literatur im Rahmen der vorliegenden Arbeit gegeben werden kann. Die oben angeführten Studien sind als Beispiele der Hauptuntersuchungen in diesem Bereich zu betrachten. 107 Bei Implikaturen wird nicht alles Gemeinte explizit geäußert. Zum Thema der skalaren Implikaturen bei der Interpretation von definiten und indefiniten NPn siehe Hawkins (1991) und Horn (2006).

Erwerb der Artikel

125

5.2.2 Artikel im bilingualen Erwerb Studien zum Erwerb von (in)definiten Nominalphrasen, und insbesondere zum Erwerb des bestimmten und unbestimmten Artikels im bilingualen Erwerb, sind weniger zahlreich als jene zum monolingualen Erwerb. Nichtdestotrotz hat die Erwerbsforschung auch auf dem Gebiet der Zweisprachigkeit viele Ergebnisse zu diesem Phänomen zu bieten. Untersuchungen zum simultan bilingualen Erwerb des Deutschen und einer romanischen Sprache (Italienisch oder Französisch) zeigen, dass die für den monolingualen Erwerb der Sprachen charakteristischen Merkmale auch im bilingualen Erwerb der Artikel auftreten. Simultan zweisprachige Kinder erwerben früher Determinierer in den romanischen Sprachen als im Deutschen (oder in einer anderen germanischen Sprache), was dem Zeitplan des monolingualen Erwerbs der jeweiligen Sprache ähnelt (siehe Kap. 5.2.1). Beim Vergleich der Zeit des zielsprachlichen Gebrauchs von Determinierern im Deutschen bei zweisprachigen und einsprachigen Kindern fällt auf, dass zweisprachige Kinder früher die zielsprachliche Phase erreichen. Dieser Unterschied wird durch die Präsenz der romanischen Sprache im Gehirn zweisprachiger Kinder erklärt. Im Gegensatz dazu kann die Phase des zielsprachlichen Gebrauchs von Determinierern in der romanischen Sprache bei simultan zweisprachigen Kindern bis zu sechs Monate später eintreten als bei monolingualen Kindern, die eine romanische Sprache erwerben, was von vielen Forschern als zwischensprachlicher Einfluss interpretiert wird (siehe z. B. Paradis & Genesee, 1997; Granfeldt, 2000; Hulk, 2000, 2004; Bonnesen, 2005; Kupisch, 2007; Prévost 2009; Barton, 2016). Obwohl der Zeitpunkt des ersten Gebrauchs von Determinierern bei simultan zweisprachigen Kindern variieren kann, wird der zielsprachige Gebrauch der Determinierer im Deutschen bei bilingualen Kindern in Untersuchungen zu späteren Erwerbsphasen belegt. Zweisprachige Kinder durchlaufen dieselben Stadien wie monolinguale Kinder beim Artikelerwerb, von der Phase der Auslassung bis zur zielsprachigen Verwendung. Bestimmte und unbestimmte Artikel tauchen auch bei bilingualen Kindern als erste Determinierer auf, wobei maskuline Formen vor den femininen Formen und Singular vor Plural erscheinen, wie beim L1-Erwerb (Müller, 1994; Granfeldt, 2003; Hulk, 2004). Im Gegensatz zu den morphosyntaktischen Aspekten des Artikelgebrauchs, die sowohl im monolingualen als auch im simultan bilingualen Erwerb relativ schnell erworben werden, dauert die Entwicklung der Fähigkeit, mit dem bestimmten und unbestimmten Artikel die dem Diskursrahmen entsprechenden Referenzbeziehungen herzustellen, etwas länger. Die sog. egozentrischen Fehler108 sind beispielsweise

108 Vgl. dazu Kap. 5.1.2.

126

Artikel und Nullargumente im Spracherwerb

bei simultan zweisprachigen Kindern (Deutsch/Französisch und Deutsch/Italienisch) von Kupisch (2006) belegt worden. Einige Untersuchungen zum simultan bilingualen Erwerb von Determinierern konzentrieren sich auf den Gegensatz zwischen den Nominalphrasen mit spezifischer und generischer Referenz (siehe beispielsweise Kupisch & Pierantozzi, 2010; Kupisch & Barton, 2013; Barton, 2016)109. Sie zeigen eine Überakzeptanz des bestimmten Artikels in generischen Äußerungen im Deutschen bei Kindern im Grundschulalter. Barton (2016) liefert einen Nachweis für ein Entwicklungsstadium im Deutschen, in dem die generische Lesart von den simultan bilingualen Kindern für NPn mit dem bestimmten Artikel bevorzugt wird. Untersuchungen zum sukzessiv bilingualen Erwerb in der Kindheit zeigen, dass definite Artikel problematisch für jene Kinder sein können, die die zweite Sprache nach der ersten erwerben (z. B. Chondrogianni, 2008; Tsimpli & Mastropavlou, 2007). Die Auslassungsphase dauert bei sukzessiv zweisprachigen Kindern länger als bei monolingualen oder simultan bilingualen Kindern. Chondrogianni (2008) berichtet beispielsweise über die Produktion des definiten Artikels bei nur 26,9 % in jener Gruppe von Kindern, die durchschnittlich 35 Monate Kontakt zu ihrer zweiten Sprache (Griechisch) hatten. Die Forscherin zeigt aber auch, dass in den darauf folgenden Sprachentwicklungsphasen die Produktion des definiten Artikels in der frühen L2 bei Kindern schnell ansteigt. Chondrogianni et al. (2015) demonstrieren darüber hinaus, dass sukzessiv zweisprachige Kinder für die Ungrammatikalität von Sätzen mit fehlendem definitem Artikel sensibel sind, auch wenn sie den definiten Artikel in dieser Zeit noch nicht in allen Kontexten, die ihren Gebrauch aus pragmatischen Gründen verlangen, produzieren. Der Erwerb von definiten und indefiniten Artikeln ist nicht nur ein Gegenstand empirischer Untersuchungen, sondern auch ein Ausgangspunkt für wichtige Hypothesen zur Erklärung des Verlaufs des Spracherwerbs unter verschiedenen Bedingungen. Im Rahmen des generativen Ansatzes wird der Syntaxerwerb als Prozess der Parametersetzung verstanden, der einem Kind trotz des begrenzten Inputs eine schnelle Aneignung von syntaktischen Kernbereichen ermöglicht (siehe dazu Kap. 2.4). Im Rahmen dieses Ansatzes schlagen Ionin et al. (2004) den Parameter der Artikelwahl vor, nach dem die Artikel in den verschiedenen Sprachen das Merkmal [+definit] oder [+spezifisch] markieren110. 109 Zweisprachige Kinder neigen dazu, den definiten Artikel in den generischen Kontexten in einem höheren Maße als monolinguale Kinder überzugeneralisieren (Serratrice et al., 2009). Der Gebrauch des bestimmten und unbestimmten Artikels in generischen Kontexten ist im Deutschen variabel (siehe z. B. Brugger, 1993). Kupisch und Pierantozzi (2010) zeigen, dass deutsch-italienisch zweisprachige Kinder generische Interpretation für definite markierte NPn zulassen. 110 Siehe Kap. 4.1.2 und 4.1.3 zu den Begriffen der Definitheit und der Spezifizität.

127

Erwerb der Artikel

Nach diesem Parameter können Sprachen, in denen zwei Artikel auftauchen, in zwei Gruppen eingeteilt werden: – [+definit] – Sprachen, in denen Artikel auf Grund der Definitheit unterschieden werden (siehe Tabelle 5–1) – [+spezifisch] – Sprachen, in denen Artikel auf Grund der Spezifizität unterschieden werden (siehe Tabelle 5–2) Tabelle 5–1: Artikelunterscheidung nach Definitheit am Beispiel des Englischen (nach Ionin et al., 2004: 13)

+spezifisch

+definit the

-definit a

-spezifisch Tabelle 5–2: Artikelunterscheidung nach Spezifizität am Beispiel des Samoanischen (nach Ionin et al., 2004: 13)

+spezifisch

+definit le

-spezifisch

se

-definit

Zur ersten Gruppe gehört neben Englisch auch Deutsch. Ionin (2003) sowie Ionin et al. Wexler (2004) zeigen, dass beim Erwerb des Englischen als L2 Artikel von Sprechern einer artikellosen L1 systematisch übergeneralisiert werden. In den Kontexten [+definit] [+spezifisch] benutzen L2-Lerner meistens der Norm entsprechend den bestimmten Artikel, und in den Kontexten [-definit] [-spezifisch] benutzen sie auch den unbestimmten Artikel richtig. Die Forscher demonstrieren jedoch, dass in den Kontexten [-definit] [+spezifisch] der bestimmte Artikel, und in den [+definit] [-spezifisch] der unbestimmte Artikel von den Lernern übergeneralisiert wird. Die Forscher argumentieren dafür, dass die Übergeneralisierung des bestimmten Artikels auf das Merkmal [+spezifisch] in den Kontexten [-definit] [+spezifisch] zurückzuführen ist. Ebenso wird der unbestimmte Artikel in den Kontexten [+definit] [-spezifisch] nicht normgerecht benutzt, weil das Merkmal [-spezifisch] L2-Lerner in diesen Fällen irreführt (siehe die weißen Felder in der Tabelle 5–3).

128

Artikel und Nullargumente im Spracherwerb

Tabelle 5–3: Artikelgebrauch im Englischen als L2 von Lernern mit artikellosen L1 (nach Ionin et al., 2004: 13)

+spezifisch -spezifisch

+definit korrekter Gebrauch des bestimmten Artikels Übergeneralisierung des unbestimmten Artikels

-definit Übergeneralisierung des bestimmten Artikels korrekter Gebrauch des unbestimmten Artikels

Ionin et al. (2004) erklären diese Befunde mit der Phase der Parametersetzung, in der Lerner zwischen zwei Parameterwerten schwanken. Den Forschern nach ist dies jene Phase, in der Lerner erkennen sollen, ob in der erworbenen Sprache Artikel auf Grund der Definitheit oder der Spezifizität unterschieden werden. Die Kontexte [-definit] [+spezifisch] und [+definit] [-spezifisch] (siehe weiße Felder in Tabelle 5–3) stellen Problemfälle dar, weil bei ihnen die beiden Parametersetzungen gegensätzlich sind. Die Hypothese von Ionin et al. (2004) ist als sog. Schwankungshypothese (Fluctuation Hypothesis) in der Spracherwerbsforschung bekannt. Obwohl sie in der Studie von Ionin et al. (2004) erwachsene bilinguale Sprecher betrifft, wird sie auch auf Kinder, die sukzessiv eine zweite Sprache erwerben, erweitert (Ionin et al., 2009). Die Autoren zeigen, dass sukzessiv zweisprachige Kinder, die eine artikellose L1 sprechen, im L2-Erwerb bei der Wahl des Merkmals, das den Artikelgebrauch determiniert, zwischen Definitheit und Spezifizität schwanken. Die Daten der Kinder, die meistens unter schulischen Bedingungen Englisch erwerben111, veranschaulichen, dass sie für die Spezifizität in den Diskurskontexten sensibel sind, wobei diese Kinder im Gegensatz zu erwachsenen Lernern den Spezifizitätsunterschied nur bei indefiniten Nominalphrasen machen (siehe Ionin et al., 2009). Die Schwankungshypothese ist zum Ausgangspunkt einiger empirischer Untersuchungen geworden. Einige Forscher, wie beispielsweise Hawkins et al. (2006), unterstützen einerseits die Schwankungshypothese, aber andererseits unterstreichen sie auch, dass ihre Rolle durch den L1-Transfer modifiziert werden kann. Zdorenko und Paradis (2008) zeigen dagegen auf, dass Kinder, die ihre zweite Sprache in der Kindheit erwerben, viel schneller als erwachsene Lerner an den Punkt des normgerechten Artikelgebrauchs gelangen. Die Forscherinnen untersuchen den Erwerb der Artikel bei Kindern im Alter von 4–7 Jahren, die Englisch als ihre zweite Sprache erwerben. Diese Kinder gehören zwei Gruppen an, wenn es um ihre Erstsprache geht. Die erste Gruppe bilden Kinder, die Spanisch, Arabisch oder Rumänisch als L1, also Sprachen mit Artikeln, sprechen. Zur 111 Siehe beispielsweise Sopata (2009) zu den Unterschieden im Verlauf der Sprachentwicklung beim Erwerb der Zweitsprache unter schulischen und natürlichen Bedingungen.

Erwerb der Artikel

129

zweiten Gruppe gehören Kinder mit artikellosen Sprachen als L1, Chinesisch oder Japanisch. Zdorenko und Paradis (2008) schlussfolgern aus ihrer Untersuchung, dass auch Kinder, die eine artikellose Sprache als L1 sprechen, schneller als Erwachsene den normgerechten Artikelgebrauch in ihrer zweiten Sprache erwerben. Sie argumentieren dafür, dass die Phase der Schwankung bei den Kindern relativ kurz , aber die Schwankung zwischen den Parameterwerten ein stärkerer Prozess als der L1-Transfer sei. Die Annahme des spezifischen Parameters der Artikelwahl, der von Ionin et al. (2004) vorgeschlagen wird, wird von einigen Forschern kritisiert (z. B. Hawkins et al., 2006). Auch die Operationalisierung der Spezifizität von Ionin et al. (2004) wird von einigen Forschern hinterfragt (Trenkic, 2008). Nichtsdestotrotz scheinen die referentiellen Eigenschaften der Artikel wirklich eine wichtige Rolle in ihrem Erwerb zu spielen, worauf die Studie von Ionin et al. (2004) die Spracherwerbsforscher aufmerksam macht. Einige Forscher argumentieren dafür, dass, was den Gebrauch eines Morphems in der L2 determiniert, nicht einfach seine An- oder Abwesenheit in der L1 ist, sondern semantische, prosodische und morphologische Faktoren, die seinen Gebrauch regeln, und der Weg, auf dem die Merkmale, die mit dem gegebenen Morphem verbunden sind, in der L2 umgebaut werden müssen. Die sog. Hypothese der Merkmalumbauung (Feature Reassembly Hypothesis – Lardiere, 2009) wird zuerst für die Zweitsprache vorgeschlagen, aber dann für andere Spracherwerbstypen erweitert (vgl. Chondrogianni et al., 2015; Chondrogianni & Marinis, 2016)112. Nach dieser Hypothese beruht der L2-Erwerb darauf, dass Lerner die mit gegebenen L1-Morphemen verbundenen Merkmale an die entsprechenden L2-Morpheme binden und sich dabei nach den wahrgenommenen Ähnlichkeiten richten. Zu Problemen kommt es, wenn die Merkmalspezifizierung bei den entsprechenden L1- und L2-Einheiten nicht übereinstimmt. Chondrogianni et al. (2015) zeigen, dass der Gebrauch des definiten Artikels bei sukzessiv bilingualen Kindern von seinen, als semantisch aufgefassten, Eigenschaften abhängig sein kann. Die Autoren erforschen den Gebrauch und die Verarbeitung von definiten Artikeln bei L1 Türkisch/L2 Englisch sukzessiv zweisprachigen Kindern, die 6–8 Jahre alt sind. Die Studie zeigt, dass der Gebrauch des definiten Artikels bei den Kindern besser in den sog. bridgingKontexten als in den anaphorischen Kontexten113 ist114. Die morphologischen 112 Die Hypothese von Lardiere (2009) wird sogar für den L1-Erwerb erweitert. Dabei wird argumentiert, dass auch L1-Kinder die für die gegebene Sprache relevanten Merkmale aus dem universalen Repertoire wählen, und sie entsprechend in ihrer Sprache anwenden lernen müssen (vgl. Chondrogianni et al., 2015; Chondrogianni & Marinis, 2016). 113 Unter anaphorischen Kontexten werden in den Studien Kontexte verstanden, in denen der Referent aufgegriffen wird, der schon im vorangehenden Diskurs aufgetreten ist. Als bridging-Kontexte werden solche bezeichnet, in denen der Referent nicht direkt im vor-

130

Artikel und Nullargumente im Spracherwerb

und prosodischen Eigenschaften des definiten Artikels sind in beiden Kontexten dieselben. Die Forscher argumentieren dafür, dass, was die zwei Kontexte unterscheide, die verschiedenen semantischen Eigenschaften der Kontexte seien. Sie schlussfolgern, dass der Transfer von L1 in L2 vom semantischen Kontext abhängig ist, in dem das gegebene Merkmal realisiert wird (vgl. Lardiere, 2009; Chondrogianni et al., 2015). Eine andere einflussreiche Hypothese zur Erklärung des Gebrauchs der Artikel und anderer Konstruktionen im bilingualen Erwerb ist die sog. Hypothese der Schnittstellen (Interface Hypothesis – Sorace & Filiaci, 2006; Sorace & Serratrice, 2009). Die Forscherinnen postulieren, dass der Erwerb von Strukturen, die an der Schnittstelle zwischen der Syntax und anderen sprachlichen Domänen, wie zum Beispiel Diskurs und Pragmatik, liegen, eine andere Herausforderung für zweisprachige Kinder darstellen als der Erwerb von Strukturen, die an der Syntax-Semantik-Schnittstelle liegen. In dieser Studie werden Englisch-Italienisch und Spanisch-Italienisch bilinguale Kinder im Alter von 6,2 bis 7,11 und 8,0 bis 10,10 untersucht. Die Autorinnen konzentrieren sich auf zwei Konstruktionen, einerseits auf die Subjektrealisierung in Form von Null oder Pronomen und andererseits auf den definiten Artikel in NPn im Plural, mit spezifischer oder generischer Referenz. Die erste Struktur wird von den Autorinnen als an der Syntax-Diskurs/Pragmatik-Schnittstelle und die zweite als an der Syntax-Semantik-Schnittstelle angesiedelte Konstruktion aufgefasst. Die SyntaxSemantik-Schnittstelle gilt als innere, die andere als externe Schnittstelle der Sprache, weil sie nach der Integration von grammatischen und außergrammatischen Informationen verlangt (vgl. Sorace & Serratrice, 2009). Die Forscherinnen argumentieren, dass der Erwerb von Strukturen an der Syntax-Diskurs/ Pragmatik-Schnittstelle eine große Herausforderung für bilinguale Kinder darstelle, sie wird aber nicht von der Kombination der zu erwerbenden Sprachen beeinflusst. Der Erwerb von Strukturen an der Syntax-Semantik-Schnittstelle ist dafür eine relativ kleine Herausforderung für zweisprachige Kinder, aber ihre Entwicklung wird davon beeinflusst, welche Sprachen erworben werden. Der Erwerb von Strukturen an beiden Schnittstellen wird vom reduzierten Input beeinflusst, d. h. wenn bilinguale Kinder weniger Kontakt zur gegebenen Sprache haben, begehen sie mehr Fehler in den Strukturen an beiden Schnittstellen. Die Schnittstellenhypothese (Interface Hypothesis) wird durch mehrere empirische Befunde unterstützt (z. B. Valenzuela, 2006; Bohnacker & Rosen, 2008), aber durch einige empirische Untersuchungen wird sie nicht bestätigt (z. B. angehenden Diskurs aufgetreten ist, aber das gemeinsame Wissen der Gesprächspartner und der Kontext macht den Referenten einzigartig. Zum Beispiel (nach Lyons, 1999: 7): Ich war gestern auf einer Hochzeit. Die Braut hatte ein blaues Kleid an.Vgl. auch Kap. 4.2. 114 Ähnliche Ergebnisse sind auch bei monolingualen Kindern festgestellt worden (Schafer & de Villiers, 2000).

Erwerb der Artikel

131

Ivanov, 2009; Rothman, 2009b; Hopp, 2010; Slabakova et al., 2012). Beispielsweise zeigt Soler (2014), dass das der erworbenen Sprache entsprechende pragmatische Wissen früher als das für die gegebene Struktur relevante syntaktische Wissen erworben werden kann. Eine alternative Erklärung für solche Ergebnisse liefern Pires und Rothman (2011), die das Integrative Model des Bilingualen Erwerbs (Intergrative Model of Bilingual Acquisition) vorschlagen. Die Autoren unterstreichen die Tatsache, dass im bilingualen Spracherwerb unterschiedliche Faktoren eine wichtige Rolle spielen. Die externe Syntax-Diskurs/Pragmatik-Schnittstelle, die in der Interface Hypothesis als Hauptursache für die möglichen Unterschiede zwischen monound bilingualem Erwerb angesehen wird, wird von Pires und Rothman (2011) als eine der möglichen Faktoren angesehen, die den bilingualen Erwerb determinieren. Einer der wichtigsten Faktoren ist die Komplexität der sprachlichen Bereiche, die erworben werden. Der Faktor der Komplexität betrifft nach Pires und Rothman (2011) nicht nur die Syntax-Diskurs/Pragmatik-Schnittstelle, sondern auch andere Schnittstellen wie zum Beispiel die Syntax-SemantikSchnittstelle. Der andere Faktor ist der Parameterumbau zwischen L1 und L2. Eine wichtige Rolle spielen auch die Verarbeitungsfaktoren bei zweisprachigen Kindern und die Eigenschaften des den Kindern zugänglichen Inputs (vgl. Pires & Rothman, 2011: 74). Das Model ist für den Erwerb von unterschiedlichen Phänomenen relevant, darunter auch für den Artikelerwerb, der eindeutig die verschiedenen Schnittstellen involviert (vgl. Kap. 4). Für die Probleme mit dem Artikelgebrauch in der L2 werden auch andere Erklärungen vorgeschlagen. Tsimpli und Mastropavlou (2007) argumentieren dafür, dass morphosyntaktische Defizite in der L2 permanent sein würden, wenn das nicht-interpretierbare Merkmal der Definitheit in der Erstsprache nicht vorkommt, weil nach den Forscherinnen der Erwerb von neuen nicht-interpretierbaren Merkmalen nach dem Abschluss des L1-Erwerbs nicht möglich sei (vgl. Failed functional features-Hypothese – Kap. 2.4). Trenkic (2007) verbindet Probleme mit dem L2-Artikelgebrauch mit andauernden pragmatischen Defiziten. Goad und White (2009) führen die Probleme auf die prosodischen Repräsentationen zurück, die aus der L1 übernommen werden und einen konsistenten Artikelgebrauch in der L2 verhindern. Die Untersuchungen des Artikelerwerbs im sukzessiven Bilingualismus zusammenfassend, muss man sagen, dass es einerseits ein Phänomen ist, das den Kindern Probleme während der Sprachentwicklung bereitet. Andererseits zeigen Untersuchungen, dass auch subtile referentielle Unterschiede von Kindern erworben werden können. Die uneinheitlichen Ergebnisse der empirischen Studien zu diesem Thema, die nur zum Teil mit der verschiedenen angewandten Forschungsmethodologie erklärt werden können, haben noch keine überzeugende theoretische Erklärung gefunden.

132

Artikel und Nullargumente im Spracherwerb

Der Gebrauch der Determinierer, und spezifisch des definiten und indefiniten Artikels, wird auch zum häufigen Gegenstand der Untersuchungen des Herkunftssprachenerwerbs. Die Resultate der Forschung sind jedoch auch in diesem Bereich nicht eindeutig. Polinsky und Scontras (2020a) zählen den Gebrauch von Determinierern zu jenen Phänomenen, bei denen sich Sprecher der Herkunftssprache nicht von monolingualen Sprechern einer gegebenen Sprache unterscheiden, auch dann, wenn die beiden Sprachen der Herkunftssprecher unterschiedliche Determinierersysteme haben. Als Beispiel für eine Untersuchung, die diese These unterstützt, kann eine Studie zu den Herkunftssprechern des Englischen, deren Umgebungssprache Hebräisch ist, gelten (Polinsky, 2018). Polinsky und Scontras (2020a) erklären die Stärke der Determinierersysteme und ihre Widerstandsfähigkeit gegenüber zwischensprachlichen Einflüssen damit, dass Determinierer Referenzbezüge im Diskurs aufstellen, und dadurch unentbehrlich für die gegenseitige Verständigung der Gesprächspartner sind. Darüber hinaus sind Determinierer strukturell markant, was auch nach Polinsky und Scontras (2020a) dazu beiträgt, dass sie in den Herkunftssprachen nicht den zwischensprachlichen Einflüssen unterliegen. Im Rahmen der Herkunftssprachenforschung gibt es aber doch einige Studien, die demonstrieren, dass sich der Gebrauch und die Interpretation der Artikel durch die Sprecher einer Herkunftssprache von denen monolingualer Sprecher unterscheiden können (vgl. Montrul & Ionin, 2010; Kupisch, 2012; Kupisch & Rothman, 2016). Zusammenfassend soll hier festgehalten werden, dass simultan zweisprachige Kinder meistens Artikel ähnlich wie monolinguale Kinder gebrauchen, obwohl es, bedingt durch Sprachkombinationen, zu Verzögerungen oder Beschleunigungen kommen kann. Sukzessiv zweisprachige Kinder und Sprecher einer Herkunftssprache können mit dem Artikel einige Probleme haben. Das Ausmaß dieser Probleme kann jedoch unterschiedlich sein, und die Forschung hat dafür noch keine allgemein gültige Erklärung geliefert.

5.3

Erwerb von Nullargumenten

5.3.1 Nullargumente im monolingualen Erwerb Die Untersuchungen zu Nullargumenten im monolingualen Erwerb sind seit den 80-er Jahren des 20. Jahrhunderts ziemlich intensiv. Das Interesse an diesem Phänomen ist in der generativen Spracherwerbsforschung am Anfang mit dem im Rahmen der Theorie der Prinzipien und Parameter vorgeschlagenen Nullsubjekt-Parameter (Chomsky, 1981; Rizzi, 1982; Jaeggli & Safir, 1989) verbunden. Spracherwerbsuntersuchungen konzentrieren sich daher auf Nullsubjekte (siehe Hyams, 1983, 1986) und auf den Zusammenhang zwischen dem Weglassen der

Erwerb von Nullargumenten

133

Subjekte und der Produktion von unflektierten anstelle von flektierten Verbformen bei Kindern (sog. root infinitives; siehe Rizzi, 1993/94). Im monolingualen Erwerb des Deutschen ist die Entwicklung der Verbflexion, der Verbstellung und der Realisierung der Subjekte eng miteinander verbunden. Untersuchungen zeigen, dass Kinder in der Anfangsphase oft unflektierte Verben in der Satzendstellung benutzen und dabei oft Subjekte weglassen (z. B. Meisel, 1990, 1994; Clahsen, 1991; Tracy, 1991, 2002, Clahsen & Penke, 1992; Clahsen et al., 1996; Lasser, 2002). In der nächsten Entwicklungsphase, in der Kinder produktiv finite Verben benutzen, stellen sie sie in die normgerechte V2Position, gleichzeitig steigt der Anteil der von ihnen realisierten Subjekte (vgl. Hamann, 1996). Die Untersuchungen des Erwerbs unterschiedlicher Sprachen zeigen, dass Kinder in der frühen Phase des Spracherwerbs Subjekte auslassen, und zwar unabhängig davon, ob sie eine Nullsubjektsprache oder eine Nicht-Nullsubjektsprache erwerben (vgl. z. B. Hyams, 1983, 1986, 2011 zum Englischen; Pierce, 1989 zum Französischen; Guasti, 1993/94 zum Italienischen; Valian & Eisenberg, 1996 zum Portugiesischen; Hamann & Plunkett, 1998 zum Dänischen). Die frühe Spracherwerbsphase, in der Subjekte ausgelassen werden, die in der Erwachsenensprache durch ein Pronomen oder eine NP ausgedrückt worden wären, ist auch im Deutschen beobachtet worden (z. B. Clahsen, 1991; Clahsen & Penke, 1992). Clahsen (1991) zeigt, dass Kinder bis zu 40 % der Subjekte in der frühen Sprachentwicklungsphase, vor dem Erwerb der Subjekt-Verb-Kongruenz, auslassen. In den späteren Phasen ist der Anteil der ausgelassenen Subjekte viel geringer, aber die Nullsubjekte kommen noch in den Daten der Kinder in nicht normgerechten Kontexten vor115. Hamann (1996) demonstriert, dass die von ihr untersuchten Kinder, die im Alter von 3;4 zu 3;7 sowie von 3;1 zu 3;4 Jahren sind, in der späteren Entwicklungsphase des Deutschen, d. h. nach dem Erwerb der Subjekt-Verb-Kongruenz, das Subjekt in der Vor-Verb-Stellung in 6,7 % bis 18,9 % der Fälle (Kind 1) und in 3,9 % bis 17,9 % der Fälle (Kind 2) auslassen (vgl. Hamann, 1996: 207–208). In der Vor-Verb-Stellung sind Nullsubjekte auch in der Erwachsenensprache zugelassen, weil diese Stellung die Topik-Stellung im Deutschen ist (vgl. Kap. 4.5). Die Prozentzahlen zu den Nullsubjekten in den Daten der Kinder sind jedoch höher als jene 4 %, die für die Erwachsenensprache charakteristisch sind (vgl. Schmitz et al., 2012). Kinder lassen auch Subjekte in der Nach-Verb-Stellung aus, obwohl das im Deutschen nicht der Norm entspricht. Die Prozentzahlen sind für diese Position jedoch geringer, und betragen von 1,2 % bis 16,7 % beim ersten Kind und von 0,8 % bis 11,0 % beim zweiten Kind in Hamanns Studie. 115 Siehe Kap. 4.5 zu den Kontexten im Deutschen, in denen die Auslassung der Subjekte in der Erwachsenensprache zugelassen ist.

134

Artikel und Nullargumente im Spracherwerb

Das Phänomen der Auslassung der Subjekte in der frühen Phase des monolingualen Erwerbs wird auf unterschiedliche Art erklärt. Hyams (1983, 1986) argumentiert, dass die von Kindern in Nicht-Nullsubjektsprachen produzierten Nullsubjekte eine Folge der nicht korrekten pro-drop-Parametersetzung sind. Die Hypothese wird jedoch stark kritisiert, weil Kinder ihre Subjektauslassungen vor allem mit unflektierten Verben gebrauchen, und sie in einigen Kontexten, wie in WH-Fragen und Nebensätzen, gar nicht benutzen, obwohl in Nullsubjektsprachen Nullsubjekte in solchen Kontexten auftauchen. Eine andere Erklärung für Nullsubjekte von Kindern schlagen Bloom (1990) und Valian (1991) vor, sie führen sie auf Verarbeitungseinschränkungen zurück. Ihre Vorhersagen sind nicht empirisch bestätigt worden, weil volle NPn nicht häufiger als Pronomen, entgegen der Annahme der eingeschränkten Verarbeitungskapazität bei Kindern, ausgelassen werden (vgl. Serratrice & Allen, 2015). Spätere Vorschläge für die Erklärung der Auslassung der Argumente durch kleine Kinder vereinbaren die syntaktische Perspektive mit der pragmatischen, die die Diskursbedingungen der referentiellen Ausdrücke berücksichtigt (siehe frühe Vorschläge dafür in Clancy, 1993, 1997 und Allen, 2000). Die Wahl der Form des referentiellen Ausdrucks wird durch mehrere Faktoren determiniert, u. a. vorangehenden Diskurs, mentale Räume, die im Bewusstsein der Gesprächspartner geschaffen werden, Sprechsituation, Gesten und Sprachverarbeitungskapazität des Sprechers. All diese Faktoren spielen eine Rolle beim Erwerb der Fähigkeit, referentielle Ausdrücke, darunter Nullsubjekte, zu benutzen (vgl. Kap. 5.1). Der Erwerb der referentiellen Ausdrücke erfordert ja nicht nur das Erlernen der morphologischen Formen, mit welchen ein Argument in der gegebenen Sprache ausgedrückt werden kann (z. B. volle NP, Pronomen, Klitika). Beim Erwerb der referentiellen Ausdrücke, darunter der Nullsubjekte, müssen sich Kinder auch ihre Distribution und ihre referentiellen Funktionen im Diskursrahmen sowie die Herstellung ihrer C/edge-Bindung aneignen (vgl. Kap. 4.3). Viele Untersuchungen zum Erwerb der referentiellen Ausdrücke betreffen nicht nur Nullsubjekte, sondern auch Nullobjekte. Im Laufe des monolingualen Erwerbs durchlaufen Kinder eine Phase, in der sie Objekte auslassen, unabhängig davon, ob sie eine Nullobjektsprache oder eine Nicht-Nullobjektsprache erwerben (siehe z. B. Pérez-Leroux et al., 2017 für eine Zusammenfassung der Befunde). Die den Diskursbedingungen entsprechende Realisierung der Objekte wird in verschiedenen Sprachen unterschiedlich schnell erworben, und der Anteil der Nullobjekte kann in einigen Sprachen höher als in anderen sein (siehe Varlokosta et al., 2016 für einen Vergleich der Daten aus unterschiedlichen Sprachen). Im Deutschen lassen Kinder Objekte weniger häufig aus als Subjekte. Hamann (1996) zeigt, dass die von ihr untersuchten 3-jährigen Kinder Objekte in 6 % der

Erwerb von Nullargumenten

135

Fälle auslassen. Bei Subjekten liegen die Auslassungswerte bei 9 %-10 %. Der Unterschied in der Häufigkeit der Subjekt- und Objektauslassungen ähnelt dem Größenverhältnis in den Daten der erwachsenen Sprecher des Deutschen (Ruppenhofer, 2018). Die Mehrheit der Objektauslassungen geschieht bei Kindern in der Vor-Verb-Stellung, die als Topik-Position die Benutzung der Nullobjekte im Deutschen zulässt. In der Nach-Verb-Stellung werden Objekte von den Kindern selten weggelassen. Hamann (1996) berichtet über einen generellen Anteil von ca. 2 % der Nullobjekte in der nicht normgerechten Nach-VerbStellung in den Sprachdaten der Kinder. Bei einem Kind liegt der Wert zwischen 1,3 % und 5 %, und bei dem anderen zwischen 0,5 % und 2,3 % in den einzelnen untersuchten Perioden. Auch in der Studie von Varlokosta et al. (2016), die elizitierte Daten zur Objektrealisierung in einem pronominalen Kontext in mehreren Sprachen von Kindern im Alter von ca. 5 Jahren darstellen, benutzen die L1-Deutsch erwerbenden Kinder in 89 % der Fälle Pronomen. Die NPn werden durch diese Kinder in 4,6 % realisiert und Objektauslassungen treten in 3,4 % der Fälle auf. Die Daten zeugen davon, dass im monolingualen Erwerb des Deutschen Nullobjekte und ihre korrekte Platzierung relativ schnell erworben werden. In einigen Sprachen, wie beispielsweise im Polnischen, dauert der Erwerb des komplexeren Systems der Nullargumente länger (vgl. Smoczyn´ska, 1985). Einige Studien zu Nullobjekten im monolingualen Erwerb des Polnischen zeigen, dass Kinder eine Phase durchlaufen, in der sie Objekte ziemlich oft auslassen (Mykhaylyk & Sopata, 2016; Sopata, 2016; Varlokosta et al., 2016). Darüber hinaus scheinen sie im Alter zwischen drei und fünf Jahren nicht zwischen Kontexten zu unterscheiden, in denen Nullformen erscheinen oder nicht erscheinen können. Erst im Alter von sechs Jahren werden Nullobjekte im monolingualen Erwerb des Polnischen ähnlich den Nullobjekten in der Erwachsenensprache verwendet, weil sie überwiegend in angemessenen Diskurskontexten erscheinen (vgl. Sopata, 2016). Erklärungen für Objektauslassungen im Laufe des monolingualen Erwerbs können in zwei Ansätze, den grammatischen und den pragmatischen, eingeteilt werden. Im Rahmen des grammatischen Ansatzes werden die Objektauslassungen auf die Verarbeitungskomplexität der weggelassenen Einheiten, meistens der klitischen Elemente, zurückgeführt (z. B. Hamann et al., 1996; Jakubowicz et al., 1997; Zesiger et al., 2010). In allen Erklärungsvorschlägen dieser Gruppe wird eine Art von Defizit des Wissens der Kinder über syntaktische oder morphophonologische Eigenschaften der Objekte angenommen. Wexler et al. (2004) sowie Gavarró et al. (2010) nehmen an, dass die mehrfachen Überprüfungsoperationen bei Klitika den Kindern Probleme bereiten (Unique Checking Constraint). In Sprachen, in denen eine solche Operation angenommen wird (z. B. Französisch, Italienisch, Katalanisch), kommt es zu häufigeren Objekt-

136

Artikel und Nullargumente im Spracherwerb

auslassungen beim Spracherwerb. Andere Forscher verbinden Objektauslassungen mit jenen Problemen, die Klitika Kindern bereiten (Grüter, 2006; Grüter & Crago, 2012), weil sie annehmen, dass vor allem Klitika von Kindern weggelassen werden. Auf der anderen Seite steht die Erklärung von Schaeffer (2000), die annimmt, dass Objektauslassungen auf die noch nicht vollständig entwickelte pragmatische Komponente der Sprache der Kinder zurückzuführen sind. Die Vorschläge der pragmatischen Gruppe erklären die Auslassung der Argumente mit unterschiedlichen Faktoren, die mit dem Diskurs zusammenhängen. Die Studien fokussieren auf verschiedene Eigenschaften des Diskurses und der Referenten, z. B. auf das Vorhandensein des Referenten in der Umgebung, auf den Kontrast zwischen möglichen Referenten, auf ihre Neuigkeit und Person (Allen, 2000), auf die gemeinsame Aufmerksamkeit der Gesprächspartner (Skarabela et al., 2013) und auf die Anzahl der Referenten (Serratrice, 2008). Viele Studien belegen jedoch, dass Kinder für pragmatische Faktoren, die den Gebrauch der Nullargumente bedingen (z. B. Hughes & Allen, 2006; siehe Hyams, 2011 für eine Zusammenstellung der Studien), sensibel sind. Jene Forscher, die Objektauslassungen beim Erwerb von Sprachen, die Nullobjekte zulassen, zu erklären versuchen, unterstreichen, dass die Option der Nullform von Kindern relativ lange bevorzugt werden kann (vgl. Allen, 2000 zum Inuktitut oder Costa & Lobo, 2007; Silva, 2010; Costa et al., 2012 zum Portugiesischen). Die Natur der Nullformen, die von Kindern gebraucht werden, kann sich von der der Erwachsenen unterscheiden. Pérez-Leroux et al. (2008) und Pirvulescu et al. (2012) argumentieren dafür, dass die Nullformen der Kindersprache universale minimale Strukturen, die sog. default null cognate objects sind116. Costa und Lobo (2007) behandeln die Objektauslassungen von Kindern auch als Formen, die sich von den zielsprachlichen Nullobjekten unterscheiden117. Sopata (2016) argumentiert auch dafür, dass sich die von kleinen Kindern verwendeten Nullelemente von den Nullobjekten der Erwachsenen unterscheiden. Kleine Kinder verlassen sich mehr auf die Diskurslizensierung bei der Interpretation der Nullelemente (vgl. Roeper, 1999; Serratrice et al., 2004), und umgehen den syntaktischen Mechanismus der C/edge-Bindung, den sie zu der Zeit noch nicht erworben haben. Objektauslassungen bei Kindern sind also nicht gleich den Nullobjekten in der Erwachsenensprache, die Bündel von syntakti-

116 Pérez-Leroux et al. (2008) und Pirvulescu et al. (2012) nehmen bei intransitiven Verben (z. B. tanzen) eine universale Struktur mit einem Kognat als Objekt (z. B. einen Tanz tanzen) an, das mit dem Verb zusammengeschmolzen ist. Sie schlagen weiter vor, dass Kinder diese null cognate objects auch für transitive Verben übergeneralisieren. 117 Costa et al. (2012) betrachten die Nullformen in der Kindersprache als Übergeneralisierung jener Formen, die Teil der Zielgrammatik sind.

Erwerb von Nullargumenten

137

schen Merkmalen sind (vgl. Kap. 4.3)118. Der volle Erwerb der Nullargumente involviert ihre syntaktische Bindung an die stillen C/edge-Merkmale (Sigurðsson, 2011; 2014) und ihre Interpretation in Hinsicht auf den pragmatischen Kontext (vgl. Ariel, 1991; De Cat, 2015; Serratrice & Herve, 2015). Es sind komplexe Aufgaben, die Kinder im monolingualen Erwerb der gegebenen Sprache erst mit der Zeit bewältigen. Die Tatsache, dass die Nullformen im monolingualen Erwerb des Deutschen meistens in der zielsprachlichen Position relativ früh erscheinen (siehe Hamann, 1996) und dass sie selten in unzulässigen Kontexten von Kindern gebraucht werden (siehe Varlokosta u.a, 2016), deutet darauf hin, dass das System der Nullargumente im Deutschen, d. h. Topik-drop, für Kinder transparent ist, und sie schnell Nullargumente gebrauchen, die den Formen der Erwachsenensprache ähneln (vgl. Kap. 4.3). In einigen anderen Sprachen, wie beispielsweise im Polnischen oder im Portugiesischen, dauert es länger, was auf das komplexere System der Nullargumente in diesen Sprachen zurückgeführt wird (vgl. Sopata et al., 2021). Als Fazit lässt sich festhalten, dass im monolingualen Erwerb Subjekte und Objekte in der Anfangsphase oft ausgelassen werden. In der Zeit nach dem Erwerb der Subjekt-Verb-Kongruenz werden die Nullargumente in einigen Sprachen, wie im Deutschen, relativ schnell zielsprachig verwendet, und in einigen anderen Sprachen, in denen das System der Nullargumente komplexer ist, dauert die Aneignung der Fähigkeit, Nullobjekte normgerecht zu gebrauchen, etwas länger.

5.3.2 Nullargumente im bilingualen Erwerb Der Erwerb der referentiellen Ausdrücke ist ein häufiger Gegenstand der Erstspracherwerbsforschung, weil der Prozess uns einen Einblick liefern kann, wie die Schnittstelle zwischen Syntax, Diskurs und Pragmatik in der menschlichen Sprache funktioniert, und wie sie von Kindern aufgebaut wird. Der Prozess des Aufbaus der Syntax-Diskurs/Pragmatik-Schnittstelle ist noch faszinierender, wenn im Gehirn dieser Kinder zwei unterschiedliche Sprachsysteme aufgebaut werden, wie es bei zweisprachigen Kindern ja der Fall ist. Die zwischensprachlichen Unterschiede, oder einfach das Vorhandensein von zwei Sprachsystemen im Gehirn, können die Entwicklung des Sprachbereichs beeinflussen, auch, wenn die Sprachen als separate Systeme zu betrachten sind (vgl. Kap. 2.5.1). Die Forschung zum Erwerb von Nullsubjekten in bilingualen Kontexten hat sich zuerst auf Sprachkombinationen konzentriert, in denen eine Sprache 118 Vgl. Sopata (2016) zur detaillierten Diskussion zu diesem Thema.

138

Artikel und Nullargumente im Spracherwerb

Nullsubjekte zulässt und die andere nicht. Die ersten Untersuchungen auf diesem Gebiet der Subjektrealisierung bei zweisprachigen Kindern zeigen, dass sie bei der Wahl der referentiellen Ausdrücke die Regeln der gegebenen Sprache befolgen (Meisel, 1989; Paradis & Genesee, 1996). Die späteren Untersuchungen zu den referentiellen Ausdrücken im bilingualen Erwerb identifizieren jedoch diesen Bereich als Lokus möglicher zwischensprachlicher Einflüsse. Unterschiedliche Studien zeigen einen höheren Gebrauch von overten, also phonetisch realisierten Subjekten, in Nullsubjektsprachen von zweisprachigen Kindern im Vergleich zu monolingualen Kindern. Overte Subjekte treten auch in Kontexten auf, in denen sie pragmatisch unangebracht sind (z. B. Paradis & Navarro, 2003; Serratrice et al., 2004; Hacohen & Schaeffer, 2007; Haznedar, 2010; Schmitz et al., 2012; Silva-Corvalán, 2014). Die Mehrheit der pragmatisch unangebrachten overten Subjekte kommt in sprachlichen Daten bilingualer Kinder zu dem Zeitpunkt vor, wenn der konsistente Gebrauch von pronominalen Subjekten bei Kindern zu sehen ist (Haznedar, 2010: 130). Zweisprachige Kinder akzeptieren auch die overten Subjekte in den Nullsubjektsprachen häufiger als monolinguale Kinder, wenn ihre andere Sprache eine Nicht-Nullsubjektsprache ist (Montrul, 2004; Tsimpli et al., 2004; Sorace et al., 2009). In einigen Studien, in denen Spontandaten von bilingualen Kindern untersucht werden, wird jedoch kein Beleg für den höheren Gebrauch overter Subjekte gefunden (siehe Serratrice & Hervé, 2015 für eine Zusammenstellung). Das Ausmaß des Gebrauchs pragmatisch unangebrachter overter Subjekte in der Nullsubjektsprache ändert sich mit der Zeit stark, und ist unter anderem davon anhängig, wie dominant die Nicht-Nullsubjektsprache bei den zweisprachigen Kindern ist (vgl. Silva-Corvalán, 2014). Sopata et al. (2021) zeigen in einer Untersuchung von deutschpolnisch bilingualen Kindern im Alter von 5–13 Jahren, dass sich die simultan zweisprachigen Kinder im Gebrauch der Nullsubjekte nicht von den monolingualen Deutsch sprechenden Kindern unterscheiden. Die Studie zeigt jedoch, dass die sukzessiv bilingualen Kinder von den monolingualen Kindern im vergleichbaren Alter abweichen, wenn es um den Gebrauch der Nullsubjekte geht. Die Ergebnisse der Untersuchung demonstrieren also, dass die Übergeneralisierung der overten Subjekte durch sukzessiv zweisprachige Kinder auch bei einer Sprachkombination auftreten kann, in der beide Sprachen Nullsubjekte zulassen119. Die Übergeneralisierung der overten Subjekte in den Nullsubjektsprachen bei bilingualen Kindern, die eine Nullsubjektsprache und eine Nicht-Nullsubjektsprache erwerben, wird unterschiedlich erklärt. Paradis und Navarro (2003) argumentieren dafür, dass die Übergeneralisierung durch die Häufigkeit des 119 Vgl. Kap. 4.5 zur Beschreibung der unterschiedlichen Nullsubjekteigenschaften im Deutschen und Polnischen.

Erwerb von Nullargumenten

139

Auftretens der overten Subjekte in der Nicht-Nullsubjektsprache verursacht wird. Serratrice et al. (2004) schlagen ein ähnliche Erklärung vor, weil sie annehmen, dass die overten Subjekte in den Nullsubjektsprachen, wie beispielsweise im Italienischen, eine markierte Option sind, die mit den Diskursmerkmalen [+topic] und [+focus] assoziert werden. In den Nicht-Nullsubjektsprachen, wie beispielsweise im Englischen, sind die overten Subjekte eine unmarkierte Default-Option. Als Folge des häufigen Gebrauchs der overten Subjekte als unmarkierte Option in Nicht-Nullsubjektsprachen bleicht die Assoziierung der overten Subjekte mit den Diskursmerkmalen [+topic] und [+focus] in den Nullsubjektsprachen bei zweisprachigen Kindern aus. Das Ausbleichen führt zum Gebrauch der phonetisch realisierten Subjekte in pragmatisch unangebrachten Kontexten. Auch Silva-Corvalán (2014) verbindet das Phänomen der Übergeneralisierung overter Subjekte in Nullsubjektsprachen durch bilinguale Kinder mit dem zwischensprachlichen Einfluss. Die Forscherin postuliert in diesem Zusammenhang einen zwischensprachlichen Priming-Effekt. Die Erklärungen der Übergeneralisierung der overten Subjekte in den Nullsubjektsprachen mit dem zwischensprachlichen Einfluss sind jedoch nicht überzeugend in jenen Fällen, in denen beide Sprachen der Bilingualen Nullsubjektsprachen sind. In solchen Fällen kann ja der höhere Gebrauch der overten Subjekte nicht auf den häufigeren Kontakt zur Nicht-Nullsubjektsprache zurückgeführt werden (vgl. Sorace et al., 2009; Rinke & Flores, 2018; Sopata et al., 2021). Eine alternative Erklärung wird von Sopata et al. (2021) vorgeschlagen. Die Forscher sehen den höheren Gebrauch der overten Subjekte eher als Vermeidung der Anwendung von Nullsubjekten, deren Erwerb als Bündel von syntaktischen Merkmalen komplex ist, und mehr Zeit bei zweisprachigen Kindern in Anspruch nehmen kann. Auf die anderen Erklärungen, die sowohl Nullsubjekte als auch Nullobjekte betreffen, wird später noch eingegangen. Die Untersuchungen zur Realisierung des Objekts bei zweisprachigen Kindern zeigen, dass sie dazu neigen, Nullobjekte in Nicht-Nullobjektsprachen häufiger als einsprachige Kinder überzugeneralisieren (z. B. Pirvulescu et al., 2014). Dieser Befund steht in klarem Kontrast zu den Daten zur Subjektrealisierung durch bilinguale Kinder, die dazu neigen, die Option overter Subjekte in den Nullsubjektsprachen überzugeneralisieren. Der Unterschied zwischen den zweisprachigen und einsprachigen Kindern bei der Realisierung des Objekts besteht darin, dass die Phase der Auslassung der Objekte, die auch bei monolingualen Kindern auftritt (siehe Unterkap. 5.3.1), bei bilingualen Kindern länger sein kann (Pérez-Leroux et al., 2008; Pirvulescu et al., 2014; Rinke et al., 2019; Sopata, 2021). Die Ergebnisse der Untersuchung polnisch-deutsch zweisprachiger Kinder im Alter zwischen 2,8 und 5,8 Jahren veranschaulichen, dass sukzessiv bilinguale

140

Artikel und Nullargumente im Spracherwerb

Kinder mehr Nullobjekte im Deutschen als monolinguale Deutsch erwerbende Kinder benutzen (siehe Sopata, 2021). Unterschiede zwischen monolingualen und bilingualen Kindern werden auch im Falle jener Kinder festgestellt, deren eine Sprache ihre Herkunftssprache ist. Dabei konzentrieren sich viele Untersuchungen auf den Gebrauch von pronominalen Subjekten (Montrul, 2002, 2004; Rothman, 2007, Rinke & Flores, 2018). Die Objektrealisierung in der Herkunftssprache weicht auch in einigen Sprachen von der monolingualen Entwicklung ab, indem die Phase der Objektauslassung bei zweisprachigen Kindern etwas verlängert zu sein scheint (siehe beispielweise Rinke et al., 2019 für Polnisch und Portugiesisch als Herkunftssprachen in Kontakt mit dem Deutschen). Viele Forscher, die die von den monolingualen Kindern abweichende Argumentrealisierung bilingualer Kinder zu erklären versuchen, verbinden dieses Phänomen mit dem zwischensprachlichen Einfluss (vgl. Kap. 2.5.2). In der Forschung werden vor allem drei Faktoren genannt, die es wahrscheinlich machen, dass das gegebene Phänomen dem zwischensprachlichen Einfluss unterliegt. Der erste Faktor ist die Lokalisierung des Phänomens an der Schnittstelle zwischen Syntax und Pragmatik (Hulk & Müller, 2000; Müller & Hulk, 2001; Sorace, 2011) oder Syntax und Semantik (Montrul & Ionin, 2010; Sorace & Serratrice, 2009). Der zweite ist die strukturelle Überlappung, die zur syntaktischen Ambiguität führt (Döpke, 1998; Müller, 1998)120. Der dritte vorgeschlagene Faktor ist die syntaktische Komplexität (z. B. Jakubowicz, 2002; Rothman, 2009b; Strik & Pérez-Leroux, 2011). Hulk und Müller (2000) sowie Müller und Hulk (2001) formulieren ihre Hypothese über den zwischensprachlichen Einfluss, um die höheren Anteile an Objektauslassungen in den Daten von deutsch-französisch, niederländischfranzösisch und deutsch-italienisch simultan zweisprachigen Kindern im Vergleich zu einsprachigen Kindern zu erklären. Sie führen die höhere Anzahl an Objektauslassungen in romanischen Sprachen auf den Einfluss der Topik-dropEigenschaft aus den germanischen Sprachen zurück. Im sukzessiven bilingualen Erwerb sind die zwischensprachlichen Einflüsse häufiger (vgl. Kap 2.6.2). Grüter und Crago (2012) liefern zwar Beweise dafür, dass die Nullobjekte von der Erstsprache nicht in die frühe Zweitsprache von den Kindern übernommen werden. Sopata (2021) zeigt jedoch in ihrer Studie, dass sukzessiv zweisprachige Kinder, die L1 Polnisch und L2 Deutsch sprechen, im Deutschen mehr Nullobjekte als einsprachige Kinder benutzen. Sie verbindet den höheren Gebrauch der Nullelemente mit dem zwischensprachlichen Einfluss, der 120 Von syntaktischer Ambiguität spricht man, wenn eine Sprache über eine Konstruktion zum Ausdruck eines Phänomens verfügt, und die andere Sprache über zwei solche Konstruktionen verfügt.

Erwerb von Nullargumenten

141

jedoch nicht als direkter Transfer der Nullargumente aus der L1 in die L2 zu sehen ist. Vielmehr handelt es sich dabei um einen indirekten zwischensprachlichen Einfluss, der in der Übernahme einer Strategie des Gebrauchs von Nullargumenten besteht, die bei den monolingualen, 3–4 jährigen Polnisch erwerbenden, Kindern zu sehen ist (Sopata, 2016). Die Strategie der Durchsuchung des allgemeinen pragmatischen Kontextes und der Umgehung der syntaktischen Einbettung der Nullargumente in den Diskurs (C/edge-Bindung – vgl. Kap. 4.3) erklärt am besten den Gebrauch von Nullobjekten im Polnischen in den Daten der 3–4 jährigen einsprachigen Kinder (Sopata, 2016) und im Deutschen bei den 3–5 jährigen sukzessiv zweisprachigen Kindern mit L1 Polnisch und L2 Deutsch (Sopata, 2021). Der höhere Gebrauch der Nullobjekte durch bilinguale Kinder, im Vergleich zu monolingualen, wird auch von einigen Forschern als Ergebnis des Bilingualismus an sich aufgefasst, der mit reduziertem Input einhergehe (Pérez-Leroux et al., 2008; Pirvulescu et al., 2014)121. In einigen Sprachbereichen führt die InputVariabilität und der reduzierte Kontakt zu beiden Sprachen, die für den bilingualen Erwerb typisch sind (siehe jedoch dazu Kap. 3.4), zu einer längeren Etappe, während der eine Default-Repräsentation einer Struktur, beispielsweise Objektauslassung, in beiden Sprachen aufrechterhalten wird (vgl. Pirvulescu et al., 2014: 501). Pérez-Leroux et al. (2008) fassen Objektauslassungen als minimale Strukturen, sog. default null cognate objects auf, die in der mentalen Grammatik von Kindern zulässig sind. Wenn Kinder im Input unterschiedliche Formen von Nullobjekten antreffen, behalten sie diese Default-Option länger. Untersuchungen zu Nullargumenten stellen auch einen der Ausgangspunkte für eine andere Hypothese zur Erklärung des Verlaufs des bilingualen Erwerbs von unterschiedlichen Sprachbereichen – die sog. Schnittstellenhypothese (Interface Hypothesis – Sorace & Filiaci, 2006; Sorace & Serratrice, 2009) dar. Die Forscherinnen unterscheiden zwischen Strukturen, die an der Schnittstelle zwischen der Syntax und dem Diskurs/der Pragmatik oder an der Syntax-Semantik-Schnittstelle liegen (vgl. Kap. 5.2.2). Nullsubjekte werden hier als Konstruktionen verstanden, die an der Syntax-Diskurs/Pragmatik-Schnittstelle liegen, und dadurch eine große Herausforderung für zweisprachige Kinder darstellen. Diese Hypothese wird durch einige Untersuchungen bestätigt, durch andere wiederum widerlegt (vgl. Kap. 5.2.2). Der Erwerb der Strukturen, die an der Syntax-Diskurs/Pragmatik-Schnittstelle liegen, wird auch als Herausforderung für zweisprachige Kinder im Integrativen Model des Bilingualen Erwerbs (Pires & Rothman, 2011 – Intergrative Model of Bilingual Acquisition) angesehen (vgl. Kap. 5.2.2). Für die Forscher ist es jedoch nur ein Faktor unter anderen, die den bilingualen Erwerb beeinflussen. 121 Siehe Kap. 3 zum Inputfaktor.

142

Artikel und Nullargumente im Spracherwerb

Als den wichtigsten Faktor betrachten sie die Komplexität der erworbenen Sprachbereiche. Rothman (2009b) argumentiert, dass die inhärente Komplexität der Konstruktionen, die an den Schnittstellen liegen, zur zwischensprachlichen Beeinflussbarkeit der Strukturen führt. Da der Gebrauch der Nullargumente eine sehr komplexe Aufgabe ist, stellt sie einen Bereich dar, in dem sich der bilinguale vom monolingualen Erwerb unterscheiden kann. Sopata et al. (2021) zeigen beispielsweise, dass sukzessiv zweisprachige Kinder mit L1 Polnisch und L2 Deutsch Nullsubjekte in der L2 Deutsch vermeiden. Der Befund kann überraschen, weil im Polnischen Nullsubjekte sehr häufig auftreten. Die Forscher führen das Ergebnis auf die Komplexität der Nullargumente zurück (vgl. Rothman, 2009b), bei deren Gebrauch die syntaktischen und pragmatischen Informationen integriert werden müssten. Darüber hinaus zeigt die Studie, dass die polnisch-deutsch zweisprachigen Kinder der Nullobjekte, die in beiden Sprachen einige Ähnlichkeiten aufweisen, früher erwerben als die Nullsubjekte, die in beiden Sprachen ganz unterschiedlicher Natur sind (Topic drop im Deutschen und pro drop im Polnischen – vgl. Kap. 4.5). Die Studie zeigt daher, dass der Erwerb der Nullargumente nicht einfach ein Prozess von Auslassungen von sprachlichen Einheiten ist, sondern ein komplexer Prozess, in dem sich Kinder die Nullargumente als Bündel von stillen, aber syntaktisch aktiven, Merkmalen aneignen müssen. Den bilingualen Erwerb von Nullargumenten zusammenfassend soll hier festgestellt werden, dass die Daten von simultan zweisprachigen meistens weniger als die von sukzessiv zweisprachigen Kindern von einsprachigen Kindern abweichen. Der Gegensatz zwischen dem Erwerb von Nullsubjekten und Nullobjekten von zweisprachigen Kindern ist bemerkenswert. Während die meisten Studien über die Übergeneralisierung von overten Subjekten bei bilingualen Kindern berichten, veranschaulichen viele Untersuchungen zur Objektrealisierung, dass Nullobjekte von zweisprachigen Kindern übergeneralisiert werden. Abschließend zu Kapitel 5 ist festzuhalten, dass die Erforschung des Erwerbs der Bereiche der Artikel und der Nullargumente uns einen sehr guten Einblick in die menschliche Spracherwerbsfähigkeit gewähren kann. Nominalphrasen mit einem bestimmten oder unbestimmten Artikel sind volle Formen, die dem Hörer mehrere Informationen liefern, um den Referenten im Bewusstsein der Gesprächspartner zu aktivieren. Nullargumente sind hingegen reduzierte Formen, die wenig Information liefern, weil der Referent im Bewusstsein der Gesprächspartner aktiviert ist. Parallele Untersuchungen zum Erwerb beider Formen können daher dazu beitragen, einen besseren Einblick in das Zusammenspiel der kognitiven und sprachlichen Elemente bei der Aufstellung von Referenzbeziehungen zu gewinnen.

Kapitel 6: Methodologie der empirischen Untersuchungen

6.1

Fragestellung

Das übergreifende Ziel der vorliegenden Arbeit ist, zum besseren Verständnis des bilingualen Spracherwerbsprozesses beizutragen. Der Gegenstand der Untersuchung ist die Entfaltung des Referenzsystems im Deutschen bei den deutschpolnisch zweisprachigen Kindern, die einerseits Deutsch als eine ihrer Erstsprachen oder als ihre frühe Zweitsprache und andererseits als Mehrheits- oder Herkunftssprache erwerben. Dabei konzentriere ich mich auf zwei Bereiche der Sprachstruktur des Deutschen, und zwar auf den Erwerb des bestimmten und unbestimmten Artikels zum Ausdruck der definiten oder indefiniten sowie spezifischen oder unspezifischen Referenz sowie den Erwerb der Nullargumente. Das erste der Ziele der vorliegenden Arbeit ist ein Vergleich des Erwerbs von den Sprachbereichen im Deutschen durch deutsch-polnisch zweisprachige Kinder, wodurch die Einsicht in den Aufbau des Referenzsystems durch zweisprachige Kinder gewonnen wird. Das zweite Ziel ist einen Einblick in das Zusammenspiel des Alters- und Inputfaktors zu gewinnen, die auf den Erwerb des Artikel- und Nullargumentsbereichs im Deutschen bei zweisprachigen Kindern im Alter von 7–13 Jahren einwirken. Wie in Kapiteln 2 und 3 dargestellt, wird der Spracherwerb durch mehrere Faktoren determiniert. Einer der wichtigsten Faktoren ist einerseits das Alter zu Beginn des Spracherwerbs, woraus sich die Einteilung der Spracherwerbsprozesse in den Erwerb der Erstsprache und den Erwerb der (frühen) Zweitsprache ergibt (vgl. Kap. 2). Andererseits gehört auch der Input zu den wichtigsten Faktoren, die den Spracherwerb beeinflussen. Dieser Faktor lässt die erworbene Sprache als Herkunftssprache vs. Mehrheitssprache bezeichnen (vgl. Kap. 3). Ein präziser Vergleich des Erwerbs der gewählten Bereiche des Deutschen durch Kinder, die einerseits Deutsch als Erstsprache oder als frühe Zweitsprache und andererseits als Herkunftssprache oder als Mehrheitssprache erwerben, gewährt Einblicke in die Mechanismen des bilingualen Spracherwerbs.

144

Methodologie der empirischen Untersuchungen

Die sprachlichen Bereiche, deren Erwerb in der vorliegenden Arbeit untersucht werden, sind Artikel und Nullargumente. Nominalphrasen mit unbestimmtem Artikel führen neue Referenten in den Diskurs im Deutschen ein und liefern daher dem Hörer viele lexikalische Informationen. Sie sind das Paradebeispiel für volle referentielle Ausdrücke. Auf der anderen Seite stehen die Nullargumente, die sich nur auf hochzugängliche Entitäten122 beziehen können, deren Existenz sowie Identität durch den Kontext im Deutschen bestimmt werden. Sie liefern keine lexikalische Informationen und gelten daher als reduzierte Formen. Nominalphrasen mit dem bestimmten Artikel stehen im Deutschen in der Mitte des Kontinuums (vgl. Kap. 4). Der Erwerb der Artikel und der Nullargumente ist eng mit dem Erwerb der Referenz im Allgemeinen verbunden. Der Erwerb der Fähigkeit, einen Referenzbezug herzustellen, beinhaltet nicht nur die Aneignung der Formen referentieller Ausdrücke und ihren Einsatz in den Satzrahmen. Die Referenzherstellung setzt kognitive Fähigkeiten voraus, die ermöglichen, auf gegebene Entitäten in der Welt Bezug zu nehmen. Kinder müssen auch lernen, wie definite Argumente an ihre C/edge-Binder zu binden sind (vgl. Kap. 5). Auf Grund dessen ist der Erwerb dieser beiden Bereiche, des Artikels und der Nullargumente, für den Gegenstand der empirischen Untersuchung der vorliegenden Arbeit gewählt worden. Sowohl Nominalphrasen mit bestimmtem oder unbestimmtem Artikel als auch Nullargumente sind referentielle Ausdrücke, deren Gebrauch die Integration von Informationen aus mehreren Bereichen, und zwar aus Morphosyntax und Diskurs/Pragmatik, verlangt. Sie sind also Phänomene, die an der Schnittstelle liegen (vgl. Kap. 5). Nominalphrasen mit dem unbestimmten Artikel, Nominalphrasen mit dem bestimmten Artikel und Nullargumente unterscheiden sich stark in der Hinsicht auf den Diskursstatus des Referenten, auf den sie referieren können. Ihr Erwerb, und vor allem der Erwerb ihrer referentiellen Funktionen, kann also unterschiedlich verlaufen. Während vieles über den Erwerb der Artikel und der Nullargumente in der Erstsprache geklärt und in der relevanten Literatur beschrieben worden ist (vgl. Kap. 5.2.1 und 5.3.1), bleiben noch einige Fragen in Bezug auf die Entwicklung ihrer Funktionen im bilingualen Erwerb offen (vgl. Kap. 5.2.2 und 5.3.2). Forschungsfragen, die sich in Bezug auf den Gegenstand und die Zielsetzung der vorliegenden empirischen Studie ergeben, können folgendermaßen formuliert werden: 1) Inwieweit ist der bilinguale Erwerb der Artikel zum Ausdruck der definiten oder indefiniten sowie spezifischen oder unspezifischen Referenz im Deutschen als Mehrheits-, Herkunfts-, Erst- und frühe Zweitsprache dem monolingualen Erwerb ähnlich? 122 Vgl. Abb. 4–2 in Kap. 4.2 zur Zugänglichkeit der Referenten.

Probanden

145

2) Unterscheidet sich der bilinguale Erwerb der Artikel zum Ausdruck der definiten oder indefiniten sowie spezifischen oder unspezifischen Referenz im Deutschen als Mehrheits-, Herkunfts-, Erst- und frühe Zweitsprache voneinander? 3) Inwieweit ist der bilinguale Erwerb der Nullargumente im Deutschen als Mehrheits-, Herkunfts-, Erst- und frühe Zweitsprache dem monolingualen Erwerb ähnlich? 4) Unterscheidet sich der bilinguale Erwerb der Nullargumente im Deutschen als Mehrheits-, Herkunfts-, Erst- und frühe Zweitsprache voneinander? 5) Sind der bilinguale Erwerb der Artikel und der Nullargumente im Deutschen als Mehrheits-, Herkunfts-, Erst- und frühe Zweitsprache sich ähnlich? Gibt es Unterschiede zwischen den Erwerbsprozessen im Bereich der Artikel und der Nullargumente vor dem Hintergrund der Entwicklung der allgemeinen Sprachkompetenz? 6) Welcher von den Faktoren, Alter bei Erwerbsbeginn des Deutschen, Alter bei Erwerbsbeginn des Polnischen, kumulativer Input im Deutschen und kumulativer Input im Polnischen, beeinflusst am meisten den Erwerb der Artikel und der Nullargumente im Deutschen bei den deutsch-polnisch zweisprachigen Kindern? Um Frage 1 und 3 beantworten zu können, werden die Sprachdaten von vier Gruppen bilingualer Probanden, die Deutsch als Erst- und frühe Zweitsprache sowie als Mehrheits- und Herkunftssprache mit monolingualen Kindern verglichen, die Deutsch erwerben. Bei der Beantwortung der Frage 2 und 4 werden die sprachlichen Daten der vier Gruppen miteinander verglichen. Die Frage 5 wird durch einen Vergleich der Daten für die zwei Sprachbereiche, d. h. zu Artikeln und Nullargumenten, in allen vier Gruppen beantwortet. Um die Frage 6 beantworten zu können, werden die Daten der zweisprachigen Kinder der logistischen Regressionsanalyse ohne Gruppeneinteilung unterzogen.

6.2

Probanden

Die vorliegende empirische Untersuchung betrifft Daten von zweisprachigen Kindern, die im Zeitraum zwischen 2016 und 2018 in Polen und in Deutschland erhoben worden sind. Die im vorliegenden Unterkapitel dargestellten Informationen zu den Probanden sind anhand eines ausführlichen Fragebogens gesammelt worden, mit Hilfe dessen die Eltern der untersuchten Kinder interviewt worden sind. Insgesamt werden die Daten von 63 zweisprachigen Kindern im Rahmen der vorliegenden Studie analysiert. Alle zweisprachigen Kinder, die hier untersucht

146

Methodologie der empirischen Untersuchungen

werden, erwerben dieselben Sprachen: Deutsch und Polnisch. Es handelt sich immer um den Erwerb unter natürlichen Bedingungen, d. h. die Sprachen werden hauptsächlich durch Interaktionen mit Muttersprachlern und auf Grund eines natürlichen Inputs erworben. Eine zusätzliche institutionelle Sprachförderung ist bei manchen Kindern involviert. Bei keinem Kind, das in der vorliegenden Arbeit untersucht wird, besteht ein Verdacht auf das Vorliegen einer spezifischen Sprachentwicklungsstörung. Die in der vorliegenden Studie berücksichtigten zweisprachigen Kinder sind alle im Alter von 7;0 bis 12;11 Jahren. Ihr Durchschnittsalter ist 9;7 Jahre. Die Standardabweichung der Alterswerte bei der Gesamtheit der zweisprachigen Kinder beträgt 1;8 Jahre. In der vorliegenden Arbeit werden Daten von Kindern nicht berücksichtigt, die jünger oder älter als die angegebene Altersspanne sind. Die Auswahl ist mit dem Forschungsdesign der Arbeit verbunden, die auf die Erforschung des Erwerbs von referentiellen Ausdrücken abzielt. Für die Altersstufe über 7 Jahre kann man annehmen, dass die kognitiven Voraussetzungen für die Referenzherstellung bei den Kindern hinreichend entwickelt sind (vgl. Kap. 5.1.1). Ab 13 Jahren kann man wiederum kaum mehr von Kindern reden, weil sie als Teenager ungefähr in diesem Alter in die Hochphase der Pubertät übergehen. Die 63 zweisprachigen Kinder werden in vier Gruppen eingeteilt. Die Einteilung erfolgt nach zwei Kriterien: Art der Zweisprachigkeit und Art des Inputkontextes. In Hinsicht auf die Art der Zweisprachigkeit wird unter simultan und sukzessiv bilingualen Kindern unterschieden (siehe Kap. 2). Bei der Berücksichtigung des Faktors des Inputkontextes werden die Kinder in solche unterschieden, die Deutsch als Mehrheitssprache oder als Herkunftssprache erwerben (siehe Kap. 3). Daraus ergibt sich die Einteilung dieser zweisprachigen Kinder in vier Gruppen: – simultan zweisprachige Kinder (2L1), die in Deutschland wohnen, bei denen also Deutsch die Mehrheitssprache (MS) ist – MS/2L1 – sukzessiv zweisprachige Kinder, die in Deutschland wohnen, bei denen Deutsch die Mehrheitssprache (MS) und die frühe Zweitsprache (L2) ist – MS/ L2 – simultan zweisprachige Kinder (2L1), die in Polen wohnen, bei denen also Deutsch die Herkunftssprache (HS) ist – HS/2L1 – sukzessiv zweisprachige Kinder, die in Polen wohnen, bei denen Deutsch auch die Herkunftssprache (HS) ist und die Polnisch als frühe Zweitsprache (L2) erwerben – HS/mit L2 Die Einteilung der zweisprachigen Kinder der vorliegenden Studie in Gruppen wird in Tabelle 6–1 veranschaulicht:

147

Probanden

Tabelle 6–1: Einteilung in Gruppen

Simultane Zweisprachigkeit (2L1) Sukzessive Zweisprachigkeit (L2)

Deutsch als Mehrheitssprache (MS) MS/2L1

Deutsch als Herkunftssprache (HS) HS/2L1

MS/L2

HS/mit L2

Die Unterscheidung in simultane und sukzessive Zweisprachigkeit determiniert das Alter, in dem Kinder den Spracherwerb begonnen haben. In der Literatur werden mehrere Vorschläge zum exakten Alter gemacht, ab wann von einem sukzessiven und nicht mehr simultanen Erwerb der gegebenen Sprache die Rede sein soll (siehe Kap. 2.6.1). Für die vorliegende Studie ist die Grenze von 3 Jahren angenommen worden (vgl. Meisel, 2011; Sopata & Długosz, im Druck u. a.). Kinder, die bis zum Alter von 3;0 Jahren den Erwerb von beiden Sprachen angefangen haben, werden als simultan Bilinguale bezeichnet. Zweisprachige Kinder, die den Erwerb von einer ihrer Sprachen im Alter von 3;0 Jahren oder später angefangen haben, werden sukzessiv Bilinguale genannt. Für das Alter zu Beginn des Spracherwerbs wird in der vorliegenden Arbeit das Alter gehalten, in dem das gegebene Kind mit der gegebenen Sprache regelmäßig in Kontakt kommt. Für die Unterscheidung der Gruppen in solche, die Deutsch als Mehrheitssprache vs. Herkunftssprache sprechen, ist der Wohnort ausschlaggebend (siehe Kap. 3.5). Nach Rothman (2009) wird eine Sprache als Mehrheitssprache bezeichnet, wenn sie als dominante Sprache der weiteren sozialen Umgebung fungiert. Eine Sprache wird Herkunftssprache genannt, wenn sie zu Hause (von beiden Eltern, von einem Elternteil oder von anderen Familienmitgliedern) gesprochen wird, aber nicht die dominante Sprache der weiteren sozialen Umgebung ist (vgl. Kap. 3.5.1). Demnach werden die Kinder, die in Deutschland wohnen, jenen Gruppen zugeordnet, die Deutsch als Mehrheitssprache erwerben. Die zweisprachigen Kinder, die in Polen wohnen, werden dementsprechend jenen Gruppen zugeordnet, die Deutsch als Herkunftssprache (HS) erwerben. Auch Kinder, die in der Region von Oppeln wohnen, werden als Herkunftssprachensprecher (HSS) bezeichnet, weil Deutsch in dieser Region zwar als verbreitet, jedoch nicht als dominant in der weiteren sozialen Umgebung, gelten kann. Zu den HSS zählen sowohl Kinder, die von Geburt an in Polen wohnen, als auch solche, die in ihrer Kindheit vor dem 7. Lebensjahr, also vor Schuleintritt, nach Polen mit ihren Familien gekommen sind (vgl. Kap. 3.5). Die zwei Gruppen, die in Deutschland wohnen und die Deutsch daher als MS erwerben, unterschieden sich durch das Alter zu Beginn des Erwerbs des Deutschen. In der Gruppe MS/2L1 sind Kinder, die sowohl Polnisch als auch Deutsch

148

Methodologie der empirischen Untersuchungen

vor dem 3. Lebensjahr zu erwerben begonnen haben. Die Gruppe MS/L2 erwirbt nur Polnisch als Erstsprache (L1) und Deutsch als frühe Zweitsprache (L2), weil der Erwerb des Deutschen bei den Kindern nach 3 Jahren oder später begonnen hat. Für jene Gruppen, die in Polen wohnen, und die also Deutsch als HS sprechen, ist Deutsch immer L1. Beide Gruppen, sowohl HS/2L1 als auch HS/mitL2, erwerben Deutsch als L1, da ihr Kontakt zu Deutsch vor dem 3. Lebensjahr begonnen hat. Der Gegensatz zwischen der simultanen und sukzessiven Zweisprachigkeit betrifft in den HS-Gruppen nicht Deutsch, sondern Polnisch. Die Gruppe HS/2L1 erwirbt Polnisch und Deutsch simultan, weil diese Kinder in der Gruppe zu Beginn des Erwerbs beider Sprachen weniger als 3 Jahre alt waren. Die sukzessiv bilingualen HSS, also die Gruppe HS/mit L2, erwerben Deutsch auch als ihre L1 (sonst würden sie nicht als HSS gelten), aber Polnisch ist dafür ihre frühe L2, weil sie mit dem Erwerb des Polnischen mit 3 Jahren oder später angefangen haben. Der Unterschied zwischen den zwei Gruppen mit simultan bilingualen Kindern liegt im Status des Deutschen in Hinsicht auf den Inputkontext MS vs. HS. Die zwei Gruppen mit sukzessiv bilingualen Kindern unterscheiden sich durch drei Faktoren, den Status des Deutschen in Hinsicht auf den Inputkontext MS vs. HS, den Status des Deutschen in Hinsicht auf das Alter zu Beginn des Spracherwerbs, also frühe L2 in der Gruppe MS/L2 vs. L1 in der Gruppe HS/mit L2, sowie den Status des Polnischen L1 in der Gruppe MS/L2 vs. frühe L2 in der Gruppe HS/ mit L2. Die Unterschiede zwischen den Gruppen in Hinsicht auf den Status der erworbenen Sprachen werden in der Tabelle 6–2 veranschaulicht: Tabelle 6–2: Unterschiede zwischen den Gruppen in Hinsicht auf den Status der erworbenen Sprachen Zweisprachigkeit simultan

Gruppe MS/2L1 HS/2L1

Deutsch MS, L1 HS, L1

Polnisch HS, L1 MS, L1

sukzessiv

MS/L2 HS/mit L2

MS, L2 HS, L1

HS, L1 MS, L2

Tabelle 6–2 veranschaulicht auch die Tatsache, dass sich die Bezeichnungen der Gruppen auf den Status des Deutschen in den einzelnen Gruppen beziehen. Da der Forschungsgegenstand der vorliegenden Arbeit die Untersuchung des Erwerbs der gewählten Phänomene im Deutschen ist, scheint die Benennung der Gruppen im Hinblick auf den Status des Deutschen die einzig richtige Wahl zu sein. Man darf jedoch nicht vergessen, dass die zweisprachigen Kinder, die Deutsch als HS erwerben, gleichzeitig Polnisch als MS sprechen. Die sukzessiv bilingualen Kinder wiederum, die Deutsch als frühe L2 erwerben, sprechen Polnisch als L1 usw. Keines der zweisprachigen Kinder ist also immer HSS. Es

149

Probanden

kann so nur in Hinsicht auf eine der beiden Sprachen in seinem Gehirn bezeichnet werden. Die vier Gruppen wurden als möglichst homogene Gruppen gebildet. Eine volle Homogenität kann jedoch nicht ganz beim geplanten Forschungsdesign erzielt werden. Einerseits hat die Spracherwerbsforschung gezeigt, dass der Spracherwerb ein Prozess ist, der eine hohe individuelle Variabilität involviert. Jedes zweisprachige Kind hat seine eigene Sprachbiographie. Viele Forscher weisen daher zurecht darauf hin, dass Zweisprachigkeit am besten als Kontinuum aufgefasst werden soll (vgl. Luk, 2015; de Cat, 2020). Während also die im Rahmen der Studie gebildeten Gruppen einen Kontrast zwischen der simultanen und sukzessiven Zweisprachigkeit sowie den Gegensatz zwischen dem Deutschen als MS und HS widerspiegeln, sind die anderen Faktoren so weit berücksichtigt, dass ein Vergleich zwischen den Gruppen, im Hinblick auf die Forschungsziele, gemacht werden kann, und sinnvolle statistische Analysen trotz der gewissen Heterogenität der Gruppen durchgeführt werden können. Die detaillierten Angaben zu den Gruppen sind der Tabelle 6–3 zu entnehmen: Tabelle 6–3: Zusammenstellung der Angaben zu zweisprachigen Kindern Gruppe Beschreibung

MS/2 L1 Simultan Bilinguale, die in Deutschland wohnen 21

MS/L2 Sukzessiv Bilinguale, die in Deutschland wohnen 19

HS/2 L1 Simultan Bilinguale, die in Polen wohnen 13

HS/mit L2 Sukzessiv Bilinguale, die in Polen wohnen 10

8 Mädchen 13 Jungen 9;2 7;0–12;11 SD 1;10

11 Mädchen 8 Jungen 10;1 7;10–12;3 SD 1;2

5 Mädchen 8 Jungen 10 7;2–12;9 SD 2

5 Mädchen 5 Jungen 8;9 7;0–11;8 SD 1;5

1;2 0–2;11 SD 1;2

5;10 3;0–8;6 SD 1;10

0

0

8 4;3–12;11 SD 2;2 Kumulativer Input – 54 Deutsch (in Monaten) 20–107 SD 22

4;3 1;6–7;6 SD 1;8 31 18–59 SD 12

wie Alter beim wie Alter beim Testen Testen 54 28–124 SD 26

89 67–110 SD 13

POLNISCH Alter bei Erwerbsbeginn – Polnisch (in Jahren)

0

2 Monate 0–1;6 SD 6 Monate

4;9 3;0–6;10 SD 1;6

Anzahl der Kinder Geschlecht Alter beim Testen (in Jahren) DEUTSCH Alter bei Erwerbsbeginn – Deutsch (in Jahren) Kontaktdauer zu Deutsch (in Jahren)

0

150

Methodologie der empirischen Untersuchungen

(Fortsetzung) Gruppe MS/2 L1 MS/L2 HS/2 L1 Kontaktdauer zu Pol- wie Alter beim wie Alter beim 9;1 nisch (in Jahren) Testen Testen 7;2–12;9 SD 1;11 Kumulativer Input – 56 90 66 Polnisch (in Mona34–99 63–119 30–121 ten) SD 15 SD 17 SD 31

HS/mit L2 4;1 1;8–8;3 SD 2;2 17 3–34 SD 11

In der Tabelle sind der Durchschnittswert, die Werte von – bis und die Standardabweichung (SD) angegeben.

Die Tabelle 6–3 beinhaltet die Angaben zur Anzahl und zum Geschlecht der Kinder in jeder Gruppe sowie das durchschnittliche Alter der Kinder in der gegebenen Gruppe beim Testen. Zu den beiden Sprachen der Kinder, Deutsch und Polnisch, sind jeweils drei Größen angegeben: das durchschnittliche Alter der Kinder in der einzelnen Gruppe bei Erwerbsbeginn, die Dauer des Kontakts zur gegebenen Sprache und der kumulative Input in der Sprache. Bei allen Größen sind der Durchschnittswert, die Werte von – bis und die Standardabweichung (SD) angegeben. Der kumulative Input in der gegebenen Sprache soll uns einen besseren Einblick in die Inputmenge, die dem einzelnen Kind zugänglich ist, geben. Auf Grund der sehr variablen Intensität des Sprachkontakts ist die Dauer des Kontakts eine sehr allgemeine, und womöglich oft unpräzise, Angabe in Bezug auf den zugänglichen Input. Das Errechnen des kumulativen Inputs berücksichtigt nicht nur die Länge des Kontakts zur gegebenen Sprache, sondern auch seine Intensität. Der Wert des kumulativen Inputs ist dadurch eine genauere Messung der Inputmenge, die dem gegebenen Kind zugänglich ist. Der kumulative Input wird in der vorliegenden Arbeit in Anlehnung an den Vorschlag von Unsworth (2013, 2016) errechnet. Die Grundlage dafür bilden Fragebögen, die von den Eltern jedes Kindes im Rahmen eines Interviews ausgefüllt worden sind. Im Fragebogen wurden die Eltern unter anderem darum gebeten, die relative Menge des Inputs für jedes Jahr und für jede Sprache einzuschätzen, die dem Kind zugänglich war. Die Eltern sollten dafür die Prozentzahl 100 % des Sprachkontakts im Allgemeinen in einem Jahr zwischen Polnisch und Deutsch teilen. Die Eltern waren dessen bewusst, dass sie bei der Einschätzung sowohl die sprachlichen Interaktionen ihrer Kinder mit allen Familienmitgliedern zu Hause als auch die Interaktionen des Kindes in der Schule und in der Freizeit berücksichtigen sollen. Die relativen Werte zur Inputmenge in beiden Sprachen für jedes Jahr sind dann in die absoluten Zahlen der Monate umgerechnet worden. Dabei ist davon ausgegangen worden, dass sich die Zahl des 100 % des Sprachkontakts im Allgemeinen in einem Jahr auf 12 Monate bezieht, und die von den Eltern geschätzten relativen Werte des Kontakts zu einer

Probanden

151

gegebenen Sprache sich auf eine proportionale Anzahl der Monate in einem Jahr beziehen (z. B. 100 % = 12 Monate; 50 % = 6 Monate). Im letzten Schritt des Errechnens des kumulativen Inputs sind die Monatszahlen aus den einzelnen Jahren für jede Sprache separat addiert worden. Dabei sind die Jahre des Kontakts zur gegebenen Sprache vom Anfang des Spracherwerbs bis zum Zeitpunkt des Testens berücksichtigt worden. Auf diese Weise spiegelt der Wert des kumulativen Inputs nicht nur die Länge des Kontakts zur gegebenen Sprache sondern auch seine Intensität wider, die von Kind zu Kind sowie von Jahr zu Jahr unterschiedlich sein kann. Der Tabelle 6–3 kann man entnehmen, dass die Gruppe MS/2L1 aus 21 simultan bilingualen Kindern besteht, die in Deutschland wohnen. Ihr Durchschnittsalter liegt bei 9;2 Jahren. Es handelt sich dabei meistens um Kinder, die in Familien aufwachsen, in denen ein Elternteil Polnisch und der andere Elternteil Deutsch mit dem Kind spricht. In einigen Fällen sind beide Eltern Polnisch, und der Kontakt mit Deutsch wird durch Interaktionen mit Tagesmüttern, älteren Geschwistern, Freunden und Nachbarn aufgenommen. Das Durchschnittsalter bei Erwerbsbeginn des Deutschen liegt in der Gruppe bei 1;2 Jahren, und es reicht von 0 bis zu 2;11 Jahren. Die Kinder der Gruppe MS/2L1 haben durchschnittlich 8 Jahre Kontakt mit Deutsch hinter sich. Die Intensität des Kontakts ist unterschiedlich, wovon die Werte des kumulativen Inputs von 20 bis 107 zeugen. Alle Kinder der Gruppe MS/2L1 erwerben Polnisch von Geburt an. Die Intensität des Kontakts zu Polnisch ist auch variabel (34–99 Monate, siehe Tabele 6–3). Zur Gruppe MS/L2 gehören 19 sukzessiv bilinguale Kinder, die in Deutschland wohnen und die Polnisch als L1 und Deutsch als MS sowie frühe L2 erwerben. Sie sind durchschnittlich 10;1 Jahre alt. Sie sind in Polen geboren, und Polnisch ist ihre Familiensprache. Sie erwerben Deutsch als ihre frühe L2 unter natürlichen Bedingungen. Einige Kinder erhalten eine zusätzliche Sprachförderung in L2 Deutsch, die jedoch nicht mit dem Verdacht auf eine spezifische Sprachstörung zusammengebracht werden soll. Der Grund für die zusätzliche Sprachförderung sind eher Sorgen der Eltern um die richtige Entwicklung der Zweisprachigkeit. Das Durchschnittsalter bei Erwerbsbeginn des Deutschen liegt in dieser Gruppe bei 5;10 Jahren. Der Wert reicht von 3;0 bis zu 8;6 Jahren. Die Kinder der Gruppe MS/L2 haben durchschnittlich 4;3 Jahre Kontakt mit Deutsch hinter sich. Seine Intensität ist variabel (18–59 Monate des kumulativen Inputs in Deutsch, siehe Tabelle 6–3). Alle Kinder der Gruppe MS/L2 erwerben Polnisch von Geburt an. Die Intensität des Kontakts zu Polnisch ist bei allen Kindern hoch, weil sie alle in den ersten Lebensjahren einsprachig aufgewachsen sind. Die Werte des kumulativen Inputs in Polnisch liegen zwischen 63 und 119 Monaten (siehe Tabelle 6–3). Die Gruppe HS/2L1 bilden 13 simultan bilinguale Kinder, die in Polen wohnen und die daher Deutsch als HS erwerben. Es handelt sich dabei um Kinder, die in

152

Methodologie der empirischen Untersuchungen

Familien aufwachsen, die der deutschen Minderheit in Polen angehören. Ihr Wohnort ist die Region von Oppeln. Die Eltern der Kinder sind auch deutschpolnisch Bilinguale, die mit beiden Sprachen von Geburt an in Polen aufgewachsen sind und daher als HSS zu betrachten sind. Die untersuchten Kinder können daher als HSS der zweiten oder sogar der dritten Generation betrachtet werden. Die Familiensprachenpolitik beruht in den meisten Fällen auf dem Szenario, in dem beide Elternteile beide Sprachen in den Interaktionen mit den Kindern benutzen. Bei 3 Kindern wird der Gebrauch der Sprachen zu Hause nach dem Prinzip eine Person/eine Sprache geregelt. Das Durchschnittsalter der Kinder aus der Gruppe HS/2L1 liegt bei 10 Jahren. Sie erwerben alle Deutsch von Geburt an. Der Wert des kumulativen Inputs zeugt jedoch von der unterschiedlichen Intensität des Kontakts mit Deutsch (28–124 Monate, siehe Tabelle 6–3). Das durchschnittliche Alter bei Beginn des Polnischerwerbs ist in der Gruppe HS/2L1 sehr niedrig und reicht von 0 bis 1;6 Jahren. Die Intensität des Kontakts zu Polnisch ist sehr variabel (30–121 Monate, SD 31 Monate, siehe Tabelle 6–3). Zur letzten Gruppe – HS/mit L2 – gehören 10 sukzessiv bilinguale Kinder, die in Polen wohnen, die Deutsch daher als HS und Polnisch als frühe L2 erwerben. Sieben Kinder der Gruppe HS/mit L2 sind in Deutschland geboren und sind im Alter vor 7 Jahren mit ihren Eltern nach Polen umgezogen. Vor dem Umzug hatten die Familien keinen Kontakt zu Polen und die Kinder sind einsprachig aufgewachsen. Drei andere Kinder aus der Gruppe sind in Polen geboren. Sie sind jedoch vor dem Kindergarteneintritt einsprachig aufgewachsen. Ihr regelmäßiger Kontakt zu Polnisch begann erst im Kindergarten, weil die Familiensprache ausschließlich Deutsch war. Die Kinder der Gruppe HS/mit L2 sind durchschnittlich 8;9 Jahre alt. Alle erwerben Deutsch von Geburt an. Der Wert des kumulativen Inputs in Deutsch ist bei allen Kindern der Gruppe relativ hoch (67– 110 Monate, siehe Tabelle 6–3), was mit der einsprachigen Erziehung in den ersten Lebensjahren in Zusammenhang gebracht werden kann. Das durchschnittliche Alter bei Beginn des Polnischerwerbs beträgt 4;9 Jahre in der Gruppe HS/mit L2. Die Intensität des Kontakts mit Polnisch ist sehr variabel. Der durchschnittliche Wert des kumulativen Inputs von Polnisch beträgt 17 Monate. Die individuellen Werte des kumulativen Inputs des Polnischen in der Gruppe HS/mit L2 reichen von 3 bis 34 Monaten (siehe Tabelle 6–3). Wenn wir die Gruppen miteinander im Hinblick auf die unterschiedlichen Variablen vergleichen, dann sehen wir, dass sie bei den für die vorliegende Arbeit wichtigsten Variablen als relativ homogen bezeichnet werden können. In allen Gruppen haben wir Kinder beider Geschlechts. Die Durchschnittswerte des Alters beim Testen liegen in allen Gruppen zwischen 8;9 und 10;1 Jahren. Das sichert die Ähnlichkeit der Gruppen im Hinblick auf die kognitive Entwicklung,

Probanden

153

die bei der Erforschung des Erwerbs von referentiellen Ausdrücken von großer Bedeutung ist. Die Variable des Alters bei Beginn des Deutscherwerbs hat den Wert 0 oder etwas über 0 Jahre bei den Gruppen MS/2L1, HS/2L1 und HS/ mit L2 entsprechend dem Forschungsdesign der vorliegenden Arbeit (vgl. Tabelle 6–3). In der Gruppe MS/L2 liegt der Wert höher, weil die Gruppe von den sukzessiven Bilingualen bestimmt wird, die Deutsch als frühe L2 erwerben. Der Unterschied im Alter bei Beginn des Deutscherwerbs zwischen den Gruppen hat logischerweise zur Folge, dass der kumulative Input im Deutschen in der Gruppe MS/L2 am niedrigsten ist (siehe Tabelle 6–3). In beiden Gruppen mit simultan bilingualen Kindern, MS/2L1 und HS/2L1, sind die Durchschnittswerte des kumulativen Inputs des Deutschen gleich (54 Monate, siehe Tabelle 6–3). Der Wert des kumulativen Inputs des Deutschen ist in der Gruppe HS/mit L2 am höchsten, was in Anbetracht dessen, dass die Kinder in dieser Gruppe in ihren ersten Lebensjahren einsprachig deutsch aufgewachsen sind, nicht überrascht. Ein Spiegelbild dieser Situation der Gruppen in Hinsicht auf den Deutscherwerb entsteht beim Vergleich der Situation der Gruppen im Hinblick auf den Erwerb des Polnischen. Das Alter zu Beginn des Polnischerwerbs liegt in beiden Gruppen mit simultanen Bilingualen und bei der Gruppe MS/L2 bei oder nicht viel über 0. In einer Gruppe – HS/mit L2 – liegt der Wert des Alters zu Beginn des Polnischerwerbs höher, was dem Forschungsdesign der vorliegenden Studie entspricht (siehe Tabelle 6–3), weil zu dieser Gruppe Kinder gehören, die eben Polnisch nicht als L1 sondern als frühe L2 erwerben. Der Unterschied in der Variable des Alters bei Beginn des Erwerbs zieht die unterschiedlichen Werte des kumulativen Inputs von Polnisch in den Gruppen mit sich. In den Gruppen mit simultan bilingualen Kindern, MS/2L1 und HS/2L1, sind die Durchschnittswerte des kumulativen Inputs im Polnischen ähnlich (56 und 66 Monate, siehe Tabelle 6–3). Der Wert des kumulativen Inputs im Polnischen ist in der Gruppe MS/L2 am höchsten, weil die Kinder aus der Gruppe in ihren ersten Lebensjahren einsprachig polnisch aufgewachsen sind. Der Wert des kumulativen Inputs in Polnisch der Gruppe MS/L2 (90 Monate) ähnelt auch dem Wert des kumulativen Inputs in Deutsch der Gruppe HS/mit L2 (89 Monate). Beide Gruppen sind sukzessiv Bilinguale, die Deutsch oder Polnisch als ihre L2 erwerben und deren andere Sprache ihre L1 ist, die in den ersten Jahren als die einzige Sprache von ihnen erworben worden ist. Das muss sich in den Werten des kumulativen Inputs wiederfinden. Die Gruppen MS/L2 und HS/mit L2 sind sich auch darin ähnlich, dass sie den Wert des kumulativen Inputs in der jeweiligen L2 am niedrigsten unter den Gruppen haben. In der Gruppe HS/mit L2 liegt der Wert des durchschnittlichen kumulativen Inputs in Polnisch bei 17 Monaten, und in der Gruppe MS/2L1 liegt der entsprechende Wert in Hinsicht auf Deutsch etwas höher, und zwar bei 31 Monaten (siehe Tabelle 6–3). Die niedrigen Werte spiegeln unter

154

Methodologie der empirischen Untersuchungen

anderem die Tatsache wider, dass die Kinder in den Gruppen den Erwerb der jeweiligen L2 mindestens 3 Jahre nach der Geburt begonnen haben. Die Daten der zweisprachigen Kinder werden in der vorliegenden Studie nicht nur miteinander sondern auch mit den Daten von monolingualen deutschsprachigen Kindern verglichen. Die Gruppe besteht aus 16 einsprachigen Kindern, die in Deutschland wohnen. Das durchschnittliche Alter beträgt in der Gruppe 9;5 Jahre. Die einzelnen Kinder sind zwischen 7;3 und 11;2 Jahre alt. Sie sind also im Alter, in dem die kognitiven Voraussetzungen für die Referenzherstellung im Diskurs als erworben gelten können. Das Alter der einsprachigen Kinder entspricht auch dem Alter der zweisprachigen Kinder, was einen sinnvollen Vergleich zwischen den Gruppen ermöglicht. Die detaillierten Angaben zu monolingualen Kindern sind in der Tabelle 6–4 enthalten: Tabelle 6–4: Zusammenstellung der Angaben zu einsprachigen Kindern Gruppe Anzahl der Probanden Geschlecht

Monolinguale 16 7 Mädchen 9 Jungen

Alter beim Testen (in Jahren) 9;5 7;3–11;2 SD 1;1 Alter/Kumulativer Input – 113 Deutsch (in Monaten) 87–134 SD 13 In der Tabelle sind der Durchschnittswert, die Werte von – bis und die Standardabweichung (SD) angegeben.

Der Tabelle 6–4 kann man entnehmen, dass der kumulative Input im Deutschen bei den einsprachigen Kindern den Wert von 113 Monaten hat, und viel höher als der entsprechende Wert bei den zweisprachigen Kindern ist. Der Unterschied zwischen den Werten ist selbstverständlich, weil bei einsprachigen Kindern der Input nicht zwischen zwei Sprachen geteilt wird, wie es bei zweisprachigen Kindern der Fall ist. Man muss immerhin im Auge behalten, dass die Werte nur eine Annäherung an die Wirklichkeit darstellen. Sie können nicht die individuellen Unterschiede widerspiegeln, bei denen beispielsweise ein Kind, das unter gesprächigen Leuten aufwächst, an mehr sprachlichen Interaktionen in einem Monat teilnimmt als ein anderes Kind in drei Monaten. Solche Unterschiede könnten nur im Rahmen von präzisen Aufnahmen aller Interaktionen der Kinder festgehalten werden, die bei der Anzahl der Probanden in der vorliegenden Arbeit nicht machbar gewesen wäre.

Untersuchungsmethoden

6.3

155

Untersuchungsmethoden

In der vorliegenden Arbeit werden fünf unterschiedliche Tests mit allen Probandengruppen durchgeführt: Grammatikalitätsurteile (Grammaticality Judgment Task) – GJT, Aufgabe der erzwungenen Wahl (Forced Choice Task) – FCT, Satzwiederholung (Sentence Repetition Task) – SRTund zwei rezeptive Aufgaben, die auf dem Bildausmalen und auf der Bildwahl beruhen, die die bevorzugte Lesart von referentiellen Ausdrücke abfragen. Viele Studien der Spracherwerbsforschung basieren auf einem Typ von Sprachdaten, entweder von Urteilsdaten oder von Produktionsdaten. Es wurde jedoch gezeigt, dass die Ergebnisse dieser zwei Aufgabentypen komplementäre Informationen über zweisprachige Personen liefern (z. B. Sherkina-Lieber et al., 2011), obwohl sie auf demselben Sprachwissen der Probanden basieren und dadurch oft korrelieren (Paradis, 2010). In der vorliegenden Arbeit werden daher fünf unterschiedliche Testaufgaben genutzt, um einen vielseitigen Einblick in den Erwerb von denselben zwei Phänomenen zu bekommen. Die beiden ersten Untersuchungsmethoden, Grammaticality Judgment Task und Forced Choice Task, zielen auf die Erforschung der Ebene der mentalen Repräsentation grammatischen Wissens ab. Sie können nicht als direkte Widerspiegelung der Sprachkompetenz betrachtet werden (vgl. Ribbert & Kuiken, 2010; Ionin & Zyzik, 2014 zu GJT sowie Schütze & Sprouse, 2014 zu FCT). Die Urteilsaufgaben können aber als solche angesehen werden, die uns den bestmöglichen Einblick unter den offline-Aufgaben in die Sprachkompetenz geben, weil sie am wenigsten die Verarbeitungskapazität der Probanden engagieren (vgl. Liceras et al., 2008: 830). Die Urteilsaufgaben erfordern zwar das Verstehen der Sätze und die metalinguistische Bewusstheit, die beim Fällen der Urteile oder dem Wählen zwischen den Strukturalternativen notwendig sind. Die Aufgaben unterliegen jedoch viel weniger den Verarbeitungseinschränkungen, wie es in der Sprachproduktion der Fall ist. Die dritte Untersuchungsmethode, Sentence Repetition Task, unterscheidet sich sowohl von den rein produktiven als auch von den rein rezeptiven Aufgaben. Sie basiert jedoch auf dem Sprachverstehen und der Sprachproduktion (Makrodimitris & Schulz, 2021). Die Probanden werden während der Testaufgabe gebeten, Sätze zu wiederholen. Um der Aufgabe gerecht zu werden, müssen die Probanden einen gehörten und gelesenen Satz rekonstruieren, was sie nur durch die Aktivierung der konzeptuellen Satzrepräsentation tun können. Die bisherigen Untersuchungen zeigen, dass Satzwiederholungen das Sprachwissen der Probanden abbilden (siehe z. B. Chiat et al., 2013). Diese Aufgabe erfordert eine hohe Sprachverarbeitungskapazität, ihre Ergebnisse werden außerdem vom Arbeitsgedächtnis beeinflusst.

156

Methodologie der empirischen Untersuchungen

Die rezeptiven Aufgaben, die in der vorliegenden Arbeit im Bildausmalen und in der Bildwahl bestehen, erfordern weniger Sprachverarbeitungskapazität. Meist sind die Ergebnisse der Kinder bei den rezeptiven Aufgaben besser als bei den produktiven Aufgaben, auch wenn die Aufgaben dieselbe Struktur betreffen (siehe z. B. Grüter, 2006). In den rezeptiven Aufgaben werden auch weniger Unterschiede zwischen ein- und zweisprachigen Kindern als in der Sprachproduktion gefunden (siehe z. B. Windsor & Kohnert, 2004). Die fünf Untersuchungsmethoden der vorliegenden Arbeit sollen uns daher eine sehr gute Einsicht in den Erwerb von referentiellen Ausdrücken gewähren, wobei sowohl die produktive als auch die rezeptive Seite des Sprachgebrauchs und darüber hinaus die mentale Repräsentation des Sprachwissens berücksichtigt wird. Zur Gestaltung, Durchführung und Antworterfassung der GJT, FCT und SRT wurde die E-Prime 2.0 Professional SP2-Software113 benutzt. Jeder Satz in der GJT, FCT und SRT wird von einer kleinen Einführung begleitet, damit der Kontext etabliert wird, der für die Beurteilung der Angemessenheit des Gebrauchs von referentiellen Ausdrücken oder die Wahl bzw. den Gebrauch des entsprechenden Ausdrucks notwendig ist. Der/die einführende/n Satz/Sätze werden von einer Person vorgelesen und der Zielsatz oder die Zielsätze, die beurteilt oder gewählt werden sollen, wird von der anderen Person geäußert. Dadurch entsteht ein kleiner Dialog. In der SRT werden Äußerungen einer Person präsentiert. Die Kontexte und die Zielsätze in GJT, FCT und SRT wurden den Kindern während der Untersuchung visuell und auditiv präsentiert. Die Aufnahmen sind von deutschen Muttersprachlern in einem Studio angefertigt worden. Man hat sichergestellt, dass die Intonation der Sprecher neutral ist. Am Anfang jeder Aufgabe wurde die Prozedur den Kindern erklärt und die Kinder konnten einige Übungsaufgaben lösen sowie Fragen stellen. Während der Untersuchung gab es zwei Randomisierungen, um Reihenfolgseffekte zu vermeiden. Die Untersuchung wurde immer bei den Kindern zu Hause oder in der Schule an einem ruhigen Ort durchgeführt. Die Kinder saßen am Computer und wurden von einem Forscher begleitet. Die Gesamtheit der Interaktionen während der Untersuchung zum Deutschen verlief auf Deutsch. Die Untersuchungsmaterialien wurden auf eine spielerische Art und Weise konzipiert, um die Kinder zur aktiven Teilnahme zu motivieren. Die Antworten auf die Untersuchungsfragen wurden immer von spielerischen Aufgaben, wie beispielsweise einem Puzzle, begleitet.

Untersuchungsmethoden

157

6.3.1 Grammatikalitätsurteile (Grammaticality Judgment Task) – GJT Die Aufgabe mit Grammatikalitätsurteilen umfasst 20 Sätze insgesamt. Die Hälfte der Zielsätze entspricht der Norm des Deutschen und die andere Hälfte beinhaltet einen grammatischen Fehler oder einen dem Kontext unangemessenen Gebrauch eines referentiellen Ausdrucks. Acht Sätze sind dem Bereich der Artikel und acht Sätze Strukturen mit Nullargumenten gewidmet. Die anderen vier Sätze sind Füller. Die Sätze, anhand deren das Wissen um den bestimmten und unbestimmten Artikel untersucht wird, spiegeln die Oppositionen definit vs. indefinit und spezifisch vs. unspezifisch wider, wie sie von Ionin et al. (2004) aufgefasst worden sind (vgl. Kap. 4.1.2, 4.1.3 und 4.4). Die in den Sätzen enthaltenen Nominalphrasen können in vier Kategorien eingeteilt werden (siehe Beispiele 6–1, 6–2, 6– 3 und 6–4): 6–1

6–2

6–3

6–4

definit und spezifisch Person A: Ich habe einen Kuli und Buntstifte, mit den Buntstiften zeichne ich aber gerade. Person B: Komm schon, du kannst mir wenigstens den Kuli leihen. definit und unspezifisch Person A: Was sucht ihr hier? Es ist den Schülern nicht erlaubt in der Pause hier zu sein. Person B: Wir suchen den Hausmeister, wir sind neu hier. indefinit und spezifisch Person A: Hallo, ich bin Lisa. Möchtest du mit mir eine Sandburg bauen? Person B: Nein, ich warte auf einen Freund, wir gehen gleich baden. indefinit und unspezifisch Person A: Ich sehe, dass du dich als Spiderman verkleiden willst, und du hast schon einiges in Rot gefunden. Wie kann ich dir noch helfen? Person B: Ich brauche noch einen roten Mantel.

Die Sätze werden von vier nicht normgerechten Sätzen begleitet, die NPn mit einem Artikel enthalten, der dem Kontext nicht angemessen ist. Die vollständige Liste der Sätze ist in Anhang A zu sehen. Die Zielsätze, anhand deren das Wissen um die Nullargumente untersucht wird, beinhalten Nullsubjekte und Nullobjekte. Die grammatisch korrekten Sätze enthalten ein Nullargument in Topik-Position, wie es in Beispiel 6–5 zu sehen ist: 6–5

Person A: Wo hast du dich versteckt? Person B: _Bin unter dem Tisch.

In den inkorrekten Sätzen wird ein Subjekt oder ein Objekt im Satzinneren ausgelassen, wie man es im Beispiel 6–6 sieht:

158 6–6

Methodologie der empirischen Untersuchungen

Person A: Was hat er gegessen? Person B: *Eine Kokosnuss hat _ gegessen.

Die Zielsätze enthalten die Nullsubjekte in der 1. und 3. Person Sg. sowie Nullobjekte in der 3. Person Sg. Die vollständige Liste der Sätze ist in Anhang A zu sehen. Bei der Satzbeurteilung wurden die Kinder angewiesen, mit einem Tastendruck zu zeigen, ob der gegebene Satz für sie gut oder schlecht klang. Sie hatten zwei rot und grün markierte Tasten zur Wahl. Sie sahen die Sätze am Bildschirm (siehe Abb. 6–1) und hörten ihre Aufnahmen durch Kopfhörer. Der Zielsatz, der beurteilt werden sollte, blieb 15 Sekunden lang am Bildschirm zu sehen. Zum Schluss wurden die Kinder gebeten, die von ihnen als »schlecht klingend« beurteilten Sätze mündlich zu korrigieren. Das sollte sicherstellen, dass der Grund für die negative Beurteilung des gegebenen Satzes relevant für die vorliegende Studie war. Die Prozedur, in der die als inkorrekt beurteilen Sätze erst zum Schluss von den Probanden korrigiert werden, hat zum Ziel, die Strategie zu vermeiden, nach der die Probanden dazu neigen, die Sätze nicht abzulehnen, weil sie sie nicht korrigieren (vgl. Ionin & Zyzik, 2014).

Abb. 6–1: GJT am Computerbildschirm

Untersuchungsmethoden

159

6.3.2 Aufgabe der erzwungenen Wahl (Forced Choice Task) – FCT Die Aufgabe der erzwungenen Wahl umfasst 20 Testitems insgesamt. In jedem Testitem sind eine Frage und zwei Antworten enthalten. In der Frage wird ein Kontext gebildet. Zwei unterschiedliche Antworten, von denen eine normgerecht und eine nicht normgerecht ist, werden von zwei Kindsfiguren gegeben. Acht Testitems sind dem Phänomen der Nominalphrasen und sechs den Strukturen mit Nullargumenten gewidmet. Die anderen sechs Items werden als Füller betrachtet. Die Items mit den NPn mit bestimmtem oder unbestimmtem Artikel spiegeln die Opposition definit vs. indefinit und spezifisch vs. unspezifisch wider, ähnlich wie es in der GJT der Fall ist (vgl. auch Kap. 4.1.2, 4.1.3 und 4.4). Die NPn in den einzelnen Testitems können in vier Kategorien eingeteilt werden (siehe Beispiele 6–7, 6–8, 6–9 und 6–10): 6–7

6–8

6–9

6–10

definit und spezifisch Kontext: Hast du das Foto nach dem Fußballspiel gemacht, wo nur ein Tor gefallen ist? Wer ist das? Person A: *Hier bin ich, und hier ein Fußballspieler, der das Tor geschossen hat. Person B: Hier bin ich, und hier der Fußballspieler, der das Tor geschossen hat. definit und unspezifisch. Kontext: Wer würfelt beim Spielen zuerst? Person A: *Ein Kleinster. Person B: Der Kleinste. indefinit und spezifisch Kontext: Guten Tag, wie kann ich Ihnen helfen? Person A: *Ich suche den roten Handschuh. Ich glaube, ich habe ihn hier gestern liegen lassen. Person B: Ich suche einen roten Handschuh. Ich glaube, ich habe ihn hier gestern liegen lassen. indefinit und unspezifisch Kontext: Was wünschst du dir zu Weihnachten? Vielleicht möchtest du eine Puppe, oder ein Spielzeug für deinen Hund? Person A: Ich möchte ein Buch über Hunde bekommen. Person B: *Ich möchte das Buch über Hunde bekommen.

Die vollständige Liste der relevanten Testitems in der FCT ist in Anhang B angegeben. Die FCT-Items zu den Nullargumenten beinhalten analog zur GJT Nullsubjekte und Nullobjekte. Die Nullsubjekte treten in der 1. und 3. Person Sg. und die Nullobjekte in der 3. Person Sg. auf. Die grammatisch korrekten Antworten enthalten ein Nullargument in Topik-Position, und in den nicht korrekten

160

Methodologie der empirischen Untersuchungen

Antworten treten die Argumentauslassungen im Satzinneren auf, wie es in Beispiel 6–11 zu sehen ist: 6–11

Kontext: Willst du das Buch kaufen? Person A: *Nein, ich kenn schon. Person B: Nein, kenn ich schon.

Die vollständige Liste der FCT-Testitems zu Nullargumenten ist in Anhang B zu sehen. In der FCT wurden die den Kontext bildende Frage und zwei alternative Antworten schriftlich am Computerbildschirm und gleichzeitig mündlich durch Kopfhörer den Kindern präsentiert. Die Antworten erschienen als Sprechblasen von zwei unterschiedlichen Kindsfiguren, die in zwei verschiedenen Farben gekleidet waren (siehe Abbildung 6–2). Die Aufgabe der Kinder bestand darin, jene Antwort zu wählen, die besser klang. Die Wahl erfolgte durch Drücken einer von zwei farbigen Tasten, deren Farbe der Kleidung der Kinderfigur mit der gegebenen Sprechblase entsprach.

Abb. 6–2: FCT am Computerbildschirm

Untersuchungsmethoden

161

6.3.3 Satzwiederholung (Sentence Repetition Task) – SRT Die Satzwiederholung umfasst insgesamt 30 Testitems. Die einzelnen Testitems sind entweder 8 bis 15 Silben oder um 20 Silben lang. Die Anzahl der kürzeren und längeren Testitems ist in beiden untersuchten Bereichen gleich. Die Items bestehen aus zwei kürzeren Sätzen oder einem zusammengesetzten Satz. Dadurch wird ein Kontext für die Herstellung der Referenz der untersuchten referentiellen Ausdrücke gebildet. Damit der Gebrauch von NPn mit bestimmten oder unbestimmten Artikeln sowie von phonetisch realisierten oder nicht realisierten Argumenten untersucht werden kann, ist ein zumindest kurzer Kontext für die Herstellung ihrer Referenz notwendig. Alle Sätze in der SRT sind grammatisch korrekt und die volle oder reduzierte Form der referentiellen Ausdrücke (siehe Kap. 4) ist dem Kontext angemessen. Zwölf Testitems sind dem Gebrauch von Artikeln und sechzehn dem Gebrauch von Nullargumenten vs. overten Argumenten gewidmet. Die anderen Items in der SRT, die keines der hier untersuchten Phänomene enthalten, werden als Füller betrachtet. Wie in den anderen Aufgaben spiegeln die Items, die dem Gebrauch von Artikeln gewidmet sind, die Opposition definit vs. indefinit und spezifisch vs. unspezifisch wider (vgl. auch Kap. 4.1.2, 4.1.3 und 4.4). Die NPn in den einzelnen Testitems werden in vier Kategorien eingeteilt (siehe die Beispiele 6–12, 6–13, 6–14 und 6–15): 6–12

6–13 6–14

6–15

definit und spezifisch Komm in den Garten! Siehst du den Apfel, der eben vom Baum runtergefallen ist? definit und unspezifisch Ich will auf den höchsten Baum klettern, den ich finden kann. indefinit und spezifisch Gehst du mit mir auf den Spielplatz? Ich möchte dir einen neuen Freund von mir vorstellen. indefinit und unspezifisch Ich liebe alle Tiere. Ich habe aber Angst einen Hund zu streicheln, den ich gar nicht kenne.

Alle relevanten Testitems in der SRT sind in Anhang C angegeben. Alle SRT-Items zur Argumentrealisierung bestehen aus Äußerungen, in denen ein Kontext vorhanden ist, in dem die Auslassung des Subjekts oder Objekts in der gesprochenen Sprache normgerecht ist. In drei Sätzen kommen Nullobjekte in der Topik-Position vor, und in drei Sätzen treten overte Objekte an dieser Stelle auf. In fünf Sätzen tauchen Nullsubjekte auf, und in fünf kommen overte Subjekte vor, wie es in den Beispielen 6–16–6–19 zu sehen ist. Ähnlich wie in der GJT und der FCT treten die Nullsubjekte in der 1. und

162

Methodologie der empirischen Untersuchungen

3. Person Sg. sowie in der 2. Person Sg. auf, während die Nullobjekte in der 3. Person Sg. in der SRT vorkommen. 6–16 6–17

6–18 6–19

Nullsubjekt Was hat er mit der Puppe gemacht? _Hat sie gekämmt. Overtes Subjekt Was hat sie mit der wunderschönen bunten Vase gemacht? Sie hat sie zerbrochen. Nullobjekt Hast du dich um die Blume gekümmert? _Hab ich gegossen. Overtes Objekt Was ist mit dem Flugzeug? Das hab ich repariert, es fliegt jetzt.

Die vollständige Liste der SRT-Testitems zur Argumentrealisierung ist in Anhang C angegeben. In der SRT wurden den Kindern die Sätze auditiv präsentiert. Bevor die Kinder gebeten wurden, einen Satz zu wiederholen, hatten sie einen kurzen Farb-WortInterferenztest (Stroop-Test, Stroop, 1935) zu machen. Sie hatten die Aufgabe, mit einem Tastendruck die Farbe eines auf dem Bildschirm erscheinenden Wortes zu bestimmen. Das Wort konnte in unterschiedlichen Farben erscheinen. Die Wortbedeutung und die Wortfarbe konnten übereinstimmen (z. B. GELB in gelber Farbe geschrieben) oder die Wortbedeutung und die Wortfarbe konnten nicht übereinstimmen (z. B. GELB in blauer Farbe geschrieben). Erst nachdem das Kind vier Aufgaben des Stroop-Tests nacheinander ausgeführt hatte, erschien auf dem Bildschirm eine Anforderung zur Satzwiederholung (eine Figur mit offenem Mund). Der Einsatz des Stroop-Tests zwischen der Satzpräsentation und der Wiederholung hatte zum Ziel, ein passives Imitieren der Sätze von den Kindern zu vermeiden.

6.3.4 Rezeptive Aufgaben – Bildausmalen und Bildwahl Die erste rezeptive Aufgabe besteht darin, Bilder auszumalen. Das Bildausmalen umfasst neun Anweisungen mit den dazu passenden Bildern. Alle zielen auf die Untersuchung der Interpretation der Artikel ab. Jede Anweisung besteht aus zwei Sätzen, die den Kontext für die Referenzherstellung bilden und einem Satz, der eine NP mit einem bestimmten oder einem unbestimmten Artikel im Singular beinhaltet. Die Kinder wurden gebeten, gemäß der Anweisung die entsprechenden Objekte mit einem Buntstift auszumalen. Die Bilder sind so gestaltet, dass das Kind beim Ausmalen eine Entscheidung treffen muss, wie es die gegebene NP interpretiert. Ein Beispiel der Anweisung und des dazu passenden Bildes ist in Abbildung 6–3 zu sehen.

Untersuchungsmethoden

163

Abb. 6–3: Bildausmalen

Die NP im dritten Satz der Anweisung in Abb. 6–3 ist eine definite NP. Der Kontext in den zwei ersten Sätzen der Anweisung bestimmen als Referenten der NP das Pferd, das Gras frisst. Auf dem Bild ist nur ein Tier zu sehen, das diese Bedingung erfüllt, und daher als Referent der definiten NP das Pferd gelten soll. Das Tier sollte daher von den Kindern ausgemalt werden, wenn sie die definite NP der Norm entsprechend interpretieren. Die Ausmal-Aufgabe beinhaltet vier Sätze mit NPn mit bestimmtem Artikel und fünf Sätze mit unbestimmtem Artikel. Die NPn sind im Maskulinum (3), im Femininum (3) und im Neutrum (3). Die vollständige Liste ist in Anhang D zu sehen. Die zweite rezeptive Aufgabe ist die Bildwahl. Ihr Gegenstand ist es auch, die Interpretation des bestimmten und unbestimmten Artikels der Kinder zu untersuchen. Sie umfasst drei Anweisungen mit den dazu passenden Bildpaaren. In jeder Anweisung wird zuerst ein allgemeiner Kontext geschaffen. Darauf folgt ein zusammengesetzter Satz, in dem NPn mit bestimmtem oder unbestimmtem Artikel vorkommen. Sie beziehen sich auf einen oder auf zwei Referenten. Die Kinder wurden angewiesen, ein Bild aus zwei Alternativen zu wählen. Die Bilder veranschaulichen alternative Interpretationen von NPn, auf die sich die NPn auf ein oder auf zwei Gegenstände beziehen. Ein Beispiel der Anweisung und des dazu passenden Bildpaares ist in Abbildung 6–4 zu sehen. Die NP ein Puppenhaus im ersten Satzteil bezieht sich auf einen Referenten. Die NP ein Puppenhaus im zweiten Satzteil kann sich nicht auf denselben Referenten beziehen, weil sie den unbestimmten Artikel beinhaltet. Die normgerechte Interpretation der zwei NPn mit dem unbestimmten Artikel ist, dass sie

164

Methodologie der empirischen Untersuchungen

Abb. 6–4: Bildwahl

sich auf zwei unterschiedliche Objekte beziehen. So eine Situation wird auf dem zweiten Bild der Abbildung 6–4 veranschaulicht. Wenn das Kind die NP mit dem unbestimmten Artikel normgerecht interpretiert, wählt es das zweite Bild. Die anderen zwei Aufgaben werden in Beispiel 6–20 und 6–21 angegeben: 6–20 6–21

Peter und Marie waren im Park. Peter hat einen Hund gestreichelt, Marie hat auch den Hund gestreichelt. Katja und Markus waren im Zoo. Katja hat eine Giraffe gefüttert, Markus hat auch die Giraffe gefüttert.

In den Beispielen 6–20 und 6–21 ist eine umgekehrte Situation zu Abb. 6–4 zu sehen. In den ersten Satzteilen kommt der unbestimmte Artikel, und in den zweiten Satzteilen der bestimmte Artikel vor. Die NPn den Hund und die Giraffe stehen in der Relation der Anapher zu den koreferentiellen Ausdrücken aus den ersten Satzteilen und können sich deshalb nur auf dieselben Referenten beziehen. Die normgerechte Interpretation ist in diesen Fällen eine Wahl des Bildes, auf dem der Bezug auf einen Referenten veranschaulicht ist. Beide rezeptiven Aufgaben sind als traditionelle Aufgaben mit Papier und Buntstiften konzipiert worden. Der Grund dafür war vor allem, den Kindern etwas Erholung vom Computerbildschirm zu geben und etwas Diversität in den Test einzuführen, der aus mehreren, für Kinder herausfordernden, Aufgaben besteht.

Datenauswertungsverfahren

6.4

165

Datenauswertungsverfahren

Alle sprachlichen Daten der Kinder sind in E-Prime 2.0 Professional SP2-Software gespeichert worden. Dabei wurden sie anonymisiert, um die Sicherheit der Kinder zu bewahren. Ihre Daten wurden auf solch Weise kodiert, dass die Zugehörigkeit der Daten aus einzelnen Tests zu einem Individuum gesichert worden ist. Die linguistische Analyse der Daten erfolgt im Excel-Programm. In der GJT werden die Akzeptierung eines korrekten Satzes oder die Ablehnung eines inkorrekten Satzes mit der entsprechenden Korrektur als korrekte Antworten betrachtet. Im Falle der Ablehnung eines Satzes wurden die Kinder gebeten, den Satz zu korrigieren. Wenn die Kinder den Satz nicht korrigiert haben, gilt die Antwort als irrelevant und sie wird von der weiteren Analyse ausgeschlossen. Wenn die Kinder einen inkorrekten Satz korrigiert haben, aber ihre Korrektur ein anderes Phänomen betraf, und das relevante Phänomen blieb in der Form des Ausgangssatzes, dann gilt die Antwort als inkorrekt. Die Kinder wurden zum Schluss der Aufgabe um die Korrektur aller Sätze gebeten, die sie als schlecht klingend beurteilt hatten. Dabei konnte passieren, dass die Kinder ihre Meinung geändert haben. Wenn die Kinder ihre Meinung geändert haben und bei der Aufforderung zur Korrektur den inkorrekten Satz doch als korrekt beurteilt haben, gilt ihre Antwort als inkorrekt. Wenn die Kinder ihre Meinung bei der Beurteilung eines korrekten Satzes bei der Aufforderung zur Korrektur geändert haben und ihn doch als gut beurteilt haben, gilt ihre Antwort als korrekt. Die Anzahl irrelevanter Antworten ist niedrig und wird in den nächsten Kapiteln 7 und 8 für jede Gruppe gesondert angegeben. Die Aufgabe der Kinder in der FCT besteht darin, eine Antwort unter zwei Alternativen zu wählen. In den meisten Fällen wird eine Wahl zwischen einem normgerechten Satz und einem nicht-normgerechten Satz erzwungen. Als richtige Antwort gilt in solchen Fällen die Wahl des normgerechten Satzes. In wenigen Fällen wird eine Wahl zwischen zwei Sätzen erzwungen, die beide der Norm entsprechen. Dabei wird die Präferenz der Kinder für die eine oder die andere Struktur untersucht. In diesen Fällen gilt die Wahl beider Sätze in der FCT als korrekte Antwort. In der GJT und der FCT wurden die Reaktionszeiten in Millisekunden gemessen. Als Reaktionszeit gilt dabei die Zeit zwischen der Präsentation eines gegebenen Satzes und der Reaktion des Kindes, d. h. dem Drücken einer Taste. In der SRT werden die Wiederholungen der Sätze im Hinblick darauf analysiert, ob die Kinder Änderungen eingeführt haben, die für die untersuchten Phänomene relevant sind. Bei der Untersuchung des Artikelgebrauchs wird daher analysiert, ob die Kinder in den wiederholten Sätzen den bestimmten Artikel durch den unbestimmten Artikel ersetzt haben, oder umgekehrt. Bei der Analyse der Realisierung der Argumente wird untersucht, ob die Kinder den

166

Methodologie der empirischen Untersuchungen

Status des Arguments von Overt zu Null, oder umgekehrt, bei der Satzwiederholung geändert haben. Als irrelevant gelten hier Sätze, die gar nicht von den Kindern wiederholt worden sind. Auch Sätze, in denen die relevante Struktur bei der Wiederholung ausgelassen worden ist, werden als irrelevant aus der weiteren Analyse ausgeschlossen. Die Anzahl der irrelevanten Sätze ist nicht groß; sie wird auch bei der Besprechung der Ergebnisse in den Kap. 7 und 8 angegeben. Die Satzwiederholungen der Kinder in der SRT werden auch in jener Hinsicht analysiert, ob sie im Allgemeinen korrekt sind. Als korrekt gelten Wiederholungen, die den Sinn des Ausgangssatzes wiedergeben und keinen grammatischen oder lexikalischen Fehler aufweisen. Wenn ein Fehler oder mehrere Fehler in der Satzwiederholung auftreten, dann wird sie als inkorrekt betrachtet. Als grammatische Fehler gelten in diesem Schritt der Analyse alle Verstöße gegen das grammatische System des Deutschen, also nicht nur solche in den Bereichen des Artikelgebrauchs und der Nullargumente. Die meisten Fehler in den Satzwiederholungen der Kinder im Hinblick auf die allgemeine grammatische Korrektheit betreffen den nominalen Bereich, insbesondere Kasus und Genus. Die lexikalischen Fehler sind mit der Wortwahl verbunden. Die SRT-Ergebnisse unterliegen auch der Analyse in Bezug auf die Exaktheit der Wiederholungen im Verhältnis zu den auditiv präsentierten Ausgangssätzen. Als exakte Wiederholungen gelten solche Äußerungen, in denen kein Element ersetzt, vertauscht oder ausgelassen worden ist. Die Wiederholungen, in denen ein Element oder mehrere Elemente ersetzt, vertauscht oder ausgelassen worden sind, werden als nicht exakte Wiederholungen betrachtet. Zu unterstreichen ist, dass die grammatische Korrektheit und die Exaktheit unterschiedliche Kriterien der Analyse sind. Eine Satzwiederholung kann als grammatisch korrekt eingestuft werden, wenn sie den Sinn des Ausgangssatzes wiedergibt und keinen grammatischen Fehler aufweist. Gleichzeitig aber kann sie als nicht exakte Wiederholung klassifiziert werden, weil die Wortfolge beispielsweise geändert worden ist, aber die Änderung keine Ungrammatikalität verursacht hat. Als irrelevant werden bei diesen Analyseschritten jene Fälle ausgeschlossen, bei denen die Kinder den Ausgangssatz gar nicht wiederholt haben. Bei den rezeptiven Aufgaben – Bildausmalen und Bildwahl – werden die Interpretationen des bestimmten und unbestimmten Artikels analysiert. Als irrelevant gelten jene Reaktionen der Kinder, die gar nichts oder etwas ganz anderes gemalt haben. Die Anzahl solcher Reaktionen ist niedrig und wird in Kap. 7 angegeben. Beim Bildausmalen wird die Präferenz der Kinder analysiert, die Nominalphrase mit dem bestimmten oder unbestimmten Artikel anaphorisch zu interpretieren. Dabei werden die Reaktionen der Kinder auf die Sätze mit der NP mit bestimmtem oder unbestimmtem Artikel untersucht. Als »anaphorisch« wird eine solche Reaktion eingestuft, bei der die Kinder ein Objekt ausmalen, worauf schon im ersten Satz der Anweisung referiert worden ist. Dadurch wird

Datenauswertungsverfahren

167

sichtbar, dass die Kinder die NP im letzten Satz als Anapher betrachten. Als »nicht anaphorisch« wird eine Reaktion klassifiziert, bei der die Kinder ein Objekt ausmalen, worauf nicht im ersten Satz der Anweisung referiert worden ist. Dadurch zeigen sie, dass sie die NP im letzten Satz nicht als Anapher interpretieren. Das Ziel der Analyse der Ergebnisse der zweiten rezeptiven Aufgabe – die Bildwahl – ist auch die Interpretation des bestimmten und unbestimmten Artikels der Kinder. Als normgerechte Antworten gelten hier Entscheidungen der Kinder bei der Bildwahl, die der Norm des Deutschen entsprechen. D. h. im Falle der Anweisung, die zwei NPn mit dem unbestimmten Artikel enthält, gilt die Wahl eines Bildes als normgerecht, auf dem sich die geschilderte Tätigkeit auf zwei unterschiedliche Objekte bezieht. Im Gegensatz dazu steht eine Anweisung, die eine NP mit unbestimmtem und eine NP mit bestimmtem Artikel enthält. In solchen Fällen wird die Wahl eines Bildes, auf dem sich die geschilderte Tätigkeit auf ein Objekt bezieht, als normgerecht betrachtet. Bei dieser Aufgabe würde eine Antwort als irrelevant gelten, bei der kein Bild unter zwei Alternativen gewählt worden wäre. Alle Antworten der Kinder bei der Bildwahl sind jedoch relevant und unterliegen der oben beschriebenen Analyse. Die statistischen Analysen werden mit dem Programm IBM SPSS Statistics 26.0 durchgeführt. Um die Abhängigkeit der nominalen Variablen von der Gruppenzugehörigkeit und/oder den Bedingungen zu ermitteln, wird eine verallgemeinerte gemischte Modellanalyse durchgeführt. Der Proband wird dabei als zufälliger Effekt in das Modell aufgenommen, während die Gruppenzugehörigkeit und, falls vorhanden, die Testbedingung als feste Effekte miteinbezogen werden. Die Interaktion von Gruppenzugehörigkeit und Testbedingung wird ebenfalls in die Modelle aufgenommen. Für die Analysen wird eine binomiale Wahrscheinlichkeitsverteilung mit einer Logit-Bindungsfunktion verwendet. Das angepasste Akaike-Informationskriterium (AIC) wird als Kriterium für die Modellanpassung herangezogen. Es wird auch eine logistische Regressionsanalyse durchgeführt, um festzustellen, ob das Alter beim Beginn des Deutscherwerbs, das Alter beim Beginn des Polnischerwerbs, der Input im Deutschen, der Input im Polnischen und die Testbedingung (falls vorhanden) Prädiktoren für die Richtigkeit/Genauigkeit der nominalen Variablen sind. Die Kollinearität wird anhand des VIF-Koeffizienten kontrolliert, wobei der VIF-Wert