Gesprochene Schulsprache in der Primarstufe: Ein empirisches Verfahren zur Evaluation von Fördereffekten im Bereich Deutsch als Zweitsprache 9783110403015, 9783110402957

Current programs to help primary school students learn German as a second language have the overarching aim of strengthe

271 41 13MB

German Pages 398 [513] Year 2015

Report DMCA / Copyright

DOWNLOAD PDF FILE

Table of contents :
Danksagung
Inhalt
Abbildungsverzeichnis
Tabellenverzeichnis
1 Einleitung und Zielsetzung
2 Gesprochene Schulsprache: Theorie und Forschungsstand
2.1 Zur Relevanz von Schulsprache
2.2 Konzeptualisierungen und Merkmale von Schulsprache
2.3 Gesprochene Schulsprache im Spannungsfeld von Mündlichkeit und Schriftlichkeit
2.3.1 Gesprochene-Sprache-Forschung – ein Überblick
2.3.2 Nähe-Distanz-Modellierungen
2.3.3 Systemfrage
2.3.4 Medial-extensionales Modell
2.3.5 Gesprochene Schulsprache in der Primarstufe – Versuch einer Konzeptualisierung
2.4 Schulsprache – Standardsprache
2.4.1 Zur Relevanz standardsprachlicher Fähigkeiten
2.4.2 Zu den Begriffen Standarddeutsch und Sprachnorm
3 Deutsch-als-Zweitsprache-Erwerb: Theorie und Forschungsstand
3.1 L2-Erwerbshypothesen
3.2 Nativistische und kognitivistische Erklärungsansätze
3.3 Analyse von Erwerbsfortschritten
3.3.1 Emergenz-Kriterium
3.3.2 Klassische Fehleranalyse
3.4 Stolpersteine des DaZ-Erwerbs
3.4.1 Wortschatz (semantische Basisqualifikation)
3.4.1.1 Grundlegende Erkenntnisse zum zweitsprachlichen Wortschatzerwerb
3.4.1.2 Verbaler Wortschatz
3.4.1.3 Funktionswortschatz
3.4.2 Grammatik (morphosyntaktische Basisqualifikation)
3.4.2.1 Satzmodelle
3.4.2.2 Verbalflexion
3.4.2.3 Nominalflexion
3.4.3 Zusammenfassung
4 Sprachlehr- und -lernforschung
4.1 Explizites und implizites Wissen
4.2 Focus on Form
4.3 Language Awareness
5 Sprachstandsdiagnose
5.1 Hintergründe und Anforderungen
5.2 Sprachstandsdiagnoseverfahren
6 Entwicklung eines empirischen Verfahrens zur Evaluation von Fördereffekten
6.1 Methodische Grundlagen
6.1.1 Merkmal und Konstrukt
6.1.2 Testitems
6.1.3 Gütekriterien
6.2 Stichprobe
6.2.1 Stichprobe der Pilotierung
6.2.2 Hauptstichprobe
6.3 Datenerhebung
6.3.1 Zielsetzung
6.3.2 Elizitierungsverfahren
6.3.2.1 Aufwärmphase
6.3.2.2 Erhebungsphase
6.4 Transkription
6.4.1 Zum Transkriptionssystem CHAT
6.4.2 Transkriptionskonventionen
6.5 Kodierung
6.5.1 Variablenauswahl
6.5.1.1 Indikatoren schulsprachlicher Kompetenz
6.5.1.2 Indikatoren und Stolpersteine des DaZ-Erwerbs fortgeschrittener Lerner
6.5.1.3 Variablenübersicht
6.5.2 Kodierverfahren: Quantitative Inhaltsanalyse
6.5.2.1 Analyseschritt 1: Wiederholungen und Selbstkorrekturen
6.5.2.2 Analyseschritt 2: Präpositional- und Nominalphrase
6.5.2.3 Analyseschritt 3: ‚Reste‘-Analyse
6.5.2.4 Analyseschritt 4: Lexikalische Mittel und syntaktische Komplexität
6.5.2.5 Auszählung und Dateneingabe
6.6 Evaluierung: Prüfung der Gütekriterien
6.6.1 Güteprüfung des Elizitierungsverfahrens
6.6.2 Güteprüfung des Transkriptionsverfahrens
6.6.3 Güteprüfung des Kodierverfahrens
6.6.3.1 Deskriptive Häufigkeitsanalyse
6.6.3.2 Prüfung der Objektivität
6.6.3.3 Dimensionsanalysen
6.6.3.4 Skalenkonstruktion und -beschreibung
6.6.3.5 Prüfung der Reliabilität
6.6.3.6 Berechnung der Testwerte
6.6.3.7 Prüfung der Validität
6.6.3.8 Prüfung der Nebengütekriterien
7 Diskussion
7.1 Zusammenfassung
7.2 Diskussion der theoretischen Grundlagen
7.3 Diskussion des neu entwickelten Evaluationsinstruments
7.3.1 Diskussion des Elizitierungs- und Transkriptionsverfahrens
7.3.2 Diskussion des Kodierverfahrens
7.3.3 Diskussion der Evaluationsergebnisse (Güteprüfung)
7.4 Fazit
8 Anhang
Literaturverzeichnis
Index
Recommend Papers

Gesprochene Schulsprache in der Primarstufe: Ein empirisches Verfahren zur Evaluation von Fördereffekten im Bereich Deutsch als Zweitsprache
 9783110403015, 9783110402957

  • 0 0 0
  • Like this paper and download? You can publish your own PDF file online for free in a few minutes! Sign Up
File loading please wait...
Citation preview

Julia Webersik Gesprochene Schulsprache in der Primarstufe

DaZ-Forschung

Deutsch als Zweitsprache, Mehrsprachigkeit und Migration Herausgegeben von Bernt Ahrenholz Christine Dimroth Beate Lütke Martina Rost-Roth

Band 9

Julia Webersik

Gesprochene Schulsprache in der Primarstufe Ein empirisches Verfahren zur Evaluation von Fördereffekten im Bereich Deutsch als Zweitsprache

DE GRUYTER

Gedruckt mit Unterstützung des Förderungs- und Beihilfefonds Wissenschaft der VG Wort.

ISBN 978-3-11-040295-7 e-ISBN (PDF) 978-3-11-040301-5 e-ISBN (EPUB) 978-3-11-040308-4 ISSN 2192-371X Library of Congress Cataloging-in-Publication Data A CIP catalog record for this book has been applied for at the Library of Congress Bibliografische Information der Deutschen Nationalbibliothek Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über http://dnb.dnb.de abrufbar. © 2015 Walter de Gruyter GmbH, Berlin/München/Boston Druck und Bindung: CPI books GmbH, Leck ♾ Gedruckt auf säurefreiem Papier Printed in Germany www.degruyter.com

Danksagung Danken möchte ich an erster Stelle natürlich meinen beiden Doktormüttern Prof. Dr. Heidi Rösch und Prof. Dr. Petra Stanat, die mich durch ihre spezifischen Expertisen zu jeder Zeit wunderbar betreut haben. Eine große Hilfe war in diesem Zusammenhang außerdem Jenny Paetsch, die mich immer wieder geduldig in allen Fragen rund um die Statistik beraten hat. Neben dieser fachlichen Unterstützung wäre die Arbeit jedoch ohne die Hilfe meiner Familie und dabei insbesondere den tatkräftigen Einsatz meiner Mutter, Dr. Almuth-Maria Sekler, nicht möglich gewesen. Danke euch allen! Zu danken ist weiterhin allen studentischen Hilfskräften, die mich sehr verlässlich bei der Erhebung, Transkiption, Kodierung und Eingabe der Daten unterstützt haben: Anna Bischoping, Anja Eidner, Jessica Menz, Kathrin Philipp, Henning Stamer, Nadine Bühler, Silke Göttle, Luisa Kröger, Katja Leukam, Julia Seufert, Annika Claaßen, Lena Eberhardt, Jessica Grohe, Bastian Karsch, Helene Karsten, Anna Lüll, Julia Mogath, Julia Roth und Laura Bradel Für die Finanzierung dieser studentischen Unterstützung, durch die ein solch aufwändiges empirisches Projekt überhaupt erst möglich wurde, möchte ich mich bei der Pädagogischen Hochschule Karlsruhe und dem Instituts zur Qualitätsentwicklung im Bildungswesen (IQB) der Humboldt-Universität zu Berlin bedanken, die die dafür notwendigen Fördermittel zur Verfügung gestellt haben. Mein abschließender Dank gilt meinen lieben Freunden für ihre sehr hilfreiche Unterstützung in der letzten Korrekturphase: Johanna Fay, Christopher Sappok, Andreas Krafft, Bettina Deutsch und Katja Jansen

Inhalt 1

Einleitung und Zielsetzung | 1 

2 2.1 2.2 2.3

Gesprochene Schulsprache: Theorie und Forschungsstand | 6  Zur Relevanz von Schulsprache | 6  Konzeptualisierungen und Merkmale von Schulsprache | 11  Gesprochene Schulsprache im Spannungsfeld von Mündlichkeit und Schriftlichkeit | 31  Gesprochene-Sprache-Forschung – ein Überblick | 31  Nähe-Distanz-Modellierungen | 35  Systemfrage | 49  Medial-extensionales Modell | 57  Gesprochene Schulsprache in der Primarstufe – Versuch einer Konzeptualisierung | 61  Schulsprache – Standardsprache | 74  Zur Relevanz standardsprachlicher Fähigkeiten | 74  Zu den Begriffen Standarddeutsch und Sprachnorm | 77 

2.3.1 2.3.2 2.3.3 2.3.4 2.3.5 2.4 2.4.1 2.4.2 3 3.1 3.2 3.3 3.3.1 3.3.2 3.4 3.4.1 3.4.1.1 3.4.1.2 3.4.1.3 3.4.2 3.4.2.1 3.4.2.2 3.4.2.3 3.4.3

Deutsch-als-Zweitsprache-Erwerb: Theorie und Forschungsstand | 86  L2-Erwerbshypothesen | 87  Nativistische und kognitivistische Erklärungsansätze | 90  Analyse von Erwerbsfortschritten | 94  Emergenz-Kriterium | 94  Klassische Fehleranalyse | 97  Stolpersteine des DaZ-Erwerbs | 106  Wortschatz (semantische Basisqualifikation) | 108  Grundlegende Erkenntnisse zum zweitsprachlichen Wortschatzerwerb | 108  Verbaler Wortschatz | 115  Funktionswortschatz | 116  Grammatik (morphosyntaktische Basisqualifikation) | 121  Satzmodelle | 121  Verbalflexion | 123  Nominalflexion | 125  Zusammenfassung | 136

VIII | Inhalt

4 4.1 4.2 4.3

Sprachlehr- und -lernforschung | 139 Explizites und implizites Wissen | 139  Focus on Form | 144  Language Awareness | 147 

5 5.1 5.2

Sprachstandsdiagnose | 151  Hintergründe und Anforderungen | 151  Sprachstandsdiagnoseverfahren | 155 

6

Entwicklung eines empirischen Verfahrens zur Evaluation von Fördereffekten | 166  Methodische Grundlagen | 166  Merkmal und Konstrukt | 166  Testitems | 167  Gütekriterien | 168  Stichprobe | 176  Stichprobe der Pilotierung | 176  Hauptstichprobe | 176  Datenerhebung | 178  Zielsetzung | 178  Elizitierungsverfahren | 181  Aufwärmphase | 181  Erhebungsphase | 182  Transkription | 192  Zum Transkriptionssystem CHAT | 193  Transkriptionskonventionen | 195  Kodierung | 205  Variablenauswahl | 205  Indikatoren schulsprachlicher Kompetenz | 208  Indikatoren und Stolpersteine des DaZ-Erwerbs fortgeschrittener Lerner | 209  Variablenübersicht | 211  Kodierverfahren: Quantitative Inhaltsanalyse | 217  Analyseschritt 1: Wiederholungen und Selbstkorrekturen | 221  Analyseschritt 2: Präpositional- und Nominalphrase | 225  Analyseschritt 3: ‚Reste‘-Analyse | 234  Analyseschritt 4: Lexikalische Mittel und syntaktische Komplexität | 243  Auszählung und Dateneingabe | 250 

6.1 6.1.1 6.1.2 6.1.3 6.2 6.2.1 6.2.2 6.3 6.3.1 6.3.2 6.3.2.1 6.3.2.2 6.4 6.4.1 6.4.2 6.5 6.5.1 6.5.1.1 6.5.1.2 6.5.1.3 6.5.2 6.5.2.1 6.5.2.2 6.5.2.3 6.5.2.4 6.5.2.5

Inhalt | IX

6.6 6.6.1 6.6.2 6.6.3 6.6.3.1 6.6.3.2 6.6.3.3 6.6.3.4 6.6.3.5 6.6.3.6 6.6.3.7 6.6.3.8

Evaluierung: Prüfung der Gütekriterien | 256  Güteprüfung des Elizitierungsverfahrens | 256  Güteprüfung des Transkriptionsverfahrens | 265  Güteprüfung des Kodierverfahrens | 266  Deskriptive Häufigkeitsanalyse | 266  Prüfung der Objektivität | 275  Dimensionsanalysen | 285  Skalenkonstruktion und -beschreibung | 295  Prüfung der Reliabilität | 302  Berechnung der Testwerte | 307  Prüfung der Validität | 313  Prüfung der Nebengütekriterien | 320 

7 7.1 7.2 7.3 7.3.1 7.3.2 7.3.3 7.4

Diskussion | 322  Zusammenfassung | 322  Diskussion der theoretischen Grundlagen | 324  Diskussion des neu entwickelten Evaluationsinstruments | 329  Diskussion des Elizitierungs- und Transkriptionsverfahrens | 329  Diskussion des Kodierverfahrens | 331  Diskussion der Evaluationsergebnisse (Güteprüfung) | 335  Fazit | 340 

8

Anhang | 345 

Literaturverzeichnis | 346  Index | 375 

Abbildungsverzeichnis Abb. 1. Abb. 2. Abb. 3. Abb. 4. Abb. 5. Abb. 6. Abb. 7. Abb. 8. Abb. 9. Abb. 10. Abb. 11. Abb. 12. Abb. 13. Abb. 14. Abb. 15. Abb. 16. Abb. 17. Abb. 18. Abb. 19.

Abb. 20.

Abb. 21. Abb. 22. Abb. 23.

The Academic Language Continuum | 12 Vier-Felder-Modell zur Verortung von BICS und CALPS | 16 The „Dual-Iceberg” Representation of Bilingual Proficiency | 17 Modell zur Beschreibung von Schulsprache im Fachunterricht | 24 Medium und Konzeption | 36 Nähe-Distanz-Modell von Koch & Oesterreicher | 37 Einbettung von Sprache in soziale Kontexte| 40 Grundstruktur des Nähe-Distanz-Modells von Ágel & Hennig | 44 Zusammenhang von Parametern und Hierachieebenen im NäheDistanz-Modell von Ágel und Hennig | 46 Durchschnittliche Werte mündlicher und schriftlicher Textsorten für Faktor 1 und 2 | 49 Regelmengen zur Produktion schriftlicher und mündlicher Texte | 52 System, Norm und Rede | 53 Zusammenhang der Ebenen System, Norm und Rede am Beispiel des Phonems /r/ |  55 Grammatikmodell für geschriebene und gesprochene Sprache | 56 Parameter zur Charakterisierung gesprochener Sprache bei Fiehler et al. (2004) und Hennig (2006)  | 59 Modell zur Abgrenzung von Standard und (Standard-) Varietäten | 82 Grad der Normierung geschriebener und gesprochener Sprache | 83 Prozess der Erkennens und Identifizierens von Fehlern  | 100 Kontraste der Leistungen von Mehrsprachigen und nicht deutsch Erstsprachigen gegenüber deutsch Erstsprachigen zum Ende des neunten Jahrgangs | 109 Sicherheit in Bezug auf Determiniererverwendung und Markierung der Nominalflexion bei Kindern mit und ohne Migrationshintergrund | 126 Die Rolle expliziten Wissens beim L2-Erwerb | 142 Cartoon zu standardisierten Diagnoseverfahren | 152 Sprachliche Dimensionen und Indikatoren von Tulpenbeet | 162

XII | Abbildungsverzeichnis Abb. 24. Abb. 25. Abb. 26. Abb. 27. Abb. 28. Abb. 29. Abb. 30. Abb. 31. Abb. 32. Abb. 33. Abb. 34. Abb. 35. Abb. 36. Abb. 37. Abb. 38. Abb. 39. Abb. 40. Abb. 41. Abb. 42. Abb. 43.

Zusammenfassende Übersicht über Gütekriterien | 169 Herkunftssprachen der getesteten Schüler | 177 Angaben der Eltern zur Dauer der Kitazeit ihrer Kinder | 178 Mögliche Bestandteile der Selbstreparatur | 202 Algorithmus A zur Identifikation von Wiederholungen und Selbstkorrekturen (Transkription) |  204 Hierarchische Darstellung der Kriterien zur Variablenauswahl | 206 Übersicht der Kodierschritte | 219 Algorithmus B zur Identifikation von Wiederholungen und Selbstkorrekturen (Analyseschritt 1) |  222 Algorithmus C zur Analyse von Fehlern in der Nominalphrase (Analyseschritt 2) |  228 Algorithmus D zur Analyse von Genus- und Kasusfehlern (Analyseschritt 2) |  232 Algorithmus E zur syntaktischen Fehleranalyse (Analyseschritt 3) |  238 Transkript und Auswertungsvorlage Wortschatzanalyse (Analyseschritt 4) |  245 Transkriptausschnitt mit Markierung von Verben und Adjektiven | 247 Screenshot Auszählung Inhaltswörter (Analyseschritt 4b) |  248 Kurvengruppe zur Veranschaulichung des Zusammenhangs von Wortschatzreichtum und Parameter D | 252 Ergebnisse aus Analyseschritt 4 mit Type-TokenBerechnung | 255 Ergebnis des Scree-Tests | 289 Scatterplot Testwerte Elaborierte Sprachverwendung und Formalsprachliche Abweichungen (Grammatik) |  309 Scatterplot Testwerte Elaborierte Sprachverwendung und Fehlerschwerpunkte der Nominalflexion | 309 Scatterplot Testwerte Elaborierte Sprachverwendung und Lexikalisch-semantische Unsicherheiten | 310

Tabellenverzeichnis Tab. 1. Tab. 2. Tab. 3.

Tab. 4. Tab. 5.

Tab. 6. Tab. 7. Tab. 8.

Tab. 9. Tab. 10. Tab. 11. Tab. 12. Tab. 13. Tab. 14. Tab. 15. Tab. 16. Tab. 17. Tab. 18. Tab. 19. Tab. 20. Tab. 21. Tab. 22.

Häufigkeit bildungssprachlicher Elemente in Sprachproben einund zweisprachiger Schüler | 21 Signifikanz verschiedener bildungssprachlicher Indikatoren | 22 A Description of the Linguistic Components of Academic English and Their Associated Features Used in Everyday Situations and in Academic Situations | 26 Register Features of Spoken Interaction and School-Based Texts | 28 Linguistic Features and Core Domains of Cognitive Accomplishments Involved in Academic Language Performance | 29 Kontextuelle Einflüsse auf den Diskurs | 42 Distanzsprachliche Kommunikationsbedingungen gesprochener Schulsprache | 62 Distanzsprachliche Merkmale in Bezug auf Rollenparameter, Situationsparameter, Parameter des Codes und Parameter des Mediums | 65 Durch die Zeitlichkeit mündlicher Produktion bedingte sprachliche Merkmale | 67 Zusammenfassung typischer grammatikalischer und lexikalischer Merkmale von Schulsprache | 73 What is involved in knowing a word | 111 Synkretismen beim bestimmten Artikel | 128 Entwicklungssequenzen beim Genus- und Kasuserwerb | 130 Stufen bei der Aneignung der Kasusmarkierungen am Artikel | 132 Stolpersteine und Indikatoren für Erwerbsfortschritte fortgeschrittener DaZ-Lerner | 137 Vier-Felder-Modell zweitsprachlichen Wissens | 140 Focus on FormS, Focus on Form, Focus on Meaning | 146 Subtests des Sprachstandsdiagnoseverfahren SET 5-10 | 158 Subtests des Sprachstandsdiagnoseverfahren SFD | 159 Subtests des Sprachstandsdiagnoseverfahren P-ITPA | 159 Exemplarischer Aufbau einer Transkription | 197 Operationalisierbare Indikatoren gesprochener Schulsprache | 209

XIV | Tabellenverzeichnis Tab. 23. Tab. 24. Tab. 25. Tab. 26. Tab. 27. Tab. 28. Tab. 29. Tab. 30. Tab. 31. Tab. 32. Tab. 33. Tab. 34. Tab. 35. Tab. 36. Tab. 37. Tab. 38. Tab. 39. Tab. 40. Tab. 41. Tab. 42. Tab. 43. Tab. 44. Tab. 45. Tab. 46. Tab. 47. Tab. 48. Tab. 49. Tab. 50. Tab. 51. Tab. 52.: Tab. 53.

Zusätzliche Förderschwerpunkte im BeFo-Projekt (FoF-Ansatz)  | 210 Variablenübersicht basierend auf der Hauptstichprobe  | 212 Kennwerte zur Relativierung der Variablen-Häufigkeiten | 216 Übersicht Kodierung Analyseschritt 1 | 224 Übersicht Kodierung Analyseschritt 2 | 226 Probeverfahren „Liegt ein Kasusfehler vor?“ | 230 Probeverfahren „Liegt ein Genusfehler vor?“ | 231 Kodierung von Wiederholungsfehlern im Bereich der Nominalflexion | 234 Übersicht Kodierung Analyseschritt 3 | 234 Suchbegriffe für die automatisierte Suche (Analyseschritt 3)  | 236 Ausschnitt der Tabellen zur Differenzierung von semantisch falschen Substantiven bzw. Verben und Näherungsbegriffen | 237 Beispiel für ein kodiertes Transkript (Analyseschritte 1-3) | 240 Übersicht Kodierung Analyseschritt 4 | 244 Berücksichtigte Präpositionen und Konnektoren bzw. Satzverbindungen/-gefüge (Analyseschritt 4 | 246 Token-Werte und syntaktische Strukturen (Analyseschritt 4) | 254 Güteprüfung des Elizitierungsverfahrens | 257 Häufigkeitsanalyse der Gesamtwortzahl (n = 150 | 263 Häufigkeitsanalyse der Gesamtwortzahl (n = 145) | 264 Ursprüngliche und kombinierte Variablen zur Kodierung abweichender Markierungen der Nominalflexion | 273 Mittelwert, Standardabweichung und Interklassenkorrelation für alle Einzelvariablen | 277 Statistische Kennwerte und ICC der neu kombinierten Variablen 281 Liste aller verbleibenden Variablen (Grundlage für Validitäts- und Reliabilitätsanalysen) | 283 Variablen mit MSA-Koeffizient < 0.5 | 287 Mustermatrix | 290 Strukturmatrix | 291 Faktorenkorrelation | 294 Zuordnung der Variablen zu den Skalen (Übersicht | 300 Skala Elaborierte Sprachverwendung | 304 Skala Lexikalisch-semantische Unsicherheiten | 305 Skala Fehlerschwerpunkte der Nominalflexion | 305 Skala Formalsprachliche Abweichungen (Grammatik) | 306

Tabellenverzeichnis | XV Tabellenverzeichnis | XV

Tab. 54. Tab. 54. Tab. 55. Tab. 55. Tab. 56. Tab. 56. Tab. 57. Tab. 57. Tab. 58. Tab. 58. Tab. 59. Tab. 59. Tab. 60. Tab. 60. Tab. 61. Tab. 61. Tab. 62. Tab. 62. Tab. 63. Tab. 63. Tab. 64. Tab. 64.

Skalen-Übersicht | 307 Skalen-Übersicht | 307 Formeln zur Berechnung der Skalen-Testwerte | 311 Formeln zur Berechnung der Skalen-Testwerte | 311 Korrelation der Skalen-Testwerte | 312 Korrelation der Skalen-Testwerte | 312 Skalenübersicht mit statistischen Kennwerten der Skalenübersicht mit statistischen Kennwerten der Testwerte | 312 Testwerte | 312 Korrelation aller Testwerte mit der Variablen Korrelation aller Testwerte mit der Variablen Gesamtwortzahl | 313 Gesamtwortzahl | 313 Faktorenanalyse mit den Testwerten der 3 Hauptskalen | 315 Faktorenanalyse mit den Testwerten der 3 Hauptskalen | 315 Korrelation der BeFo-Grammatiktestwerte mit ELFE, DEMAT und Korrelation der BeFo-Grammatiktestwerte mit ELFE, DEMAT und WWT | 317 WWT | 317 Erwartete Korrelationen für den Testwert der Skala Elaborierte Erwartete Korrelationen für den Testwert der Skala Elaborierte Sprachverwendung | 317 Sprachverwendung | 317 Erwartete Korrelationen für den Testwert der Skala Erwartete Korrelationen für den Testwert der Skala Lexikalisch- semantische Unsicherheiten | 318 Lexikalisch- semantische Unsicherheiten | 318 Erwartete Korrelationen für die Testwerte Formalsprachliche AbErwartete Korrelationen für die Testwerte Formalsprachliche Abweichungen (Grammatik) und Fehlerschwerpunkte weichungen (Grammatik) und Fehlerschwerpunkte Nominalflexion | 318 Nominalflexion | 318 Korrelation der Testwerte des vorliegenden Verfahrens mit AußenKorrelation der Testwerte des vorliegenden Verfahrens mit Außenkriterien | 319 kriterien | 319

1 Einleitung und Zielsetzung Wie effektiv ist Sprachförderung? Auf diese Frage lässt sich zum gegenwärtigen Stand der Forschung trotz der zahlreichen Bemühungen, Kinder und Jugendliche beim Erwerb des Deutschen als Zweitsprache (DaZ) zu unterstützen, kaum eine Antwort geben. Seit dem sogenannten PISA-Schock, im Zuge dessen auch die große Bildungsbenachteiligung von Schülern 1 mit Deutsch als Zweitsprache deutlich wurde 2, werden in allen Bundesländern diverse Maßnahmen zur Sprachförderung eingesetzt, wobei sich ein Großteil auf den Elementarbereich bzw. das Jahr vor der Einschulung konzentriert 3. Im Primarbereich scheinen derzeit vor allem sogenannte Feriencamps erfolgreich zu sein (vgl. z.B. Rösch 2008; Ballis & Spinner 2008). Sehr verbreitet sind außerdem DaZ-Vorbereitungs- oder -Lernklassen, Förderstunden und integrative DaZ-Förderung innerhalb des Regelunterrichts (vgl. Rösch 2005a). Bei vielen dieser Fördermaßnahmen und -programme ist jedoch weitgehend unklar, auf welchem didaktischen Konzept die Förderung basiert bzw. basieren sollte, weil die DaZ-Didaktik in vielen Bereichen noch in den Kinderschuhen steckt (Schmölzer-Eibinger 2007: 140; Lütke 2011b: 105). Darüber hinaus mangelt es vor allem an einer methodisch fundierten Evaluierung der jeweiligen Maßnahmen (Stanat & Müller 2005: 23–24; Stanat, Baumert & Müller 2005: 857; Reich & Roth 2002: 21; Söhn 2005: 65–67; Riemer 2008: 9), was sicher auch auf methodische Schwierigkeiten wie z.B. die Kontrolle von Drittvariablen zurückzuführen ist (vgl. Kaltenbacher 2011: 163). Hopf fasst zusammen: 0F

1F

2F

In der BRD gibt es seit den 60er-Jahren des vorigen Jahrhunderts eine zwischen und innerhalb der Bundesländer bestehende große Vielfalt der (sprachlichen […]) Beschulung der Schüler mit Migrationshintergrund, ohne dass eine wissenschaftlich verlässliche Evaluierung der Auswirkungen auch nur einer einzigen Form dieses Unterrichts durchgeführt worden wäre. Dagegen gibt es eine Reihe von Begleituntersuchungen sowie eine fast schon unüberschaubare Literatur, in welcher die Diskussion um die Sprachen- und Leistungsfrage teils mit klugen und plausiblen Argumenten, teils mit emotional aufgeladener Schärfe geführt wird. Befürwortung oder Ablehnung des einen oder anderen Modells basieren dabei einerseits auf allgemeinen Überlegungen, andererseits auf einem bunten Strauß von mehr oder weniger einschlägigen wissenschaftlichen Untersuchungen. In aller || 1 Bezieht sich aus Gründen der Lesbarkeit wie auch bei Testleiter, Interviewer, Lehrer, Schulleiter, Klassenkameraden etc. auf männliche und weibliche Personen. 2 Für eine Übersicht der PISA-Ergebnisse 2000–2009 vgl. Stanat, Rauch & Segeritz (2010) 3 Für einen Überblick der Fördermaßnahmen in den einzelnen Bundesländern siehe Dietz & Lisker (2008)

2 | Einleitung und Zielsetzung Regel wird deren wissenschaftliche Tragfähigkeit jedoch nicht ernsthaft geprüft. Aufgrund der Versäumnisse der Forschung befinden wir uns somit noch heute in einer Situation, in der die Schulpolitik und -Verwaltung, aber auch die Lehrer nicht auf Befunde zurückgreifen können, die es erlauben, bestimmte Unterrichtsarrangements unter Verweis auf ihre wissenschaftlich verlässlich nachgewiesenen Vorzüge einzuführen, andere dagegen begründet abzulehnen. (Hopf 2005: 239)

Zu demselben Ergebnis kommen auch Limbird & Stanat in ihrer zusammenfassenden Darstellung zu Sprachförderprogrammen und ihrer Wirksamkeit: Über die Wirksamkeit der verschiedenen Maßnahmen der Sprachförderung für Schülerinnen und Schüler mit Migrationshintergrund, die in Deutschland zur Anwendung kommen, ist wenig bekannt. Kaum eine Studie hat systematisch untersucht, wie sich die Leistungen der Kinder und Jugendlichen, die an den jeweiligen Programmen teilnehmen, entwickeln. (Limbird & Stanat 2006: 261)

Auch außerhalb groß angelegter Programme „sind die Auswirkungen von Sprachunterricht auf den DaZ-Erwerb noch kaum erforscht und auch der DaZUnterricht noch weitgehend empirisch unerforscht“ (Ahrenholz 2003a: 298). Dieser Befund hat sich in den letzten Jahren nicht wesentlich verändert, so dass es laut Lütke (2010a: 69) keine abschließenden empirischen Beweise gibt, die klären, ob die Sprachaneignung durch unterrichtliche Instruktion gefördert werden kann. Auch Kaltenbacher (2011: 175) kommt zu demselben Schluss: „Welche Maßnahmen […] für bestimmte Altersgruppen die besten Ergebnisse erbringen, ist weit von einer wissenschaftlichen Klärung entfernt“, und Redder et al. (2011) fordern ausdrücklich: Die Professionalisierung von Förderung setzt voraus, dass Förderkonzepte auf empirischer Forschung basieren und systematisch reflektiert werden. Evidenzbasierung lässt sich durch die kritische Entwicklung von Diagnoseverfahren, die Weiterentwicklung und Evaluation bestehender Förderkonzepte und durch Erkenntnisgewinnung aus sorgfältig geplanten, durchgeführten und in ihren Wirkungen empirisch überprüften Interventionsstudien im Feld gewinnen. (Redder et al. 2011: 11)

Ein Beispiel für eine methodisch fundierte Evaluation eines Sprachförderprogramms stellt das Jacobs-Sommercamp Projekt dar, bei dem in einer experimentellen Feldstudie die Effekte verschiedener DaZ-Sprachförderansätze untersucht wurden 4. 3F

|| 4 Eine ausführliche Beschreibung des Evaluationskonzeptes dieser Studie findet sich in Stanat, Baumert & Müller (2005), eine Darstellung des Designs und der Ergebnisse in Stanat, Baumert & Müller (2008) und Stanat et al. (2012).

Einleitung und Zielsetzung | 3

In den Folgestudien BeFo I unter der Leitung von Prof. Dr. Petra Stanat und Prof. Dr. Heidi Rösch und BeFo II 5 unter der Leitung von Prof. Dr. Petra Stanat soll eine längerfristige und in den Schulkontext eingebundene Förderung evaluiert werden (Stanat, Baumert & Müller: 24). Anknüpfend an die Ergebnisse der Jacobs-Sommercamp Studie wird in BeFo die Wirksamkeit zweier didaktischer Ansätze der Zweitsprachförderung – Focus on Form (FoF) und Focus on Meaning (FoM) – in Form einer experimentellen Feldstudie mit Prä-Post-Design überprüft. Die BeFo-Stichprobe umfasst 362 Drittklässler mit Deutsch als Zweitsprache aus 15 Berliner Grundschulen, von denen 252 Schüler mit sprachlichem Förderbedarf über einen Zeitraum von einem Schuljahr (2010/11) nachmittags Förderunterricht erhielten. Dabei wurden sie zufällig auf die Treatmentgruppen (FoF und FoM) und eine Wartekontrollgruppe aufgeteilt. Während „es im FoF-Ansatz primär um Sprachbewusstheit und eine formalsprachlich angemessene Sprachproduktion geht, [fokussiert] der FoM-Ansatz das Verstehen von komplexen fachlichen Inhalten und das Kommunizieren über diese Inhalte“ (Rösch & Stanat 2011: 156). Beide Ansätze verfolgen dabei das übergeordnete Ziel, vor allem solche sprachlichen Kompetenzen zu fördern, die als grundlegend für schul- oder bildungssprachliche Kommunikation angesehen werden (Rösch & Stanat 2011: 156) 6. Eine wesentliche Voraussetzung für die systematische Evaluierung von Förderprogrammen wie dem BeFo-Projekt sind geeignete Instrumente, mit denen die Lernerfolge gemessen werden können (vgl. Kaltenbacher 2011). Solche validierten Instrumente liegen derzeit nur für einige sprachliche Teilbereiche vor. In vielen Förderprogrammen wird der Erfolg oder Misserfolg der Förderung deshalb durch eigens entwickelte Analyseverfahren ermittelt, über deren Güte meist wenig bekannt ist. Oder es wird auf externe Effekte wie z.B. eine Zunahme an Gymnasialempfehlungen verwiesen (z.B. Benholz 2004), wobei der kausale Zusammenhang zur Förderung nicht empirisch nachgewiesen wird. Aus Mangel an Alternativen werden Testinstrumente z.T. auch für Untersuchungsgegenstände eingesetzt, für die sie nicht konzipiert und deshalb auch nicht oder nur eingeschränkt valide sind (Kaltenbacher 2011: 167–168; Ehlich 2007: 53). 4F

5F

|| 5 BeFo I = Bedeutung und Form. Fachbezogene und sprachsystematische Förderung in der Zweitsprache BeFo II = Vertiefende Analysen zu Bedingungen der Wirksamkeit sprachsystematischer und fachbezogener Sprachförderung bei Grundschulkindern nicht-deutscher Herkunftssprache 6 Für eine genauere Darstellung des Projekts und seiner Förderansätze siehe Rösch & Rotter (2010); Rösch & Stanat (2011); Rösch, Rotter & Darsow (2012) und Darsow, Felbrich & Paetsch (2012).

4 | Einleitung und Zielsetzung Gerade für DaZ-Förderung im Schulalter gibt es bisher so gut wie keine validierten Instrumente zur Evaluation der Fördereffekte (vgl. Kap. 4). So liegt bislang auch kein validiertes Verfahren vor, durch das Lernfortschritte in Bezug auf bildungssprachliche Fähigkeiten, denen im Kontext Schule eine Schlüsselfunktion zugesprochen wird und die vielen DaZ-Schülern Schwierigkeiten bereiten, verlässlich erfasst werden könnten. Solche Instrumente sind jedoch angesichts der immer lauter werdenden Forderung nach „durchgängiger Sprachbildung“ (Gogolin & Lange 2011) und Sprachförderung über die Elementarstufe hinaus von großer Bedeutung. Denn neben pädagogisch-didaktischen Ergebnissen sind empirisch verlässliche Erkenntnissen zur Effektivität von Förderansätzen gerade für bildungspolitische Entscheidungen eine notwendige Grundlage (Redder et al. 2011: 11). Aus den genannten Gründen hat man sich im Rahmen des BeFo-Projekts zur Evaluation der Effektivität der Förderintervention neben dem Einsatz einiger veröffentlichter Tests wie z.B. ELFE 1–6 (Lenhard 2006) oder WWT 6–10 (Glück 2011) für die zusätzliche Entwicklung und Validierung eigener Instrumente entschieden. In diesem Kontext war es die Zielsetzung der vorliegenden Arbeit, ein Instrument zu entwickeln und zu evaluieren, das Fördereffekte in Bezug auf die gesprochene Schulsprache erfasst (vgl. Kap. 5). Das Verfahren setzt sich aus den Bausteinen Elizitierung, Transkription und Kodierung zusammen (vgl. Kap. 6.36.5). Ziel des Elizitierungsverfahrens ist es, durch eine weitgehend dekontextualisierte Kommunikationssituation einen möglichst authentischen Rahmen zur Produktion gesprochener Schulsprache zu schaffen. Die auf diese Weise elizitierten Sprachproben werden transkribiert und anschließend hinsichtlich ausgewählter Merkmale gesprochener Schulsprache kodiert und ausgewertet. Im Vordergrund stehen dabei lexikalische und morpho-syntaktische Mittel, deren Erwerb im Gegensatz zu anderen sprachlichen Bereichen relativ gut untersucht ist (Landua, Maier-Lohmann & Reich 2008: 171), so dass sich aus den vorliegenden Arbeiten Indikatoren für Erwerbs- bzw. Lernfortschritte ableiten ließen (vgl. Kap. 2) 7. Durch den wiederholten Einsatz des Instruments vor und nach der Förderintervention lässt sich mittels statistischer Verfahren wie dem t-Test oder der Varianzanalyse überprüfen, ob signifikante Unterschiede 6F

|| 7 Die Fokussierung auf grammatikalische und lexikalische Mittel bedeutet jedoch keineswegs, dass schulsprachliche Kompetenz auf diese Aspekte reduziert werden kann. Vielmehr ist Ehlich & Trautmann (2005: 45) Recht zu geben, die den Handlungscharakter von Sprache betonen und Sprachkompetenz durch einen „Qualifikationsfächer“ zu fassen versuchen, der auch für Schulsprache relevant ist.

Einleitung und Zielsetzung | 5

zwischen den Prä- und Post-Ergebnissen vorliegen, die sich entsprechend als Fördereffekte interpretieren lassen. Grundlage für die Entwicklung eines solchen Instruments ist die theoretische Modellierung und Beschreibung des zu erfassenden Merkmals, d.h. der produktiven, medial mündlichen schulsprachlichen Kompetenz von Primarschülern mit Deutsch als Zweitsprache. Da bislang keine Konzeptualisierung dieses Merkmals bzw. des entsprechendes Registers vorliegt, werden nach einer zusammenfassenden Darstellung der Relevanz schulsprachlicher Fähigkeiten (vgl. Kap. 2.1) zunächst die Ergebnisse der bestehenden Arbeiten zu den Merkmalen von Schulsprache vorgestellt (vgl. Kap. 2.2). Eine Besonderheit gesprochener Schulsprache besteht in der Kombination aus medialer Mündlichkeit und konzeptioneller Schriftlichkeit. Deshalb werden im weiteren Verlauf der Arbeit Modellierungen zu Mündlichkeit und Schriftlichkeit der Gesprochene-Sprache-Forschung mit Blick auf eine mögliche Verortung gesprochener Schulsprache reflektiert (vgl. Kap. 2.3). Da konzeptionelle Schriftlichkeit bzw. Distanzsprache auf formale Genauigkeit angewiesen ist, wird die Beherrschung der Standardsprache als wesentliche Voraussetzung schulsprachlicher Kommunikation angesehen (vgl. Kap. 2.4). Viele DaZ-Schüler im Primarschulalter scheinen über dieses Voraussetzung jedoch nicht zu verfügen. Kap. 2 widmet sich deshalb den empirisch ermittelten Stolpersteine und Indikatoren des DaZ-Erwerbs von Schülern im Primarschulalter, d.h. mit mind. 3–4 Kontaktjahren zur deutschen Sprache. Darüber hinaus werden grundsätzliche Hypothesen und Merkmale des Deutsch-alsZweitsprache-Erwerbs zusammengefasst und Möglichkeiten der Erfassung von Erwerbs- bzw. Lernfortschritten aus Sicht der Deutsch-als-ZweitspracheForschung diskutiert. Da es im Rahmen von Förderprogrammen typischerweise um gesteuerte Lehr-Lern-Kontexte geht, werden in Kap. 3 außerdem grundlegende Konzepte und Annahmen der Sprachlehr- und -lernforschung vor allem in Hinblick auf formfokussierte Sprachförderung zusammengefasst. Nachdem der Untersuchungsgegenstand gesprochene Schulsprache und die besonderen Bedingungen zweitsprachlicher Erwerbs- und Lernprozesse erörtert wurden, werden in Kap. 4 Verfahren zur Sprachstandsdiagnose dahingehend reflektiert, ob sie sich im Rahmen von Evaluationsstudien zur Erfassung des beschriebenen Konstrukts eignen. Gegenstand von Kap. 5 ist die Beschreibung des selbst entwickelten Verfahrens zur Evaluation von Fördereffekten auf die gesprochene Schulsprache von Primarschülern. Dieses auf die vorherigen theoretischen Überlegungen aufbauende Instrument wird anhand einer Substichprobe von 150 DaZ-Förderschülern des BeFo-Projekts erprobt. Die anschließende Evaluierung erfolgt durch Prüfung der klassischen Gütekriterien (vgl. Kap. 6.6).

6 | Gesprochene Schulsprache: Theorie und Forschungsstand

2 Gesprochene Schulsprache: Theorie und Forschungsstand 2.1 Zur Relevanz von Schulsprache Für die in PISA und anderen internationalen Vergleichsstudien wie DESI und IGLU festgestellten sprachlichen und fachlichen Leistungsrückstände von Schülern mit Migrationshintergrund werden ab der 3. Klasse vor allem die komplexer werdenden sprachlichen Anforderungen der Schule verantwortlich gemacht (z.B. Döll, Roth & Siemon 2009: 73; Grießhaber 2008; Gogolin & Lange 2011, 108; Redder et al. 2011: 30–31). Da diese Anforderungen stetig zunehmen, erklärt sich auch, warum die Schere bezüglich der Leistungen von Schülern mit und ohne Migrationshintergrund trotz guter alltagssprachlicher Fähigkeiten im Laufe der Schulzeit immer weiter auseinander geht (Grießhaber 2008: 31). In groß angelegten Untersuchungen wie z.B. dem vom Europarat 2008 in Auftrag gegebenen Projekt „Language Across the Curriculum“ (Vollmer 2006) wird mittlerweile systematisch untersucht, welche besonderen sprachlichen Anforderungen die Schule an ihre Schüler stellt. Dabei wird die enge Verbindung und gegenseitige Bedingtheit von fachlichem und sprachlichem Lernen hervorgehoben 8: 7F

Language Across the Curriculum (LAC) as a concept acknowledges the fact that language education does not only take place in specific subjects explicitly defined and reserved for it, such as mother tongue education, foreign language education, second language education etc.). Language learning and education also take place in each and every subject in school, in each and every academic/mental activity, across the whole curriculum – whether we are conscious of it or not. (Vollmer 2006: 5)

Wie Knapp (1999) in seinem vielzitierten Aufsatz „Verdeckte Sprachschwierigkeiten“ feststellt, werden Defizite in Bereichen der schulsprachlichen Kompetenz leider häufig zu spät erkannt und erst am Ende der Primarstufe sichtbar: Gegen Ende des zweiten Schuljahrs und im dritten Schuljahr berichten denn Lehrkräfte an der Grundschule häufig von solchen Kindern, dass sie "in ein Loch fallen" oder "plötzlich"

|| 8 Eine sehr anschauliche Analyse der bildungssprachlichen Herausforderungen im Sachunterricht der Grundschule findet sich in Ahrenholz (2010c).

Zur Relevanz von Schulsprache | 7 erheblich Schwierigkeiten mit den schulischen Anforderungen bekommen. (Knapp 1999: 30)

Dies ist zum einen darauf zurückzuführen, dass sich der Unterricht in den ersten Schuljahren auf inhaltliche Aspekte konzentriert und eine große Toleranz gegenüber sprachlichen Mängeln zu beobachten ist (Knapp 1999: 31). Zum anderen wird die Sprache der Schule mit dem zunehmenden Einsatz von Texten immer komplexer, so dass gerade Kinder, die außerhalb der Schule kaum mit Schriftsprache in Kontakt kommen, den Anschluss verlieren. Während der ersten Grundschuljahre findet ein Großteil des Unterrichts mündlich und in einem tendenziell alltagssprachlichen Register statt. Dabei geht es vorwiegend darum, sich verständlich zu machen bzw. mitzuteilen. Formale Aspekte spielen nur dann eine Rolle, wenn sie für das Erreichen der kommunikativen Ziele von Bedeutung sind. Da Ungenauigkeiten auf formaler Ebene jedoch häufig durch nonverbale Hilfsmittel wie Gestik, Mimik und Intonation oder einen geteilten Kontext bzw. Wissenshintergrund kompensiert werden können, fallen Defizite in diesem Bereich nicht auf (Jeuk 2010: 65; Cantone & Haberzettl 2008: 94–95; Rösch 2005c: 117). Spiegel (2008: 16) weist in diesem Zusammenhang zusätzlich darauf hin, dass die Kinder sich „eine Art Überlebenswortschatz angeeignet“ haben, aufgrund dessen die tatsächlichen Sprachfähigkeiten überschätzt würden. Günther (2007a: 156) weist zudem darauf hin, dass dies durch bestimmte Eigenschaften der gesprochenen Sprache noch verstärkt wird. Denn aufgrund der Zeitgebundenheit und artikulatorischer Bedingungen kommt es auch bei muttersprachlichen Sprechern zu Enklisen und gerade bei den Flexionsmarkierungen zu Elisionen, so dass Abweichungen in diesen Bereichen nicht auffallen bzw. im Coseriuschen Sinne als „normal“ einzustufen sind (vgl. Kap. 2.3.3). Es überrascht daher nicht, dass es sich bei den sprachlichen Bereichen, die von solchen mündlichen ‚Ungenauigkeiten‘ betroffen sind, um genau die sprachlichen Merkmale handelt, die DaZ-Kindern später besondere Schwierigkeiten bereiten und die meist erst im Zusammenhang mit der Schriftsprache entdeckt und erworben werden (z.B. die zielsprachliche Markierung von Genus und Kasus). Auch die Vermeidung komplexerer sprachlicher Strukturen, die noch nicht vollständig erworben wurden, führt dazu, dass Lehrkräfte die sprachlichen Defizite ihrer Schüler oft nicht bemerken (Jeuk & Schäfer 2007: 38). Hinzu kommt eine mehr oder weniger bewusst angewandte „Schonpädagogik“ (Knapp 1999: 31), bei der Lehrer komplexe, fachlich und inhaltlich verdichtete Äußerungen vermeiden, um vor allem Kinder mit Deutsch als Zweitsprache aufgrund ihres kulturellen und familiären Hintergrundes nicht zu überfordern. Dies kann

8 | Gesprochene Schulsprache: Theorie und Forschungsstand jedoch unwillentlich dazu führen, dass sprachliche Fähigkeiten nicht im notwendigen Maße ausgebaut werden (Gogolin 2007: 30). Auf die besondere Bedeutung schulsprachlicher Kompetenz für eine erfolgreiche Bildungskarriere ist vielfach hingewiesen worden (vgl. z.B. Ahrenholz 2010c; Siebert-Ott 2000: 140; Becker 2006; Rösch & Ahrens 2003; Müller & Dittmann-Domenichini 2007: 72). Sie bildet zum einen die Grundlage für das Verständnis fachlicher Inhalte, zum anderen wird von „erfolgreichen Schülern“ erwartet, dass sie in der Lage sind, „sich bildungssprachlich auszudrücken und bildungssprachliche Ausdrucksweisen zu verstehen“ (Gogolin & Lange 2011: 111). Einen ersten empirischen Nachweis für die grundlegende Bedeutung bildungssprachlicher Kompetenz liefern Ergebnisse eines Hamburger Grundschulversuchs, denen zufolge Schüler, die sich bildungssprachlicher Redemittel bedienten, in standardisierten Leistungstests im Lesen und in Mathematik signifikant bessere Ergebnisse erzielten als Schüler, die sich vorwiegend eines alltagssprachlichen Registers bedienten (Neumann, Gogolin & Roth 2007: 60– 61). Empirische Untersuchungen zur bildungssprachlichen Kompetenz der Schüler, die im Rahmen desselben Schulversuchs durchgeführt wurden, lassen außerdem darauf schließen, dass sich die Kompetenzunterschiede nicht auf den Bildungshintergrund oder den sozioökonomischen Status der Eltern zurückführen lassen, sondern „dass die Unterschiede in der Zweisprachigkeit begründet liegen, genauer: im noch nicht abgeschlossenen Zweitspracherwerb“ (Neumann, Gogolin & Roth 2007: 61) 9. Auch im englischsprachigen Raum wird die herausragende Bedeutung der Bildungssprache für den sozio-ökonomischen Erfolg hervorgehoben, wobei die Terminologie keineswegs einheitlich ist: 8F

the language of education (Halliday, 1994); the language of school, the language of schooling, the language that reflects schooling (Schleppegrell, 2001); advanced literacy (Colombi & Schleppegrell, 2002); scientific language (Halliday & Martin, 1993); or, more specifically, academic English (Bailey, 2007; Scarcella, 2003) (Snow & Uccelli 2009: 112)

Christie (1985) spricht in Bezug auf die Bedeutung von „academic Englisch” von einem „hidden curriculum“ und auch Scarcella betont: „Learning academic

|| 9 Über die Bedeutung von sprachlichem und sozialem Hintergrund für den Erwerb bildungssprachlicher Kompetenz herrscht jedoch noch Uneinigkeit. So liefern nach Lengyel (2010: 598) andere empirische Untersuchungen Anhaltspunkte dafür, dass die soziale Herkunft sogar einen stärkeren Einfluss auf den Erwerb der schulbezogenen Sprache ausüben könnte als der sprachliche Hintergrund.

Zur Relevanz von Schulsprache | 9

English is probably one of the surest, most reliable ways of attaining socioeconomic success in the United States” (Scarcella 2003: 3). Im deutschsprachigen Raum führte Gogolin (2004) in diesem Zusammenhang den Begriff „Bildungssprache“ ein. Als „grobe Charakterisierung“ von Schul- oder Bildungssprache schlägt sie vor, „dass Schulsprache mit den Regeln schriftsprachlicher Kommunikation mehr gemeinsam hat als mit alltagssprachlichen mündlichen Gesprächsweisen“ (Gogolin, Neumann & Roth 2003: 51) 10. Auch wenn die Sprache der Schule immer wieder als maßgebliche Hürde für Zweitsprachenlerner hervorgehoben wird, sei an dieser Stelle darauf hingewiesen, dass die Sprache der Schule selbstverständlich auch an Schüler mit Deutsch als Muttersprache hohe Anforderungen stellt und der Erfolg in diese Domäne maßgeblich vom familiären Umfeld beeinflusst wird. So weisen Gogolin, Neumann & Roth 2003 zu Recht darauf hin, dass 9F

Kinder aus bildungsnahen Elternhäusern die Chance [haben], die sprachlichen Varianten, um die es in der Sprache der Schule geht, auch zu Hause zu lernen oder zu üben. Sie durchlaufen beispielsweise eine Lesesozialisation, die den schulsprachlichen Anforderungen entgegenkommt. Dies gilt selbstverständlich prinzipiell auch für diejenigen, die aus zugewanderten Familien kommen und mehrsprachig aufwachsen. Kinder aber, deren Familien nicht schriftsprachbeflissen sind, also nicht intensiv auf die Schriftförmigkeit der schulischen Kommunikation vorbereiten, haben so gut wie keinen anderen Lernort dafür, diese Anforderungen erfüllen zu lernen, als eben die Schule. (Gogolin, Neumann & Roth 2003: 51)

Aufgrund der beschriebenen Defizite im Bereich schulsprachlicher Kompetenz sollte sich Sprachförderung auf die sprachlichen Bereiche konzentrieren, die für den rezeptiven und produktiven Umgang mit Schulsprache grundlegend sind und im ungesteuerten Erwerb nicht angeeignet werden: Erforderlich sind Untersuchungen, die helfen, Licht in das Dunkel über die Art und Weise zu bringen, wie Unterricht zur Aneignung bildungssprachlicher Fähigkeiten beiträgt – oder eben nicht beiträgt. [Dafür] sind Interventionsstudien erforderlich, die zeigen können, ob eine andere Sprach- und Interaktionspraxis im Unterricht die Aneignung bildungssprachlicher Fähigkeiten besser unterstützen würde. (Gogolin 2009: 277)

Für den englischsprachigen Raum konnte in verschiedenen Untersuchungen gezeigt werden, „dass Kinder aus bildungsferneren Schichten von einem Unterricht profitieren, in dem die Differenz zwischen alltäglichem und bildungsrelevantem Sprachgebrauch ausdrücklich zum Thema gemacht wird“ (Gogolin || 10 Zur begrifflichen Differenzierung von Schul- bzw. Bildungssprache und den weiteren Charakteristika dieses Registers vgl. Kap. 2.2

10 | Gesprochene Schulsprache: Theorie und Forschungsstand 2009: 272). Auch die Ergebnisse der Jacobs-Sommercamp Studie (vgl. Kap. 1) deuten in diese Richtung. Darüber hinaus ist Schul- bzw. Bildungssprachlichkeit immer im engen Zusammenhang mit sozialen und kulturellen Kontexten zu sehen. Dabei ist es eine grundelgende Frage, ob die Schwierigkeiten der Schüler eher mit der richtigen Einschätzung bzw. Vertrautheit der kommunikativen Situationen und ihren spezifischen Bedingungen zu tun haben, oder ob sie eher sprachlicher Natur sind. Eine eindeutige Antwort auf diese Frage ist kaum möglich, da spezifische sprachliche Kompetenzen natürlich nur dann erworben werden können, wenn auch Kommunikationssituationen erlebt werden, die die entsprechenden Mittel erfordern. Interessant sind in diesem Zusammenhang jedoch die Ergebnisse von de Temple, Wu & Snow (1991), die in einer Untersuchung von 150 Schülern der zweiten bis fünften Jahrgangsstufe einer Schule in Manhattan zumindest für den englischsprachigen Raum nachweisen konnten, dass alle untersuchten Schüler Unterschiede zwischen kontextgebundenen und -entbundenen (d.h. schulsprachlichen) Aufgabenstellungen erkannten und versuchten, ihre Sprache entsprechend anzupassen (vgl. auch Webersik 2012a): Children in all grades were sensitive to the instruction given in the oral tasks and adjusted their language accordingly. Quantity, specificity, narrativity, and main theme were all higher under decontextualized instructions. […] Thus, as one might expect, children talked more, were more specific, and mentioned a higher proportion of the crucial pictorial elements under decontextualized instructions. (de Temple, Wu & Snow 1991: 476) The great difference in the children's performance in the two oral conditions provides evidence that children can produce highly decontextualized oral language given the need to communicate information to a distant audience. (de Temple, Wu & Snow 1991: 481)

Auch die von Oomen-Welke (1987: 128–129) untersuchten türkischen Grundschulkinder sowie die 8–11-jährigen Kinder in einer Studie von Herman (1997) variierten ihre sprachlichen Äußerungen in Abhängigkeit von der Kontextualisierung der Aufgabenstellung. Eine genauere Analyse der Sprachproben in der Studie von de Temple, Wu & Snow (1991) offenbarte jedoch Unterschieden bei den erst- und zweitsprachlichen Schülern: Während Schülern mit Englisch als Erstsprache bei der kontextentbundenen Aufgabenstellung nicht nur längere Redebeiträge produzierten, sondern dabei auch spezifische sprachliche Mittel z.B. für eindeutige Referenzbezüge und Lokalisierungen einsetzten, konnten solche sprachlichen Strukturen in den Sprachproben der Schüler mit Englisch als Zweitsprache nicht nachgewiesen werden:

Konzeptualisierungen und Merkmale von Schulsprache | 11 This result suggests that when faced with a decontextualized task children in the NE [nonEnglish] group simply talked more. That is, the NE children understood that more explicit reference and more information about location was needed in the decontextualized condition, but could not successfully recruit the linguistic resources to accomplish their goals. (Ricard & Snow 1990: 260)

Die Schwierigkeiten nicht-muttersprachlicher Schüler mit situationsentbundenen Gesprächssituationen, wie sie für bildungssprachliche Kommunikationssituationen typisch sind, liegen also eindeutig auch auf sprachlicher Ebene. Das Register der Schul- oder Bildungssprache wird immer wieder mit konzeptioneller Schriftlichkeit in Verbindung gebracht (vgl. Kap. 2.2 ). Dabei ist zu betonen, dass sich das Merkmal der Schriftlichkeit nicht nur auf das Medium der Schrift beschränkt, sondern auch charakteristisch für die gesprochene Schulsprache ist, der im Übrigen bereits in der Grundschule eine große Bedeutung beigemessen wird (siehe z.B. Gogolin 2006: 82; Siebert-Ott 2000: 140; de Temple, Wu & Snow 1991: 470–471; Schleppegrell 2009: 4; Scarcella 2003: 10; Knapp 1997: 21, Knapp 1999; Rösch 2003b: 31; Jeuk 2010: 121; Ahrenholz 2010c: 19–32; Vollmer & Thürmann 2010: 109). Gesprochene Schulsprache kann zudem eine wichtige Brückenfunktion beim Aufbau konzeptionell und medial schriftlicher Ausdrucksformen einnehmen (de Temple, Wu & Snow 1991: 471; Ortner 2009: 2232; Jeuk 2010: 53). Beispiele für freie, konzeptionell schriftliche Kommunikationsformen im Medium der Mündlichkeit sind z.B. mündliche Berichte oder Erzählungen (z.B. im Morgenkreis), Buchpräsentationen, Lehr-Lern-Dialoge, Abfrage von Wissen und Aufnahme und Verarbeitung von mündlich vermittelten Inhalten (Gogolin, Lange & Grießbach 2010: 9; Herman 1997: 42–43). August & Shanahan (2006: 448) fordern in ihrem Überblick zum Forschungsstand zur Entwicklung von literacy bei Kindern mit Migrationshintergrund daher ausdrücklich, Umfang (scope) und sophistication der mündlichen Sprachfähigkeiten dieser Kinder zu fördern.

2.2 Konzeptualisierungen und Merkmale von Schulsprache In vielen Veröffentlichungen stehen die Termini Schulsprache, Bildungssprache oder auch „Bildungssprache der Schule“ (Gogolin 2006: 82) für sehr ähnliche Konzepte. Gogolin (2009: 270) weist in diesem Zusammenhang zu Recht darauf hin, dass Bildungssprache nicht nur im schulischen Kontext relevant ist und lehnt daher die Bezeichnung Schulsprache ab. In vielen Veröffentlichungen

12 | Gesprochene Schulsprache: Theorie und Forschungsstand werden die Begriffe jedoch trotzdem weitgehend synonym verwendet. In Bezug auf das zugrundeliegende Konstrukt des im Rahmen der vorliegenden Arbeit zu entwickelnden Diagnoseinstruments erscheint der Begriff Schulsprache zunächst präziser, da ausdrücklich sprachliche Fähigkeiten im Kontext Schule fokussiert werden. Da diese Fähigkeiten jedoch auch für Kommunikationssituationen außerhalb der Schule bedeutsam sind, wird u.a. aus stilistischen Gründen auch der Terminus Bildungssprache verwendet, ohne dass damit eine inhaltliche Differenzierung ausgedrückt werden soll. Weiterhin ist darauf hinzuweisen, dass natürlich nicht die gesamte Kommunikation der Schule als bildungssprachlich einzustufen ist. Vielmehr wechseln die Kommunikationsformen ständig. So ist der Dialog auf dem Schulhof eindeutig einem alltagssprachlichen Register zuzuordnen. Auch die Gespräche in der Klasse können konzeptionell mündlich sein, z.B. bei Gruppenarbeiten. In anderen Situationen findet man wiederum Mischformen. Auch sind die Grenzen zwischen Alltags-, Bildungs- und Fachsprache fließend, so dass „jeder Text, jeder Unterrichtskommunikation wie auch jeder Fachdiskurs […] in unterschiedlichem Maße Elemente aller drei“ aufweist (Ahrenholz 2010c: 17). Das komplexe Merkmale Bildungssprache ist daher gerade im Kontext Schule am ehesten als Kontinuum zu denken (vgl. Abb. 1):

Abb. 1. The Academic Language Continuum (Henrichs 2010, 2)

Wie bei anderen Varietäten auch muss man strenggenommen von mehreren Bildungssprachen ausgehen, die im Kontext bestimmter Kommunikationssituationen oder „kommunikative Praktiken“ (Fiehler et al. 2004: 22) (vgl. Kap. 2.3.4 ) jeweils neu zu bestimmen sind. Dazu gehört in einem ersten Schritt, zwischen mündlichen und schriftlichen Formen sowie rezeptiven und produktiven Anforderungen zu differenzieren (Ahrenholz 2013: 87–88). Deutlich wird auch, dass Bildungssprachlichkeit sich nicht nur durch bestimmte lexikalische und morpho-syntaktische Merkmale auszeichnet, sondern auch spezifische diskursive, pragmatische und literale Fähigkeiten erfordert. Letztere sind

Konzeptualisierungen und Merkmale von Schulsprache | 13

jedoch bisher kaum untersucht und stellen keinen Schwerpunkt des vorliegenden Forschungsvorhabens dar. Auch wenn Schulsprache Thema diverser Veröffentlichungen ist und Einigkeit darin besteht, dass „die Vermittlung dieses Registers […] genuine Aufgabe der Schule oder der Berufsausbildung“ ist (Ahrenholz 2010a: 23), herrscht insgesamt Einigkeit darüber, dass das Register Bildungssprache bisher nicht ausreichend empirisch untersucht ist (z.B. Ahrenholz 2013: Lengyel 2010: 596; Müller & Dittmann-Domenichini 2007: 78): Eine genauere Spezifizierung der Besonderheiten von Bildungssprache und ihrer Förderung in den aufeinander folgenden Bildungsetappen steht allerdings noch aus. [...] Hierzu ist es notwendig, die Anforderungen der Bildungssprache, denen Heranwachsende in den jeweiligen Bildungsetappen und in den verschiedenen Schulfächern begegnen, genauer zu bestimmen. Es ist zu klären, über welche sprachlichen Mittel Schülerinnen und Schüler verfügen müssen, um in der Lage zu sein, bildungssprachlich kompetent zu handeln. [...] Auch wenn erste Versuche unternommen worden sind, das Konzept der Bildungssprache in die Entwicklung von Förderansätzen einfließen zu lassen, ist in systematischer Hinsicht noch weitgehend ungeklärt, welche Besonderheiten Bildungssprache im Primarbereich aufweist, welche dieser Eigenheiten Kindern besondere Schwierigkeiten bereiten und wie diese Schwierigkeiten effektiv überwunden werden können. (Redder et al. 2011: 31)

Aufgrund dieser Desiderata versucht man gegenwärtig u.a. im Projektverbund „Fachunterricht und Deutsch als Zweitsprache (Fach-DaZ)“ eine empirische Basis aus Schulbuchtexten und Unterrichtsbeiträgen zu gewinnen, „um die sprachlichen Mittel zu beschreiben, die bei der Wissensvermittlung und Wissensaneignung in verschiedenen Fächern und verschiedenen Altersgruppen von Bedeutung sind“ (Ahrenholz 2013: 96). Zum jetzigen Zeitpunkt steht das Projekt jedoch noch sehr am Anfang, so dass bislang keine umfassenden Ergebnisse vorliegen. Die Ursache für den Mangel einer differenzierten Modellierung liegt zum einen in der Vielschichtigkeit des Untersuchungsgegenstands (vgl. z.B. Snow & Uccelli 2009: 114; Scarcella 2003: 5), zum anderen in den fließenden Übergängen zwischen den verschiedenen angrenzenden Registern: Allgemeinsprache, Bildungssprache und Fachsprache sind folglich nicht immer trennscharf und jeder Text, jede Unterrichtskommunikation wie auch jeder Fachdiskurs hat in unterschiedlichem Maße Elemente aller drei. (Ahrenholz 2010c: 17)

Auch wenn wir von einer systematischen Modellierung des Konzepts Schulsprache offensichtlich noch weit entfernt sind, wird in den letzten Jahren intensiv an einer Konzeptualisierung für das entsprechende Konstrukt gearbeitet.

14 | Gesprochene Schulsprache: Theorie und Forschungsstand Die meisten Arbeiten zu Schul- oder Bildungssprache beziehen sich auf die soziolinguistischen und funktionalen Ansätze von Basil Bernstein (z.B. 1964: 1971) und Michael Halliday (1961, 1985). Ausgehend von der Untersuchung des Zusammenhangs sprachlicher und sozialer Merkmale entwickelte Bernstein in den 60er Jahren eine Theorie zu linguistischen Codes, die unterschiedliche Sprachformen bzw. Register repräsentieren. Grundlegend war dabei die Unterscheidung in einen restringierten und einen elaborierten Code. Dabei bestimmt die soziale Beziehung der Gesprächspartner, welcher Code angemessen ist. Während der restringierte Code v.a. in alltäglichen Situationen Anwendung findet, in denen sich die Gesprächspartner gut kennen und diverse nonverbale Mittel zur Kommunikation einsetzen, kann in Situationen, die den elaborierten Code fordern, nicht von einer gemeinsamen Wissensbasis ausgegangen werden. Die Sprecher sind deshalb auf verbale Kommunikationsmittel angewiesen, die gezielt und differenziert einzusetzen sind: An elaborated code, or at least an orientation towards this code, will develop to the extent that the discrete intent of the other person may not be taken for granted. In as much as the other person's intent may not be taken for granted, then the speaker is forced to expand and elaborate his meanings, with the consequence that he chooses more carefully among syntactic and vocabulary options. (Bernstein 1964: 63)

Bernstein betont, dass auch das Beherrschen des restringierten Codes für bestimmte soziale Funktionen von großer Bedeutung ist. Im Zusammenhang mit schulischen Erfolgt sei jedoch vor allem der elaborierte Code besonders wichtig: As a child progresses through a school it becomes critical for him to possess, or at least to be oriented toward, an elaborated code if he is to succeed. (Bernstein 1964, 66–67)

Halliday stellt in seinem Ansatz der Systemisch Funktionalen Linguistik die kommunikative Funktion sprachlicher Formen in den Vordergrund. Dabei bestimmen die Bedingungen und Ziele einer konkreten Kommunikationssituation, welche sprachlichen Formen bzw. welches Register den gegebenen Erfordernissen am ehesten entsprechen. In Gantefort & Roth (2010: 579) wird dieser Ansatz wie folgt beschrieben: The choice of different lexical and grammatical options is related to the functional purposes that are foregrounded by speakers/writers in responding to the demands of various tasks. […] For any particular text type, these features can be described in terms of the lexical and grammatical features and the organizational structure found in that text type. (Schleppegrell 2001: 432, zit. nach Gantefort & Roth 2010: 579)

Konzeptualisierungen und Merkmale von Schulsprache | 15

In diesem Zusammenhang unterscheiden sowohl Bernstein als auch Halliday grundsätzlich zwischen kontextgebundenen und kontextentbundenen Gesprächssituationen, die aufgrund der Informationen, die der Kontext bereitstellt oder eben nicht bereitstellt, eine höhere oder niedrigere sprachliche Elaboriertheit und Explizitheit erfordern (vgl. Kap. 2.3.2 ). Auch im deutschsprachigen Raum wurde schon früh auf das Phänomen der Bildungssprache aufmerksam gemacht, wobei hier zunächst von „Büchersprache“ die Rede war (Mendelsohn 1784, zit. nach Ortner 2009: 2229). Der Ursprung der Verwendung des Terminus „Bildungssprache“ in seiner heutigen Bedeutung wird meist mit Habermas in Verbindung gebracht, der ihn wie Halliday funktional beschreibt: In der Öffentlichkeit verständigt sich ein Publikum über Angelegenheiten allgemeinen Interesses. Dabei bedient es sich weitgehend der Bildungssprache. Die Bildungssprache ist die Sprache, die überwiegend in den Massenmedien, in Fernsehen, Rundfunk, Tages- und Wochenzeitungen benutzt wird. Sie unterscheidet sich von der Umgangssprache durch die Disziplin des schriftlichen Ausdrucks und durch einen differenzierteren, Fachliches einbeziehenden Wortschatz; andererseits unterscheidet sie sich von Fachsprachen dadurch, dass sie grundsätzlich für alle offensteht, die sich mit den Mitteln der allgemeinen Schulbildung ein Orientierungswissen verschaffen könnten. (Habermas 1977: 39)

Die Funktion von Bildungssprache besteht somit gesellschaftspolitisch betrachtet darin, sich in der Öffentlichkeit über „Angelegenheiten allgemeinen Interesses“ zu verständigen. Weiterhin sollten laut Habermas all diejenigen bildungssprachliche Kompetenz besitzen, die über die „Mittel der allgemeinen Schulbildung“ verfügen. Wie jedoch schon in den Beobachtungen Bernsteins angedeutet wurde, stellen elaborierte Sprachfähigkeiten die Basis für schulischen Erfolg dar. Die „allgemeine Schulbildung“ steht somit in der Pflicht, den Schülern bildungssprachliche Fähigkeiten zu vermitteln. Denn die Vermutung (Bernstein 1964: 62), dass einige Bevölkerungsgruppen ausschließlich über ‚restringierte‘ bzw. alltagssprachliche Fähigkeiten verfügen, ist mittlerweile offenkundig. Auch Halliday betont, dass sich bildungssprachliche Kompetenz nicht von allein entwickelt, sondern gezielter Förderung bedarf: The ability to operate institutionally [...] is something that has to be learnt; it does not follow automatically from the acquisition of the grammar and vocabulary of the mother tongue. (Halliday 1973, zit. nach Schleppegrell 2004: 21)

16 | Gesprochene Schulsprache: Theorie und Forschungsstand

Abb. 2. Vier-Felder-Modell zur Verortung von BICS und CALPS nach Cummins (1981: 12)

Die Dimension der Kontexteinbindung bezieht sich darauf, ob die Kommunikation den situativen Kontext, in dem sie stattfindet, mit einbezieht, so dass die Verständigung auf einen geteilten Kontext von Sprecher und Zuhörer basiert, oder ob sie auch ohne ein solches geteiltes Wissen funktioniert (vgl. dazu auch den Situationsparameter von Hennig und „Kontext C“ im Rahmen der Modellierung von Ivanic, vgl. Kap. 2.3.2 ). Die zweite Dimension (kognitiver Anspruch) bezieht sich weniger auf die inhaltliche Komplexität als auf sprachliche Handlungsroutinen, die für die Verarbeitung des Gesagten oder Gehörten nötig sind (Gantefort & Roth 2010: 577–578): The upper parts of the vertical continuum consist of communicative tasks and activities in which linguistic tools have become largely automatized and thus require little active cognitive involvement for appropriate performance. At the lower end of the continuum are tasks and activities in which the linguistic tools have not become automatized and thus require active cognitive involvement. (Cummins 2000: 68)

Nur durch automatisch ablaufende Prozesse oder Routinen werden kognitive Kapazitäten für die Verarbeitung des propositionalen Gehalts der Äußerungen frei: Ein Gespräch auf dem Pausenhof, das sich auf das gerade stattfindende Fußballspiel bezieht, erfordert keine kognitiv anspruchsvollen Handlungsroutinen und ist als stark kontextgebunden einzustufen (= BICS). Eine schriftliche Argumentation zur Legalisierung von Abtreibungen kann sich m.E. nicht auf einen gemeinsamen Kontext berufen und erfordert kognitive Verarbeitungsroutinen auf einem hohen Niveau (= CALP), um die komplexen und abstrakten Inhalte verbalisieren bzw. verarbeiten zu können. Neben einigen Merkmalen von CALP, die auf der Sprachoberfläche zu beobachten sind (z.B. Fachvokabular, komplexe morpho-syntaktische Struktu-

Konzeptualisierungen und Merkmale von Schulsprache | 17

ren), ist ein anderer wesentlicher Teil als zugrunde liegende Kompetenz zu verstehen. Gemeint sind basale Strategien und kognitive Routinen im oben beschriebenen Sinne, die auch nicht an eine konkrete Einzelsprache gebunden sind, sondern ‚über-einzelsprachlich‘ ausgebildet werden können. Gerade einer kognitiv anspruchsvollen und abstrakten Sprachverwendung, wie sie in der Schule üblich ist, liegen solche Denkoperationen und Verarbeitungsprozesse zugrunde, die nicht an eine spezielle Sprache gebunden sind und von Cummins als Common Underlying (Language) Proficiency bezeichnet werden. Das in Abb. 3 dargestellte Dual-Iceberg-Modell veranschaulicht diese Zusammenhänge:

Abb. 3. The „Dual-Iceberg” Representation of Bilingual Proficiency nach Cummins (1981: 24)

Auch wenn die Modellierungen von Cummins weitreichenden Einfluss hatten und die Grundlage verschiedener Untersuchungen darstellen, wurden sie zugleich in verschiedener Hinsicht kritisiert. Ein wesentlicher Kritikpunkt richtet sich gegen die unzureichende linguistische Fundierung, die komplexe linguistische Phänomene und Prozesse zu sehr vereinfacht und reduziert (Scarcella 2003: 5; Ahrenholz 2008e: 72). Neben der linguistischen fehle auch eine empirische Präzisierung der BICS-CALP-Dichotomie. So konnte „die von Cummins vorgeschlagene Differenzierung von Aspekten sprachlicher Kompetenzen […] bislang weder theoretisch noch empirisch in zufrieden stellender Weise bestimmt“ werden (Stanat, Baumert & Müller 2005: 863) 11. F0 1

|| 11 Für einen Übersicht der Kritikpunkte an der BICS-CALP-Konzeptualisierung und Cummins Antworten darauf siehe Cummins (2000: 86–111)

18 | Gesprochene Schulsprache: Theorie und Forschungsstand In der aktuellen Debatte im deutschsprachigen Raum wurde der Begriff „Bildungssprache“ durch Ingrid Gogolin im Kontext der Vorbereitung von FörMig (vgl. Kap. 1) neu eingeführt und unter der Bezeichnung „Bildungssprache der Schule“ weiterentwickelt (Gogolin & Lange 2011: 109–110). Die Wissenschaftler um Gogolin und FörMig beziehen sich primär auf die Arbeiten von Bernstein, Halliday, Cummins und Habermas und definieren Bildungssprache folgendermaßen: Mit Bildungssprache ist also ein bestimmter Ausschnitt sprachlicher Kompetenz bezeichnet. Gemeint ist ein formelles Sprachregister, d.h. eine Art und Weise Sprache zu verwenden, die bestimmte formale Anforderungen beachtet. Sehr grob charakterisiert kann man sagen, dass Bildungssprache auch dann, wenn sie im Mündlichen vorkommt, an den Regeln des Schriftsprachgebrauchs orientiert ist. Besonderes Gewicht besitzt das Register im Bildungskontext: Es wird bei Lernaufgaben, in Lehrwerken und anderem Unterrichtsmaterial verwendet; es wird in Prüfungen und vielen Unterrichtsgesprächen eingesetzt. Je weiter eine Bildungsbiographie fortschreitet, je weiter sich der Unterricht in Fächer bzw. Fächergruppen ausdifferenziert, umso mehr wird das Register Bildungssprache verwendet und gefordert. (Gogolin & Lange 2011: 111)

Auch wenn Gogolin & Lange hier hervorheben, dass Bildungssprache besonders im Schulkontext von großer Bedeutung ist, wird an anderer Stelle darauf hingewiesen, dass dieses Register auch in anderen Kontexten gebräuchlich ist (Gogolin 2009: 270). In diesem Sinne schließt das Konzept der Bildungssprache auch die „alltägliche Wissenschaftssprache“ (Ehlich 1999) mit ein, die sich auf nicht fachgebundene häufig wiederkehrende Wendungen bezieht, die für den wissenschaftlichen Diskurs charakteristisch sind. Wenn Bildungssprache ausschließlich auf den Kontext Schule bezogen wird, empfehlen Gogolin & Lange (2011: 112) den Begriff Schulsprache, der als Ausschnitt des Registers Bildungssprache zu verstehen sei. Schul- oder Bildungssprache teilt viele Merkmale distanzsprachlicher Kommunikation. Dazu gehören Monologizität, hohe Informationsdichte, Situationsentbindung, symbolische, generalisierende, abstrahierende und kohärenzbildende Redemittel und textuelle Strukturen (Gogolin 2006: 82, 2009: 270). Ein erster Ansatz zur Systematisierung der Merkmale von Bildungssprache wird laut Gogolin & Lange (2011: 113–114) in einem unveröffentlichten Manuskript von Hans H. Reich vorgelegt. Dabei wird zwischen diskursiven, lexikalisch-semantischen und syntaktischen Merkmalen unterschieden: Diskursive Merkmale betreffen den Rahmen und die Formen, die kennzeichnend für Bildungssprache sind, z.B.: – eine klare Festlegung von Sprecherrollen und Sprecherwechsel;

Konzeptualisierungen und Merkmale von Schulsprache | 19

– – –

ein hoher Anteil monologischer Formen (z.B. Vortrag, Referat, Aufsatz); fachgruppentypische Textsorten (z.B. Protokoll, Bericht, Erörterung); stilistische Konventionen (z.B. Sachlichkeit, logische Gliederung, angemessene Textlänge)

Lexikalisch-semantische Merkmale beziehen sich auf Eigenarten des Wortschatzes und einzelne Bedeutungen. Kennzeichnend für Bildungssprache sind: – differenzierende und abstrahierende Ausdrücke (z.B. ‚nach oben transportieren‘ statt ‚raufbringen‘); – Präfixverben, darunter viele mit untrennbarem Präfix und mit Reflexivpronomen (z.B. ‚erhitzen‘, ‚sich entfalten‘, ‚sich beziehen‘); – nominale Zusammensetzungen (z.B. ‚Winkelmesser‘); – normierte Fachbegriffe (z.B. ‚rechtwinklig‘; ‚Dreisatz‘) Syntaktische Merkmale der Bildungssprache beziehen sich auf Besonderheiten im Satzbau: – explizite Markierungen der Kohäsion (also des Textzusammenhangs); – Satzgefüge (z.B. Konjunktionalsätze, Relativsätze, erweiterte Infinitive); – unpersönliche Konstruktionen (z.B. Passivsätze, man-Sätze); – Funktionsverbgefüge (z.B. ‚zur Explosion bringen‘, ‚einer Prüfung unterziehen‘, ‚in Betrieb nehmen‘); – umfängliche Attribute (z.B. ‚die nach oben offene Richter-Skala‘, ‚der sich daraus ergebende Schluss‘) Im Schulversuch Bilinguale Grundschulklassen in Hamburg wurde im deutschsprachigen Raum erstmals der Versuch unternommen, die Merkmale des Registers Bildungssprache empirisch zu ermitteln (Neumann, Gogolin & Roth 2007). Zu diesem Zweck wurden schriftliche und mündliche Sprachproben von einund zweisprachigen Schülern in Hinblick auf bildungssprachliche Strukturen untersucht. Während sich die Kategorien für die schriftlichen Texte vor allem auf Vorarbeiten aus dem englischsprachigen Raum stützten (Gogolin & Roth 2007: 42), wurde für die Abbildung von bildungssprachlichen Elementen in der gesprochenen Sprache eine Faktorenanalyse durchgeführt, die vier Komponenten oder Dimensionen nachwies, von denen drei auch im Sinne zugrundeliegender Konstrukte näher beschrieben werden konnten (Neuman, Gogolin & Roth 2007: 59): 1. Umgangssprachlicher Modus: v.a. sprechsprachliche Floskeln und umgangssprachliche Wendungen 2. Akademischer Modus: Substantivierungen, Komposita, viele Verben, unpersönliche Ausdrücke und Konnektoren

20 | Gesprochene Schulsprache: Theorie und Forschungsstand 3.

Elaborierter Modus: Konjunktiv, Passiv

Dabei werden der akademische und elaborierte Modus „tentativ als Formen bildungssprachlicher Kompetenz im Deutschen“ betrachtet (Gogolin & Roth 2007: 42). Die Aussagekraft dieser Ergebnisse muss jedoch aufgrund der relativ kleinen Stichprobe (n = 87 DaM-, DaZ- und bilinguale Schüler, Neuman, Gogolin & Roth 2007: 8) eingeschränkt werden. Auch werden Datenerhebung und Kodierverfahren nur in groben Zügen beschrieben (Neuman, Gogolin & Roth 2007: 9–10) und keiner systematischen Validierung unterzogen. Dennoch können die Ergebnisse als erste Grundlage für weitere empirische Untersuchungen betrachtet werden und finden in der Entwicklung diagnostischer Instrumente im Rahmen von FörMig (Tulpenbeet und Bumerang) eine erste Anwendung (Gantefort & Roth 2010: 582–585). Eine weitere aktuelle Untersuchung ist die empirische Studie von Britta Hövelbrinks (2013) zum Gebrauch bildungssprachlicher Elemente im 1. Schuljahr. In ihrer Untersuchung vergleicht Hövelbrinks mündliche Sprachproben von bilingualen, sprachförderbedürftigen Kindern (n=20) mit entsprechenden Proben von monolingualen Schülern ohne Förderbedarf. Für alle Sprachproben, die aus drei Unterrichtsstunden zum Thema „Licht und Farben“ (Hövelbrinks 2013: 79) stammen, wurden anschließend bestimmte, als bildungssprachlich eingestufte Elemente ausgezählt. Das Ergebnis der Untersuchung wird in Tab. 1 zusammengefasst. Leider werden die einzelnen Kategorien und ihre Kodierung nicht im Detail erläutert. Problematisch erscheint, dass hier offensichtlich schriftsprachliche Kategorien auf gesprochene Sprache angewendet werden, obwohl z.B. syntaktische Strukturen in der gesprochenen Sprache anderen Gesetzmäßigkeiten unterliegen als in der Schriftsprache (vgl. Kap 2.3 ). Aus methodischer Sicht scheint es außerdem problematisch, dass die Redebeiträge aller bilingualen Schüler den Redebeiträgen aller monolingualen Schüler gegenübergestellt werden, ohne zu kontrollieren, wer wie viel gesagt hat. So ist es theoretisch denkbar, dass ein Großteil der bildungssprachlichen Mittel von nur einem Schüler produziert wurde und daraus dann Aussagen für die gesamte Gruppe abgeleitet werden. Dieses Problem wird dadurch verstärkt, dass die mündliche Beteiligung am Unterricht freiwillig ist, so dass hier nur die aktiven Schüler berücksichtigt werden. Auch weitere mögliche Einflussfaktoren (z.B. Lehrerbeiträge, Interesse am Thema etc.) werden nicht kontrolliert.

Konzeptualisierungen und Merkmale von Schulsprache | 21

Tab. 1. Häufigkeit bildungssprachlicher Elemente in Sprachproben ein- und zweisprachiger Schüler (Hövelbrinks 2013: 80) Indikator

Bilingual (2024 Turns) Monolingual (3078 Turns)

Satzkomplexität vollständiger Hauptsatz

739

1533

vollständiger Nebensatz

40

74

Parataxe

78

168

doppelte Prädikation

8

17

Hypotaxe

61

97

Satzverknüpfung Konjunktion Hauptsatz

134

262

Konjunktion Nebensatz

80

113

Relativsatz

34

88

Infinitivergänzung

4

13

Partizipialergänzung

0

0

Komposita

103

245

Nominalisierung

12

24

nicht-trennbare Verben

31

75

trennbare Verben

157

366

Konjunktiv I

0

0

Konjunktiv II

1

20

Vorgangspassiv

1

5

Zustandspassiv

0

7

Unpersönliches „man“

53

94

Apposition

4

17

Adjektivattribut

58

140

Genitivattribut

0

0

Präpositionalphrase

209

561

Gesamt

1807

3919

komplexe Wortbildung

Modus

unpersönliche Ausdrücke

Satzerweiterungen

22 | Gesprochene Schulsprache: Theorie und Forschungsstand Anschließend wurden die Mittelwerte der einzelnen Indikatoren in beiden Gruppen berechnet und einem Signifikanztest unterzogen (vgl. Tab. 2), dessen Aussagekraft jedoch dahingehende einzuschränken ist, dass die ermittelten Häufigkeiten nicht an der Anzahl der Redebeiträge relativiert wurden, so dass 2024 Redebeiträge (turns) der zweisprachigen Schüler mit 3078 Redebeiträgen der monolingualen Schüler verglichen wurden (Hövelbrinks 2013: 81, Fußnote 5). Dass in 3078 Redebeiträgen tendenziell mehr bildungssprachliche Elemente vorkommen als in 2024 Redebeiträgen ist unmittelbar einsichtig. Tab. 2. Signifikanz verschiedener bildungssprachlicher Indikatoren in der Studie von Hövelbrinks (2013: 82)

Indikator

T

df

vollständiger Hauptsatz (.003)

-3,127

40

vollständiger Nebensatz (.045)

-2,078

38,046

Signifikanz (2seitig) .003

.045

Parataxe (.020)

-2,413

40

.020

Konjunktion Hauptsatz (.045)

-2,073

40

.045

Relativsatz (.11)

-2,689

38,018

.11

Komposita (.18)

-2,481

33,695

.18

nicht-trennbare Verben (.028)

-2,298

31,480

.028

trennbare Verben (.005)

-3,026

34,775

.005

Konjunktiv II (.002)

-3,589

23,135

.002

Apposition (.013)

-2,639

29,592

.013

Adjektivattribut (.004)

-3,185

27,346

.004

Präpositionalphrase (.001)

-3,663

34,179

.001

Auch wenn die Ergebnisse aufgrund der relativ kleinen Stichprobe, der Beschränkung auf wenige Unterrichtsstunden und der genannten methodischen Einschränkungen nicht generalisierbar sind, deuten sie darauf hin, dass die untersuchten Indikatoren von zweisprachigen Kindern tendenziell weniger frequent eingesetzt werden als von ihren einsprachigen Mitschülern. Eine eher deduktive Herangehensweise zur Beschreibung von Schulsprache wählen die Wissenschaftler um Helmuth Johannes Vollmer im Rahmen des vom Europarat in Auftrag gegebenen Projekts Language Across the Curriculum (Vollmer 2006). Ausgehend von der Annahme, dass Sprache in allen Schulfä-

Konzeptualisierungen und Merkmale von Schulsprache | 23

chern eine zentrale Rolle spielt, sollen durch die genaue Analyse von schulischen Curricula, Lehr- und Lernmaterialien und verschiedenen Aufgabenarten die darin implizit und explizit enthaltenen sprachlichen Anforderungen genauer beschrieben werden (Vollmer 2011, 1–2). Ziel ist die Entwicklung eines schulsprachlichen Referenzrahmens, „der sich auf Fachunterricht und fachliches Lernen über alle Fächer hinweg bezieht“ und zugleich die Grundlage für ein eigenes Unterrichtsfach Schulsprache darstellen könnte (Vollmer/Thürmann 2010, 112–116). Bisher konnten acht zentrale Diskursfunktionen, die im Kontext Schule bedeutsam sind, identifiziert werden, wobei eine umfassende und detaillierte Beschreibung derselben noch aussteht (Vollmer 2011, 2–3): 1. 2. 3. 4. 5. 6. 7. 8.

AUSHANDELN (engl. Negotiating) von Bedeutung wie von Prozessen ERFASSEN / BENENNEN (engl. Naming) BESCHREIBEN / DARSTELLEN (engl. Describing) BERICHTEN / ERZÄHLEN (engl. Reporting/Narrating) ERKLÄREN / ERLÄUTERN (engl. Explaining) ARGUMENTIEREN/STELLUNG NEHMEN (engl. Arguing/Positioning) BEURTEILEN / (BE)WERTEN (engl. Evaluating) SIMULIEREN / MODELLIEREN (engl. Simulating / Modelling)

Außerdem wurde das in Abb. 4 dargestellte Modell zur Beschreibung von Schulsprache im Fachunterricht entwickelt:

24 | Gesprochene Schulsprache: Theorie und Forschungsstand

Abb. 4. Modell zur Beschreibung von Schulsprache im Fachunterricht nach Vollmer & Thürmann (2010: 113)

Die hier besonders interessierende Dimension 4 wird in Vollmer & Thürmann (2010) ausführlich beschrieben. Die folgende Darstellung beschränkt sich auf die Beschreibung der sprachlichen Mittel in den Bereichen Grammatik und Wortschatz, mit denen „Textualität erkannt bzw. hergestellt wird“, da diese für die vorliegende Arbeit von besonderem Interesse sind. Nach Vollmer & Thürmann (2010: 121–122) zeichnet sich „die schulsprachlich kompetente Verwendung morphosyntaktischer Mittel“ durch folgende Fähigkeiten aus: –



dass die Lernenden über ein breiteres Spektrum von Synsemantika verfügen und diese kontrolliert und der logischen Struktur ihres Gedankengangs entsprechend einsetzen und damit auch entsprechende Verweisstrukturen aufbauen können, dass sie innerhalb des Rahmens komplexer Sätze lokale, temporale und modale Beziehungen versprachlichen können,

Konzeptualisierungen und Merkmale von Schulsprache | 25

– –

dass sie innerhalb des Textrahmens mit den Tempora kontrolliert umgehen und das Zeitgefüge (Vor-, Gleich-, Nachzeitigkeit) abbilden können, und dass sie dafür sensibel sind, wann sie die Modalität einer Aussage (z.B. den Grad der Sicherheit oder Wahrscheinlichkeit) kennzeichnen sollten und welche Mittel dafür einzusetzen sind.

In Bezug auf den Wortschatz heißt es, dass „im schulischen Bildungsverlauf […] der Wortschatz für die einzelnen Domänen im Fachunterricht ausgeweitet und spezialisiert“ wird. Dabei sind nach Vollmer & Thürmann (2010: 121–122) vor allem die folgenden drei Faktoren kennzeichnend für schulsprachliche Kompetenz: – –

die Verfügbarkeit der fachunterrichtlichen Wortschätze, die Sensibilität für den treffenden Wortgebrauch bzw. durch die Vermeidung von Wörtern, die mit dem schulsprachlichen Register nicht kompatibel sind (Jargon, alltagssprachliche Ausdrücke), die Fähigkeit, die Kohäsion von Texten nicht allein durch Reihung, sondern durch den expliziten Gebrauch von Konjunktionen und Satzadverbien sowie durch semantische Substitutionen (Synonyme, begriffliche Unterordnung, Überordnung etc.) herzustellen.

Mittlerweile liegt in Vollmer & Thürmann (2013) eine Weiterentwicklung und Ausdifferenzierung des in Abb. 4 dargestellten Modells vor, bei der die sprachlichen Mittel aus Dimension 4 nun eine eigene Dimension 5 ausmachen. Weiterhin wird das Modell um die Dimensionen „Fachunterrichtliche Inhalte und Methoden“ und „Soziokultureller Kontext und personale Faktoren“ ergänzt und die Zusammenhänge zwischen unterrichtlichen Lernaufgaben und den verschiedenen Dimensionen differenzierter dargestellt. Dabei verfolgt das Modell v.a. didaktische Ziele, indem es einerseits „ein Raster für die curricularer Detailplanung […] im Rahmen eines bildungssprachlichen Gesamtkonzepts“ zur Verfügung stellt, und andererseits als „Raster für konkrete Unterrichtsplanung und -analyse“ fungieren kann (Vollmer & Thürmann 2013: 48). Für die oben dargestellten sprachlichen Mittel in den Bereichen Grammatik und Wortschatz bedeutet diese Neumodellierung jedoch keine Veränderung. Im englischsprachigen Raum beschäftigt man sich schon länger mit der Erforschung der Merkmale von academic language. Ausgehend von der als zu vereinfachend kritisierten BICS-CALP-Dichotomie von Cummins entwickelt Scarcella (2003) in Anlehnung an Kern (2000) einen konzeptuellen Rahmen, bei dem eine linguistische, eine kognitive und eine sozio-kulturelle/psychologische Dimensi-

26 | Gesprochene Schulsprache: Theorie und Forschungsstand on zur Beschreibung von academic English unterschieden werden. Die hier besonders interessierende linguistische Dimension beinhaltet phonologische, lexikalische, grammatikalische, soziolinguistische und diskursive Komponenten (Scarcella 2003: 11) und wird in Tab. 3 weiter spezifiziert. Die für das akademische Register beschriebenen Merkmale werden dabei den entsprechenden alltagssprachlichen Strukturen gegenübergestellt: Tab. 3. A Description of the Linguistic Components of Academic English and Their Associated Features Used in Everyday Situations and in Academic Situations (Scarcella 2003: 12) Linguistic Components of Ordinary English

Linguistic Components of Academic English

The Phonological Component knowledge of everyday English sounds and knowledge of the phonological features of the ways sounds are combined, stress and academic English, including stress, intonaintonation, graphemes, and spelling tion, and sound patterns. Examples: ship versus sheep /I/ - /i/ Examples: demógraphy, demográphic, sheet versus cheat /sh/ - /ch/ cádence, genéric, casualty, and celerity ------------------------------->----------------->------------------>--------------------->------------->--------> The Lexical Component knowledge of the forms and meanings of knowledge of the forms and meanings of words that are used across academic disciwords occurring in everyday situations; knowledge of the ways words are formed with plines (as well as in everyday situations outprefixes, roots, suffixes, the parts of speech side of academic settings); knowledge of the ways academic words are of words, and the grammatical constraints formed with prefixes, roots, and suffixes, the governing words parts of speech of academic words, and the grammatical constraints governing academic words Example: investigate ------------------------------->----------------->------------------>--------------------->------------->--------> The Grammatical Component knowledge of morphemes entailing semantic, knowledge that enables ELs to make sense out syntactic, relational, phonological, and distri- of and use the grammatical features (morphobutional properties; knowledge of syntax; logical and syntactic) associated with arguknowledge of simple rules of punctuation mentative composition, procedural description, analysis, definition, procedural description, and analysis; knowledge of the grammatical co-occurrence restrictions governing words; knowledge of grammatical metaphor; knowledge of more complex rules of punctuation ------------------------------->----------------->------------------>--------------------->------------->-------->

Konzeptualisierungen und Merkmale von Schulsprache | 27 Linguistic Components of Ordinary English

Linguistic Components of Academic English

The Sociolinguistic Component knowledge that enables ELs to understand the knowledge of an increased number of lanextent to which sentences are produced and guage functions. The functions include the understood appropriately; knowledge of general ones of ordinary English such as frequently occurring functions and genres apologizing, complaining, and making requests as well as ones that are common to all academic fields; knowledge of an increased number of genres, including expository and argumentative text ------------------------------->----------------->------------------>--------------------->------------->--------> The Discourse Component knowledge of the basic discourse devices knowledge of the discourse features used in used, for instance, to introduce topics and specific academic genres including such keep the talk going and for beginning and devices as transitions and other organizationending informal types of writing, such as al signals that, in reading, aid in gaining letters and lists perspectives on what is read, in seeing relationships, and in following logical lines of thought; in writing, these discourse features help ELs develop their theses and provide smooth transitions between ideas ------------------------------->----------------->------------------>--------------------->------------->-------->

Schleppegrell (2001: 2004) nimmt eine ausdrücklich funktionale Perspektive zur Beschreibung der „language of schooling“ ein. Dabei betont sie in Anlehnung an die Arbeiten von Bernstein und Halliday die kulturellen und sozialen Aspekte bildungssprachlicher Kompetenz. Die Ursache für die Schwierigkeiten mit schulsprachlichen Anforderungen sieht sie demnach vor allem darin, dass die Schüler bestimmte Gesprächssituationen aufgrund mangelnder Erfahrung nicht angemessen einschätzen und deshalb unpassende sprachliche Mittel wählen: School-based texts are difficult for many students precisely because they emerge from discourse contexts that require different ways of using language than students experience outside of school. (Schleppegrell 2004: 9) The same children who have trouble specifying and elaborating a topic in some contexts are able to do so when they understand that the speech situation calls for such specification and elaboration. (Schleppegrell 2004: 11)

Diese Annahmen werden jedoch zumindest teilweise durch die Studien von Ricard & Snow (1990), de Temple (1991) und Herman (1997) widerlegt (vgl. Kap. 2.1 ), in denen die untersuchten Primarschüler schulsprachliche Kommunikati-

28 | Gesprochene Schulsprache: Theorie und Forschungsstand onssituationen zwar als solche erkannten, jedoch offensichtlich nicht über die erforderlichen sprachlichen Mittel verfügten. Basierend auf den Ergebnissen diverser Forschungsarbeiten 12 stellt Schleppegrell (2001, 2004) die linguistischen Merkmale alltäglicher Interaktion denen schulischer Texte gegenüber und fasst wesentliche Unterschiede in Tab. 4 zusammen: 1F

Tab. 4. Register Features of Spoken Interaction and School-Based Texts (Schleppegrell 2001: 438) Spoken interaction

School-based texts

generic

specific, technical

Lexical density

sparse

dense, elaboration of noun phrases through modifiers, relative clauses, and prepositional phrases

Subjects

pronominal, present or known lexical, nominalizations, and participants expanded NPs

Lexical features Lexical choices

Grammatical strategies Segmentation

prosodic segmentation: struc- sentence structure: structure ture indicated prosodically indicated syntactically

Mood

varied, attitude conveyed prosodically

mainly declarative, attitude conveyed lexically

Clause linkage and conjunction strategies

clause chaining with conjunctions, information added in finite segments, use of many conjunctions with generalized meanings

clause- combining strategies of embedding, use of verbs, prepositions, and nouns to make logical links, conjunctions have core (narrow) meanings

Organizational strategies

emergent structure, clause themes include conjunctive and discourse markers that segment and link part of text

hierarchical structure, using nominalization, logical links indicated through nominal, verbal, and adverbial expressions, and thematic elements that structure discourse

|| 12 Für eine Auflistung der berücksichtigen Arbeiten siehe Schleppegrell (2001: 436–437).

Konzeptualisierungen und Merkmale von Schulsprache | 29

Auch wenn die bisher zitierten Arbeiten wichtige Aspekte von Bildungssprache hervorheben, stellt keiner dieser Ansätze eine vollständige und systematische Modellierung des Konzepts Bildungssprache dar. Ohne einen solchen Rahmen ist die gezielte Förderung und Diagnose schulsprachlicher Fähigkeiten jedoch äußerst schwierig: Despite these advances in delineating academic language, a conceptualization of academic language within a consensual analytical framework that could guide educationally relevant research is still lacking. (Snow & Uccelli 2009: 113) In the absence of a conceptual framework, it is difficult to design instruction to promote academic language, to properly assess academic-language skills, or to understand what normal, expectable progress toward achievement of academic-language skills might look like. (Snow & Uccelli 2009: 115)

Snow & Uccelli (2009) wollen daher mit einen Forschungsüberblick zu den Merkmalen von Schulsprache den Grundstein für eine systematische Konzeptualisierung von academic language legen, die dann als Richtlinie für weitere Forschungsarbeiten fungieren kann (Snow & Uccelli 2009: 113). Tab. 5 fasst die Ergebnisse zusammen: Tab. 5. Linguistic Features and Core Domains of Cognitive Accomplishments Involved in Academic Language Performance (Snow & Uccelli 2009: 119–120) More Colloquial

1. Interpersonal stance Expressive/Involved Situationally driven personal stances 2. Information load Redundancy (Ong, 1995)/ Wordiness Sparsity

More Academic  Detached/Distanced (Schleppegrell, 2001)  Authoritative stance (Schleppegrell, 2001)  Conciseness  Density (proportion of content words per total words) (Schleppegrell, 2001)

3. Organization of information Dependency (Halliday, 1993)/ Addition (Ong,  Constituency (Halliday, 994b)/Subordination (Ong, 1995) (embedding, one element is a 1995) (one element is bound or linked to structural part of another) another but is not part of it) Minimal awareness of unfolding text as dis-  Explicit awareness of organized discourse (central role of textual metadiscourse markcourse (marginal role of metadiscourse markers) (Hyland & Tse, 2004) ers) Situational support (exophoric reference) Loosely connected/dialogic structure

 Autonomous text endophoric reference)  Stepwise logical argumentation/unfolding, tightly constructed

30 | Gesprochene Schulsprache: Theorie und Forschungsstand More Colloquial

More Academic

Fuzziness (e.g., sort of, something, like) Concrete/common-sense concepts

 High lexical diversity (Chafe & Danielewicz, 1987)  Formal/prestigious expressions (e.g., say/like vs. for instance)  Precision (lexical choices and connectives)  Abstract/technical concepts

4. Lexical choices Low lexical diversity Colloquial expressions

5. Representational congruence Simple/congruent grammar  Complex/congruent gram-  Compact/Incongruent grammar (clause embedding and mar (complex sentences, (simple sentences, e.g., You nominalization, e.g., The ine.g., If the water gets hotheat water and it evaporates creasing evaporation of water ter, if evaporates faster.) faster.) due to rising temperatures) (Halliday, 1993) Animated entities as agents  Abstract concepts as agents (e.g., Printing tech(e.g., Gutenberg invented nology revolutionized Europrinting with movable type.) pean book-making.) (Halliday, 1993) > Genre mastery Generic Values (Bhatia, 2002)  School-based genres (e.g.,  Discipline-specific specialized genres lab reports, persuasive es(narration, description, explasay) nation…) > Reasoning strategies Basis ways of argumentation  Specific reasoning moves valued at school and persuasion (Reznitskaya et al., 2001) > Disciplinary knowledge  Abstract groupings and Taxonomies relations Commonsense understanding > Epistemological assumptions Knowledge as fact

 Discipline-specific reasoning moves

 Disciplinary taxonomies and salient relations

 Knowledge as constructed

Wie Snow & Uccelli (2009: 115) selbst betonen, dient diese Übersicht ledglich als Grundlage für weitere notwendige Forschungsschritte zur Konzeptualisierung von Schulsprache. Diese offenen Forschungsfragen werden in Form einer „Research Agenda“ näher beschrieben (Snow & Uccelli 2009: 124–130). Neben der Notwendigkeit einer umfassenden theoretischen Modellierung von Schul- bzw. Bildungssprache und der empirischen Erforschung ihrer konkreten Merkmale stellt auch die Untersuchung der Aneignung schulsprachlicher Fähigkeiten ein dringendes Desiderat dar:

Gesprochene Schulsprache im Spannungsfeld von Mündlichkeit und Schriftlichkeit | 31 Eines der dringlichsten Desiderate besteht in der Erforschung der Aneignung schulrelevanter diskursiver Fähigkeiten. Zunächst wären auf der Grundlage authentischer Sprachdaten von Unterrichtsstunden eine Bestandsaufnahme und Klassifizierung von Diskursformen in der Schule vorzunehmen. Im Anschluss daran sollten u.a. die Aneignung von bzw. der Umgang mit den folgenden Phänomenen untersucht werden: Verfahren des institutionell geregelten Sprecherwechsels; mündliche und schriftliche Verbalisierung von eigenen Erlebnissen und Erfahrungen unter den Bedingungen des schulischen Unterrichts (Erzählen); Aneignung weiterer schulrelevanter Text- und Diskursarten wie Bericht, Beschreibung, Schilderung, Darstellung; schulische Handlungsmuster (z.B. Aufgabe-Stellen/ Aufgabe-Lösen […] mentale Rekonstruktion und mündliche bzw. schriftliche Verbalisierung von im Unterricht vermitteltem Wissen (z.B. bei mündlichen Abfragen oder bei schriftlichen Aufgaben), Rezeption und Reproduktion von Begrifflichkeiten der alltäglichen Wissenschaftssprache. (Bredel et al. 2008: 264–265)

2.3 Gesprochene Schulsprache im Spannungsfeld von Mündlichkeit und Schriftlichkeit Ein grundlegendes Desiderat in Bezug auf eine umfassende Konzeptualisierung und Merkmalsbeschreibung von Schulsprache besteht in der Berücksichtigung der Medienabhängigkeit. So wird zwar vielfach darauf hingewiesen, dass Schulsprache sich nicht auf die Schriftsprache beschränkt, sondern auch das Medium der Mündlichkeit betrifft (vgl. Kap. 2.1), worin jedoch die spezifischen Merkmale gesprochener Schulsprache in Abgrenzung zur geschriebenen Schulsprache bestehen, wird in keiner Arbeit systematisch beschrieben. Eine Besonderheit des Registers bzw. im weiteren Sinne der Varietät gesprochene Schulsprache ergibt sich aus der mündlichen Realisierungsform eines konzeptionell schriftlichen Registers. Gegenstand dieses Kapitels ist es daher, die Konzepte Mündlichkeit und Schriftlichkeit in Hinblick auf eine mögliche Verortung und Merkmalsbeschreibung der kommunikativen Praktik gesprochene Schulsprache in der Primarstufe näher zu beleuchten.

2.3.1 Gesprochene-Sprache-Forschung – ein Überblick Die wissenschaftliche Erforschung von Mündlichkeit in Abgrenzung zu Schriftlichkeit hat eine relativ junge Tradition und ist vor allem Gegenstand der Gesprochene-Sprache-Forschung. Der Beginn dieser Disziplin wir meist mit dem Vortrag „Geschriebenes Deutsch und gesprochenes Deutsch“ von Otto Behaghel am 1.10.1899 in Verbindung gebracht (z.B. Fiehler et al. 2004: 40). Doch die eigentliche Erforschung gesprochener Sprache konnte erst seit Mitte des 20.

32 | Gesprochene Schulsprache: Theorie und Forschungsstand Jahrhunderts erfolgen, nachdem die nötigen technischen Hilfsmittel zur Aufnahme und Transkription mündlicher Sprache zu Verfügung standen. Als erstes Projekt, durch das systematisch die Unterschiede zwischen gesprochenen und geschriebenen Sprachprodukten erarbeitet werden sollten, wird das in den 70er Jahren laufende Freiburger Projekt „Grundstrukturen der deutschen Sprache“ genannt (Fiehler et al. 2004: 13). Wenige Zeit später entwickelten Koch & Oesterreicher (1985) ihr viel zitiertes Modell von Nähe- und Distanzsprachlichkeit, das in de Folge von Ágel & Hennig (2006a) weiterentwickelt wurde (vgl. Kap. 2.3.2 ). Nachdem in den 80er und 90er Jahren viele Detailphänomene der gesprochenen Sprache untersucht worden waren, erkannte man, dass die „Kategorien der geschriebenen Sprache wenig geeignet sind, um das Spezifische der Mündlichkeit zu erfassen“ (Thüne o.J.: 12). Eine Folge war, dass in den letzten Jahren der Ruf nach einer umfassenden Systematisierung bzw. Theorie der gesprochenen Sprache immer lauter wurde (Hennig 2006: 39–41; Günther 2007b, 1). Dies hat u.a. dazu geführt, dass mittlerweile sowohl die IDS-Grammatik als auch seit 2005 die Duden-Grammatik gesprochensprachliche Phänomene behandeln (Schwitalla 2006: 100). Dabei handelt es sich jedoch nicht um umfassende Grammatiken der gesprochenen Sprache, sondern – zumindest im Falle der Duden-Grammatik – eher um eine Art Anhang zu spezifischen Erscheinungen der gesprochenen Sprache, die keinen Anspruch auf Vollständigkeit erhebt (Fiehler 2006b: 37, 2006a: 1176). Die meisten gängigen Grammatiken basieren nach wie vor auf der Schriftsprache und behandeln Phänomene der gesprochenen Sprache allenfalls als Randerscheinungen (Fiehler 2008b: 263–265). Eine umfassende Theorie und Grammatik der gesprochenen Sprache steht deshalb weiterhin aus, wobei auch noch kein Konsens darüber besteht, ob eine solche Grammatik überhaupt sinnvoll und erforderlich ist (vgl. Kap. 2.3.3). Um dem prozessualen, interaktionalen und dynamischen Charakter gesprochener Sprache gerecht zu werden, werden als theoretischer Rahmen für eine Grammatik der gesprochenen Sprache vor allem die Interaktionale Linguistik und die Construction Grammar diskutiert (z.B. Selting 2007; Günther 2007b). Beide Ansätze gehen davon aus, dass sich sprachliche Formen und ihre zugrundeliegenden Muster bzw. Regelhaftigkeiten im Sprachgebrauch herausbilden. Ausgangspunkt grammatischer Untersuchungen ist demnach nicht mehr ein zugrundeliegendes Sprachsystem im Sinne der langue (de Saussure) bzw. Kompetenz (Chomsky), sondern vielmehr die kommunikative Praxis im Sinne der parole bzw. Performanz und dabei – vor allem im Rahmen der interaktionalen Linguistik – der interaktive Charakter mündlicher Kommunikation (Günther 2007b: 7). Da die Eignung von Interaktionaler Linguistik und Konstruktionsgrammatik als theoretische Rahmen für eine Grammatik der gesprochenen

Gesprochene Schulsprache im Spannungsfeld von Mündlichkeit und Schriftlichkeit | 33

Sprache jedoch nicht unstrittig sind und beide Versuche noch in den Anfängen stecken 13, sollen sie hier nicht weiter verfolgt werden. Als bisher umfassendste Arbeiten zu den Eigenschaften gesprochener Sprache und den Anforderungen an eine entsprechende Grammatik können die Arbeiten von Fiehler et al. (2004) und Hennig (2006) angesehen werden. Bedeutsam für die Beschreibung gesprochener Sprache ist außerdem der Hinweis von Fiehler et al. (2004: 22), dass es „die“ gesprochene Sprache nicht gibt, „sondern immer nur gesprochene Sprache im Kontext bestimmter kommunikativer Praktiken“ (vgl. Kap. 2.3.4 ). Auch Schwitalla (2006: 23) gibt zu bedenken, dass „die Unterschiede zwischen Gattungen und Textsorten größer sein könnten als die medialen Unterscheide bei gleichen Textsorten“. Zu entscheiden ist also auch, welche Varietät gesprochener Sprache zur Diskussion steht bzw. ob es eine prototypische Form gesprochener Sprache gibt. Auch ist zu klären, welche Phänomene der (prototypischen) gesprochenen Sprache als systematisch und welche als Fehlleistungen einzustufen sind (Schreiber 1999, zit. nach Hennig 2006: 104– 105). Zur Differenzierung sprachlicher Varietäten, wozu auch die Differenzierung mündlicher und schriftlicher Sprachformen zählt, sind verschiedene Modelle ausgearbeitet worden. In Fiehler et al. (2004: 139–156) werden sieben solcher Konzepte vorgestellt, die hier überblickartig zusammengefasst werden sollen: 12F

1.

2.

Das Performanz-/Gebrauchskonzept: Varianz wird hier in Bezug auf die Größen langue – parole (de Saussure) bzw. Kompetenz – Performanz (Chomsky) als „Phänomen des individuellen Gebrauchs, einer individuellen Aktualisierung von Sprache bzw. einer individuellen Auswahl aus dem Sprachsystem“ verstanden (Fiehler et al. 2004: 140). Neben solchen Gebrauchsunterschieden werden die Unterschiede zwischen gesprochener und geschriebener Sprache v.a. auf die unterschiedlichen Produktionsbedingungen zurückgeführt, durch die eine perfekte Realisierung der langue auf der Ebene der parole oft nicht möglich ist. Das Teilsprachen- bzw. Varietätenkonzept: „Grundannahme dieses Konzepts ist, dass sich im Rahmen einer Sprache […] verschiedene Teilsprachen oder Varietäten unterscheiden lassen bzw. dass sich eine Sprache aus verschiedenen Teilsprachen bzw. Varietäten zusammensetzt“ (Fiehler et al. 2004: 142). Für die Abgrenzung der Varietäten untereinander ist vor allem die Größe und Unterschiedlichkeit der Merk-

|| 13 Für eine ausführliche Diskussion der Eignung dieser Modelle als Grundlage einer Grammatik der gesprochenen Sprache vgl. Hennig (2006: 42–53).

34 | Gesprochene Schulsprache: Theorie und Forschungsstand male ausschlaggebend. Sind die Unterschiede so groß, dass die Sprecher sich untereinander nicht mehr verstehen können, wird von unterschiedlichen Sprachen mit jeweils verschiedenen Systemen ausgegangen. Nicht ganz geklärt ist, ob Varietäten im Sinne des Gebrauchskonzepts (vgl. 1) als Performanzphänomene verstanden werden, bei dem die Sprecher nur unterschiedlichen Gebrauch desselben Systems machen, oder ob eine Varianz im Sprachsystem angenommen wird. Dies würde bedeuten, dass die Sprecher über unterschiedliche Regeln verfügen (Fiehler et al. 2004: 144). Dabei stellen sich die Fragen, ob für jede Varietät andere Teilsysteme angenommen werden müssen, in welchem Verhältnis diese Teilsysteme zueinander stehen, und wie sie voneinander abgegrenzt werden können, zumal jede Teilsprache auch intern variabel ist. 3. Das Merkmallistenkonzept: Zur Beschreibung einer angenommenen Varietät wird eine Liste mit Merkmalen erstellt, die diese Teilsprache von einer anderen Teilsprache unterscheidet. Dabei gibt es nur selten Merkmale, die nur in einer der Varietäten vorkommen. Meistens beziehen sich die Unterschiede auf die Auftretenshäufigkeit (Frequenz) der entsprechenden Phänomene und sind somit quantitativer Natur (Fiehler et al. 2004: 146). 4. Das Stilkonzept: Ähnlich wie beim Merkmallistenkonzept wird Varianz auf Verhaltensunterschiede zurückgeführt. Dabei wird angenommen, dass der Sprecher bei einer konkreten sprachlichen Realisierung immer eine Auswahl aus mehreren zugrundeliegenden Möglichkeiten trifft, die dann zu der beobachtbaren Varianz führt (Spillner 1987, zit. nach Fiehler et al. 2004: 147). 5. Das Registerkonzept: Der Fokus dieses Konzepts liegt auf der Erklärung von Varianz in Abhängigkeit von kommunikativen Situationen, an die der Sprecher seine Sprache anpasst. Da hier aus theoretischer Sicht keine neuen Aspekte hinzukommen, wird der Ansatz nicht vertiefender dargestellt. 6. Das Konzept der Kontextsensitivität: Auch bei diesem Ansatz spielt die kommunikative Situation eine entscheidende Rolle, die als Hauptfaktor für Varianz angesehen wird: „Varianz ist […] das Resultat einer kontextsensitiven, situationsanpassenden Anwendung genereller Strukturen und Regeln.“ (Fiehler et al. 2004: 150) 7. Das Konzept der offenen Systeme von Konventionen: Das auf Kummer (1975) zurückgehende Konzept geht davon aus, dass es „keine einzelne Sprache [gibt], die durch ein festliegendes System von Regeln definiert ist, sondern nur untereinander ähnliche offene Systeme von Konventi-

Gesprochene Schulsprache im Spannungsfeld von Mündlichkeit und Schriftlichkeit | 35

onen, die in Grenzen von Individuum zu Individuum variieren und niemals vollständige Verständigung erlauben“ (Kummer 1975, zit. nach Fiehler et al. 2004: 151). Sprachen, Varietäten oder Register können nach diesem Ansatz nicht mehr klar voneinander abgrenzt werden. Stattdessen stellt sich Varianz als ein Kontinuum dar. Dieser kurze Überblick macht deutlich, dass bislang noch kein Konsens über ein umfassendes theoretisches Modell zur Beschreibung von Gemeinsamkeiten und Unterschieden verschiedener Varietäten gefunden werden konnte (Fiehler 2011). Wohl liegen aber einige Modellierungen zur Differenzierung von Mündlichkeit und Schriftlichkeit vor, die im Folgenden vorgestellt werden sollen.

2.3.2 Nähe-Distanz-Modellierungen Nach Koch & Oesterreicher (1985), die sich neben Arbeiten von Behagel (1899), De Mauro (1971), Hesse & Kleineidam (1973) vor allem auf Söll & Hausmann (1985, c1974) beziehen, wird eine ausschließliche Differenzierung in Mündlichkeit und Schriftlichkeit der Vielschichtigkeit des Phänomens nicht gerecht. So gibt es Kommunikationsformen wie den Bericht eines Nachrichtensprechers oder den Vortrag eines Wissenschaftlers, die zwar mündlich produziert werden, dennoch aber viele Eigenschaften geschriebener Texte aufweisen. Umgekehrt gibt es schriftliche Texte wie z.B. Comics oder private Briefe, die verschiedene sprachliche Strukturen verwenden, die klassischerweise der gesprochenen Sprache zugeordnet werden (Söll & Hausmann 1985, c1974: 17–25 zit. nach Koch & Oesterreicher 1985: 17). Koch & Oesterreicher (2008: 199–200) unterscheiden deshalb zwischen der Realisierungsform bzw. dem Medium einer Äußerung und ihrer Konzeption. So kann eine sprachliche Äußerung im phonischen oder graphischen Code realisiert werden (= Ebene des Mediums). Die Ebene der Konzeption bezieht sich dagegen auf „kommunikative Strategien“ (Koch & Oesterreicher 1985: 17), die eher dem „Duktus der Mündlichkeit“ oder dem „Duktus der Schriftlichkeit“ (Schlieben-& Lange 1983: 81, zit. nach Koch & Oesterreicher 2008: 199) zugeordnet werden können. In Abb. 5 werden die beiden Ebenen von Mündlichkeit und Schriftlichkeit veranschaulicht 14: 13F

|| 14 Auch Utz Maas beschäftigt sich mit der Beschreibung von Mündlichkeit und Schriftlichkeit, wobei er die Begriffe „orat“ und „literat“ für die konzeptionelle, „mündlich“ und „schriftlich“ für die mediale Ebene verwendet Maas (2004: 2010).

36 | Gesprochene Schulsprache: Theorie und Forschungsstand

Abb. 5. Medium und Konzeption nach Söll & Hausmann (1985, zit. nach Koch & Oesterreicher 2008: 200)

Während phonischer und graphischer Code als strikte Dichotomie zu verstehen sind, stellen konzeptionelle Mündlichkeit und Schriftlichkeit die Pole eines Kontinuums dar, d.h. ein Text kann als mehr oder weniger schriftlich eingestuft werden und entsprechend sowohl Merkmale konzeptioneller Mündlichkeit als auch konzeptioneller Schriftlichkeit enthalten (z.B. ein Brief an eine Freundin). Koch & Oesterreicher (1985) identifizieren weiterhin verschiedene Merkmale, die für konzeptionell schriftliche und mündliche Texte charakteristisch sind. Ein wesentliches Merkmal konzeptionell schriftlicher Produktionen ist dabei die relative Unabhängigkeit vom situativen Kontext, so dass Kommunikation auch über räumliche und zeitliche Entfernungen der Kommunikationspartner ermöglicht wird. Koch & Oesterreicher (1985, 21) sprechen deshalb von einer „Sprache der Distanz“. Die Merkmale, die den Pol „gesprochen“ charakterisieren, entsprechen dagegen einer Kommunikationsform, die als „Sprache der Nähe“ bezeichnet wird. Viele medial mündliche Kommunikationsformen sind als eher nähesprachlich und umgekehrt viele schriftliche Kommunikationsformen als distanzsprachlich einzustufen. Dennoch gibt es auch Redekonstellationen, die diesen Prototypen nicht entsprechen. So wird z.B. ein Vortrag oder eine Präsentation zwar mündlich realisiert, weist aber viele typisch distanzsprachliche Merkmale auf (z.B. Monolog, Themenfixierung, Situationsentbindung, vgl. Abb. 6). Um in solchen Fällen nicht von Schriftlichkeit reden zu müssen, favorisieren Koch & Oesterreicher (1985: 30) hier den Begriff der „elaborierten Mündlichkeit“, der zugleich eine wesentliche Versprachlichungsstrategie (Elaboriertheit) distanzsprachlicher Kommunikationssituationen ausdrückt. Denn je nachdem, ob die Kommunikationsbedingungen und -ziele eine Sprache

Gesprochene Schulsprache im Spannungsfeld von Mündlichkeit und Schriftlichkeit | 37

der Nähe oder der Distanz erfordern, sind spezifische Versprachlichungsstrategien notwendig: Einander fremde Kommunikationspartner, die z.B. in Form eines Geschäftsbriefes miteinander kommunizieren und sich auf keinen gemeinsamen kommunikativen Kontext beziehen können, müssen sich sprachlich äußerst präzise ausdrücken und werden darum bemüht sein, Informationen möglichst verdichtet zu kommunizieren. Bei einem vertrauten face-to-face Gespräch unter Freunden geht es oft gar nicht um die exakte Übermittlung von Informationen. Im Vordergrund steht der soziale Austausch, der oft eng an den situativen Rahmen gebunden ist und daher mit verkürzten, wenig komplexen Äußerungen auskommt. Die prototypischen Kommunikationsbedingungen und damit verbundenen Versprachlichungsstrategien fassen Koch & Oesterreicher (1985: 23) in Abb. 6 zusammen, wobei a-k den Grad der Nähe bzw. Distanz anzeigen:

Abb. 6. Nähe-Distanz-Modell von Koch & Oesterreicher (1985: 23)

38 | Gesprochene Schulsprache: Theorie und Forschungsstand Auch wenn mit diesem Modell eine erste Grundlage für die Beschreibung mündlicher und schriftlicher Kommunikationsformen gegeben ist, weisen Ágel & Hennig (2006b: 13–14) zu Recht auf theoretische und praktische Mängel hin: Kritisiert wird eine unzureichende Differenzierung zwischen bzw. Zuordnung zu den Ebenen Kommunikationsbedingungen und Versprachlichungsstrategien. So bleibt z.B. unklar, weshalb Prozesshaftigkeit und Vorläufigkeit den Strategien und nicht den Bedingungen zugeordnet werden. Auch innerhalb der Ebenen erschließt sich nicht immer die Zuordnung zu den Konzepten Bedingung bzw. Strategie: Die aufgelisteten Kommunikationsbedingungen sind z.T. eher Merkmale oder äußere Umstände der Kommunikation (z.B. Dialog, keine Öffentlichkeit) und die aufgeführten Strategien z.T. keine Strategien im eigentlichen Sinne (z.B. Prozesshaftigkeit, Informationsdichte). Vor allem aber werden „universale und diskursartendifferenzierende Merkmale vermischt sowie die Gleichrangigkeit der einzelnen Kommunikationsbedingungen und Versprachlichungsstrategien suggeriert“, anstatt Abhängigkeiten darzustellen und Gewichtungen vorzunehmen (Ágel & Hennig 2006b: 14). Dadurch „ist dem Modell nicht zu entnehmen, welche der Versprachlichungsstrategien sich aus welchen Kommunikationsbedingungen ergeben“. Auch sind die „Angaben dazu, wie sich die Strategien sprachlich manifestieren, […] äußerst spärlich“ (Hennig 2006: 69). Für die Praxis bedeuten diese Kritikpunkte eine mangelnde Anwendbarkeit bzw. Operationalisierbarkeit v.a. im Zusammenhang mit empirischen Arbeiten, da aufgrund der beschriebenen Ungenauigkeiten eine verlässliche Einordnung von Diskursarten nicht möglich ist. Ausgehend von ihrer Kritik am Nähe-Distanz-Modell von Koch & Oesterreicher, haben Ágel & Hennig (2006b, 2007b) das Modell weiterentwickelt 15. Dabei verfolgen sie folgende Ziele: 14F

a) in theoretischer Hinsicht: 1.

2.

eine präzisierende Beschreibung der komplexen Zusammenhänge zwischen medial mündlichen und schriftlichen Diskursarten und den jeweils präferierten sprachlichen Mitteln; eine modellierende Verdeutlichung der dadurch entstehenden Abhängigkeiten und Hierarchien. (Ágel/Hennig 2007a, 184)

|| 15 Die Ausführungen zum Modell von Ágel & Hennig basieren in weiten Teilen auf Hennig (2006: 72–84) und Ágel & Hennig (2007a) und werden im Folgenden nicht gesondert zitiert.

Gesprochene Schulsprache im Spannungsfeld von Mündlichkeit und Schriftlichkeit | 39

b) in praktischer Hinsicht: 1. 2.

die Schaffung einer Beschreibungsgrundlage für sprachliche Besonderheiten prototypischer gesprochener und geschriebener Sprache; die Schaffung einer Grundlage für die kommunikationstheoretische Verortung von einzelnen Diskursarten (Ágel/Hennig 2007a, 184)

Das Modell geht von mehreren Ebenen aus, die durch fünf Parameter (R, Z, S, M und C) näher beschreiben werden. Diese Parameter betreffen besonders einschlägige „universal-pragmatische Bedingungen des Nähe- und Distanzsprechens“ (Hennig 2006: 75), die unter anderen Bezeichnungen auch in anderen Arbeiten zu den Merkmalen gesprochener Sprache behandelt werden und deshalb im Vorfeld beschrieben werden sollen: Der Rollenparameter (R) beschreibt Möglichkeiten, die sich aus der Rollendynamik der Gesprächsteilnehmer ergeben. Damit bezieht er sich vor allem auf den interaktiven Charakter mündlicher Kommunikation, auf den auch andere Autoren mehrfach hingewiesen haben. Durch die Kopräsenz der Gesprächspartner (vgl. Situationsparameter) und die dialogischen Diskursformen kommt es häufig zu „kollaborativen Konstruktionen“ (joint achievement), die als gemeinsames Produkt der Sprecher zu verstehen sind (Günther 2007b: 11; Fiehler 2006a: 1195). Der Zeitparameter (Z) beschreibt Verfahren, die sich aus der Zeitgebundenheit bzw. Zeitfreiheit der Produktion ergeben. Während man sich beim Schreiben von Texten viel Zeit für Planung und Formulierung der Äußerungen lassen kann, erfolgt das Sprechen in einer weitaus höheren Geschwindigkeit. Planung und Produktion (Formulierung) müssen deshalb im Sinne der Auer‘schen Online-Prozessierung zeitgleich ablaufen und während der Produktion inkrementell aufgebaut werden (Auer 2000). Dabei geht Auer davon aus, dass unser Sprachverarbeitungssystem bzw. unser Sprachprozessor (im übertragenen Sinne) Vermutungen darüber anstellt, wie eine begonnene Äußerung v.a. strukturell fortgesetzt wird. Die so entstandenen Projektionen können zu einer schnelleren Produktion, Verarbeitung und Interpretation der Äußerungen beitragen (vgl. dazu Auer 2000 und 2005: 3–12). Quasthoff & Heller (2012) sprechen in diesem Zusammenhang von der „transitorischen Qualität“ medialer Mündlichkeit, von der natürlich auch die Sprachverarbeitung auf der Hörerseite betroffen ist. So führt gerade die „Flüchtigkeit“ und „Kurzlebigkeit“ (Fiehler et al. 2004: 22–23) mündlicher Gesprächsformen dazu, dass die Äußerungen vom Produzenten so zugeschnitten sein müssen, „dass sie prozessierbar sind“ (Quasthoff & Heller 2012). Als Folge lassen sich viele der Strukturen, die typischerweise in der ge-

40 | Gesprochene Schulsprache: Theorie und Forschungsstand sprochenen Sprache verwendet werden, als Verfahren der Verständnissicherung erklären (z.B. Wiederholung, Paraphrasen, Operator-Skopus-Strukturen) (Fiehler 2006a: 1190). Auch die Belastung des Arbeitsgedächtnisses durch die Online-Prozessierung, die durch Müdigkeit, Stress oder Ablenkung noch verstärkt werden kann, wirkt sich auf die Formulierung von Äußerungen aus. Dies zeigt sich an der Oberfläche z.B. durch Verzögerungsphänomene, Korrekturen, Abbrüche, Neuansätze oder Expansionen (vgl. Gülich 1994: 79–84; Schwitalla 2006: 125; Fiehler 2006a, 1191, 2008a: 91). Der Situationsparameter (S) bezieht sich im Wesentlichen auf das Kriterium der Kontexteinbindung bzw. -entbindung. Während bei prototypischer gesprochener Sprache „Raum, Zeit, Sprecher und Adressat der Sprechsituation […] als gemeinsames Wissen unmittelbar gegeben […] und mitgedacht“ sind, erfordert die raum-zeitliche Trennung distanzsprachlicher Kommunikationsformen die Dekontextualisierung sprachlicher Handlungen (Fiehler 2006a: 1183). So können durch den gemeinsamen Kontext von Sprecher und Hörer in der gesprochenen Sprache viele Details, die bei raum-zeitlicher Distanz ausformuliert werden müssen, weggelassen oder verkürzt werden, was „zum vermeintlich elliptischen Charakter mündlicher Verständigung“ führen kann (Fiehler 2006a: 1205). In diesem Sinne ist auch die Grice’schen Konversationsmaxime der Quantität zu verstehen, die besagt, dass man nur so viel, wie für das Verständnis nötig ist, zu sagen braucht (Schwitalla 2006: 103). Zu beachten ist dabei, dass das Konstrukt Kontext in der Literatur durchaus unterschiedlich beschrieben wird. Ivanic (1994) schlägt ein Modell zur Charakterisierung von Kontext vor, das die verschiedenen Ansätze integriert und als Orientierung für die Beschreibung von Mündlichkeit und Schriftlichkeit dienen soll. Dabei werden drei Kontext-Ebenen (A-C) unterschieden, wobei jede Ebene einen größeren Geltungsbereich als die jeweils darunterliegende aufweist:

Abb. 7. Einbettung von Sprache in soziale Kontexte nach Ivanic (1994: 182)

Gesprochene Schulsprache im Spannungsfeld von Mündlichkeit und Schriftlichkeit | 41

Kontext A steht für die konkrete physische Umgebung, in der der Text produziert und interpretiert wird und entspricht damit Bühlers Ich-Hier-Jetzt-Origo (Bühler 1934). Ist eine Kommunikationssituation im Sinne von Kontext A kontextgebunden, so befinden sich die Gesprächspartner zeitgleich in derselben räumlichen Umgebung. Der Wahrnehmungsraum der Gesprächspartner ist identisch, so dass Personen, Gegenstände oder Vorgänge im direkten Umfeld die Kommunikation mit beeinflussen können (Ivanic 1994: 183). In Bezug auf die gegenseitige Wahrnehmung der Gesprächspartner und deren Auswirkung auf die Gestaltung der Kommunikation prägten Sacks et al. (1974) im Rahmen der Konversationsanalyse den Begriff „Recipient Design“. Damit ist gemeint, dass die Sprecher ihre Redebeiträge an den Bedürfnissen des Hörers ausrichten (Stein 2003: 432–433), was durch diverse Rückkopplungs-Signale von Seiten des Hörers unterstützt wird. By 'recipient design' we refer to a multitude of respects in which the talk by a party in a conversation is constructed or designed in ways which display an orientation and sensitivity to the particular other(s) who are the co-participants. In our work we have found recipient design to operate with regard to word selection, topic selection, admissibility and ordering of sequences, options and obligations for starting and terminating conversations etc. (Sacks, Schegloff & Jefferson 1974: 727)

In prototypischen distanzsprachlichen Kommunikationssituationen sind durch das Fehlen eines gemeinsamen Kontextes keinerlei außersprachliche Informationen gegeben. Auch fehlen direkte Rückmeldungen durch den Rezipienten. Um die gegenseitige Verständigung zu ermöglichen, sind deshalb neben lexikalischer Genauigkeit elaborierte morphologische und syntaktische Strukturen notwendig (Stein 2003: 436). Diese Notwendigkeit erklärt wiederum, warum für distanzsprachliche (typischerweise schriftliche) Kommunikationsformen ein größeres Bedürfnis nach einer normierten Grammatik besteht als für nähesprachliche Diskursformen (Hennig 2006: 23). In Tab. 6 wird zusammengefasst, welche sprachlichen Konsequenzen ein geteilter bzw. nicht geteilter Kontext im Sinne eines geteilten Wahrnehmungsraumes (= Kontext A) haben:

42 | Gesprochene Schulsprache: Theorie und Forschungsstand Tab. 6. Kontextuelle Einflüsse auf den Diskurs nach Ivanic (1994: 184) Aspects of discourse Reference to people, things, time and place Interpersonal meanings

Assessing interpreters’ knowledge, values, feelings, attitudes and beliefs

Context A shared (usually spoken)

can use indexicals (e.g. her, this, now, there) Can be indicated by stance, voice quality, prosody, gesture and facial expression Can be monitored online

Context A not shared (usually written)

Must be explicit in the language Can only be conveyed by lexico-grammatical choices

Must be guessed in advance

Auch Kontext B bezieht sich noch auf den konkreten Text, schließt aber im Gegensatz zu A alle Umstände mit ein, unter denen der Text entstanden ist; also seine Absicht, seinen Inhalt und auch die Kommunikationspartner – und zwar auch dann, wenn sie nicht physisch anwesend sind. In diesem Verständnis können auch geschriebene Texte kontextgebunden sein, indem sie z.B. die angenommenen Einstellungen der Leser berücksichtigen (Ivanic 1994: 183). Kontext C ist deutlich weiter gefasst, abstrakter und nicht an einen konkreten Text gebunden. Er bezieht sich auf den sozio-kulturelle Kontext, in dem ein Text realisiert und interpretiert wird. Eine ähnlich weit gefasste Definition von Kontextualisierung, die sich besonders auf schulsprachliche Kommunikation bezieht, schlagen für den englischen Raum Ricard & Snow (1990) vor: Language used in situations in which the speaker cannot rely on shared social, physical, or historical contexts has been referred to as “decontextualized.” Decontextualized language differs from contextualized language primarily on two dimensions: 1. It is removed from the face-to-face setting […] 2. Shared knowledge of the topic cannot be presumed, so more explicit presentation of information is required. […] Lexical rather than indexical reference and more complex syntax are required. Control over decontextualized language is called for in a number of situations, most notably when talking to strangers, […] and in a variety of tasks at school, such as sharing time, […] and performing on oral or written exams. (Ricard & Snow 1990: 252)

Die Parameter des Mediums und des Codes entsprechen der Uni- bzw. Multimodalität typischer Nähe- und Distanzsprache und werden von Ágel und Hennig wir folgt differenziert: Der Parameter des Mediums (M) bezieht sich auf Bedingungen und Merkmale, die im Zusammenhang mit der Medialität stehen. So kann in mündlichen Äußerungen die Prosodie starken Einfluss auf grammatikalische Strukturen ausüben, während dies bei schriftlichen Produktionen nicht möglich ist. Bei

Gesprochene Schulsprache im Spannungsfeld von Mündlichkeit und Schriftlichkeit | 43

letzteren übernehmen dafür bestimmte graphische Merkmale (z.B. Orthographie, Interpunktion etc.) eine wichtige Funktion. Auch der Parameter des Codes (C) könnte leicht mit der Unterscheidung von graphischem und phonischem Code bei Söll/Hausmann (1985c: 1974) verwechselt werden. Bei Ágel und Hennig verweist der Parameter des Codes dagegen auf die Möglichkeit, zusätzlich zum verbalen Code nonverbale Mittel einzusetzen. Dies ist in nähesprachlichen Kommunikationssituationen gegeben, in distanzsprachlichen dagegen nicht (vgl. die Bedingungen des Universalen Axioms unten). In ihrer Gesamtheit bieten die in Form der Parameter beschriebenen Merkmale nähe- und distanzsprachlicher Kommunikation eine Erklärung für die Variabilität mündlicher Sprache: Geschriebene Sprache ist in ihrer Funktion als Raum-Zeit-übergreifendes Verständigungsmedium auf Einheitlichkeit angewiesen, die nur durch eine Fixierung in Form von Normen erreicht werden kann. Nähesprache ist nicht ausschließlich auf verbale Verständigungsmittel angewiesen, sondern kann durch ihre Multimodalität und ihren Situationsbezug auch nonverbale Informationen nutzen. Ungenauigkeiten oder Abweichungen von Normen bzw. Konventionen können auf diese Weise problemlos kompensiert werden. Solche Abweichungen oder Varianten lassen sich dadurch erklären, dass prototypische gesprochene Sprache sich in besonderer Weise an den situativen Kontext, den Rezipienten und die Bedingungen von Produktion und Verarbeitung anpasst. Diese Anpassungsfähigkeit kann daher als zentrales Charakteristikum gesprochener Sprache betrachtet werden, das ihren beständigen Wandel und in der Folge ihre Vielfalt und Varianz erklärt (Fiehler 2006a: 1185–1186). Im Rahmen des Nähe-Distanz-Modells von Ágel und Hennig (2006a) kommt den beschriebenen Parametern eine zentrale Funktion zu. Der in Abb. 8 dargestellte Zusammenhang der verschiedenen Ebenen und Parameter soll daher im Folgenden näher erläutert werde:

44 | Gesprochene Schulsprache: Theorie und Forschungsstand

Abb. 8. Grundstruktur des Nähe-Distanz-Modells von Ágel & Hennig (2006a, zit. nach Hennig 2006: 72)

Auf der obersten Ebene I (= UNIAX, d.h. Universales Axiom) wird eine Kommunikationsform als prinzipiell nähe- oder distanzsprachlich charakterisiert. Dabei wird genau dann von prinzipieller Nähesprachlichkeit gesprochen, wenn Produzent und Rezipient sich zur gleichen Zeit im selben Raum aufhalten (= offene Produktion und Rezeption durch raumzeitliche Nähe). Ist dies nicht der Fall, handelt es sich um prinzipielle Distanzsprachlichkeit (= geschlossene Produktion und Rezeption durch raumzeitliche Distanz). Die darunterliegenden Ebenen umfassen weitere Kriterien zur genaueren Beschreibung von Kommunikationsformen. Dabei betreffen die Ebenen II und III das, was meistens als Kommunikationsbedingungen beschrieben wird (vgl. z.B. Abb. 6), wobei hier zusätzlich zwischen äußeren und inneren Bedingungen unterschieden wird. Die äußeren Bedingungen betreffen außersprachliche Realitäten (z.B. Rollendynamik vs. Rollenstabilität), während die inneren Bedingungen sich in der Kommunikation entwickeln (z.B. Interaktivität vs. Eigenaktivität). Die Ebenen IV und V betreffen die sprachliche Realisierung, also das, was bei Koch und Oesterreicher etwas

Gesprochene Schulsprache im Spannungsfeld von Mündlichkeit und Schriftlichkeit | 45

undifferenziert als „Versprachlichungsstrategien“ bezeichnet wird (vgl. Abb. 6). Dabei können die einzelnen sprachlichen Merkmale auf Ebene V übergeordneten Strategien oder Verfahren zugeordnet werden, die auf Ebene IV beschrieben werden. Im Einzelnen bedeutet dies Folgendes: Ebene II (= UNIKOM, d.h. Universale Parameter der Kommunikation) beschreibt die äußeren Kommunikationsbedingungen. Diese ergeben sich zunächst aus der Zuordnung einer Kommunikationsform zu offener (d.h. nähesprachlicher) bzw. geschlossener (d.h. distanzsprachlicher) Kommunikation im Sinne des Universalen Axioms (Ebene I). So ergibt sich z.B. aus der raumzeitlichen Nähe in offenen Kommunikationsformen, dass Sprecher- und Hörerrolle meist nicht festgelegt sind, was wiederum Einfluss auf die Kommunikationsform hat, die auf Ebene III (= UNIDIS, d.h. Universale Parameter der Diskursgestaltung) weiter differenziert werden. So kann sich ein Diskurs z.B. durch Interaktivität auszeichnen, die sich durch den häufigen Wechsel von Sprecher- und Hörerrolle ergibt (Rollenparameter). Auch die anderen Parameter können die Diskursgestaltung in unterschiedlicher Weise prägen. So kann bei distanzsprachlichen Kommunikationsformen die Zeitfreiheit zu einer geplanten Diskursgestaltung führen und die Kontextentbindung eine symbolische (im Gegensatz zu einer deiktischen) Diskursgestaltung erfordern. Auf Ebene IV (= UNIVER, d.h. Universale Diskursverfahren) werden für die auf Ebene III identifizierten Formen der Diskursgestaltung spezifische Diskursverfahren identifiziert (z.B. Überlappung von Gesprächsbeiträgen bzw. gleichzeitiges Sprechen aufgrund häufiger Rollenwechsel). Diese Verfahren führen zur Verwendung unterschiedlicher sprachlicher Mittel, die auf Ebene V (= UNIMERK, d.h. universale Diskursmerkmale) differenziert werden. So gehen häufige Rollenwechsel z.B. oft mit Adjazenzstrukturen einher, die von Produzent und Rezipient gemeinsam produziert werden (z.B. A: „Und wenn ich morgen nach Hause komme…“ – B: „… schaust du als erstes nach der Post, ich weiß.“ oder A: „Woher kommst du?“ – B: „Aus Berlin.“). Die Zeitgebundenheit (Zeitparameter) begründet dagegen das häufige Auftreten von Abbrüchen, Selbstkorrekturen und aggregativen Strukturen an den Satzrändern (z.B. „Der Typ, der kommt bestimmt nicht wieder.“, „Dann hab ich einen Hund gesehen so einen ganz kleinen aus Südamerika glaub ich.“). 16 15F

|| 16 Eine umfassende Übersicht über nähe- und distanzsprachliche Merkmale auf den Ebenen IV mit einer Zuordnung zu den fünf Parametern und einer ausführlichen Erklärung der aufgelisteten sprachlichen Mittel nähesprachlicher Kommunikation im Sinn von Ebene V (UNIMERK) findet sich in Ágel & Hennig (2007a: 189–193).

46 | Gesprochene Schulsprache: Theorie und Forschungsstand

Abb. 9. Zusammenhang von Parametern und Hierachieebenen im Nähe-Distanz-Modell von Ágel und Hennig, zit. nach Hennig (2014: 254)

Gesprochene Schulsprache im Spannungsfeld von Mündlichkeit und Schriftlichkeit | 47

Abb. 9 „fasst die Korrelation der fünf Parameter (= horizontale Ebene) und der Hierarchieebenen II-V (= vertikale Ebene) zusammen“, wobei „aus Gründen der Überschaubarkeit […] jedem Parameter auf den Ebenen IV und V nur jeweils zwei Diskursverfahren und Diskursmerkmale zugeordnet“ wurden (Hennig 2014: 253): Während die Modellierungen von Koch und Oesterreicher und Ágel und Hennig vor allem auf theoretischen Überlegungen basieren, analysierte Biber (1986) zum empirischen Nachweis der Dimensionen mündlich vs. schriftlich im Rahmen einer empirischen Korpusanalyse 545 mündliche und schriftliche Textproben 17 hinsichtlich 41 lexikalischen und syntaktischen Merkmalen, die verschiedenen Forschungsarbeiten zufolge als relevant für mündliche und schriftliche Kommunikationsformen angesehen werden (Biber 1986: 387). Weiterhin wurden die Merkmale zugrundeliegenden kommunikativen Funktionen zugeordnet, die zugleich die aus den rezipierten Forschungsarbeiten abgeleiteten Hypothesen widerspiegeln: 16F

(a) Writing has a more detached style – shown, for example, by the frequency of passives and nominalizations. (b) Writing has a more elaborated style, as in the use of subordinate clauses and prepositional phrases. (c) Writing has a more explicit level of expression, as shown by type/token ratio or precise vocabulary. (d) Writing has a more explicit marking of informational relations, e.g. cleft constructions. (e) Speech uses a more inexplicit, informal style of expression, as shown by informal vocabulary items or the general-reference pronoun it. (f) Speech refers more to interactional features, e.g. by using 1st and 2nd person pronouns or questions. (g) Speech is more situated in a physical/temporal context, as evidenced by place and time adverbs. (h) Speech and writing differ in their use of verb tenses and aspects, e.g. the past and present tenses. (Biber 1986: 388)

|| 17 Dabei handelt es sich um ein breites Spektrum an mündlichen und schriftlichen Texte erwachsener Sprecher mit der Erstsprach Englisch (für eine Übersicht siehe Biber 1986: 390).

48 | Gesprochene Schulsprache: Theorie und Forschungsstand Die in den Sprachproben identifizierten und quantifizierten Merkmale wurden einer Faktorenanalyse unterzogen, die drei Hauptkomponenten ergab und inhaltlich als drei zugrundeliegende textuelle Dimensionen interpretiert wurde: 1.

Dimension: Interactive vs. Edited Text

Factor 1 identifies a dimension which characterizes texts produced under conditions of high personal involvement and real-time constraints (marked by low explicitness in the expression of meaning, high subordination, and interactive features) as opposed to texts produced under conditions permitting considerable editing and high explicitness in the lexical content, but little interaction or personal involvement. The distribution of features shown here suggests the label 'Interactive vs. Edited Text'. (Biber 1986: 395)

2.

Dimension: Abstract vs. Situated Content

Here the features with positive weights (nominalizations, prepositions, passives, specific conjuncts, it-clefts etc.) share a function which marks a highly abstract, nominal content and a highly learned style. Consideration of the features with positive and negative weights suggests the label 'Abstract vs. Situated Content' for the dimension identified by this factor - i.e. a detached, formal style vs. a concrete, colloquial one. […] In contrast, the features with negative weights on Factor 2 share the marking of very concrete content and more informal style, indicated by high reference to the temporal and physical situation by means of place and time adverbs - and reduced surface form, through deletion of relative pronouns and subordinator that. […] Consideration of the features with positive and negative weights suggests the label 'Abstract vs. Situated Content' for the dimension identified by this factor - i.e. a detached, formal style vs. a concrete, colloquial one. (Biber 1986: 395–396)

3.

Dimension: Reported vs. Immediate Style

Over-all, the dimension identified by this factor distinguishes texts with a primary narrative emphasis, marked by considerable reference to a removed situation, from those with non-narrative emphases (descriptive, expository, or other), marked by little reference to a removed situation but by high occurrence of present tense forms. These characteristics suggest the label 'Reported vs. Immediate Style'. (Biber 1986: 396)

Um zu zeigen, welches Gewicht den drei Dimensionen in den untersuchten Textsorten zukommt, wurden für jede Textsorte die durchschnittlichen Faktorwerte ermittelt. Abb. 9 zeigt beispielhaft für Faktor 1 und 2, dass die ermittelten Dimensionen ein differenzierteres Bild auf geschriebene und gesprochene Texte liefern als eine eindimensionale mündlich-schriftlich-Dichotomie. Bibers Studie kann deshalb m.E. als empirischer Nachweis für die Existenz von Näheund Distanzsprachlichkeit gesehen werden. So könnte Distanzsprachlichkeit in diesem Sinne tendenziell als „edited“, „abstract“ und „reported“, Nähesprach-

Gesprochene Schulsprache im Spannungsfeld von Mündlichkeit und Schriftlichkeit | 49

lichkeit dagegen als „interactive“, „situated“ und „immediate“ klassifiziert werden, wobei natürlich auch hier verschiedene Zwischenformen existieren. Problematisch in Bezug auf das Konzept Schulsprache bleibt jedoch, dass die Ergebnisse auf Textproben Erwachsener mit der Erstsprache Englisch beruhen und speziell schulische Kommunikationsformen wie Unterrichtssprache, Texte und Aufgaben in Lehrwerken, schulische Präsentationsformen etc. nicht berücksichtigt werden. Die untersuchten sprachlichen Merkmale beziehen sich auf das Englische und sind nicht oder nur eingeschränkt auf die deutsche Sprache übertragbar.

Abb. 10. Durchschnittliche Werte mündlicher und schriftlicher Textsorten für Faktor 1 und 2 (Biber 1986: 398–399)

2.3.3 Systemfrage Ein wichtiges Thema im Zuge der Debatte um die Notwendigkeit einer eigenen Grammatik für die gesprochene Sprache ist die Frage, ob für die gesprochene Sprache ein eigenes Sprachsystem angenommen werden muss, das sich vom Sprachsystem der geschriebenen Sprache unterscheidet. Diese Frage ist auch für die Konzeptualisierung von gesprochener Schulsprache bedeutsam, da zu klären ist, auf welchem grammatikalischen System gesprochene Schulsprache basiert.

50 | Gesprochene Schulsprache: Theorie und Forschungsstand Hintergrund der Systemdebatte ist die durch de Saussure und Chomsky begründete Annahme eines dem konkreten Sprachgebrauch (parole bzw. Performanz) zugrundeliegenden Sprachsystems (langue bzw. Kompetenz). Dieses ist als abstraktes System von Regeln und Zeichen zu verstehen, das beim Sprechen realisiert wird (parole). Unterschiede zwischen langue und parole werden durch Produktions- und Kommunikationsbedingungen erklärt, welche lange Zeit nicht Gegenstand linguistischer Beschreibung waren. Hauptaufgabe der strukturalistisch und generativ geprägten Linguistik war die Beschreibung des Sprachsystems (vgl. Wunderli 2013; Chomsky 1965). Da dieses der direkten Beobachtung jedoch nicht zugänglich ist, muss bei den konkreten Realisierungen immer geklärt werden, ob es sich um systemrelevante Strukturen oder um Abweichungen auf Performanzebene handelt. Geschriebene Sprache ist aufgrund der beschriebenen distanzsprachlichen Merkmale weniger anfällig für Variabilität, so dass die meisten sprachwissenschaftlichen Arbeiten auf Analysen der Schriftsprache basieren. Seit im Zuge der Pragmatisierung der Linguistik verstärkt die Ebene der parole und damit auch der mündlichen Realisierung von Sprache in den Blick rückte, ist eine Debatte bezüglich des sprachtheoretischen Status‘ von gesprochener und geschriebener Sprache entbrannt, deren Positionen Stein (2003: 438–439) wie folgt zusammenfasst: Zwischen den beiden diametral entgegengesetzten Positionen der Abhängigkeit, wonach die geschriebene Sprache von der gesprochenen abhängig und determiniert ist (vgl. Glück 1987), und der Autonomie, wonach die Schriftsprache ein völlig autonomes System darstellt (vgl. Feldbuch 1985), nimmt die Annahme der Interdependenz, wonach gesprochene und geschriebene Sprache als zwei weitgehend übereinstimmende und sich gegenseitig beeinflussende Systeme aufzufassen sind (vgl. Karin Müller 1990), eine vermittelnde Position ein. (Stein 2003: 438–439)

Als wesentliche Kriterien für die Entscheidung, ob gesprochener und geschriebener Sprache dasselbe oder unterschiedliche Systeme zugrunde liegen, werden meist Größe und Art der Unterschiede sowie die dadurch bedingte Verständigungsmöglichkeit („mutual intelligibility“) zwischen Sprachen angeführt. Vertretern der Autonomie-Position oder „Differenz-Hypothese“ (Fiehler 2008b: 271) sind die Unterschiede zwischen gesprochener und geschriebener Sprache zu groß, um von einem gemeinsamen System auszugehen. Hier werden meist Differenzen aufgeführt, die sich aus der Zeitgebundenheit (onlineProzessierung), Prozesshaftigkeit und Interaktivität mündlicher Praktiken ergeben (z.B. Sprecherwechsel, Gliederungssignale, Höreräußerungen, Reparaturen und Gesprächsstrukturen, Fiehler, zit. nach Schwitalla 2006: 24). Solche Abwei-

Gesprochene Schulsprache im Spannungsfeld von Mündlichkeit und Schriftlichkeit | 51

chungen müssten unter der Annahme eines gemeinsamen Systems als ungrammatische Performanzphänomene gewertet werden. Vertreter der Autonomie-Position weisen jedoch darauf hin, dass viele solcher Strukturen im Rahmen mündlicher Kommunikation spezifische Funktionen erfüllen und von den Sprechern während des Diskurses auch nicht als normwidrig empfunden werden (z.B. Operator-Skopus-Strukturen, Fiehler et al. 2004: 139–261). Außerdem wird darauf hingewiesen, dass mündliche Kommunikation trotz Abweichungen vom schriftsprachlichen System „nicht weniger regelgeleitet ist als schriftliche“ und sich lediglich in der Art der Regeln unterscheidet (Fiehler et al. 2004: 132). Geht man von einem gemeinsamen zugrundeliegenden System aus, müssten sich die bestehenden linguistischen Kategorien für die Beschreibung beider Sprachformen eignen. Verschiedene Autoren stimmen jedoch darin überein, dass „es eine Reihe von [gesprochensprachlichen] Phänomenen gibt, die in einer traditionellen Syntaxanalyse nur schwer zu klären sind“ (Schlobinski 1997: 11) und fordern ein eigenes Kategorieninventar für die gesprochene Sprache (Fiehler 1994; Hennig 2006; Stein 2003: 447; Thüne o.J.). Auch Günther (2007b: 1) moniert im Zusammenhang mit der Frage nach der Notwendigkeit einer eigenen Grammatik für die gesprochene Sprache die immer wieder zu erfahrenden Unzulänglichkeit gängiger Grammatiktheorien, die von der "Satz-, der Formalitäts- und Kompositionalitätsprämisse" (Deppermann 2006a: 44) ausgehen und somit grammatische Strukturen, die die Satzgrenze über- wie auch unterschreiten, als randgrammatische Phänomene ausgrenzen oder gar gänzlich ignorieren, die ferner syntaktische Regeln rein formal (losgelöst von ihren Funktionen) betrachten, und die die Satzbedeutung als durchweg kompositional begreifen. Hinzu kommt m.E., dass gängige Grammatiktheorien wesentliche Merkmale des Sprachgebrauchs, die empirische Studien zur Grammatik gesprochener Sprache ans Licht gebracht haben – ihre Medialität, ihre Handlungsbezogenheit, die ihr inhärente Dialogizität, die Sequenzialität und Zeitlichkeit ihrer Entfaltung, die Tatsache, dass wir uns an musterhaft vorgeprägten Formaten orientieren etc. – schlichtweg ausblenden. (Günther 2007b: 1)

Vertreter der Annahme eines gemeinsamen zugrundeliegenden Systems (z.B. Steger 1987; Rath 1994; Stein 2003) betonen dagegen die Gemeinsamkeiten mündlicher und schriftlicher Sprachformen und argumentieren, dass es nur wenige Kategorien gibt, die ausschließlich in der gesprochenen bzw. geschriebenen Sprache verwendet werden. Die beobachtbaren Unterschiede sind dann nicht auf unterschiedliche (Teil-)Systeme, sondern unterschiedliche Verwendungsweisen desselben Systems zurückzuführen (Steger 1987, zit. nach Fiehler et al. 2004: 141). Meist handele es sich um Häufigkeitsunterschiede oder Strukturen, die auf Produktionsumstände zurückzuführen und in diesem Verständnis nicht vom Sprecher intendiert seien (Schwitalla 2006: 24).

52 | Gesprochene Schulsprache: Theorie und Forschungsstand In diesem Zusammenhang wird argumentiert, dass es auch bei der Produktion bzw. Formulierung schriftlicher Texte zu Störungen komme, die in der gleichen Weise in der gesprochenen Sprache aufträten und auf die Gleichzeitigkeit von Planung und Produktion zurückgeführt werden könnten. Der Unterschied bestehe lediglich darin, dass diese Störungen in der Endfassung des schriftlichen Textes nicht mehr sichtbar wären (Stein 2003: 439–441; Gülich 1994: 92; Schwitalla 2006: 35). Angesichts der Komplexität der Fragestellung wird auch nach alternativen bzw. integrierenden Konzeptualisierungen gesucht, bei denen zusätzlich zu einem gemeinsamen System eigene symbolische Teilbereiche für gesprochene bzw. geschriebene Sprache angenommen werden (Schwitalla 2006: 23). Wie in Abb. 10 veranschaulicht, gibt es demnach Regelmengen, die für beide Realisierungsformen Gültigkeit besitzen; zugleich aber auch Strukturen, die nur für mündliche oder schriftliche Produktionen gelten:

Abb. 11. Regelmengen zur Produktion schriftlicher und mündlicher Texte nach Fiehler (2008b: 271)

Auch Hennig geht zusätzlich zu einem gemeinsamen System von getrennten Subsystemen aus (Hennig 2006: 108–109). Dabei weist sie in ihrer Argumentation angesichts der großen Varianz kommunikativer Praktiken und unter Berufung auf Koch und Oesterreicher (1985) darauf hin, dass die Systemfrage nur in Bezug auf die Endpunkte des Nähe-Distanz-Kontinuums sinnvoll diskutiert werden könne. Im Rahmen ihrer Zielsetzung gehe es deshalb nicht darum, „einzelne Strukturmittel auch im anderen Medium zu belegen, sondern darum, Regularitäten des Funktionierens der Kernbereiche des Nähe- und Distanzsprechens zu ermitteln“ (Hennig 2006: 106). Weiterhin betont sie, dass es

Gesprochene Schulsprache im Spannungsfeld von Mündlichkeit und Schriftlichkeit | 53

viele sprachliche Regularitäten sowohl im Bereich des Wortes als auch bei der Verknüpfung von Einheiten (Morpho-Syntax) gibt, die sowohl für die gesprochene als auch die geschriebene Sprache gelten. Auch die Tatsache, dass Mündlichkeit und Schriftlichkeit sich in literalen Kulturen gegenseitig beeinflussen, spräche dafür, dass diese beiden Sprachformen nicht losgelöst voneinander betrachtet werden könnten (Hennig 2006: 13). Dennoch geht sie aufgrund von funktionellen Unterschieden zwischen gesprochen- und geschriebensprachlichen Strukturen von zusätzlichen differenzierten Teilsystemen aus: Ich schlage vor, die Unterschiede im Sprachsystem als primäre Unterschiede zu bezeichnen und die Unterschiede im Sprachgebrauch als sekundäre Unterschiede. Es ergibt sich folgende Position zur Systemfrage: Eine Dichotomie ‚ein gemeinsames System‘ vs. ‚zwei Systeme‘ ist zu einseitig. Es sind drei Ebenen zu unterscheiden: Erstens gibt es ein gemeinsames System, das die Regularitäten umfasst, die sowohl für das Nähe- als auch für das Distanzsprechen gelten. Zweitens finden sich auch systembezogene primäre Unterschiede, d. h., man kann von Subsystemen für prototypische gesprochene und geschriebene Sprache sprechen, die zusätzlich zum gemeinsamen System vorhanden sind. Und drittens schließlich gibt es sekundäre Unterschiede im Sprachgebrauch, die nicht systembezogen sind – es handelt sich dabei um Gebrauchsunterschiede, die Varianten des gemeinsamen Systems darstellen. (Hennig 2006: 109)

Den theoretischen Rahmen für Hennigs Ansatz bildet Coserius‘ Unterscheidung von System, Norm und Rede (Coseriu 1971), die sich aus der Kritik an der als zu vereinfachend empfundenen Dichotomie von langue und parole entwickelt hat. Im Gegensatz zu de Saussure und Chomsky sieht Coseriu die Rede, also parole, als Ausgangspunkt sprachwissenschaftlicher Untersuchungen. In der Rede manifestiert sich neben des Systems im klassischen Sinne eine weitere (Zwischen-)Ebene: die Norm. Dabei existieren die drei Ebenen nicht losgelöst voneinander, sondern bedingen sich gegenseitig (Hennig 2006: 110).

Abb. 12. System, Norm und Rede nach Coseriu (1979: 56)

Unter Rede versteht Coseriu den ganz konkreten Akt des Sprechens. Dieser ergibt sich zum einen aus den Bedingungen der Norm und des Systems, zum

54 | Gesprochene Schulsprache: Theorie und Forschungsstand anderen umfasst er Merkmale, die sich aus der konkreten Realisierung ergeben und individueller, spontaner und zufälliger Natur sind. Im Gegensatz zum direkt erfahrbaren Akt des Sprechens gehören die Ebenen der Norm und des Systems zum sprachlichen Wissen (Eckert 1986: 62). Die Ebene der Norm beschreibt, was in einer Sprache normal bzw. gebräuchlich ist. Im Gegensatz zu zufälligen und gelegentlichen Merkmalen individueller Äußerungen beschreibt sie historisch gewachsene und gesellschaftlich geprägte Konventionen. Gemeint ist also keine präskriptive Norm, die vorschreibt, was richtig oder falsch ist, sondern das, was Sprecher einer Gemeinschaft in einer bestimmten Situation als normal bzw. gebräuchlich ansehen. In diesem Sinne können sich die zur Normebene zählenden Strukturen je nach kommunikativer Situation und sprachlicher Varietät (Dialekt, Soziolekt etc.) unterscheiden. Korrektheit als normkonforme Sprachverwendung hat dann nichts mit standardsprachlichem Sprechen zu tun, sondern meint die „Entsprechung einer Form gegenüber einer Tradition des Sprechens“ (Eckert 1986: 65). Zur Unterscheidung von Norm und System führt Coseriu das Konzept von funktionellen, d.h. systematischen, in Abgrenzung zu nicht-funktionellen Oppositionen ein. Bei letzteren handelt es sich um Gebrauchsregularitäten in Abhängigkeit von der jeweiligen kommunikativen Situation (Hennig 2006: 112). So ist z.B. die Verwendung bestimmter Slangausdrücke in der Kommunikation Jugendlicher im Coseriu‘schen Sinne völlig normal, während dies in formellen Kommunikationssituationen nicht der Fall ist. Diese Unterschiede haben aber nur in Bezug auf andere Normen (hier z.B. eine andere soziale Umwelt) oder in Bezug auf „das, was man nicht sagt“, eine bestimmte Funktion und werden deshalb als „Sekundäropposition“ bezeichnet (Coseriu 1974, zit. nach Eckert 1986: 67). Oppositionen, die interne Form-Funktions-Unterschiede betreffen, bilden dagegen die Ebene des Systems. Ein Beispiel dafür ist das Phoneminventar einer Sprache. So stellen z.B. die Laute [r] und [v] eine funktionelle Opposition dar, die sich durch Minimalpaarbildung nachweisen lässt (z.B. rund – wund) und deshalb zur Ebene des Systems gehört. Unterschiedliche Realisierungen des Phonems /r/ (z.B. die Allophone [r], [R] oder [ʁ]) haben dagegen keine bedeutungsunterscheidende Funktion. Je nach Region bzw. Dialekt gilt eine bestimmte Realisierungsform als normal (= Ebene der Norm). Zusätzlich zu diesen Unterschieden auf der Normebene kommen noch individuelle Unterschiede hinzu. So kann man durch genaue lautliche Analysen zeigen, dass unterschiedliche Sprecher den Laut [r] jeweils leicht verschieden artikulieren (Ebene der Rede), wobei alle Realisierungsformen der Norm entsprechen (vgl. Abb. 13):

Gesprochene Schulsprache im Spannungsfeld von Mündlichkeit und Schriftlichkeit | 55

Abb. 13. Zusammenhang der Ebenen System, Norm und Rede am Beispiel des Phonems /r/, in Anlehnung an Coseriu (1975: 66)

Natürlich kann die Norm auch mit dem System bzw. die Rede mit der Norm zusammenfallen. Dies ist dann der Fall, wenn das System nur eine Möglichkeit anbietet bzw. wenn ein Sprecher bei der Realisierung in keiner Weise von der Norm abweicht. Doch immer dort, wo das System verschiedene fakultative Realisierungsmöglichkeiten erlaubt, werden die Unterschiede der Ebenen offensichtlich (Coseriu 1975: 81). Der Sprecher wählt dann aus den auf funktionellen Oppositionen bestehenden Möglichkeiten des Systems aus, wobei die Norm einschränkt, welche Realisierungsform in der gegebenen kommunikativen Situation „normal“ bzw. üblich oder gebräuchlich ist (Coseriu 1979: 57). Aus diesen Annahmen leitet Hennig ab, dass nur dann von unterschiedlichen Systemen gesprochen werden kann, wenn zwischen zwei Sprachen bzw. Sprachformen primäre, d.h. funktionelle Oppositionen bestehen: Wenn gesprochener und geschriebener Sprache jeweils eigene Systeme zugrunde liegen sollen, müssen entweder für dieselbe kommunikative Funktion jeweils eigene, voneinander verschiedene Formen in den beiden Realisierungsformen nachweisbar sein, oder bestimmte Funktionen kommen nur in einer der beiden Sprachformen vor. Als Beispiele für solche ausschließlich gesprochensprachlichen Funktionen werden Gliederungs- sowie Sprecher- und Hörersignale genannt (Hennig 2006: 112). Umgekehrt könnten die Regeln der Schreibung (vgl. Abb. 11) als spezifisch schriftsprachliche Funktionen angeführt werden. In anderen Fällen finden sich Strukturen zwar sowohl in der gesprochenen als auch in der geschriebenen Sprache, beinhalten aber jeweils andere Funktionen (z.B. Ellipsen und Anakoluthe), wobei Hennig sich immer auf prototypische Nähe- und Distanzsprache bezieht (Hennig 2006: 112).

56 | Gesprochene Schulsprache: Theorie und Forschungsstand Doch neben den genannten primären (funktionalen) Oppositionen zeigt Hennig, dass zwischen gesprochener und geschriebener Sprache auch sekundäre Oppositionen auf der Ebene der Norm beobachtet werden können. Sie geht genau dann von sekundären Unterschieden aus, „wenn die sprachlichen Mittel zum Ausdruck einer Funktion sowohl in geschriebener als auch gesprochener Sprache zur Verfügung stehen, aber Bevorzugungen zu verzeichnen sind“. Ein Beispiel hierfür ist die häufigere Verwendung von Perfektformen in mündlichen Produktionen gegenüber Präteritumsformen in schriftlichen Texten (Hennig 2006: 113). Da es zudem mit Bezug auf das Nähe-Distanz-Modell bestimmte kommunikative Grundbedingungen gibt, die für gesprochene und geschriebene Sprache gleichermaßen gelten und denen die gleichen sprachlichen Formen entsprechen, muss auch von einer gemeinsamen Grammatik des Systems und einer gemeinsamen Norm ausgegangen werden. Daraus ergibt sich das in 14 dargestellte sechsgliedrige Grammatikmodell:

Abb. 14. Grammatikmodell für geschriebene und gesprochene Sprache nach Hennig (2006: 120)

Während bisherigen Grammatiken meist die implizite Annahme eines gemeinsamen Sprachsystems zugrunde liegt (Hennig 2006: 34), fordert Hennig eine differenzierte Analyse sprachlicher Formen in Hinblick auf ihre Funktion in prototypischer Nähe- und Distanzsprache. So ergibt eine exemplarische Analyse von weil-Sätzen im Zusammenhang mit der Verbstellung, dass formal und funktional unterschiedliche Typen von weil-Sätzen identifiziert werden können, die

Gesprochene Schulsprache im Spannungsfeld von Mündlichkeit und Schriftlichkeit | 57

entweder GSPSS, GSPSN oder GGRS zugeordnet werden können (Hennig 2006: 144) 18. In Bezug auf die Notwendigkeit, bei gesprochensprachlichen Phänomenen zwischen systemrelevanten und performanzbedingten Strukturen zu unterscheiden, schlägt Hennig (2006: 276) vor, zwischen „erklärbaren“ und „regelhaften“ Erscheinungen zu differenzieren und nur letztere zum Gegenstand einer Grammatik der gesprochenen Sprache zu machen. Dabei sind v.a. Strukturen, die auf die Gleichzeitigkeit von Planung und Produktion (vgl. Zeitparameter) zurückzuführen sind, zwar „erklärbar“, meist jedoch nicht regelhaft bzw. systematisch. Denn solche Strukturen (z.B. Abbrüche, Neuansätze) können zwar durch eine Überlastung des Arbeitsgedächtnisses erklärt werden, sie erfüllen jedoch keine eigene kommunikative Funktion und waren daher auch nicht intendiert. Anders verhält es sich z.B. mit bestimmten Strukturen an den Satzrändern, denen in der gesprochenen Sprache eine besondere, eigene Leistung zugeschrieben werden kann (z.B. Aufmerksamkeitssteuerung), und die bestimmten Gesetzmäßigkeiten unterliegen. Während die Modellierung von Hennig die Annahme eines zugrundeliegenden Sprachsystems nicht grundsätzlich negiert, sondern durch die beschriebene Differenzierung versucht, die Besonderheiten nähesprachlicher Kommunikation in das Modell zu integrieren, distanzieren sich andere Arbeiten ganz vom klassischen Kompetenz-Performanz-Ansatz (z.B. Construction Grammar) und fordern „eine radikale Pragmatisierung“ der Grammatikschreibung (Schlobinski 1997: 11). Andere erachten die Systemdebatte als müßig, solange keine geeignete Konzeptualisierung von Varianz vorliegt (vgl. Kap. 2.3.1 .) Im letzteren Sinne argumentieren Fiehler et al. (2004: 128) und schlagen aufgrund der Vielfalt an Varianz in der gesprochenen Sprache vor, sich auf die Analyse und Beschreibung charakteristischer Strukturen und Regeln einzelner kommunikativer Praktiken zu konzentrieren. 17F

2.3.4 Medial-extensionales Modell Während Ágel & Hennig (2006a, 2006b) genau wie Koch & Oesterricher (1985) einen Prototypen-Ansatz vertreten und daher vorschlagen, sich bei der Beschreibung von Nähe- und Distanzsprache auf prototypische Kommunikationsformen an den Endpunkten des Nähe-Distanz-Kontinuums zu konzentrieren, || 18 Eine Übersicht für eine mögliche Einordnung von Phänomenen zu den beiden Grammatiken der gesprochenen Sprache (System und Norm) findet sich in Hennig (2006: 290–292)

58 | Gesprochene Schulsprache: Theorie und Forschungsstand vertreten Fiehler et al. (2004) eine medial-extensionale Sichtweise auf mündliche Kommunikation: Betrachtet man mündliche Kommunikation medial-extensional, so ist das Spektrum der mündlichen kommunikativen Praktiken so breit und vielfältig, dass sich nur wenige Merkmale ausmachen lassen, die allen mündlichen Praktiken gemeinsam sind. Allen gemeinsam ist jedoch, dass die Verständigung in ihnen durch bedeutungstragende leibliche Aktivitäten, d.h. mittels kurzlebiger Hervorbringung wie z.B. bedeutungstragenden Lauten und körperlichen Bewegungen, in zeitlicher Sukzession erfolgt. Darüber hinaus lassen sich eine Reihe von Merkmalen benennen, die zwar nicht für alle Praktiken gelten, die aber konstitutiv sind für Klassen von mündliche kommunikativen Praktiken und die durch unterschiedliche Ausprägungen dieser Merkmale Praktiken bzw. Klassen von Praktiken differenzieren. (Fiehler et al. 2004: 53)

Die Ursache für die Vielfalt mündlicher Praktiken sehen Fiehler et al. (2004: 53) darin, dass „die ursprüngliche Form der mündlichen Verständigung von Angesicht zu Angesicht im Laufe der Zeit durch neue kommunikative Praktiken erweitert worden ist“. Zu den neuen Formen mündlicher Verständigung zählen reproduktive mündliche Praktiken, wie das Vortragen zuvor schriftlich ausgearbeiteter Vorträge, institutionelle mündliche Praktiken, die durch die Zunahme gesellschaftlicher Institutionen mit je eigenen Kommunikationsformen zurückzuführen sind, und Praktiken, die im Zusammenhang mit neuen technischen Geräten (Aufnahmegeräte, Telefon, Radio, Fernsehen, Internet etc.) entstanden sind (Fiehler et al. 2004: 54–55). Weiterhin schlagen Fiehler et al. (2004: 56–57) 11 Bedingungen vor, die für die Charakterisierung mündlicher Praktiken bedeutsam sind, wobei diese Liste in Abhängigkeit von der gewünschten Differenziertheit erweitert oder reduziert werden könne. Weiterhin gälten nur die ersten zwei Bedingungen für alle medial mündlichen Kommunikationsformen, während alle anderen Parameter nur für bestimmte (Gruppen von) kommunikativen Praktiken relevant seien: 1. 2. 3. 4. 5. 6. 7. 8.

Kurzlebigkeit/Flüchtigkeit Zeitlichkeit Anzahl und Größe der Parteien Kopräsenz der Parteien und Gemeinsamkeit der Situation Wechselseitigkeit der Wahrnehmung Multimodalität der Verständigung Interaktivität Bezugspunkt der Kommunikation

Gesprochene Schulsprache im Spannungsfeld von Mündlichkeit und Schriftlichkeit | 59

9. Institutionalität 10. Verteilung der Verbalisierungs- und Thematisierungsrechte 11. Vorformuliertheit von Beiträgen Hier zeigen sich durchaus Parallelen zu den Parametern von Hennig (2006: 75), die in Abb. 14 veranschaulicht werden:

Abb. 15. Parameter zur Charakterisierung gesprochener Sprache bei Fiehler et al. (2004) und Hennig (2006)

Auch wenn die Bedingung der Institutionalität hier dem Situations- und dem Rollenparameter zugeordnet wurde, weil sie für diese Parameter vermutlich besonders bedeutsam ist, müsste sie eigentlich als übergeordnete Kategorie behandelt werden. Denn kommunikative Praktiken, die sich aus den Bedingungen und Zielen einer bestimmten Institution ergeben, können sich auf alle Parameter auswirken. Ein wesentlicher Unterschied der beiden Ansätze, der sich durch die prototypenorientierte bzw. medial-extensionale Sichtweise ergibt, besteht darin, dass Hennig als grundlegendes Merkmal von prototypischer Nähesprachlichkeit die raum-zeitliche Kopräsenz von Produzent und Rezipient im Sinne des Universalen Axioms setzt (vgl. Kap. 2.3.2 ), während es Fiehler, Barden und Elstermann nicht um prototypische Nähesprache bzw. konzeptionelle Mündlichkeit geht.

60 | Gesprochene Schulsprache: Theorie und Forschungsstand Indem für sie nur die Bedingungen Kurzlebigkeit/Flüchtigkeit und Zeitlichkeit für alle mündlichen Kommunikationsformen Gültigkeit besitzen, gilt hier primär das Medium bzw. der Code, in der die Kommunikation stattfindet, als ausschlaggebend für die Differenzierung der Dimensionen gesprochen vs. geschrieben. Auch wenn Fiehler et al. (2004) aufgrund der Vielfalt an Varianz in der gesprochenen Sprache eine eigene Grammatik ablehnen und die Systemfrage erst gar nicht stellen, stellen sie doch fest, dass die anhand der Schriftsprache entwickelten Kategorien sich nicht oder nur bedingt für die Besonderheiten gesprochener Sprache eignen, welche sich vor allem durch die Charakteristika Prozessualität, Zeitlichkeit, Interaktivität und Dynamik von geschriebenen Texten unterschieden (Fiehler et al. 2004: 27). Deshalb sind in den letzten Jahren verstärkt Anstrengungen unternommen worden, Analyse- und Beschreibungskategorien zu entwickeln, die sich (auch) für die Untersuchung gesprochener Sprache eignen. Fiehler et al. (2004: 165–166) identifizieren dabei drei Tendenzen: 1.

2. 3.

Übernahme und Adaption von Kategorien der traditionellen (schriftsprachlich orientierten) Grammatik. Bezogen auf Abb. 10 würde das vor allem die Regelmengen betreffen, die sich als Schnittmenge der Phänomene gesprochener und geschriebener Sprache ergeben. Handlungs- und funktionsorientierte Reinterpretation traditioneller Kategorien (meist mit einer Namensänderung verbunden) Entwicklung eigener Kategorien für die gesprochene Sprache

Hennig stimmt dieser Differenzierung der Strategien zur Kategorienentwicklung zu und schlägt für Erscheinungen der Grammatik des Systems der gesprochenen Sprache (vgl. Kap. 2.3.3) einen „kategorialen Neustart“ (= Tendenz 3) vor, während „bei Erscheinungen der Norm Möglichkeiten der Adaption und Reinterpretation bereits vorhandener Kategorien überprüft werden“ sollten (= Tendenzen 1 und 2) (Hennig 2006: 292). Ein Beispiel für Übernahme, Reinterpretation und Neuentwicklung ergibt sich aus der Form-Funktion-Analyse von weil-Sätzen in Hennig (2006), die u.a. die Notwendigkeit einer neuen, gesprochensprachlichen Kategorie Operator (vgl. Fiehler et al. 2004) aufzeigt. Auch die Kategorie Herausstellung, welche den Wohlgeformtheitsbedingungen des schriftlichen Satzes nicht entspricht, erscheint nach einer funktionalen Analyse in der gesprochenen Sprache als wohlgeformte, funktionale und eigenständige Struktur, für die Fiehler et al. (2004: 168–173) den Kategoriennamen „Referenz-Aussage-Struktur“ verwenden. Ausgehend von diesen Überlegungen schlägt Fiehler (2006a: 1176) in Bezug auf die Frage nach einer eigenen Gram-

Gesprochene Schulsprache im Spannungsfeld von Mündlichkeit und Schriftlichkeit | 61

matik für die gesprochene Sprache vor, nur genuine Eigenschaften der gesprochenen Sprache gesondert zu beschreiben und dabei wie Hennig eine ausdrücklich funktionale Perspektive einzunehmen. Das aus seiner Feder stammende Duden-Kapitel zur gesprochenen Sprache folgt diesem Ansatz, indem Strukturen, die in gesprochener und geschriebener Sprache gleichermaßen Gültigkeit besitzen, im ‚traditionellen‘ Teil verbleiben, während im Kapitel zur gesprochenen Sprache nur Phänomene beschrieben werden, die in der geschriebener Sprache nicht vorkommen oder dort eine andere Funktion erfüllen (Fiehler 2006b: 26–27).

2.3.5 Gesprochene Schulsprache in der Primarstufe – Versuch einer Konzeptualisierung Auch wenn Distanzsprachlichkeit als übergeordnetes Merkmal von Bildungssprache immer wieder hervorgehoben wird, zeigen die Ausführungen zu Mündlichkeit und Schriftlichkeit bzw. Nähe- und Distanzsprache in Kap. 2.3.2 , dass auch dieses Konzept alles andere als eindeutig und eher im Sinne eines Kontinuums zu verstehen ist. Gesprochene Schulsprache ist demnach als tendenziell distanzsprachlich einzustufen, entspricht aber nicht der prototypischen, schriftlich realisierten Distanzsprache kompetenter Erwachsener mit Deutsch als Erstsprache. Die beschriebenen Modellierungen sind jedoch hilfreich, wenn es um die Beschreibung der außersprachlichen Kommunikationsbedingungen gesprochener Schulsprache geht. Dabei können die in Tab. 7 zusammengefassten Bedingungen als ursächlich für die besonderen Herausforderungen im Zusammenhang mit schul- bzw. distanzsprachlicher Kommunikation angesehen werden:

62 | Gesprochene Schulsprache: Theorie und Forschungsstand 7.Distanzsprachliche Kommunikationsbedingungen gesprochener Schulsprache Tab. 7. Außersprachliche Kommunikationsbedingungen Rollenstabilität von Produzent und Rezipient (Ágel & Hennig) bzw. Monologizität (Koch & Oesterreicher)

Parameter der Diskursgestaltung, die sich aus den außersprachlichen Kommunikationsbedingungen ergeben

eigenaktive Diskursgestaltung (Ágel & Hennig)

P-R-raumzeitfreier P-R-Horizont (Ágel & Hennig) bzw. raumzeitliche Trennung, Situationsentbindung, Fremdheit der Partner (Koch & Oesterreicher)

P-R-raumzeitfreie Referenz, d.h. symbolische Diskursgestaltung (Ágel & Hennig), ‚Objektivität‘ (Koch & Oesterreicher)

Öffentlichkeit (Koch & Oesterreicher) bzw. Institutionalität (Fiehleret al.)

Themenfixierung (Koch & Oesterreicher), institutionell geregelte Verteilung der Verbalisierungs- und Thematisierungsrechte (Fiehler et al.)

Teilkörper-R und Teilkörper-P (Ágel & Hennig) Monomodalität, verbale Diskursgestaltung

In der Neumodellierung des Nähe-Distanz-Modells durch Ágel/Hennig (2006a) ist das wesentliche Kriterium für prototpyische Distanzsprachlichkeit raumzeitliche Distanz, d.h. die Kommunikationspartner kommunizieren nicht zur gleichen Zeit und auch nicht im selben Raum. Dies ist bei den meisten mündlich realisierten schulsprachlichen Kommunikationsformen nicht der Fall. Dennoch herrscht Einigkeit darüber, dass schulsprachliche Kommunikation viele Merkmale von Distanzsprachlichkeit aufweist. Zu fragen ist also, welche durch die verschiedenen Ebenen und Parameter identifizierten Merkmale von Distanzsprachlichkeit auch für mündliche Kommunikationsformen in der Primarstufe Gültigkeit besitzen. Auf Ebene II (Kommunikationsparameter) zeichnet sich Distanzsprachlichkeit in der gesprochenen Schulsprache wie bei Koch/Oesterreicher (1985) durch Rollenstabilität bzw. Monologizität aus (Rollenparameter). Diese Bedingung ist z.B. beim mündlichen Erzählen (Morgenkreis), dem Vorstellen eines Buches oder dem Beschreiben eines Schaubilds/Vorgangs (z.B. im Sachunterricht) gegeben. In Bezug auf den Zeitparameter gilt für prototypische distanzsprachliche Kommunikationsformen Zeitfreiheit. Dies bedeutet, dass Äußerungen vor der Produktion geplant werden können (vgl. „Reflektiertheit“ bei Koch & Oesterreicher 1985). Dieses Kriterium gilt für gesprochene Produktionen nur sehr eingeschränkt. In der Sekundarstufe könnte man bei zuvor ausgearbeiteten

Gesprochene Schulsprache im Spannungsfeld von Mündlichkeit und Schriftlichkeit | 63

Vorträgen oder Referaten davon ausgehen, dass auch mündliche Äußerungen im Vorfeld geplant werden (vgl. Kap. 2.3.4 , Stichwort „Vorformuliertheit von Beiträgen“). In der Primarstufe ist dies jedoch eher unwahrscheinlich, so dass für diesen Parameter nähesprachliche Merkmale im Sinne der Zeitgebundenheit anzunehmen sind (vgl. Tab. 9). Der Situationsparameter wird für Ebene II mit Situationsentbindung gleichgesetzt. Auch wenn in mündlichen Kommunikationsformen der Schule Sprecher und Zuhörer nicht räumlich getrennt sind, sind die thematischen Inhalte meist vorgegeben und haben nichts mit der konkreten Unterrichtssituation zu tun (vgl. „Themenfixierung“ bei Koch & Oesterreicher 1985: 23, „Verteilung der Verbalisierungs- und Thematisierungsrechte“ bei Fiehler et al. 2004, 56–57). Dies betrifft Diskussionen im Plenum genauso wie das Beantworten von Fragen oder Gruppenarbeiten zu bestimmten Aufgaben. Versteht man die Gesprächssituation dabei nicht nur im Sinne des geteilten Wahrnehmungsraumes, sondern auch im Sinne eines geteilten Erfahrungs- und Wissenshintergrundes (vgl. Abb. 7, Kontext B), führt die relative Fremdheit der Kommunikationspartner (vgl. Koch & Oesterreicher 1985: 23) – v.a. zwischen Lehrer und Schüler, z.T. aber auch der Schüler untereinander – dazu, dass trotz räumlicher Nähe Kontextentbindung vorliegt. Außerdem gehört auch die Berücksichtigung der Bedingungen, die sich durch die Institution Schule und deren Erwartungen an sprachliches Verhalten ergeben, in den Bereich der situativen Verankerung (Ahrenholz 2008b: 174) (vgl. „Institutionalität“, Kap. 2.3.4 ). Diese Erwartungen oder Konventionen sind Teil unserer Kultur und entsprechen damit Kontext C bei Ivanic (vgl. Abb. 7). Die Parameter des Codes und des Mediums sind an Eigenschaften der phonischen bzw. graphischen Realisierungsform gebunden. Prosodische und v.a. gestische Mittel sollten in der Unterrichtskommunikation weniger stark eingesetzt werden als in alltäglichen Kommunikationsformen. Dies liegt zum einen daran, dass sich die Schüler je nach Sitzordnung unterschiedlich gut sehen können. Zum anderen ist es ein wesentliches Ziel des Unterrichts, komplexe oder abstrakte Inhalte und Vorgänge durch verbale Mittel beschreiben zu lernen. Dennoch spielen Prosodie, Gestik und Mimik im Sinne der Multimodalität natürlich auch in bildungssprachlichen Kommunikationssituationen eine wichtige Rolle, wenn die Sprache phonisch realisiert wird. Bezüglich dieser Parameter sind also auch nähesprachliche Merkmale erwartbar. Die distanzsprachlichen Merkmale gesprochener Schulsprache in der Primarstufe betreffen auf Ebene II also vor allem den Rollen- und Situationsparameter. Auf Ebene III (Diskursgestaltung) bedeutet dies für die entsprechenden Parameter eine eigenaktive und symbolische Diskurs-

64 | Gesprochene Schulsprache: Theorie und Forschungsstand gestaltung, bei der die Strukturen oft von einem Sprecher produziert werden müssen und nicht das Ergebnis einer gemeinsamen Produktion wie z.B. bei Adjazenzstrukturen (vgl. Kap. 2.3.2 ) sind (Ebene IV; Rollenparameter). So weist z.B. Grießhaber (2010c: 198–199) darauf hin, dass beim Erzählen im Klassenraum oft kaum Unterstützung durch den Hörer stattfindet. Außerdem müssen grammatische Verfahren eingesetzt werden, durch die die Inhalte auch ohne Einbezug eines gemeinsamen Kontextes ausgedrückt werden können (Situationsparameter). Übersetzt in sprachliche Merkmale (Ebene V) ist die Verständlichkeit von Äußerungen von ihrer grammatischen Integrativität (Hennig 2006, 80) bzw. der „Elaboriertheit“ bei Koch & Oesterreicher (1985: 23) abhängig. Einschränkend ist jedoch zu sagen, dass sich tendenziell monologische Gesprächssequenzen in der Primarstufe dennoch von der Monologizität geschriebener Texte unterscheiden, da die Gesprächspartner im selben Raum sind und z.T. direkt angesprochen werden. Entsprechend sind durchaus auch Merkmale erwartbar, die für dialogische Kommunikationsformen typisch sind. In Tab. 8 werden die von Ágel & Hennig (2007a: 189–203) identifizierten distanzsprachlichen Phänomene für den Rollen- und Zeitparameter sowie die Parameter des Codes und des Mediums zusammenfassend dargestellt 19. Dabei ist davon auszugehen, dass diese Phänomene potentiell auch für gesprochene Schulsprache relevant sind. 18F

|| 19 Die Auflistungen in Tab. 8 und Tab. 9 basieren auf Ágel & Hennig (2007a: 189–203) und werden z.T. durch eigene Beispiele ergänzt. Bis auf die Beispiele wird deshalb in den Tabellen auf Quellenangaben verzichtet.

Gesprochene Schulsprache im Spannungsfeld von Mündlichkeit und Schriftlichkeit | 65

Tab. 8. Distanzsprachliche Merkmale in Bezug auf Rollenparameter, Situationsparameter, Parameter des Codes und Parameter des Mediums in Anlehnung an Ágel & Hennig (2007a, 189–203) Parameter

Übergeordnetes Verfahren (Ebene IV)

Merkmale (Ebene V)

Beschreibung bzw. Beispiel

kein Kontakt von Produ-

statt Imperativ Nebensätze z.B. „Herr Müller hat gesagt, dass

zent und Rezipient

mit sollen

Anna das Buch holen soll.“

P-ohne-R-Sequenzierung

monosequenziale

Im Gegensatz zu Adjanzenzstruktu-

Strukturen

ren, die von Produzent und Rezipient gemeinsam produziert werden, werden monosequenziale Strukturen nur von einem Sprecher/ Schreiber produziert.

P-ohne-R-

-

Kontextualisierung

Während in der Nähesprache Kontexte von Produzent und Rezipient gemeinsam aufgebaut und abgeglichen werden können, muss in der Distanzsprache der Bezug zu einem bestimmten Kontext unabhängig vom Rezipienten erzeugt

Rollenparameter

bzw. aus Sicht des Rezipienten unabhängig vom Produzenten identifiziert werden (ausführlicher in (Hennig 2006, 90–93) integrative Rezeptions-

grammatisch integrierte

Während die Nähesprache über

steuerung

Verstehensanleitung

verschiedene aggregative Verfahren verfügt, um dem Rezipienten das Verstehen einer Äußerung zu erleichtern (z.B. durch OperatorSkopus-Strukturen), ist das Verstehen distanzsprachlicher Texte vollständig auf grammatische Bezüge angewiesen.

P-ohne-R-Illokutions-

explizit performative Aus-

Zur Nuancierung bzw. Verdeutli-

nuancierung

drücke

chung der Sprechabsicht ist die Distanzsprache z.B. auf performative Verben wie versprechen, schimpfen oder behaupten angewiesen.

P-ohne-R Gefühls-

Emotionssymbole: quasi-

z.B. Wut, begeistert, bedauern,

äußerung

psychologische Vokabeln

freuen etc.

66 | Gesprochene Schulsprache: Theorie und Forschungsstand Parameter

Übergeordnetes Verfahren (Ebene IV)

Merkmale (Ebene V)

indirekte grammatische

nicht-deiktische Ausdrücke Deiktische Ausdrücke, die auf den

Verfahren

Beschreibung bzw. Beispiel

außersprachlichen Kontext verweisen (z.B. „hier“, „der da drüben“) sind mangels eines gemeinsamen Kontextes nicht möglich und müssen durch Ausdrücke des

Situationsparameter

Symbolfelds ersetzt werden. eingeschränkte

Zeitliche Bezüge können nur durch

Tempuswahl

das grammatische Tempus eindeutig ausgedrückt werden. In der Nähekommunikation ist die Tempuswahl freier, da das Verständnis temporaler Zusammenhänge durch den gemeinsamen Kontext unterstützt wird.

Verfahren zur

redeeinleitendes Verb,

z.B. „Die Schülerin behauptet, sie

Markierung von Indirek-

Konjunktiv, eingeleiteter

habe nichts von der Klausur ge-

theit in der Redewiderga-

Nebensatz

wusst.“

be symbolische Infomations- Vorfeldbesetzung durch strukturierung

z.B. „Es hat geklopft“, „Es gibt

expletives es

keine Mensa in der Schule.“

Vollstrukturen

Gemeint sind vollständige Sätze im Gegensatz zu Ellipsen in der NäInformationsvermittlung aus-

tionsstrukturierung

schließlich über den verbalen Codes (im Gegensatz zu nonverbalen Mitteln in der Nähesprache).

modulare Informa-

Interpunktion

tionsstrukturierung

Hervorhebung durch Wort-

(Kompensationsverfahren)

z.B. Inversion („Auf dem Baum war

stellung

der Junge auf nicht.“)

offene Strukturen

ambigue Strukturen, z.B. „Sie fahren mit Abstand am besten.“

19F

Parameter des Mediums Parameter 20 des Codes

hesprache. autonome Informa-

(Ágel & Hennig 2007a, 203) Schreibeinheitenbildung

graphisches Wort, Schreibzeichen

|| 20 Grau gedruckt, weil Ágel und Hennig sich hier primär auf geschriebene Sprache beziehen, die aufgeführten sprachlichen Merkmale für gesprochenen Schulsprache also nur teilweise bedeutsam sind.

Gesprochene Schulsprache im Spannungsfeld von Mündlichkeit und Schriftlichkeit | 67

Nicht berücksichtigt sind in dieser Auflistung phonologische Erscheinungen wie Assimilationen (z.B. Mädschen), Elisionen (z.B. nich, sie warn, wir ham, siehste, Ich seh ein Jung etc.) und Enklisen bzw. Klitisierungen (aufm, fürs etc.) (vgl. Schwitalla 2006: 38–39; Rug 2008: 347), die ebenfalls auf die mediale Realisierungsform und damit verbundenen artikulatorischen Schwierigkeiten zurückgeführt werden können. Wie die bisherigen Ausführungen gezeigt haben, sind für gesprochene Schulsprache aber auch spezifisch nähesprachliche Kommunikationsbedingungen und -merkmale anzunehmen. Während die Ausprägung nähesprachlicher Merkmale bei den meisten Parametern in Abhängigkeit von der konkreten Kommunikationssituation in der Schule variiert, übt der Zeitparameter bei der mündlichen Realisierung von Schulsprache immer einen starken Einfluss auf die Sprachproduktion aus. Denn Kurzlebigkeit/Flüchtigkeit und Zeitlichkeit gelten, wie Fiehler et al. (2004: 56–57) zu Recht feststellen, für alle medial mündlichen Kommunikationsformen. Um der in Bezug auf Diagnoseinstrumente geäußerten Forderung nach einer Berücksichtigung der Medienabhängigkeit und der Äußerungsbedingungen bestimmter Diskurstypen insgesamt (Bredel 2007: 95; Ahrenholz 2003a: 295) gerecht zu werden, müssen daher die von Ágel & Hennig (2007a: 189–203) identifizierten und in Tab. 9 zusammengefassten Phänomene, die auf den Zeitparameter zurückgeführt werden können, berücksichtigt werden: Tab. 9. Durch die Zeitlichkeit mündlicher Produktion bedingte sprachliche Merkmale in Anlehnung an Ágel & Hennig (2007a: 189–203) Übergeordnetes Verfahren (Ebene IV)

Merkmale (Ebene V)

Beschreibung bzw. Beispiel

aggregative Strukturen Im Gegensatz zur integrativen Strukturierung der meisten schriftlichen Texte, werden Einheiten in der gesprochenen Sprache syntaktisch relativ unverbunden nebeneinander gestellt (Additivität). Denn die Gleichzeitigkeit von aggregative StruktuPlanung und Produktion behindert die Herstelrierung (Aggregatlung eines „Systemraumes“, der charakterisraum) ohne Beeintisch für schriftliche Texte ist (Symbolgrammaflussung der tik). Aggregativ strukturierte Einheiten sind Projektionsstruktur v.a. gedanklich-virtuell verknüpft, so dass auch von Kontextgrammatik gesprochen wird. So verstanden sind Syntax und Semantik bei aggregativen Strukturen von unterschiedlichen Perspektiven aus organisiert (ausführlicher in (Hennig 2006: 93–96), (Ágel 2007)

68 | Gesprochene Schulsprache: Theorie und Forschungsstand Übergeordnetes Verfahren (Ebene IV)

Merkmale (Ebene V)

Beschreibung bzw. Beispiel

aggregative Strukturen Verschiedene Formen der aggregativen Anam Satzrand kündigung und Präzisierung. Dazu zählen z.B. Strukturen, die in der traditionellen Grammatik als Linksversetzung, freies Thema, Herausstellung oder Expansion beschrieben werden. constructio ad sensum Im Gegensatz zur formalen (meist morphologisch markierten) Korrespondenz zwischen sprachlichen Einheiten wird Kohärenz z.T. auf semantischer Ebene hergestellt (z.B. „Eine aggregative StruktuMenge (Sg.) sonderbarer Bücher lagen (Pl.) auf rierung (Aggregatdem Tisch“ (Ágel & Hennig 2007a: 198)) raum) ohne Beeinflussung der aggregative Subjunkto- Verwendung einzelner Subjunktoren als „AllProjektionsstruktur ren roundsubjunktoren“, obwohl verschiedene spezifischere Subjunktoren zur Verfügung stehen (z.B. dass für damit in: „da muss er sich schon was ganz besonderes einfallen lassen; dass er das wieder gut machen kann“ Ágel & Hennig 2007a: 198) aggregative Fragewör- Fragewörter, die aggregativ realisiert sind, ter obwohl ein integratives Pendant zur Verfügung steht, bspw. an was (vs. woran) aggregative Diskursvgl. aggregative Strukturen (Zeile 1) einheiten, z.B.: Anakoluth Abbruch einer begonnenen Konstruktion aggregative StruktuApokoinu z.B. „Wo hast du denn die Tasche muss du rierung mit Beeindoch mitnehmen“ flussung der ProjekKontamination z.B. „Jetzt wo Lisa sich gerade alle um sie tionsstruktur Sorgen machen.“ Satzverschränkung „Mit welchem Bus glaubst du, dass wir fahren sollten?“ Kontamination s. aggregative Diskurseinheiten Wiederholungen aggregative Präzisie- aggregative Strukturen am rechten Satzrand, rung die der Präzisierung von Äußerungen dienen und somit die Engführung der Orientierungen sicherstellen. Dazu zählen Phänomene, die in der Linguistik bisher unter den Begriffen Nachonline-Reparaturen trag‚ Rechtsversetzung, Ausklammerung, Expansion etc. beschrieben wurden (z.B. „Er hat ein Haus gekauft ein wirklich schönes.“) Korrektursignale z.B. äh, nee, ich mein Präzisierungen z.B. „Der sieht ein Haus ein großes.“

Gesprochene Schulsprache im Spannungsfeld von Mündlichkeit und Schriftlichkeit | 69 Übergeordnetes Verfahren (Ebene IV)

Merkmale (Ebene V)

Beschreibung bzw. Beispiel

kürzere Diskurseinhei- z.B. kurze Sätze ten parataktische Diskurse Aneinanderreihung bzw. Nebenordnung von Einheiten (im Gegensatz zu vielfältigen, überbzw. unterordnenden hypotaktischen Beziehungen in distanzsprachlichen Texten) einfache Hypotaxen z.B. einfache Begründungen wie „Er kommt nicht, weil er krank ist.“ uneingeleitete Neben- z.B. „Er sagt, er war’s nicht.“ sätze unabhängige Nebenz.B. „Wenn doch endlich mal Frühling wär!“ einfache Verfahren sätze der Einheitenbildung Korrelate als Aggrega- Wenn die Integration des Nebensatzes in den tionsindikatoren Hauptsatz zusätzlich durch ein Korrelat angezeigt wird, obwohl die Integration des Nebensatzes voll grammatikalisiert ist (z.B. „wenn sie dann immer noch nicht reagiert, also dann weiß ich nicht was das fürn mädel is.“ Ágel & Hennig 2007a: 199) keine syntaktische Oberbegriff für verschiedene Formen der aggKohäsionsmarkierung regativen Aneinanderreihung von Äußerungen, bei denen […] der Zusammenhang nicht syntaktisch markiert wird, obwohl Marker für solche Zwecke zur Verfügung stehen Heckenausdrücke relativ bedeutungsleere, klassenbildende, zeitgewinnende Ausdrücke (z.B. „so was wie“, „so ein Ding“) ZeitgewinnungsÜberbrückungsphäno- Oberbegriff für verschiedene Zeitgewinnungsverfahren mene (= hesitation verfahren; am häufigsten sind Verzögerungsphenomena, Überbrü- signale wie äh, hm ckungssignale, Zögerungssignale)

Abgesehen von diesen phonologischen Merkmalen scheint die Zeitgebundenheit vor allem Einfluss auf die syntaktische Prozessierung zu haben. So führen z.B. Abbrüche, Korrekturen und aggregative Präzisierungen zu einer Veränderung der syntaktischen Struktur. Aufgrund dieser produktionsbedingten Einflüsse ist die Kategorie Satz für die gesprochene Sprache grundsätzlich problematisch. Noch umstrittener ist das Satzkonzept in Bezug auf dialogische Diskursformen mit häufigen Sprecherwechseln (vgl. Rollenparameter), so dass in der Gesprochene-Sprache-Forschung mittlerweile andere Einheitentypen wie

70 | Gesprochene Schulsprache: Theorie und Forschungsstand z.B. „möglicher Satz“ (Seting 1995), „funktionale Einheit“ (Fiehler 2007: 309) oder „Äußerungseinheit“ (Rath 1992) diskutiert werden. Nicht nur in Bezug auf das Satzkonzept, sondern auch bezüglich der generellen Gliederung gesprochener Sprache konnte bislang kein Konsens erzielt werden 21. Auch Schwitalla (2006: 83–84) kommt zu dem Ergebnis, dass „die Segmentierung gesprochener Äußerungen […] weiterhin umstritten“ ist und unterscheidet zwischen unterschiedlichen Einheiten auf vier verschiedenen Ebenen, wobei sowohl syntaktische als auch intonatorische und lexikalische Mittel bei der Segmentierung eine Rolle spielen können: 20F

1. 2. 3.

Redebeitrag (Redezug, turn, contribution) Zusammengehörende Blöcke von Äußerungseinheiten Äußerungseinheiten, z.B. Sätze, Responsive (z.B. ja, nein), kurze Sprechakte (z.B. pass auf, weiß nicht) 4. Teile von Äußerungseinheiten (z.B. Linksherausstellungen, Nachträge, Korrekturen, Paraphrasen etc.) Auch für die Beschreibung und Analyse gesprochener Schulsprache ist die Einheitenfrage daher nicht eindeutig zu beantworten. Das Satzformat ist zwar im Distanzbereich grundsätzlich als Normalfall anzusehen (Stein 2003: 423) und ist einigen Autoren zufolge auch die zentrale Äußerungseinheit gesprochener Sprache (Rath 1997: 15; Kindt 1994: 26). Dennoch ist aufgrund der Gleichzeitigkeit von Planung und Produktion, die gerade für junge Sprecher im Primarschulalter eine enorme kognitive Beanspruchung darstellt, mit Einheiten zu rechnen, die den Wohlgeformtheitsbedingungen des geschriebenen Satzes nicht entsprechen, ohne dass dies im Medium der Mündlichkeit als Normverstoß empfunden würde. Bei der Beurteilung sprachlicher Strukturen, die von der schriftsprachlichen Norm abweichen, ist die Unterscheidung in erklärbare und regelhafte Phänomene nach Hennig (2006: 276) (vgl. Kap. 2.3.3) hilfreich. So lässt sich ein Großteil der erwartbaren nähesprachlichen Phänomene gesprochener Schulsprache (z.B. Assimilationen bzw. Enklisen, Expansionen etc.) durch die besonderen zeitlichen und artikulatorischen Bedingungen mündlicher Sprachproduktion erklären, aber es handelt sich nicht um regelhafte und damit charakteristische Merkmale von gesprochener Schulsprache.

|| 21 Für einen Überblick zur Einheitenfrage in der gesprochenen Sprache vgl. z.B. Stein (2003); Hennig (2006: 147–185).

Gesprochene Schulsprache im Spannungsfeld von Mündlichkeit und Schriftlichkeit | 71

Die in Tab. 9 zusammengefassten Strukturen, die auf die Zeitlichkeit mündlicher Sprachproduktion zurückgeführt werden können, sind ebenso wie die beschriebenen phonologischen Besonderheiten auch bei gesprochener Schulsprache erwartbar und zumindest teilweise im Coseriu‘schen Sinne als normal einzustufen (vgl. Kap. 2.3.3). Bei der Untersuchung gesprochener Schulsprache sollten diese Phänomene deshalb nicht als Abweichung bzw. Fehler gewertet werden, weil hier andere Normen gelten als für die Schriftsprache. Auch wenn durch die Modellierungen von Mündlichkeit und Schriftlichkeit zumindest hinsichtlich des distanzsprachlichen Charakters gesprochener Schulsprache ein theoretischer Rahmen für eine Konzeptualisierung dieses Registers gegeben ist, fehlt es an empirischen Untersuchungen zur tatsächlichen Relevanz der beschriebenen sprachlichen Merkmale. Dabei wäre insbesondere das Alter der Sprecher zu berücksichtigen. Denn es ist klar, dass Primarschüler nicht über die gleichen kognitiven und sprachlichen Fähigkeiten verfügen wie erwachsene Sprecher. Wenn es um die konkreten sprachlichen Merkmale von Schulsprache geht, ist weiterhin zu beachten, dass es die gesprochene Schulsprache nicht gibt, sondern immer nur verschiedene schulsprachliche Kommunikationssiutationen, die je nach Kontext unterschiedliche sprachliche Mittel erfordern (vgl. Kap. 2.3.4 ). So unterliegt eine Diskussion im Plenum anderen Bedingungen und erfordert andere sprachliche Mittel als die Präsentation eines Buches oder eine Versuchsbeschreibung im Sachunterricht, obwohl es sich in allen Fällen um mündliche schulsprachliche Kommunikationssituationen handelt. An dieser Stelle ist deshalb Fiehler Recht zu geben, dass Sprachformen oder kommunikative Praktiken streggenommen nur mit Bezug zu einem konkreten kommunikativen Kontext bestimmt und beschrieben werden können (vgl. Kap. 2.3.4 ). Dies gilt natürlich auch für gesprochene Schulsprache. Auch aus anderen Wissenschaftskontexten liegen bislang nur wenige Arbeiten vor, die die sprachlichen Merkmale von Schulsprache systematisch untersuchen (vgl. Kap. 2.2 ). So stellen die Studien von Neumann, Gogolin & Roth (2007) und Hövelbrinks (2013) im deutschen Raum bisher die einzigen evidenzbasierten Arbeiten zur Untersuchung schulsprachlicher Mittel in mündlichen Sprachproduktionen von Primarschülern dar, wobei die Ergebnisse dieser Studien aus methodischen Gründen nicht generalisierbar sind (vgl. Kap. 2.2 ). Während sich die quantitative Ermittlung schulsprachlicher Merkmale vor allem auf grammatikalische Mittel konzentriert, beschreiben Vollmer & Thürmann (2010: 121–122) im Rahmen ihrer qualitativen Analyse auch die lexikalisch-semantischen Anforderungen genauer (vgl. Kap. 2.2 ). Im Vordergrund

72 | Gesprochene Schulsprache: Theorie und Forschungsstand stehen demzufolge ein ausdifferenzierter Wortschatz und „die Sensibilität für den treffenden Wortgebrauch“. Bredel et al. (2008: 260–261) betonen in diesem Zusammenhang, dass die empirische Untersuchung semantischer Merkmale von Schulsprache ein wesentliches Desiderat darstellt. Dennoch kann aus den Ergebnissen der Wortschatzuntersuchungen bei zweisprachigen Kindern und Jugendlichen […] und der vergleichenden Leseverstehensuntersuchungen im Primar- und Sekundarbereich (IGLU, PISA) […] gefolgert werden, dass die Brücke zwischen dem grundlegenden Wortschatz und dem Fachwortschatz, also das, was oben als Wortschatz der „alltäglichen Wissenschaftssprache“ bezeichnet wurde, in vielen Fällen die kritische Größe darstellt. (Komor & Reich 2008: 58)

Auch andere Autoren sind sich einig, dass ein ausdifferenzierter Wortschatz als wesentliches Charakteristikum von Bildungssprache einzustufen ist (Gogolin 2009: 269; Lengyel 2010: 596–597; Schleppegrell 2001; Scarcella 2003; Snow & Uccelli 2009). Hier zeigt sich eine weitere Parallele zu Beschreibungen von Distanzsprachlichkeit, die sich Koch & Oesterreicher (1985: 27) zufolge durch lexikalischen Reichtum, eine hohe Type-Token-Relation und eine spezifische Begrifflichkeit auszeichnet. Tab. 10 fasst lexikalische und grammatikalische Phänomene zusammen, die in den vorliegenden Untersuchungen übereinstimmend als Merkmale von Schulsprache identifiziert werden (vgl. vor allem die Untersuchungen bzw. Forschungsüberblicke von Gogolin & Roth 2007; Neumann, Gogolin & Roth 2007; Hövelbrinks 2013; Vollmer & Thürmann 2010; Schleppegrell 2001 und Snow & Uccelli 2009, Kap. 2.2 ). Außerdem entsprechen die ausgewählten Strukturen den besonderen Merkmalen konzeptioneller Schriftlichkeit bzw. Distanzsprache, wie sie in anderen Forschungskontexten erarbeitet wurden (vgl. vor allem Koch & Oesterreicher 1985; Biber 1986 und Ágel & Hennig 2007b, Kap. 2.3.2 ). An dieser Stelle sei noch einmal betont, dass damit nur einige typische grammatikalische und lexikalische Merkmale bzw. Indikatoren von Schulsprache beschrieben werden, Schulsprache sich darüber hinaus aber natürlich auch durch besondere diskursive und pragmatische Aspekte auszeichnet, die bislang jedoch nicht systematisch erforscht wurden und daher auch nicht Thema der vorliegenden Arbeit sind. Auch erhebt die Zusammenstellung keinen Ansprung auf Vollständigkeit, sondern stellt lediglich eine Zusammenfassung des gegenwärtigen Forschungsstandes dar.

Gesprochene Schulsprache im Spannungsfeld von Mündlichkeit und Schriftlichkeit | 73 Tab. 10. Zusammenfassung typischer grammatikalischer und lexikalischer Merkmale von Schulsprache Lexikalische Dichte, Spezifik und Vielfalt

Fachbegriffe, Komposita, Attribute, Verben (v.a. Präfixverben) Nominalisierungen, Funktionswörter (v.a. Präpositionen und Konjunktionen)

Komplexität Satzgefüge (Nebensätze), komplexe Nominalphrasen (umfängliche Attribute), Präpositionalphrasen, (syntaktische Vollständigkeit)

weitere typische grammatikalische Strukturen

unpersönliche Ausdrücke (v.a. man-Sätze und Passiv), Konjunktiv, kontrollierter Umgang mit Tempora

Das Merkmal syntaktische Vollständigkeit wurde hier eingeklammert, weil es in besonderem Maße von den speziellen Bedingungen mündlicher Realisierung betroffen ist: So ist aufgrund der Gleichzeitigkeit von Planung und Produktion bei beschränkten kognitiven Kapazitäten davon auszugehen, dass es bei gesprochener Schulsprache häufiger zu Abbrüchen und Neuansätzen kommt; syntaktische Vollständigkeit also schwer zu beurteilen ist. Vollständigkeit lässt sich allenfalls in Bezug auf das Prädikat, dem auch in mündlich realisierten Äußerungen eine zentrale Funktion zukommt, untersuchen (vgl. Boos-Nünning & Gogolin 1988: 52). Unvollständige oder fehlende Prädikate könnten dann auch einen wichtigen Hinweis auf die Zahl an Abbrüchen (Anakoluthen) geben, die neben den spezifischen mündlichen Produktionsbedingungen auch auf sprachliche Schwierigkeiten zurückzuführen sein könnten. Grundlage für die integrative, symbolische Diskursgestaltung schulsprachlicher Kommunikation, die v.a. aufgrund der Situationsentbindung weitgehend auf nonverbale Mittel verzichten muss, ist neben einer ausprägten lexikalischen Vielfalt die Beherrschung der Kerngrammatik entsprechend der deutschen Standardsprache (vgl. Kap. 2.4.1 ). Die Annahme, dass diese Kerngrammatik in weiten Teilen sowohl für gesprochene als auch geschriebene Sprache Gültigkeit besitzt, wird insbesondere durch Hennigs (2006) Differenzierung in eine Gemeinsame Grammatik des Systems bzw. der Norm und jeweils eigene Teilgrammatiken für gesprochene und geschrieben Sprache überzeugend modelliert (vgl. Kap. 2.3.3). Gesprochene Schulsprache basiert demnach in weiten Teilen auf den gemeinsamen Grammatiken des Systems und der Norm, wobei sich diese unter der Annahme, dass gesprochene Schulsprache mündlich realisierte Standardsprache ist, weitgehend entsprechen sollten (vgl. Kap. 2.4 ).

74 | Gesprochene Schulsprache: Theorie und Forschungsstand

2.4 Schulsprache – Standardsprache 2.4.1 Zur Relevanz standardsprachlicher Fähigkeiten Diverse Veröffentlichungen weisen darauf hin, dass viele Grundschüler mit Deutsch als Zweitsprache noch nicht über die als Grundlage schulsprachlicher Kompetenz identifizierte Kerngrammatik der deutschen Sprache verfügen 22: 21F

Das aufgezeigte Spektrum der Fehler/Abweichungen von der Norm lässt erkennen, dass die ausländischen Schüler größte Schwierigkeiten haben, bestimmte Strukturen und Regelwerke für ihre Erzeugung selbst zu analysieren und zu erfassen, selbst Schüler, die schon über zehn Jahre in Deutschland leben und eventuell sogar den Kindergarten besucht haben. Sie machen deshalb, obwohl sie z.T. schon sehr schöne Texte verfassen, sehr viele grammatische Fehler, natürlich auch, weil sie nicht wissen, worauf sie zu achten haben. Diese Fehler sind eindeutig das Ergebnis einer mangelhaften Unterweisung in der Schule […]. Das gilt auf jeden Fall für Schüler ab der dritten und vierten Klasse. Ohne klar und systematisch auf die Beherrschung bestimmter grammatischer Strukturen ausgerichtete Lernprozesse mit entsprechender Lernkontrolle werden diese Schüler nicht richtig Deutsch lernen. Sie werden es selbst merken und hinsichtlich des Wunsches, richtig Deutsch zu lernen, resignieren [...] (Schlemmer 2001: 46)

Auch Rösch & Rotter (2010) verweisen auf verschiedene empirische Untersuchungen, denen zufolge Schüler auch nach mehrjährigem Schulbesuch (ohne explizite Förderung) die Zweitsprache immer noch unpräzise und formal inkorrekt verwendeten (vgl. auch Grießhaber 2007). Im BeFo-Projekt wird deshalb (v.a. im FoF-Ansatz) ausdrücklich das Ziel verfolgt, Sprachbewusstheit und formalsprachliche Korrektheit zu fördern (Rösch & Stanat 2011: 156). Auch wenn damit nur ein relativ kleiner Ausschnitt schulsprachlicher Fähigkeiten berücksichtigt wird, handelt es sich dabei doch um Fähigkeiten, die als grundlegend für bildungssprachliche Kompetenz angesehen werden. Formale Genauigkeit im Bereich grammatikalischer Strukturen stellt zugleich die Grundlage und ein wesentliches Merkmal schulsprachlicher Kompetenz dar. So weisen verschiedene Autoren darauf hin, dass es sich bei der Schulsprache um ein formelles Register handelt, das sich gerade auf lexikalischer und morpho-syntaktischer Ebene an den grammatischen Zielnormen der geschriebenen Standardsprache orientiert (Ortner 2009: 2233; Gogolin & Lange 2011: 111; Scarcella 2003; Snow & Uccelli 2009). Wie in Kap. 2.2 und 2.3 dargestellt, weist Schulsprache viele Merkmale von Distanzsprachlichkeit auf. Dies || 22 Welche sprachlichen Bereiche als ‚Stolpersteine‘ des DaZ-Erwerbs gelten, wird in Kap. 3.4 dargestellt.

Schulsprache – Standardsprache | 75

bedeutet, dass die Inhalte häufig auch ohne situativen Kontext verständlich sein müssen. Die Informationen müssen daher vollständig und gut strukturiert bzw. elaboriert und explizit sein. Die für Eindeutigkeit, Kohäsion und Strukturiertheit notwendigen sprachlichen Mittel erfordern gute morphologische und syntaktische Kenntnisse sowie einen differenzierten Wortschatz (Rösch 2003b: 31–32; Knapp 1999: 32; Grießhaber 2007: 165; Jeuk 2010: 54). Denn distanzsprachliche Äußerungen können nur verstanden werden, wenn morphologische und syntaktische Regeln eingehalten und richtig dekodiert werden. So betonen z.B. Jeuk (2008: 136–137) und Ahrenholz (2008b: 182) die Wichtigkeit eines korrekten Genus- und Kasusgebrauchs für die Herstellung von Kohäsion und Kohärenz. So kann eine Äußerung wie „Meine Freunde haben eine lustige Frau gesehen, der ein Hund gefolgt ist, obwohl er ihr gar nicht gehörte.“

nur dann richtig verstanden werden, wenn neben Besonderheiten der Wortstellung (Verbklammer und Verbendstellung) die richtige Markierung von Genus, Kasus und Numerus an Artikeln und Pronomen sowie die Regeln der SubjektVerb-Kongruenz beherrscht werden. Auch ein genaues Verständnis des Partizips gefolgt (z.B. in Abgrenzung von verfolgt) ist bedeutsam. Gerade bei der Produktion und Rezeption mündlicher Äußerungen, bei denen Planung und Produktion bzw. Rezeption und Verarbeitung immer gleichzeitig, d.h. online erfolgen müssen, erleichtern gut ausgebildete morphosyntaktische und lexikalische Fähigkeiten das Bilden von Projektionen (vgl. Kap. 2.3.2 ). Dies funktioniert natürlich umso eher, je besser der Sprecher bzw. Hörer mit möglichen sprachlichen Strukturen und Mustern vertraut ist. Wenn Bildungssprache im Sinne Habermas‘ (vgl. Kap. 2.2 ) als Mittel der Verständigung in der Öffentlichkeit angesehen wird, so muss sie eine Basis haben, die für alle verständlich ist. Diese Basis ist die Standardsprache, welche im gesamten deutschsprachigen Raum als Kommunikationsform eingesetzt wird (Spiekermann 2007: 120). Gerade in Hinblick auf die sprachliche Pluralisierung in einer multikulturellen Gesellschaft ist ein „übergreifendes Verständigungsmedium“ von zentraler Bedeutung (Esser 2006: i). Darüber hinaus wird immer wieder darauf hingewiesen, dass Defizite in den standardsprachlichen Ausdrucksfähigkeiten gesellschaftlich stark stigmatisiert sind und zu Diskriminierung führen können. Unter anderem deswegen sehen viele Autoren in sprachlicher Korrektheit die Grundlage für gesellschaftlichen und beruflichen Aufstieg und warnen davor, die Ausbildung standardsprachlicher Fähigkeiten in der Schule zu vernachlässigen (Siebert-Ott 1998: 155;

76 | Gesprochene Schulsprache: Theorie und Forschungsstand Gogolin 2006: 83; Ehlich, Bredel & Reich 2008c: 16; Pabst-Weinschenk 2012: 85; Belke 2008: 180 oder Strecker 2009: 245): [Die Bedeutung] erwächst den Sprachnormen aus ihrer Rolle als soziales Distinktionsmerkmal: Wer unsere Normen beherrscht [...] ist einer von uns. Wer Schwierigkeiten hat, sich normgerecht zu artikulieren, gilt nur eingeschränkt als gesellschaftsfähig. Erst ihre Rolle als soziales Schiboleth verleiht den Sprachnormen, die sich auch ohne amtlichen Segen etablieren konnten, eine Brisanz, die über fachliche Dispute hinausreicht. Normgerecht sprechen zu können, ist faktisch in vielen Bereichen des gesellschaftlichen Lebens eine der wichtigsten Zugangsvoraussetzungen. Und weil dies so ist, geht es nicht an, sich [...] aus der Diskussion um Normen herauszuhalten. [...] Vor allem die Schule darf die Virulenz sprachlicher Normen nicht ignorieren, wenn sie verhindern will, dass ihre Absolventen blind für die Wirkungen ihres Sprachgebrauchs ins soziale Abseits geraten. (Strecker 2009: 245)

Die Ausbildung standardsprachlicher Fähigkeiten ist daher ausdrückliches Ziel der Bildungsstandards für alle Schulformen und dient auch in DaZ/DaFFörderkontexten als Maßstab (Spiekermann 2007: 134). Zugleich ist die Beherrschung der Standardsprache die Grundlage schulischer Wissensvermittlung (Imo 2008, 173). Auch für den Schweizer Raum wird darauf hingewiesen, dass „der schulische Erfolg bzw. Misserfolg […] in sehr hohem Maße von den […] schulsprachlichen (standardsprachlichen) Kompetenzen ab[hängt]“ (Müller & Dittmann-Domenichini 2007: 72). Zu Beginn der Schulzeit, wenn der Unterricht noch stark durch mündliche Kommunikationsformen geprägt ist, fallen grammatikalische Fehler häufig nicht auf oder werden toleriert. Doch schon während der Grundschulzeit (und erst recht in der Sekundarstufe) wird die Unterrichtssprache zunehmend konzeptionell schriftlich. Die sprachlichen Handlungen sind dann immer weniger in Situationen und Kontexte eingebettet, werden in geringerem Maße durch Illustrationen gestützt und beziehen sich zunehmend auf allgemeine Zusammenhänge (Rösch 2003b: 31) (vgl. Kap. 2.1 ). Parallel zu dieser Entwicklung nimmt auch die Bedeutung grammatikalischer Korrektheit stetig zu (Jeuk 2010: 53–54), so dass spätestens ab Klasse 3 formalsprachliche Abweichungen immer stärker ins Gewicht fallen (Knapp 1999; Siebert-Ott 2000; Montanari 2013: 33). Häufig sind es gerade die sprachlichen Bereiche, bei denen Fehler in der gesprochenen Sprache nicht auffallen oder die Kommunikation nicht beeinträchtigen (z.B. Genus, Kasus), die den Kindern später besonders schwerfallen (Jeuk 2010: 65). Deshalb wird auch schon für die Primarstufe vor einer vielleicht gut gemeinten Toleranz gegenüber Normabweichungen (Stichworte: Schonpädagogik, Ausländerbonus) gewarnt (Knapp 1999: 31). Auch die Tendenz, Mehrsprachigkeit positiv zu bewerten und Verständlichkeit gegenüber sprachlicher

Schulsprache – Standardsprache | 77

Korrektheit in den Vordergrund zu stellen, kann dazu führen, dass sich standardsprachliche Fähigkeiten in nicht ausreichendem Maße ausbilden können. Belke (2006: 846) fordert deshalb zu Recht, dass „der Sprachunterricht [nicht] aus lauter Respekt vor der Authentizität der praktizierten Mehrsprachigkeit […] darauf verzichten [dürfe], die […] im Einwanderungsland jeweils gültigen Sprachnormen zu vermitteln“. Interessant ist in diesem Zusammenhang auch eine Beobachtung im Rahmen der DESI-Studie, der zufolge sich u.a. eine hohe Wertigkeit von sprachlicher Korrektheit auf Seiten der Lehrer positiv auf die Lernerfolge der Schüler auswirkte (DESI-Konsortium 2006: 52) 23. Neben der grundsätzlichen Bedeutung von Standardsprache stellt die Beherrschung der Kerngrammatik auch die Grundlage für andere sprachliche Qualifikationen dar. So können bestimmte diskursive bzw. narrative Fähigkeiten wie die angemessene Darstellung kausaler und temporaler Beziehungen in Erzählungen nur dann realisiert werden, wenn dafür grammatikalische und lexikalische Mittel verfügbar sind (z.B. Nebensatzgefüge, Tempusformen des Verbs, Adverbien) (Jeuk 2010: 58). Auch für die Lesekompetenz und den Aufbau orthographischen Wissens sind fundierte grammatikalische Kenntnisse unverzichtbar. So zeigen Untersuchungen, dass sich bei DaZ-Schülern mehr grammatikalisch bedingte Rechtschreibfehler nachweisen lassen als bei DaM-Schülern, während sich bei den anderen Rechtschreibfehlertypen keine Unterschiede zeigen (Fix 2002: 53). Aus methodischer Sicht ist interessant, dass sprachliche Korrektheit auch ein verlässlicher Indikator für den Sprachstand zu sein scheint (z.B. Biehl 1987: 31–32; Grießhaber 2010c: 299–300). Nach Ortner (2009: 2233–2234) lassen sich anhand der Abweichungen von der zielsprachlichen Norm zudem die Zonen ermitteln, in denen „der Ausbau der gesprochene Alltagssprache zur Bildungsund geschriebenen Sprache erfolgt“. 2F

2.4.2 Zu den Begriffen Standarddeutsch und Sprachnorm Auch wenn in einschlägigen Nachschlagewerken, Bildungsstandards und wissenschaftlichen Untersuchungen immer wieder von Standardsprache, Standarddeutsch und Sprachnorm die Rede ist, bleibt oft ungeklärt, was sich hinter diesen Begriffen verbirgt:

|| 23 Dieses Ergebnis basiert auf Analysen des Englischunterrichts an Sekundarschulen. Ob dieser Zusammenhang auch für DaZ-Lerner im Primarbereich zutrifft, wäre noch zu prüfen.

78 | Gesprochene Schulsprache: Theorie und Forschungsstand Was Sprachnormen eigentlich sind, weiß niemand so recht zu sagen! Eine einheitliche, von allen Experten anerkannte Definition steht aus. Sie ist aus meiner Sicht auch nicht zu erwarten. (Hundt 2009: 118)

„Im günstigsten Falle [wird] ad hoc individuell erklärt: ‚Unter Standard verstehe ich… oder wollen wir hier verstehen…‘“ (Löffler 2005: 9). Allein die Vielzahl an (teilweise) synonymen Begriffen in diesem Zusammenhang (z.B. Hochsprache, Standardnorm, Sprachnorm, Einheitssprache, Schriftsprache, Standardvarietät etc.) zeigt, dass es einer begrifflichen Klärung bedarf, die im Zusammenhang mit dem vorliegenden Forschungsvorhaben zusätzlich mit Blick auf mündliche Realisierungsformen reflektiert werden muss. Nach Löffler (2005: 7–8) geht der Begriff des sprachlichen Standards auf eine Entlehnung aus dem Englischen zurück und löste in den 60er Jahren die Bezeichnung „Hochdeutsch“ ab, die als „nicht ganz frei von sprachlichem Standesdünkel“ eingeschätzt wurde. Die sich in diesen Jahren zeitgleich ausbreitende generelle Skepsis gegenüber allgemeingültigen Normen im Sinne von Richtig-Falsch- bzw. Gut-Schlecht-Urteilen führte dazu, dass man auch in sprachlichen Bereichen den Begriff der Norm vermied. Dies verdeutlicht Zifonun (2009: 350) sehr anschaulich durch einen Vergleich der Dudenausgaben der letzten Jahrzehnte, anhand derer sich beobachten lässt, dass die Bezeichnungen Norm und (nicht) normgerecht zunehmend durch die Begriffe Standard bzw. (nicht) standardsprachlich ersetzt wurden. Versteht man Normen jedoch weniger als Bewertungsinstrument und mehr als zugrundeliegendes Regelsystem einer Sprache, wird deutlich, dass Grammatikschreibung auf (wertfreie) Normen angewiesen ist: Sprachnorm. 1) Das Regelsystem einer Sprache, das aus vorliegenden Äußerungen zu erschließen ist, über das alle Mitglieder einer Sprachgemeinschaft verfügen (vgl. --> langue, Kompetenz). 2) Der allgemein übliche Gebrauch sprachlicher Mittel, die Gesamtheit überindividueller Regeln/ Reglementierungen/ Vorschriften/ Grundsätze/ Muster, die den individuellen Sprachgebrauch verbindlich ordnen. […] Für die Linguistik bedeutet die Gewinnung von S. eine der Sprachwirklichkeit angemessene, situativen Sprachgebrauch berücksichtigende, quantitative (häufigkeitsstatistische) Beschreibung der Sprache in ihrer kommunikativen Funktion, bei der wertende Urteile (richtig - falsch, gut - schlecht) durch deskriptive (gebräuchlich - weniger gebräuchlich) ersetzt sind. S. werden nicht als präskriptive oder metasprachliche Idealnormen gesehen, sondern als Regularitäten (auf der Ebene der --> langue oder der parole), die in ihrer Funktionalität nicht fehlerhaft sein können, wenn sie allgemein sind. [...] (Lewandowski 1994: 1037–1038)

Schulsprache – Standardsprache | 79

Auch in den verschiedenen Definitionen von Standardsprache wird Normen explizit oder implizit (durch den Hinweis auf Kodizes oder Verbindlichkeit) eine entscheidende Rolle zugesprochen: Standardsprache [standard language]. Auch: Hochsprache, Nationalsprache, Landessprache. Die historisch legitimierte und institutionalisierte überregionale Verkehrssprache einer Sprachgemeinschaft, die Umgangssprache(n) und Dialekte überlagert und durch Normen des korrekten mündlichen und schriftlichen Gebrauchs festgelegt und tradiert wird. Als am weitesten verbreitetes öffentliches Verständigungsmittel wird die S. in Schulen vermittelt und begünstigt den sozialen Aufstieg; sie ist gegenüber den --> Dialekten und --> Soziolekten das abstraktere und sozial übergreifende Kommunikationsmittel. Für Jäger ist S. "die Sprache, die im Sprachverkehr der oberen und mittleren sozialen Schichten verwendet wird". Steger bezeichnet die S., sozial gesehen, als "Dialekt der Gebildeten". (Lewandowski 1994: 1096) (Linguistisches Wörterbuch) Standardsprache Oft synonym zu --> Hochsprache, --> Schriftsprache, --> Literatursprache, --> Kultursprache, --> Einheitssprache, --> Koiné und --> Standardvarietät verwendete Bez. für eine i.d.R. kodifizierte Spr. (--> Kodifizierung), vermutl. wörtl. Übernahme von engl. standard language. Allgemeine Verbindlichkeit erhält eine S., indem sich der Staat dahinter stellt, was oft nicht ohne weiteres erkennbar ist, sich aber z.B. in Regelungen für den Schulunterricht (Lehrpläne, Lehrmaterialien) oder Behörden zeigt. (Glück 2010: 667) (Metzler Lexikon Sprache) Standardsprache [Auch: Hochsprache, --> Nationalsprache]. Seit den 70er Jahren in Deutschland übliche deskriptive Bezeichnung für die historisch legitimierte, überregionale mündliche und schriftliche Sprachform der sozialen Mittel- bzw. Oberschicht; in diesem Sinn synonyme Verwendung mit der (wertenden) Bezeichnung „Hochsprache". Entsprechend ihrer Funktion als öffentliches Verständigungsmittel unterliegt sie (besonders in den Bereichen Grammatik, Aussprache und Rechtschreibung) weitgehender Normierung, die über öffentliche Medien und Institutionen, vor allem aber durch das Bildungssystem kontrolliert und vermittelt wird. Die Beherrschung der S. gilt als Ziel aller didaktischen Bemühungen. (Bußmann 2008: 680) (Lexikon der Sprachwissenschaft) Standardsprache, die (Sprachw.): über den Mundarten, lokalen Umgangssprachen u. Gruppensprachen stehende, allgemein verbindliche Sprachform; gesprochene u. geschriebene Erscheinungsform der Hochsprache (Scholze-Stubenrecht 1999: 3699) (Duden)

Alle Definitionen stimmen darin überein, dass die Standardsprache durch Normen festgelegt wird, die sich historisch entwickelt haben und in Kodizes (z.B. dem Duden) festgehalten werden. Dabei weisen einige Autoren darauf hin, dass der kodifizierte Standard nicht gleichzusetzen sei mit dem Sprachsystem. Vielmehr handele es sich um ein theoretisches Konstrukt (Zifonun et al. 1997: 2; Stein 2003: 437), das von Linguisten als methodisches Instrument geschaffen worden sei (Hennig 2006: 37). In Bezug auf die Frage nach einer Definition von Standardsprache, schlägt Zifonun (2009: 351) deshalb vor, „das am ehesten

80 | Gesprochene Schulsprache: Theorie und Forschungsstand oder am meisten Systemadäquate […] als das Standardsprachliche“ zu bezeichnen, womit man wieder bei der Frage angelangt, ob für gesprochene und geschriebene Sprache dasselbe Sprachsystem angenommen werden sollte oder nicht (vgl. Kap. 2.3.3) 24. Die Verbindlichkeit von Sprach-Kodizes hängt davon ab, ob sie auch gesetzlich legitimiert sind. Dies ist in Deutschland für die Rechtschreibung der Fall; nicht so jedoch für die Grammatik (Strecker 2009: 235). So wird die Beherrschung der Standardsprache zwar als ausdrückliches Ziel in den Bildungsstandards hervorgehoben, eine amtlich verbindliche Regelung, auf welches Werk bzw. welchen Kodex man sich dabei bezieht, liegt jedoch nicht vor. Deshalb unterliegt die Beurteilung und Vermittlung standardsprachlicher Kompetenz in unserem Bildungssystem vor allem dem intuitiven Sprachwissen der Lehrer, die sich in Zweifelsfällen vermutlich meist auf die Duden-Grammatik berufen (Ammon 2005: 34–35). Gebraucht wird die Standardsprache laut obigen Definitionen vorwiegend von der Mittel- bzw. Oberschicht bzw. den ‚Gebildeten‘, wobei Löffler (2005: 15) zu Recht fragt: 23F

Welche „Gebildeten“ sollen das sein? […] welcher Personenkreis [bildet] eigentlich die Institution DUDEN […], die entscheidet, was aus dem riesigen Sprachkorpus der „Gebildeten“ in die Norm-Bücher aufgenommen werden soll. (Löffler 2005: 15)

Im Gegensatz zum präskriptiven Ansatz der Duden-Grammatik verfolgen Linguisten beim Schreiben von Grammatiken zumeist das Ziel einer neutralen, rein deskriptiven Darstellung von Regularitäten im Sinne der obigen Definition von Lewandowski. Die Ergebnisse dieser Bemühungen erweisen sich aufgrund ihrer Detailliertheit und Komplexität in der Praxis jedoch oft als schwer handhabbar (vgl. z.B. die IDS-Grammatik von Zifonun et al. 1997): Die Linguisten könnte man allenfalls als die Heroen bezeichnen, deren Bemühungen manchmal Prometheus-ähnliche Züge annehmen, häufiger jedoch als Sysiphus-Arbeit enden. (Löffler 2005: 16)

Zu unterscheiden ist auch, was Standardsprache aus linguistischer Sicht bedeutet und was Sprachnutzer darunter verstehen bzw. erwarten. Selbst wenn die Linguistik übereinstimmend zu dem Ergebnis käme, dass es einen Standard der deutschen Sprache nicht gibt, so gibt es dennoch im Bewusstsein der Sprach|| 24 Die IDS-Grammatik differenziert daher zwischen Standardsprache im Sinne der kodifizierten Norm, und „standardsprachlichem Sprachverkehr“, der wiederum nicht immer der kodifizierten Norm entspricht, sondern „ein Spektrum von Möglichkeiten“ aufweist Zifonun et al. 1997: 2.

Schulsprache – Standardsprache | 81

nutzer Vorstellungen einer standardsprachlichen Sprachverwendung, wie sie z.B. in der Schule als wesentliches Merkmal von Bildungssprachlichkeit erwartet wird (vgl. auch das Konzept der Norm von Coserius, Kap. 2.3.3). Bezüglich dieser alltäglichen Konzepte konnte in Untersuchungen gezeigt werden, dass Sprachnutzer eine stark schriftgebundene Vorstellung von Standardsprache haben; und zwar auch dann, wenn es sich um gesprochene Sprache handelt (Bredel 2007: 94). Gerade wenn es um Korrektheitsurteile geht, orientieren sich Sprecher an schriftsprachlichen Normvorstellungen (Schwippert, Hornberg, Freiberg & Stubbe 2007: 1187), wie sie etwa durch die Duden-Grammatik vermittelt oder in bestimmten Textsorten (z.B. Zeitungsartikeln, Sachbüchern) erfahren werden. Die Tatsache, dass Sprache fast immer durch die ‚Brille‘ der Schrift wahrgenommen und beurteilt wird, wird auch als „written language bias“ oder „Skriptizismus“ bezeichnet 25. Als Ursachen für unser schriftsprachlich geprägtes Sprachbewusstsein vermuten Schwippert et al. (2007: 1176–1177) zum einen, dass Schriftsprache in unserer Kultur besonders hoch bewertet wird, zum anderen, dass die Dauerhaftigkeit des fixierten Wortes eine Reflexion über Sprache begünstigt. Auch richteten die Schwierigkeiten beim Schreiben, das im Vergleich zum Sprechen mühsamer von der Hand ginge, die Aufmerksamkeit auf die Eigenschaften und Strukturen von Schriftsprache. Ein theoretisches Modell zur Abgrenzung des Standards von (anderen) Varietäten stellt Löffler (2005) vor, wobei er zunächst von der folgenden grundlegenden Unterscheidung zwischen Standard, Dialekt und Umgangssprache ausgeht und diese dann in Abb. 15 weiter differenziert. Dabei sind die Übergänge zwischen den verschiedenen Varietäten als fließend im Sinne eines Kontinuums zu verstehen: 24F

Standard ist die überregionale, normierte Sprachform, die kodifiziert ist für schriftlichen und teilweise mündlichen Gebrauch, und die auch unterrichtet wird. Dialekt ist das Gegenteil (Non-Standard): regional und örtlich, nicht normiert, jedenfalls nicht kodifiziert, nur für mündlichen Gebrauch und nicht für den Unterricht bestimmt. Umgangssprache ist dazwischen, teilweise überregional, teilweise normiert und kodifiziert, eher mündlich, aber auch schriftlich - und nur teilweise für den (Ausländer-) Unterricht geeignet, allenfalls auf der Fortgeschrittenenstufe.

|| 25 „Während die Bezeichnung ‚Skriptizismus‘ auf Harris (1980) zurückgeht, setzt sich Linell (1982) in einer Monographie mit dem Phänomen unter der Bezeichnung ‚the written language bias‘ auseinander. Aber auch de Saussure (1916/1967: 28, 37) spricht bereits von einer ‚Autorität der Schrift‘ und der ‚Tyrannei des Buchstaben‘ Hennig (2006: 24, Fußnote 10)

82 | Gesprochene Schulsprache: Theorie und Forschungsstand Umgangssprache ist das, was man gemeinhin nach dem Sprachunterricht bei einem Sprachaufenthalt im Lande erlernen soll. (Löffler 2005: 18)

Abb. 16. Modell zur Abgrenzung von Standard und (Standard-)Varietäten nach Löffler (2005: 21)

Auch in dieser Modellierung wird Standardsprache mit Schriftsprache assoziiert, während gesprochene Sprache hier als Mediolekt in der Kategorie Standard-Varietät bzw. Substandard aufgeführt wird. Weiterhin wird die Bedeutung von Sprachnormen in Abhängigkeit von der medialen Realisierung differenziert betrachtet. So unterscheiden sich gesprochene und geschriebene Standardsprache je nach sprachlichem Bereich bezüglich des Grades der Normierung. Dabei wird in Abb. 17 deutlich, dass gesprochene Standardsprache tendenziell weniger stark normiert ist als geschriebene Sprache:

Schulsprache – Standardsprache | 83

Abb. 17. Grad der Normierung geschriebener und gesprochener Sprache nach Löffler (2005: 22)

Auch andere Autoren wie Fiehler et al. (2004: 133), Eichinger (2009: 206) oder Spiekermann (2007: 121) weisen darauf hin, dass sich die Standardsprache aus der Schriftsprache entwickelt hat und bis heute an deren Normen orientiert. Eine Ursache für die Verbindung von Standard/Norm und Schriftsprache besteht in der Funktion von Standard- oder Hochsprache im Sinne eines öffentlichen Verständigungsmittels. Damit eine Varietät überall verstanden wird, muss sie aus mehr oder weniger festgelegten, d.h. normierten, Einheiten und Strukturen bestehen. Da ein wesentliches Merkmal von Mündlichkeit ihre Varianz, Anpassungsfähigkeit und Wandelbarkeit ist (vgl. Kap. 2.3.4 ), liegt es in der Natur der Sache, dass sich gesprochene Sprache in gewisser Weise Normierungsversuchen entzieht (Eisenberg 2007: 289–290; Fiehler et al. 2004: 22). Ein weiterer Grund für die Notwendigkeit der Normierung von Schrift besteht darin, dass ihr keine Verständigungshilfen wie ein situativer Kontext, Gestik, Mimik oder Prosodie zur Verfügung stehen, sondern alle Inhalte durch sprachliche Mittel ausgedrückt werden müssen. Diese können nur richtig kodiert und dekodiert werden, wenn sie sich an gleichbleibenden Normen orientieren. Anders verhält es sich bei gesprochener Sprache:

84 | Gesprochene Schulsprache: Theorie und Forschungsstand Da situationsgebundene gesprochene Sprache nicht losgelöst von der Kommunikationssituation verstehbar sein muss, sondern im Gegenteil diese voraussetzen kann, besteht hier ein geringeres Bedürfnis nach einer normierten Grammatik bzw. nach einer Eindeutigkeit grammatischer Zeichen, vielmehr wird die Indexikalität sprachlicher Zeichen genutzt (Hennig 2006: 23).

Schwitalla (2006: 34) fasst daher treffend zusammen: „Variabilität und Normiertheit bestimmen in hohem Maße den Unterschied zwischen gesprochener und geschriebener Sprache“. Für die gesprochene Sprache existiert vor allem aufgrund ihrer Variabilität und Anpassungsfähigkeit bisher keine eigenständige Grammatik und damit auch kein eigenständiger Standard. Bei Normfragen bezüglich der gesprochenen Sprache müssen daher schriftsprachlich orientierte Grammatiken als Ersatz herangezogen werden (Imo 2008: 154–155). Zusammenfassend lässt sich festhalten, dass die Frage nach dem Standard schon für die geschrieben Sprache keineswegs so einfach zu beantworten ist, wie vielleicht der Duden suggeriert 26. Einige Autoren sehen auch den Standard der Schriftsprache lediglich als theoretisches Konstrukt, das höchstens für bestimmte Textsorten Geltung habe und schlussfolgern deshalb, dass es „ein homogenes grammatisches System für das geschriebene Deutsch nicht gibt“ (Stein 2003: 437). Auch Löffler (2005: 25) kommt zu diesem Ergebnis, das er humorvoll wie folgt zusammenfasst: 25F

Wie die deutsche Sprache ein Kunstprodukt ist [...] so sind auch alle Einteilungsvorschläge und so genannten Definitionen zur Binnengliederung des Deutschen Kunstprodukte, allesamt an den Schreibtischen der Sprachwissenschaftler entstanden. [...] So kommt es, dass jeder an seinem Schreibtisch den Brei etwas anders durchschneidet. Das ist nicht weiter schlimm, solange niemand behauptet, ihm sei es gelungen, klare Schnitte anzubringen und haltbare Figuren auszustechen, die ein allgemein akzeptiertes terminologisches System ergeben. (Löffler 2005: 25)

In Bezug auf das vorliegende Forschungsvorhaben lassen sich die bisherigen Ausführungen wie folgt zusammenfassen: Mündlich wie schriftlich realisierte Schul- oder Bildungssprache wird als formelles, an der Schrift- bzw. Standardsprache orientiertes Register bezeichnet. Dabei wird der Begriff Schriftsprache nicht zufällig als ganz oder teilweise synonym zu Standardsprache verwendet. Denn bei der Standardsprache handelt es sich um eine normierte bzw. kodifizierte Sprachform, die sich aus der Schrift entwickelt hat und an dieser orientiert, weil erst der dauerhafte und gegenständliche Charakter der Schrift

|| 26 Für einen Überblick zur Standarddebatte vgl. Spiekermann (2007).

Schulsprache – Standardsprache | 85

eine Beschreibung und Analyse der zugrundeliegenden Regularitäten ermöglicht. Gesprochenes Standarddeutsch wird meist stillschweigend mit dem geschriebenen Standard gleichgesetzt. Und solange es keine eigene Grammatik für die gesprochene Sprache gibt, kann es auch keinen eigenen Kodex für gesprochenes Standarddeutsch geben. Während die linguistisch motivierte Forderung nach einer Grammatik für spezifisch mündliche Phänomene durchaus plausibel erscheint, ist die Festlegung von eigenen Normen für die gesprochene Sprache im Sinne prototypischer Nähekommunikation (vgl. Kap. 2.3.2 ) nicht sinnvoll bzw. möglich. Denn der Begriff der Norm impliziert immer eine Form von Fixierung und Dauerhaftigkeit, die A) dem variablen und dynamischen Wesen der gesprochenen Sprache nicht entspricht und B) nur durch die Schrift gewährleistet werden kann. Trotz der Notwendigkeit eigener Kategorien für spezifisch mündliche Phänomene kommt der schriftsprachlich geprägten Standardsprache auch in der mündlichen Form eine wichtige Funktion zu. So muss auch die gesprochene Sprache in bestimmten (bildungssprachlichen) Zusammenhängen als übergeordnetes Verständigungsmittel funktionieren und sich deshalb am allgemeinen Standard der Schriftsprache orientieren (vgl. Eisenberg 2007: 290). Dennoch ist unmittelbar einsichtig, dass sich die gesprochenen (Standard-) Sprache selbst gebildeter Sprecher von der Standardsprache schriftlich fixierter Texte unterscheidet, was vor allem auf die Zeitlichkeit mündlicher Produktion zurückzuführen ist. Diese Medienabhängigkeit muss bei der Analyse und Beurteilung gesprochener Schulsprache entsprechend berücksichtigt werden (vgl. Kap. 2.3.5 ).

86 | Deutsch-als-Zweitsprache-Erwerb: Theorie und Forschungsstand

3 Deutsch-als-Zweitsprache-Erwerb: Theorie und Forschungsstand Zweitspracherwerb bezeichnet üblicherweise den sukzessiven, ungesteuerten Erwerb einer zweiten Sprache (Ahrenholz 2008a). Im Gegensatz zum bilingualen Spracherwerb, bei dem zwei Sprachen parallel erworben werden, setzt der Erwerb der zweiten Sprache beim Zweitspracherwerb erst ein, nachdem grundlegende Kenntnisse in der Erstsprache erworben wurden. Meist wird dabei von einem Mindestalter von ca. drei Jahren ausgegangen (vgl. z.B. Ahrenholz 2008a: 5). Diese in der Theorie relativ klare Unterscheidung ist in der Praxis jedoch häufig kaum zu treffen. Vor allem in Deutschland geborene Kinder mit Migrationshintergrund haben in den ersten Lebensjahren in sehr unterschiedlichem Ausmaß Kontakt zur deutschen Sprache, so dass die Grenzen zwischen bilingualem Spracherwerb und Zweitspracherwerb fließend sind. Im Rahmen von BeFo gelten deshalb z.B. all solche Kinder als DaZ-Kinder, die in ihrem familiären Umfeld noch eine anderen Sprache sprechen als Deutsch. Auch in der vorliegenden Arbeit wird auf die Unterscheidung von bilingualen Kindern und DaZ-Kindern verzichtet. Ausschlaggebend für die Bezeichnung „Kinder mit Deutsch als Zweitsprache“ ist vielmehr, dass diese Kinder neben der deutschen Sprache in ihrem sozialen Umfeld eine weitere Sprache sprechen, die sie weitgehend ungesteuert erworben haben. Die Erwerbsreihenfolge sowie die Frage nach dem Erwerbsbeginn sind dagegen nicht von Bedeutung. Auch die Differenzierung in ungesteuerten Spracherwerb (Deutsch als Zweitsprache) und gesteuertes Sprachenlernen (Deutsch als Fremdsprache), die auf Stephen Krashens (1982) aquisition-learning-Dichotomie zurückgeht, ist in der Praxis häufig nicht anwendbar. So erwerben in Deutschland lebende Kinder mit Migrationshintergrund die deutsche Sprache zwar in großen Teilen ungesteuert; durch den Deutschunterricht in der Schule, erst recht aber durch gezielte Fördermaßnahmen wird zugleich steuernd in den Erwerb eingegriffen. Insgesamt handelt es sich bei der Zweitspracherwerbsforschung um eine sehr junge Disziplin, die erst in der 2. Hälfte des 20. Jahrhunderts einsetzte (Antos 1988: 12), so dass bislang relativ wenige empirisch gesicherte Erkenntnisse über

L2-Erwerbshypothesen | 87

Mechanismen und Merkmale des L2-Erwerbs vorliegen (Kaltenbacher & Klages 2007: 81; Jeuk 2007b: 187; Bredel 2007) 27. 26F

3.1 L2-Erwerbshypothesen Seit den 1960er Jahren wird daran gearbeitet, eine umfassende Zweitspracherwerbstheorie zu entwickeln, die möglichst viele Einflussfaktoren berücksichtigt. In diesem Zusammenhang bildeten sich verschiedene L2-Erwerbshypothesen heraus, die jede für sich wichtige Erklärungsansätze für bestimmte Aspekte der Sprachaneignung liefern 28. Ein Großteil der Forschung konzentriert sich dabei darauf, die verschiedenen sprachlichen Einflussgrößen, darunter vor allem die Bedeutung der Erstsprache, in einem Modell zu integrieren. Eine umfassende Modellierung, die alle Faktoren des Zweitspracherwerbs integriert, steht bislang jedoch noch aus. Zu den klassischen L2-Erwerbshypothesen zählen u.a. Kontrastivhypothese, Identitätshypothese, Schwellen- und Interdependenzhypothese und Interlanguagehypothese. Die Kontrastivhypothese wurde erstmals von Fries (1947) formuliert und später von Lado (1957) weiterentwickelt. Die grundlegende Annahme lautete, dass identische Elemente aus Erst- und Zweitsprache leicht zu lernen sind (positiver Transfer), während »unterschiedliche Elemente und Regeln […] Lernschwierigkeiten bereiten und zu Fehlern führen« (Bausch & Kasper 1979, zit. nach Edmondson & House 2006: 218). Diese Hypothese wurde jedoch vor allem aufgrund ihrer engen Anbindung an behavioristische und strukturalistische Theorien kritisiert. Außerdem konnte empirisch nachgewiesen werden, dass nicht allein der Kontrast zwischen Ausgangs- und Zielsprache den Erwerbsprozess beeinflusst (für eine ausführliche Darstellung der Kritik an der Kontrastivhypothese vgl. Edmondson & House 2006). Gerade beim frühen L2-Erwerb kann man Prozesse beobachten, die weitgehend unabhängig von der Erstsprache ablaufen und starke Parallelen zum Erstspracherwerb aufweisen. An diesen Beobachtungen knüpft die Identitätshypothese an. Ihre Vertreter (z.B. Dulay, Burt & Krashen 1982) gehen in Anlehnung an nativistische Theorien zum Erstspracherwerb davon aus, dass der Erwerb einer zweiten Sprache in weiten Teilen den gleichen Prozessen und Strategien unterliegt wie der Erst27F

|| 27 Für einen kurzen Überblick zur Geschichte der Zweitspracherwerbsforschung siehe Ahrenholz (2008e). 28 Die Ausführungen zu den Erwerbshypothesen basieren in weiten Teilen auf Webersik (2013a)

88 | Deutsch-als-Zweitsprache-Erwerb: Theorie und Forschungsstand spracherwerb und sich wie dieser – gesteuert von einem angeborenen Spracherwerbsmechanismus (Language Acquisition Device, Chomsky 1974) – weitgehend automatisiert vollziert. Als Beleg wird z.B. angeführt, dass Zweitsprachenlerner unabhängig von ihrer jeweiligen Erstsprache die verschiedenen Wortstellungsmuster in identischer Reihenfolge erwerben und beim Erst- und Zweitspracherwerb ähnliche Strategien wie beispielsweise Übergeneralisierungen (z.B. denkte statt dachte) oder das Auslassen von Funktionswörtern wie Artikeln oder Präpositionen zu beobachten seien. Während der Einfluss der Erstsprache auf den Erwerb der Zweitsprache bei den Vertretern der Identitätshypothese eine untergeordnete Rolle spielt, geht es im Rahmen der Schwellen- und Interdependenzhypothese gerade um den Zusammenhang bzw. die Interdependenz von Erst- und Zweitspracherwerb (Cummins 1979b, 1982). Dabei nimmt Cummins an, dass sich der Zweitspracherwerb nur dann positiv auf die kognitive Entwicklung eines Kindes auswirken kann, wenn auch ein solides Niveau in der Erstsprache erreicht wird (Cummins 1984, zit. nach Caprez-Krompàk 2009: 61). Dies wird darauf zurückgeführt, dass die Entwicklung grundlegender sprachlich-kognitiver Fähigkeiten im Sinne einer Common Underlying Proficiency (CUP) (vgl. Kap. 2.2) in der Muttersprache leichter fällt, vorausgesetzt diese wird unter „normalen“ Bedingungen erworben. Umgekehrt kann der Aufbau von CUP behindert werden, wenn Kinder mit dem Eintritt in die Schule die dort geforderten sprachlichen Fähigkeiten ausschließlich in einer unzureichend entwickelten Zweitsprache erwerben sollen. Die von Selinker (1972) postulierte Interlanguagehypothese ist bislang die umfassendste Erwerbshypothese, die wesentliche Aspekte aus Identitäts- und Kontrastivhypothese integriert und m. E. auch soziale Einflussfaktoren berücksichtigt. Der Begriff Interlanguage (auch Lernervarietät, Interim- oder Lernersprache) bezeichnet dabei die sich entwickelnde Sprache eines L2- oder Fremdsprachenlerners. Bestimmte lernersprachliche Phänomene lassen sich durch den Einfluss der Muttersprache, andere durch erwerbstypische Strategien der Hypothesengenerierung und -überprüfung erklären (z.B. Übergeneralisierungen). Charakteristisch für Lernersprachen ist, dass sie variabel sind, sich also weiterentwickeln, und dabei zu jedem Zeitpunkt systematisch aufgebaut sind. L2-Lerner versuchen also unbewusst von Anfang an, eine systematische Grammatik für die neue Sprache zu entwickeln. Dabei kommt es z.T. zu Übergeneralisierungen und nicht-linearen Erwerbsverläufen (Reich & Roth 2007: 78; Ahrenholz 2010d: 8). Letztere lassen sich gut bei der Aneignung der Verbflexion beobachten: Zu Beginn verwenden die Lerner sowohl starke als auch schwache Verben in zielsprachlich flektierter Form. Danach folgt eine Phase, in der die schwache Flexion auch bei starken Verben angewandt wird, was zu Fehlbil-

L2-Erwerbshypothesen | 89

dungen wie „er lest, er leste, er hat gelest“ führt. Dies lässt sich dadurch erklären, dass die Lerner die Verbformen zu Beginn des Erwerbs als ganze Einheiten memorieren, ohne die Endungen zu analysieren. In der zweiten Phase erfolgt das Erkennen der zugrundeliegenden Regeln, die dann auch auf Ausnahmen angewandt (übergeneralisiert) werden. Erst im dritten Stadium „filtern die Kinder die ‚irregulären Regularitäten‘ aus den prototypischen Fällen aus. Erst jetzt haben sie die Stark-/Schwachflexion als Kumulation von Regel und Abweichung erworben“ (Bredel 2007: 87). Abweichungen oder Fehler sind in diesem Sinne nicht negativ zu bewerten, sondern Teil des natürlichen Erwerbsprozesses. Oftmals kann man an ihnen sogar Erwerbsfortschritte ablesen. Diese ‚U-Form-These‘ wird jedoch auch kritisch gesehen. So weist Grießhaber (2006: 6) darauf hin, dass er „bisher noch keine Formen mit einer normgerechten Präteritumsbildung gefunden [habe], die den falsch regularisierten vorhergehen“ und schlussfolgert deshalb, dass der Hypothese damit „eine wesentliche empirische Bestätigung“ fehle. Als alternativen Erklärungsansatz für das Vorkommen solcher Formen wie gelest stellt er mit Bezug zu konnektionistischen Spracherwerbstheorien (s.u.) die sogenannte „einMechanismus-Theorie“ vor, die die U-Form-These in Frage stellt. Diese Theorie geht nicht mehr davon aus, dass die Lexeme zunächst als ganzheitliche Einheiten erworben würden, bevor zu einem späteren Zeitpunkt die Bildungsprinzipien erschlossen würden. Kindern verwendeten vielmehr „die Partizipformen der Verben vom ersten Auftreten an in einer irgendwie flektierten Form“, ganz so, „als ob sie aus einem Formenbaukasten verschiedenen Formen probeweise auf die Verben anwenden“ (Grießhaber 2006: 6). Ein weiterer Schlüsselbegriff im Rahmen der Interlanguage-Hypothese ist „die von Selinker als Fossilierung bezeichnete Verfestigung von Strukturen in der Interlanguage“ (Grießhaber 2010c: 138). Dieses Konzept bezieht sich auf die Beobachtung, dass die Entwicklung der Lernersprache in bestimmten Bereichen stagnieren (fossilieren) kann. Die Ursachen hierfür werden auf unterschiedlichen Ebenen vermutet (z.B. Motivation/Antrieb, Begabung, sozio-kultureller Hintergrund, Alter, schulische Faktoren) und sind bislang nicht abschließend geklärt 29. 28F

|| 29 Für einen Überblick zu den Einflussfaktoren des Zweitspracherwerbs vgl. Klein & Dimroth (2003: 17–25); Kniffka & Siebert-Ott (2007: 58–68); Kuhs (2008); Grießhaber (2010c: 175–192)

90 | Deutsch-als-Zweitsprache-Erwerb: Theorie und Forschungsstand

3.2 Nativistische und kognitivistische Erklärungsansätze Die klassischen L2-Erwerbshypothesen aus den 1970er-1980er Jahren orientieren sich stark an den Annahmen der Erstspracherwerbsforschung. Besonders einflussreich war dabei der nativistische bzw. mentalistische Ansatz von Chomsky (Chomsky 1965, 1981) sowie Slobins kognitivistisch orientiertes Konzept der Operationellen Prinzipien (Slobin 1973, 1985). Um eine Erklärung für die Schnelligkeit und Perfektion des Erwerbs eines so komplexen Gegenstands wie der Sprache zu finden, postuliert Chomsky eine genetisch verankerten Universalgrammatik, die aus in natürlichen Sprachen möglichen Prinzipien und Parametern besteht. Darüber hinaus verfügt der Mensch diesem Ansatz zufolge über einen angeborenen Spracherwerbsmechanismus (language acquisition device), der den Spracherwerb steuert und je nach einzelsprachlichem Input bestimmte Parameter aktiviert. Dies erklärt, warum Spracherwerb nicht willkürlich verläuft, sondern sich bestimmte Grundmuster und Gemeinsamkeiten wie z.B. festgelegte Erwerbsreihenfolgen beobachten lassen. Die zugrundeliegende Annahme solcher Erwerbssequenzen ist, dass der Erwerb sowohl der zielsprachlich-abweichenden als auch der zielsprachlich-korrekten Sprachstrukturen trotz individueller und sozial-situativer Varianzen im Kern invariant, d.h. geordnet und systematisch verläuft. (Antos 1988: 12–13)

Auch Slobins Ansatz versucht eine Erklärung für solche überindividuellen Merkmale und Verläufe des Spracherwerbs zu finden, wobei er jedoch nicht von einem angeborenen Grammatikmodul ausgeht, sondern Spracherwerb als Teil der menschlichen Kognition versteht. Angeboren sind uns demnach lediglich „universellen Prinzipien und Verfahren“, nach denen sprachlicher Input analysiert, bearbeitet und gespeichert wird. Diese Prinzipien und Verfahren bestehen Slobin zufolge in sogenannten „Operating Principles“, die als Sprachverarbeitungsstrategien zu verstehen sind und dem Lerner dabei helfen, „die Regeln der Erstsprache schrittweise aus dem Input zu erschließen“ (Diehl 2000a: 34): –

OPERATING PRINCIPLE A: Pay attention to the ends of words.



OPERATING PRINCIPLE B: The phonological forms of word can be systematically modified.



OPERATING PRINCIPLE C: Pay attention to the order of words and morphemes.



OPERATING PRINCIPLE D: Avoid interruption or rearrangement of linguistic units.



OPERATING PRINCIPLE E: Underlying semantic relations should be marked overtly and clearly.



OPERATING PRINCIPLE F: Avoid exceptions.

Nativistische und kognitivistische Erklärungsansätze | 91



OPERATING PRINCIPLE G: The use of grammatical markers should make semantic sense. (Slobin 1973: 191–206)

Die Liste der „Operating Principles“ wurde in den Folgejahren deutlich ausgeweitet, wobei vor allem die fehlende Hierarchie zwischen z.T. konkurrierenden Prinzipien kritisiert wurde. Eine mögliche Hierarchisierung schlägt die Forschergruppe des ZISA-Projekts (Clahsen et al. 1983) vor, indem sie den Erwerb der Wortstellungsregeln durch bestimmte Sprachverarbeitungsstrategien erklärt, wobei sich die Reihenfolge durch die Komplexität der zugrundeliegenden Verarbeitungsprozesse begründet (Diehl 2000a: 36). Die darauf aufbauende Teachability und Processability Theory (Pienemann 1989, 1998; VanPatten 2004) wird jedoch auch kritisch diskutiert. So weist z.B. Diehl (2000a: 33) darauf hin, dass die anhand der hierarchischen Sprachverarbeitungsstrategien festgelegte Sequenz für den Erwerb der Satzmodelle laut ZISA-Studie in der DiGS-Studie nicht vollständig bestätigt werden konnte. Weitere Kritikpunkte betreffen die angenommenen Kriterien für die Beurteilung der Komplexität bzw. kognitiven Beanspruchung der Verarbeitungsstrategien sowie die fehlende Berücksichtigung der Produktionsbedingungen mündlicher bzw. schriftlicher Texte. Auch würde nicht ausreichend zwischen produktiven und rezeptiven Aspekten unterschieden (Meerholz-Härle & Tschirner 2001: 173). Insgesamt stellt sich der empirische Nachweis invarianter Erwerbsphasen als äußerst problematisch dar und konnte bisher nur für einige morphosyntaktische Strukturen erbracht werden, wobei die Meinungen auseinandergehen, welche und wie viele Erwerbssequenzen als nachgewiesen gelten können. So heißt es bei Reich (2008a: 166), dass „im Bereich des Deutschen als Zweitsprache für eine ganze Reihe morphosyntaktischer Erscheinungen“ Erwerbsreihenfolgen nachgewiesen werden konnten, wobei er sich v.a. auf die Studien von Clahsen, Meisel & Pienemann (1983), Dittmar (1993), Wegener (1998b), Parodi (1998) und Grießhaber (1999) bezieht. Andere Autoren wie Dirim & Döll (2010: 11) kommen dagegen zu dem Ergebnis, dass es „für viele Bereiche keine nachgewiesenen Erwerbssequenzen“ gibt. Die Ursachen für diese unterschiedlichen Einschätzungen liegen vor allem in den z.T. subjektiv gesetzten Prämissen: So sind z.B. bisher ungeklärte Fragen, ab wann eine bestimmte Struktur als erworben angesehen werden kann (vgl. Kap. 3.3 ) und wie viel Variation innerhalb einer angenommenen Erwerbsstufe zulässig ist (Diehl 2000a: 37–38; Meerholz-Härle & Tschirner 2001: 173–174). Auch wird immer wieder beobachtet, dass zielsprachliche und abweichende Strukturen häufig parallel auftreten:

92 | Deutsch-als-Zweitsprache-Erwerb: Theorie und Forschungsstand In den Schüleraufsätzen ist es durchaus die Regel, dass auf engstem Raum – innerhalb desselben Satzes – normgerechte Formen und Normverstöße koexistieren, die nach dem Zufallsprinzip miteinander kombiniert zu sein scheinen, ohne jede rekonstruierbare Kohärenz – in „freier Variation“, wie Ellis dieses Phänomen bezeichnet. (Diehl 2000a: 38)

Sowohl der nativistische Ansatz von Chomsky als auch der kognitivistische Ansatz von Slobin und die darauf aufbauende Processability Theory verstehen Spracherwerb primär als Erwerb abstrakter Regeln, die dann auf sprachliche Einheiten angewandt werden. Lexik- und Grammatikerwerb erscheinen somit als voneinander getrennte Entitäten. Eine deutliche Gegenposition nehmen in jüngerer Zeit konnektionistische Modelle ein (z.B. MacWhinney et al. 1989; Bybee 1989, 2006; Marcus 2001). Diese Modelle gehen nicht mehr davon aus, dass aus dem sprachlichen Input Regeln abgeleitet werden, sondern postulieren die Ausbildung kognitiver Schemata bzw. Muster, die sich vor allem in Abhängigkeit von „Frequenz, Markiertheit und funktionaler Eindeutigkeit“ sprachlicher Strukturen ausbildeten (Diehl 2000a: 42). Die Prämissen, von denen diese Modelle ausgehen, können wie folgt zusammengefasst werden: 1.

Sie verzichten auf die Annahme jeglichen angeborenen sprachspez fischen Wissens oder sprachspezifischer Verarbeitungsprozeduren; Spracherwerb findet nach ihrer Auffassung ausschließlich durch die Interaktion von allgemeinen Lernmechanismen und der sprachlichen Eingabe statt;

2.

sie postulieren einen Spracherwerb ohne Regeln und ohne symbolische Repräsentationen. Cues statt Rules, wie es in einer der ersten Arbeiten im Rahmen dieses Modells provozierend heißt – also einzelne Stimuli anstelle von Regeln sind die Antriebskräfte des Spracherwerbs, bei dem der kognitive Apparat als ein Netzwerk vorzustellen ist, dessen Knoten unterschiedlich aktiviert werden – je nachdem, wie stark sie im Verhältnis zu den anderen Knoten des Netzwerkes „gewichtet“ sind;

3.

syntaktische und semantische Faktoren sind im Spracherwerb nicht voneinander zu lösen; der konnektionistische Ansatz ist somit funktional;

4.

konnektionistische Modelle sind Performanzmodelle; sie fragen nicht nach der Repräsentation sprachlichen Wissens, sondern nach der Verwendung sprachlicher Form-Funktion-Verbindungen. (Diehl 2000a: 39)

Bislang konnten jedoch auch konnektionistische Modelle nicht zufriedenstellend empirisch bestätigt werden, weshalb Diehl (2000a: 42) beim jetzigen Forschungsstand Ansätze empfiehlt, die konnektionistische und mentalistische Positionen integrieren. Eine solche Möglichkeit sieht sie im dualistischen Modell von Pinker & Prince (1988, 1991), das unterschiedliche Erwerbswege für

Nativistische und kognitivistische Erklärungsansätze | 93

regelmäßige und unregelmäßige Formen postuliert und in der Folge auch von Clahsen et al. (1992) erprobt wurde. Diesem Modell zufolge erfolgt der Erwerb irregulärer Flexionsformen in Anlehnung an konnektionistische Ansätze, während für regelmäßige Formen der Aufbau eines Regelinventars angenommen wird, „das immer dann abgerufen wird, wenn keine lexemspezifischen Einträge die Verwendung des regulären Flexivs blockieren“ (Diehl 2000a: 43). Im Vergleich mit regelmäßigen Formen scheinen dabei sprachliche Formen, „für die es keine Regeln gibt, die also einzelheitlich bzw. episodisch gelernt werden müssen […] für mehrsprachige Kinder eine zentrale Lernschwierigkeit“ darzustellen (Jeuk 2010: 67). Eine der ersten Arbeiten, die die Erklärungsadäquatheit konnektionistischer und dualer Modelle für den Zweitspracherwerb Deutsch empirisch nachzuweisen versucht, ist Wegeners Studie zum Erwerb der deutschen Pluralmorphologie (Wegener 2008b) (vgl. auch Ahrenholz 2008e: 73). Dabei sieht sie in ihren Daten eine Bestätigung des konnektionistischen Ansatzes, während qualitativ unterschiedliche Erwerbswege für reguläre und irreguläre Formen nicht nachgewiesen werden konnten (Wegener 2008a: 348). Abschließend lässt sich festhalten, dass sich beide Modelle noch in einem sehr frühen Entwicklungsstadium befinden und deshalb weiterer empirischer Prüfung bedürfen. Die bisherigen Ausführungen zeigen, dass der tatsächliche Zusammenhang sprachlicher Phänomene und Strukturen beim Spracherwerb bzw. bei Sprachverarbeitung und -produktion bislang nicht geklärt werden konnte. Wenn konnektionistische Modelle davon ausgehen, dass selbst semantische und syntaktische Faktoren beim Spracherwerb nicht voneinander zu trennen sind, so ist erst recht davon auszugehen, dass auch die verschiedenen grammatikalischen Strukturen keine separaten Fähigkeitskomplexe darstellen, sondern vielfältig voneinander abhängen. Wie diese Abhängigkeiten oder Zusammenhänge gestaltet sind, weiß man jedoch nicht. In der traditionellen Linguistik werden zwar verschiedene Ebenen und Kategorien unterschieden (z.B. Syntax, Morphologie, Verbalflexion, Nominalflexion, Tempus, Modus etc.), doch basieren diese Dimensionen auf strukturalistisch geprägten Systematisierungsbemühungen und wurden vor allem zu deskriptiven Zwecken entwickelt. Empirisch, d.h. durch Analyse von Sprachgebrauchsdaten (Korpusanalysen), konnte die Zugehörigkeit bestimmter sprachlicher Phänomene zu diesen theoretisch basierten Ebenen jedoch bislang nicht nachgewiesen werden. Auch zu der Frage, in welchem Verhältnis die unterschiedlichen sprachlichen Bereiche und Mittel beim Erst- und vor allem Zweitspracherwerb zueinander stehen, ist bislang wenig bekannt. Die wenigen vorliegenden Erkenntnisse beziehen sich vor allem auf den frühen Spracherwerb. So scheint am Anfang des Erwerbs die Aneignung lexikalischer Mittel (v.a. Inhaltswortschatz) zu stehen,

94 | Deutsch-als-Zweitsprache-Erwerb: Theorie und Forschungsstand bevor Grammatikalisierungsprozesse einsetzen (vgl. z.B. Tracy 2008b). Grießhaber (2010c: 166–167) vermutet zudem im Rahmen der von ihm weiterentwickelten Profilanalyse Zusammenhänge zwischen den syntaktisch definierten Profilstufen und anderen sprachlichen Mitteln. Diese Zusammenhänge werden jedoch nur relativ vage beschrieben und konnten bislang nicht empirisch nachgewiesen werden (Webersik 2013a: 345). Ein Großteil der Arbeiten zum Zweitspracherwerb untersucht ausgewählte grammatikalische Strukturen, wobei der Zusammenhang mit anderen sprachlichen Phänomenen nicht berücksichtigt wird. Aus diesem Grund kann bisher z.B. auch nicht beantwortet werden, ob Lerner, die in einem sprachlichen Bereich (z.B. Verbalflexion) viele abweichende Strukturen produzieren, auch in den anderen sprachlichen Bereichen Defizite aufweisen. Selbst Phänomene, die traditionellerweise einer bestimmten linguistischen Kategorie zugeordnet werden (z.B. V1-Stellung als Phänomen der syntaktischen Kategorie Satzmodelle) könnten bezogen auf den Spracherwerb auch mit ganz anderen Bereichen wie diskursiven oder narrativen Fähigkeiten in Zusammenhang stehen.

3.3 Analyse von Erwerbsfortschritten Eine zentrale Frage der Spracherwerbsforschung ist, anhand welcher Kriterien sich Erwerbsfortschritte ablesen lassen. Dabei kann man sich zum einen an der Produktion zielsprachlicher Formen orientieren, die dafür sprechen, dass die jeweilige Form erworben wurde (vgl. Emergenz-Kriterium, Kap. 3.3.1 ). Zum anderen kann aber auch die Analyse der abweichend bzw. fehlerhaft produzierten Formen Aufschluss über den Entwicklungsstand der Lernersprache liefern (vgl. Fehleranalyse, Kap. 3.3.2 ).

3.3.1 Emergenz-Kriterium In früheren Arbeiten wurde der Erwerb einer Struktur mit Zielsprachlichkeit bzw. Korrektheit gleichgesetzt, eine Struktur also nur dann als erworben betrachtet, wenn (fast) keine abweichenden Formen mehr auftraten. Ein solches correctness oder accuracy criterion wurde in der Folge vor allem deshalb kritisiert, weil es dem dynamischen und prozesshaften Charakter des Spracherwerbs nicht gerecht würde. Trotz dieser Einschränkungen weist Montanari jedoch zu Recht darauf hin, dass es

Analyse von Erwerbsfortschritten | 95 auch eine Vielzahl von Diagnosekontexten [gibt], in denen die Erfassung von accuracy sinnvoll und nötig ist, zum Beispiel, wenn die Möglichkeit der Teilhabe an Bildung betrachtet wird und die Ausgangsannahme ist, dass eine bestimmte Struktur (z.B. das Passiv) nicht fünf Mal zielsprachlich, sondern in der Mehrzahl der Äußerungen zielsprachlich expressiv und rezeptiv beherrscht werden muss, um einem bestimmten Text/Lerninhalt zu folgen oder ein Bildungsziel zu erreichen. (Montanari 2013: 33)

Auch bezogen auf „die letzten Phasen der Aneignung einer bestimmten morphologisch-syntaktischen Erscheinung“ kann das „Vorkommen bzw. NichtVorkommen korrekter Formen“ z.B. im Sinne von Fehlerquoten Auskunft geben (Kemp, Bredel & Reich 2008: 81). In Folge der Kritik am accuracy-criterion entwickelte Pienemann (1998) im Rahmen der Processability Theory das sogenannte emergence criterion (Emergenz-Kriterium), bei dem das erste Auftreten einer neuen Struktur im Output eines Lerners als Indiz für den beginnenden Erwerb dieser Struktur gewertet wird (vgl. Kap. 3.3.1 ). Dadurch drückt sich insofern ein Perspektivwechsel in der Spracherwerbsforschung aus, als nicht mehr der Abstand der Lernersprache zur Zielsprache, sondern der stufenweise Entwicklungsprozess des Individuums im Zentrum der Aufmerksamkeit steht (Håkansson 2013: 203). Auch im Bereich der Sprachstandsdiagnose zeigt sich in den letzten Jahren eine verstärkte Ausrichtung auf die Emergenz zielsprachlicher Strukturen – Bredel (2007: 89) spricht in diesem Zusammenhang auch von „resultativen Ressourcen“. Gute Beispiele dafür sind die Profilanalyse von Grießhaber (2005, 2010a) oder HAVAS-5 (Reich 2003). Eine besondere Bedeutung hat das Emergenz-Kriterium in Bezug auf die Bestimmung von Erwerbssequenzen bzw. -phasen. So wird das Erreichen einer Erwerbsstufe meistens mit dem Auftreten bestimmter zielsprachlicher Strukturen gleichgesetzt. Strittig ist dabei jedoch, wie oft und in welchen Zusammenhängen eine gegebene Form zielsprachlich verwendet werden muss, damit eine bestimmte Stufe als erreicht gelten kann. So zeigen z.B. Meerholz-Härle & Tschirner (2001), dass je nachdem, welche Mindestquoten man in Bezug auf Auftretenshäufigkeiten und -kontexte als Grenzwert für das Kriterium erworben setzt, unterschiedliche Erwerbsverläufe resultieren (Grießhaber 2005: 15). Ungeklärt ist auch, welche und wie viele Sprachdaten man bei einer solchen Analyse zugrunde legen sollte. Universell gültige Erwerbsverläufe sind daher schwer festzulegen und konnten bisher nur für den frühen DaZ-Erwerb beschrieben werden. Knapp-Potthoff & Knapp (1982, zit. nach Antos 1988: 21) vermuten, dass sich die individuelle Variation innerhalb der Erwerbsstadien, die sich schon bei Studien zum frühen Erwerb beobachten lässt, in fortgeschrittenen Lernersprachen eher verstärkt, so dass das Durchlaufen festgelegter Erwerbsstufen eher unwahrscheinlich ist. Dies impliziert, dass die Emergenz be-

96 | Deutsch-als-Zweitsprache-Erwerb: Theorie und Forschungsstand stimmter Formen dann auch nur noch sehr bedingt als Kriterium zur Identifikation bestimmter Erwerbsstadien bzw. -fortschritte genutzt werden kann. Eine weitere Schwierigkeit im Zusammenhang mit dem Emergenz-Kriterium besteht darin, dass zielsprachliche Formen gerade zu Beginn des Erwerbs zufällig auftreten können, ohne dass eine entsprechende Umstrukturierung der Lernergrammatik stattgefunden hätte. Weiterhin kann häufig beobachtet werden, dass „auf engstem Raum […] normgerechte Formen und Normverstöße koexistieren, die nach dem Zufallsprinzip miteinander kombiniert zu sein scheinen“ (Diehl 2000a: 39). Auch kann es sich um ganzheitlich memorisierte Einheiten bzw. Chunks 30 handeln. So „verfügen Kinder nicht selten über ein umfangreiches Repertoire ganzheitlich abgespeicherter Wendungen, die vielleicht Aufschluss über Kommunikationsfreudigkeit geben können, nicht aber über den Entwicklungsstand im Bereich der Grammatik“ (Tracy 2008a: 18). Denn auch wenn solchen formelhaften Sequenzen bzw. Chunks beim Zweitspracherwerb eine große Bedeutung zukommt (z.B. Aguado 2002; Diehl 2000a: 38–39), können die zugrundeliegenden Strukturen, solange sie vom Lerner noch nicht ‚aufgebrochen‘, d.h. analysiert und in das lernersprachliche System integriert wurden, nicht als erworben betrachtet werden (Allen & Corder 1974: 127). Die korrekte Verwendung solcher Strukturen ist dann nicht auf einen erfolgreichen Erwerb zurückzuführen, sondern basiert primär auf Imitation (Kleppin 2008: 50–51). Diehl (2000a: 38) beobachtet sowohl bei Anfängern als auch bei fortgeschrittenen Lernern im Rahmen der DiGS-Studie einen massiven Einsatz von Chunks, „die über mehrere Erwerbsphasen als ‚Fremdkörper‘ mitgeführt werden und oft fossilisieren, bevor sie überhaupt in ihrer Struktur durchschaut und bearbeitet werden“, und folgert deshalb: 29F

Die beiden Erscheinungen – Chunks und Inkonsistenz – treten in unserem Korpus zu häufig auf, um sie als Nebenerscheinungen von Erwerb unter gesteuerten Bedingungen zu bagatellisieren; sie verdienen einen angemessenen Platz in einer Theorie, die den Anspruch erhebt, der psycholinguistischen Realität des Spracherwerbs gerecht zu werden. (Diehl 2000a: 38–39)

Im Einzelfall ist oft jedoch kaum objektiv zu entscheiden, ob es sich bei der Produktion korrekter Formen um Chunks handelt oder nicht. Dies ist allenfalls

|| 30 Für das Phänomen ganzheitlich memorierter Einheiten wird neben „Chunks“ eine Vielzahl von Begriffen verwendet, darunter: Formeln, formelhafte Wendungen, Routinen, formulaic speech, prefabricated sequences etc. Für eine Übersicht zu Ursprung und Abgrenzung der verschiedenen Konzepte siehe Altmüller (2008: 84–85)

Analyse von Erwerbsfortschritten | 97

im Rahmen detaillierter qualitativer Analysen zu leisten, in denen die individuelle Entwicklung des Lerners berücksichtigt wird (Altmüller 2005: 26–27) 31. Selbst wenn in einem bestimmten Kontext eine Form wiederholt zielsprachlich verwendet wird, ist nicht sicher, dass diese Form auch in anderen Kontexten korrekt realisiert wird, das lernersprachliche System also in allen betroffenen Bereichen dem zielsprachlichen System entspricht. Eng damit verbunden ist die Frage, in welche Teilbereiche sich ein grammatisches Phänomen ausdifferenziert und welche Erscheinungsformen als Beweis für dessen Erwerb angesehen werden müssen. So bereitet z.B. der Erwerb des Dativs vielen DaZ-Lernern Schwierigkeiten (vgl. Kap. 3.4.2.3). Neben einer grundsätzlichen Unterscheidung zwischen dem Erwerb des Dativs als funktionaler Kategorie und dem Erwerb der formalen Markierung des Dativs (Montanari 2010) muss geklärt werden, wie oft und vor allem an welchen Wortarten, in welchen syntaktischen Zusammenhängen und in Kombinationen mit welchen anderen Kategorien der Nominalflexion (z.B. Genus- und Pluralmarkierung) zielsprachliche Formen produziert werden müssen, damit der Dativ als erworben angesehen oder auch nur Erwerbsfortschritte attestiert werden können. Weiterhin ist die Auftretenswahrscheinlichkeit einzelner sprachlicher Merkmale nicht nur davon abhängig, ob die zielsprachlichen Formen und Funktionen erfolgreich in das lernersprachliche System integriert wurden. Denn ob bestimmte Strukturen tatsächlich realisiert werden, hängt auch maßgeblich von anderen Variablen wie Thema, Textsorte und Textlänge ab, die wiederum von persönlichen Merkmalen wie Interessensgebieten und Vorwissen beeinflusst werden 32. 30F

31F

3.3.2 Klassische Fehleranalyse Wie die Ausführungen zum Emergenz-Kriterium (vgl. Kap. 3.3.1 ) gezeigt haben, sollte man sich bei der Untersuchung von Erwerbs- und Lernfortschritten nicht nur am Auftreten zielsprachlicher Formen orientieren. Ergänzend können auch abweichende Strukturen bzw. Fehler, wenn sie nicht rein defizitär betrachtet werden, als „Fenster zur Lernergrammatik“ (Wegener 2000b) wichtige Informationen über Lernzuwächse gerade auch im Bereich bildungssprachlicher Kompetenz liefern: || 31 Eine Übersicht mit den Kriterien verschiedener Autoren zur Bestimmung von Chunks bzw. Formeln findet sich in Altmüller (2005: 19). 32 Für eine umfassende Diskussion des Emergenz-Kriteriums siehe Pallotti (2007).

98 | Deutsch-als-Zweitsprache-Erwerb: Theorie und Forschungsstand In welchen Zonen der Ausbau der gesprochenen Alltagssprache zur Bildungs- und geschriebenen Sprache erfolgt, wird an den Fehlern erkennbar. Die Fehler zeigen an, was im Lauf der Ausbildung an sprachlich Neuem hinzukommt. (Ortner 2009: 2233–2234) Die Fehleranalyse ist auch heute noch ein Verfahren, das […] wichtige Erkenntnisse über die Lernersprache [der] Schülerinnen und Schüler liefern kann. Die Ergebnisse der Fehleranalyse geben u.a. Hinweise darauf, ob der schulische Grammatikunterricht allen Lernenden gerecht wird, welche Fehler es zu korrigieren lohnt, welche nicht etc. (Kniffka 2010: 227)

Die klassische Fehleranalyse 33 geht vor allem auf die Arbeiten Stephen Pit Corders zurück (1967, 1973) und hatte in den 70er Jahren ‚Konjunktur‘. Auch wenn die Art der Fehler zwar kein direktes Maß für Sprachkompetenz sei, sieht Corder in Fehlern die wichtigste Quelle, um etwas über das implizite Sprachwissen eines Lerners zu erfahren: 32F

Whilst the nature and quality of mistakes a learner makes provide no direct measure of his knowledge of the language, it is probably the most important source of information about the nature of his knowledge. From the study of his errors we are able to infer the nature of his knowledge at that point of his learning career and discover what he still has to learn. (Corder 1973: 257)

Corder betonte mit Bezug auf Selinkers Interlanguage-Hypothese (vgl. Kap. 3.1 ) außerdem, dass Fehler positiv zu bewerten sind, da man an ihnen erkennen kann, dass die Lerner sich hypothesengeleitet das neue Sprachsystem erschließen. Fehler sind also nicht als bewusste Regelbrüche zu verstehen, sondern als normale Phänomene einer sich entwickelnden Lernersprache (Corder 1973: 256– 272) 34. In den folgenden Jahren entwickelte Corder (1981) ein Verfahren zur systematischen Fehleranalyse, bei dem als grundlegende Schritte Fehleridentifikation, Fehlerbeschreibung und Fehlererklärung unterschieden werden (Allen & Corder 1974: 126). In einem ersten Schritt geht es darum, fehlerhafte Äußerungen eindeutig als solche zu identifizieren (vgl. Abb. 18), wobei es nur um Fehler im Sinne von „errors“ geht. Hintergrund ist die Unterscheidung von performanzbedingten Fehlern (= „lapses“) und „breaches of the code“ bzw. Kompetenzdefiziten (= errors). Während erstere auf die Produktionsbedingungen von 3F

|| 33 Einige Teile der Ausführungen zur klassischen Fehleranalyse sind Webersik (2012b) entnommen. 34 In diesem Verständnis wird die Bezeichnung „Fehler“ auch im Rahmen der vorliegenden Arbeit verwendet. Aus Gründen der Lesbarkeit wird der Begriff „Fehler“ synonym zu „Abweichungen“ verwendet und ist ausdrücklich nicht defizitär zu verstehen.

Analyse von Erwerbsfortschritten | 99

Sprache zurückzuführen sind, betreffen letztere die zugrundeliegende Sprachkompetenz 35 (Clahsen, Meisel & Pieneman 1983: 72). Da „lapses“ gleichermaßen bei L1- und L2-Sprechern zu beobachten sind und nicht auf Prozesse des Zweitspracherwerbs zurückgeführt werden, spielen sie für die Fehleranalyse eine untergeordnete Rolle. Problematisch kann jedoch sein, dass im Einzelfall nicht immer eindeutig zwischen diesen beiden Fehlertypen zu unterscheiden ist (Brown 2005: 258–259). Das eindeutige Erkennen von „errors“, d.h. die Antwort auf die erste Frage in Corders Algorithmus (vgl. Abb. 18: „Is sentence superficially well-formed in terms of the grammar of the target language?“), ist jedoch auch aus anderen Gründen nicht unproblematisch. So stellt sich vor allem die Frage nach dem Vergleichsmaßstab, die Schöler (2006: 900–901) in Bezug auf Sprachleistungsmessungen folgendermaßen auf den Punkt bringt: „Wann ist eine Äußerung grammatikalisch wohlgeformt […] wann gilt eine Äußerung als situationsangemessen?“. Denn wie die Ausführungen in Kap. 2.3 zeigen, ist die Annahme einer gemeinsamen Grammatik für alle Varietäten von Sprache nicht unstrittig, und auch die Angemessenheit lexikalischer Mittel kann sich je nach kommunikativem Kontext stark unterscheiden. Auch wenn Allen & Corder (1974: 154–155) sich bei der Beurteilung der Wohlgeformtheit auf den zielsprachlichen „social dialect“ beziehen, verrät schon die Ausrichtung auf das Konzept Satz (vgl. Abb. 18), dass es letztlich um einen Vergleich mit der schrift- bzw. standardsprachlichen Norm geht. Auch der wiederholte Verweis auf Regeln bzw. Regelbrüche impliziert nicht nur die Existenz solcher Regelhaftigkeiten, sondern auch das Vorhandensein linguistischer Kategorien zur Klassifizierung und Beschreibung derselben: 34F

Explanation of error can be regarded as a linguistic problem, i.e., a statement of the way in which he [the learner] has deviated from the realization of rules of the target language in the derivation of his sentence, that is, what rules he has broken, substituted or disregarded. (Allen & Corder 1974: 126–127)

|| 35 zu den Konzepten Kompetenz und Performanz bzw. langue und parole vgl. Kap. 2.3.3.

100 | Deutsch-als-Zweitsprache-Erwerb: Theorie und Forschungsstand

Abb. 18. Prozess der Erkennens und Identifizierens von Fehlern nach Allen & Corder (1974: 129)

Eine umfassende Beschreibung linguistischer Kategorien und Regelhaftigkeiten liegt bislang nur für die geschriebene Standardsprache vor (vgl. Kap. 2.4.2). Bezogen auf gesprochene Sprache ist eine Orientierung an den schriftsprachlich geprägten Normen der Standardsprache jedoch problematisch, da sich Mündlichkeit durch Anpassungsfähigkeit und Vielfalt auszeichnet und dadurch nach Fiehler (2006: 1185–1186) jeder Normierung entzieht. So ist z.B. „die Ordnung, die Verkettung von Äußerungen […] beim Sprechen oft sprunghaft oder brüchig, ohne dadurch normwidrig zu werden (Boos-Nünning & Gogolin 1988: 59). Zumindest für spezifisch nähesprachliche Phänomene, die nach Hennig (2006) der Grammatik des Systems bzw. Norm der gesprochenen Sprache zugeordnet wer-

Analyse von Erwerbsfortschritten | 101

den müssen (vgl. Kap. 2.3.3), stellen die Normen der Schriftsprache daher keinen angemessenen Vergleichsmaßstab dar. Ein verbindlicher Standard für die gesprochene Sprache liegt jedoch bislang nicht vor und ist nach Imo (2008: 154) vielleicht auch gar nicht möglich (vgl. Kap. 2.4.2). Bezogen auf die gesprochene Sprache sollte sich die Analyse von Fehlern deshalb konsequenterweise nur auf solche Strukturen beziehen, denen im Sinne von Hennig (2006) die Gemeinsame Grammatik des Systems bzw. der Norm zugrunde liegt (vgl. Kap. 2.3.3), so dass die Schrift- bzw. Standardsprache als Vergleichsmaßstab verwendet werden kann. Zusätzlich sollten die besonderen Merkmale mündlicher Sprachproduktion (vgl. „erklärbare Erscheinungen“, Kap. 2.3.3) berücksichtigt werden, so dass z.B. Assimilationen bzw. Enklisen bei den Flexionsendungen nicht als „error“ gewertet werden. Eine weitere Schwierigkeit, die in Corder (1973: 272–275) in Bezug auf die Beurteilung der Wohlgeformtheit diskutiert wird, betrifft die Beobachtung, dass auch grammatikalisch und lexikalisch mögliche Sätze nicht immer fehlerfrei sind. Beispielsweise kann es Äußerungen geben, die oberflächlich korrekt sind (z.B. „Der Junge geht zur U-Bahn“), die aber unter Berücksichtigung des kommunikativen Kontextes bzw. der Sprechabsicht doch Fehler enthalten (z.B. wenn der Lerner eigentlich ausdrücken wollte „Der Junge geht in die U-Bahn“). Auch in der von Kniffka (2010: 220–221) angeführten, syntaktisch zunächst wohlgeformten Lerneräußerung „Er lebte in ein[em] Dorf, das war sehr arm“ ist nicht auszuschließen, dass der Sprecher eigentlich eine Nebensatzstruktur produzieren wollte („Er lebte in einem Dorf, das sehr arm war“), dabei aber die Verbendstellung missachtet hat. Nach Corder ist bei scheinbar (bzw. „superficially”) wohlgeformten Sätzen deshalb immer auch der Kontext mit zu berücksichtigen (vgl. Abb. 18: „Does the normal interpretation according to the rules of the target language make sense in the context?“). Nachdem eine Äußerung als fehlerhaft erkannt wurde, folgt die Identifikation und Beschreibung (bzw. Klassifizierung) der konkreten Fehler. Zu diesem Zweck muss die vom Sprecher ‚intendierte‘ Äußerung zielsprachlich rekonstruiert werden (Allen & Corder 1974: 127). Wenn man den Sprecher nicht selbst dazu befragen kann („authoritative interpretation“), ist dies immer ein spekulativer Akt, der im besten Fall zu einer „plausiblen“ Rekonstruktion führt (vgl. Abb. 18: „Make plausible reconstruction of sentence in target language“). Dabei werden nur die fehlerhaften Elemente korrigiert, so dass die Ursprungsäußerung weitgehend erhalten bleibt. Auch hier stellt sich erneut die Frage nach der angemessenen Vergleichsnorm. Problematisch erscheint außerdem die Bezeichnung „intendiert“, die darauf schließen lässt, dass der Sprecher eigentlich etwas anderes sagen wollte. Dies ist höchstens dann der Fall, wenn die sprachlichen Abweichungen dazu führen, dass die inhaltliche Aussage der Äußerung

102 | Deutsch-als-Zweitsprache-Erwerb: Theorie und Forschungsstand nicht oder anders verstanden wird als „intendiert“. Insbesondere auf grammatikalischer Ebene kann jedoch nicht davon gesprochen werden, dass andere Strukturen als die tatsächlich produzierten intendiert worden wären. Denn die Lerner können nur Äußerungen ‚intendieren‘, die dem jeweiligen Entwicklungsstand ihrer Lernergrammatik entsprechen. Ein passenderer Begriff für diesen Teil der Fehleranalyse wäre demnach ‚zielsprachliche Rekonstruktion‘, da es letztlich um einen Vergleich der vom Schüler produzierten lernersprachlichen Strukturen mit den Strukturen der Zielsprache geht. Doch gerade die bruchstückhaften Äußerungen früher Lernervarietäten lassen sich oft kaum zielsprachlich rekonstruieren, zumal die Lerner vermutlich eigene erwerbsbedingte Strategien einsetzen. So antwortete ein Schüler im Rahmen der Datenerhebung (vgl. Kap. 6.3) auf die Aufforderung, ein zuvor beobachtetes Experiments zu beschreiben, zunächst lediglich mit der Äußerung „Hm, also Wasserflasche.“ Offensichtlich handelt es sich um eine unvollständige syntaktische Einheit. Hier jedoch eine „intendierte“ bzw. zielsprachliche Äußerung zu rekonstruieren, wäre weder angemessen noch möglich (vgl. z.B. Schlobinski 1997: 15). Denn es ist unwahrscheinlich, dass der Schüler einen bestimmten Satz produzieren wollte. Wahrscheinlich ist, dass er einfach nur ein wichtiges Element des Experiments benennen wollte, um dadurch den thematischen Raum des Experiments zu umreißen. Auch die folgende Äußerung erlaubt keine eindeutige Rekonstruktion: „*Und haben bei dieser so einen großen Schüssel haben die Wasser reingemacht“. Eine Fehleranalyse ist also nicht möglich, wenn Äußerungen aufgrund ihres bruchstückhaften bzw. erwerbsspezifischen Charakters nicht eindeutig rekonstruiert werden können. Das gleiche gilt für Äußerungen, bei denen trotz Beachtung des kommunikativen Kontextes mehr als eine Rekonstruktion bzw. intendierte Äußerung möglich ist (z.B. „*Das kostet teuer“: Das kostet viel vs. Das ist teuer, „*Der Mann sieht die Kind“: Der Mann sieht die Kinder vs. Der Mann sieht das Kind). Solche Fälle sind deshalb von der Analyse auszuschließen (Corder 1973: 274– 275). Doch schon das Erkennen einer solchen Ambiguität erfordert eine hohe Kompetenz auf Seiten der Auswerter (vgl. Grimm, Gutenberg & Götze 2006: 27). Letztlich kann die Frage, was ein Sprecher eigentlich sagen wollte bzw. was er gesagt hätte, wenn er die Zielsprache vollständig beherrschen würde, nie ganz ohne Spekulation beantwortet werden, weil man nicht in den Kopf der Schüler hineinschauen kann (Black-Box-Problem). Die Identifikation und Klassifizierung aller Fehler ist daher meist nicht möglich (Grimm, Gutenberg & Götze 2006: 19; Kleppin 2008) und kann in vielen Fällen nur interpretativ erfolgen (vgl. z.B. Biehl 1987: 63), was insbesondere für die gesprochene Sprache gilt:

Analyse von Erwerbsfortschritten | 103 Die allgemeinen Probleme bei der Auswertung gesprochener Sprache potenzieren sich dadurch, daß Äußerungen zweisprachiger Schüler nicht selten in - für muttersprachliche Sprecher des Deutschen - ungewöhnlicher Weise geordnet, auf unerwartete Weise verkürzt oder erweitert sind. Oft ist daher die Auswerterin oder der Auswerter gezwungen, Äußerungen zuerst "mit Sinn zu belegen", bevor sie zugeordnet werden können – also gleichsam eine einordnungsfähige Äußerung zu rekonstruieren. Dies kann durch ein Beispiel aus unserer Untersuchung illustriert werden: Der Äußerung "die guckt so / so strümpfe und hose und kleid jacke die schon trocken sind" fehlen wesentliche Elemente für eine Klassifizierung. [...] Da solche Signale fehlen, muß der Auswerter oder die Auswerterin über die Mitteilungsintention des Kindes Hypothesen bilden und sie anhand anderer Informationen prüfen. (Boos-Nünning & Gogolin 1988: 59)

Beeinflusst durch die im Rahmen der Konstrativhypothese formulierten Annahmen zum Spracherwerb (vgl. Kap. 3.1) und der darauf basierenden Constrative Analysis geht Corder (1973) von einem starken Einfluss der Erstsprache auf zweitsprachliche Produktionen aus. Deshalb schlägt er vor, bei lernersprachlichen Äußerungen, deren zielsprachliche Rekonstruktionen problematisch sind, die jeweilige Erstsprache mit zu berücksichtigen (vgl. Abb. 18: „Translate sentence literally into first language. Is plausible interpretation in context possible?“ und „Translate first language back into target language to provide plausible reconstruction”). Mittlerweile wird der Einfluss der Erstsprache auf zweitsprachliche Produktionen gerade bei fortgeschrittenen Lernern jedoch weitaus niedriger eingeschätzt als ursprünglich angenommen (vgl. Edmondson & House 2006). Auch ist ein solches Vorgehen nur bei fundierten Kenntnissen der jeweiligen Erstsprachen der Schüler möglich und erfordert zudem enorme zeitliche Ressourcen. Auf der Grundlage des Vergleichs der tatsächlichen Äußerung mit der zielsprachlichen Rekonstruktion (vgl. Abb. 18: „Compare reconstructed sentence with original erroneous sentence to locate error“) sollen dann die Abweichungen identifiziert und beschrieben werden, wobei dies im Sinne einer intensiven qualitativen Analyse der Lernersprache zu verstehen ist (vgl. Allen & Corder 1974: 128). Bei der Beschreibung und Klassifizierung von Fehlern stellt sich erneut das Problem der Vergleichsnorm – dieses Mal in Bezug auf die verwendeten Klassifikationen bzw. Kategorien. Denn die traditionellen linguistischen Kategorien wurden basierend auf der Schriftsprache kompetenter, d.h. erwachsener muttersprachlicher Sprecher entwickelt (vgl. Kap. 2.4.2). Aufgrund ihres instabilen und variablen Charakters können Lernersprachen jedoch nicht in der gleichen Weise modelliert werden; ein Problem, das auch Corder (1973: 269) erkannte. So lassen sich typische Erwerbsphänomene wie Übergeneralisierungen, die vor allem diskontinuierliche Verläufe kennzeichnen (vgl. Kap. 3.1), mit traditionellen linguistischen Kategorien kaum erfassen, weil diese

104 | Deutsch-als-Zweitsprache-Erwerb: Theorie und Forschungsstand Phänomene in der Schriftsprache kompetenter L1-Sprecher nicht vorkommen und entsprechend keine Kategorien entwickelt wurden. Kemp, Bredel & Reich (2008: 81) weisen deshalb zu Recht darauf hin, „dass die Kategorien der systematischen Grammatik nicht identisch sind mit den Kategorien des Erwerbs“. Gerade in Bezug auf produktionsbedingte Unterschiede im Sinne von Hennigs „erklärbaren Erscheinungen“ (vgl. Kap. 2.3.3) sind deshalb ggfs. Modifizierungen der schriftsprachlichen Kategorien vorzunehmen (z.B. bezogen auf die Artikulation von Flexionsendungen oder besondere Formen der syntaktischen Gliederung). Im letzten Schritt von Corders Fehleranalyse geht es um die psycholinguistische Erklärung der identifizierten und beschriebenen Fehler. Dabei wird von unterschiedlichen Fehlerursachen bzw. -stadien ausgegangen (Corder 1973: 270–272): So ist das Auftreten von Fehlern auf der presystematic stage vor allem zufälliger Natur, während Fehler auf der systematic stage bereits regelgeleitet sind und dadurch erklärt werden können, dass der Lerner Hypothesen generiert hat, die nun getestet werden. Auf der postsystematic stage wurde die zielsprachliche Regel bereits erworben, wobei es noch Unsicherheiten in der Anwendung gibt (= practice stage of learning) (Allen & Corder 1974: 131). Neben den genannten Schwierigkeiten der Fehleranalyse, die vor allem die Objektivität der Auswertung gefährden, besteht eine weitere Problematik darin, dass DaZ-Lerner bei spontaner Sprachproduktion und erst recht, wenn sie wissen, dass es um ihre sprachlichen Kompetenzen geht, Strategien einsetzen, um schwierige oder unsicher beherrschte sprachliche Strukturen und damit Fehler in diesen Bereichen zu vermeiden (z.B. Allen & Corder 1974: 126; Brown 2005: 259). Erschwerend kommt in diesem Zusammenhang hinzu, dass das Auftreten der meisten Fehler an die Verwendung bzw. Vermeidung anderer Strukturen gebunden ist. So lässt sich die Gefahr abweichender Kasusmarkierungen deutlich verringern, wenn man auf die Verwendung von Präpositionen verzichtet oder nur solche verwendet, die man sicher beherrscht (vgl. Kap. 3.4.2.3). In solchen Fällen würde dann möglicherweise nicht der Kasus als Hauptproblem auffallen, sondern eher eine inhaltliche Unvollständigkeit bzw. Ungenauigkeit. Zusammenfassend kann ein fehleranalytisches Vorgehen also vor allem aus zwei Gesichtspunkten problematisch sein: A) Es fehlt ein Vergleichsmaßstab bzw. ein Kategorieninventar für die Analyse und Klassifizierung entwicklungsbedingter Phänomene des (Zweit-)spracherwerbs, erst recht, wenn es sich um gesprochene Sprache handelt. Die Orientierung an der zielsprachlichen Standardsprache ist gerade bei entwicklungsbedingten Übergangsphänomenen und konzeptionell mündlicher Sprache problematisch. B) Die Rekonstruktion der ‚intendierten‘ bzw. zielsprachlichen Äußerungen ist teilweise ein spekulativer Akt.

Analyse von Erwerbsfortschritten | 105

Punkt A) ist vor allem bei der Untersuchung früher Lernervarietäten bedeutsam. Handelt es sich um fortgeschrittene DaZ-Lerner entsprechend der Zielgruppe der vorliegenden Arbeit, ist davon auszugehen, dass sich die Schüler in vielen der grundlegenden grammatikalischen Bereiche bereits in den letzten Aneignungsphasen befinden bzw. in Corders Terminologie auf der „postsystematic stage of errors“ (s.o.). Eine Orientierung an zielsprachlichen Strukturen ist daher durchaus gerechtfertigt (Kemp, Bredel & Reich 2008: 81). Außerdem ist die Zielsetzung des Forschungsvorhabens zu beachten. So verfolgen spracherwerbswissenschaftliche Untersuchungen meist das Ziel einer differenzierten Analyse und Beschreibung individueller Entwicklungsverläufe, für die eine Orientierung an der zielsprachlichen Norm problematisch ist. Im Gegensatz dazu sollen Verfahren, die zur Evaluation von Fördereffekten entwickelt werden, vor allem Kompetenzunterschiede erfassen, die auf die Förderintervention zurückgeführt werden können. Für diese Zielsetzung ist es wichtig, dass die Kategorien des tertium comparationis bzw. der kriterialen Norm (Gogolin 2010: 1309–1310) eindeutig und klar voneinander abgrenzbar sind. In diesem Zusammenhang eröffnen Sprachnormen eine wichtige Vergleichsmöglichkeit, die bei einer individuellen Entwicklungsperspektive nicht gegeben ist (Montanari 2013: 31–32). Auch weil es sich bei gesprochener Schulsprache um ein formelles, standardnahes Register handelt, scheint eine Orientierung an der „Kriteriumsnorm der Schule“ (Reich 2008b: 423) durchaus angemessen, zumal das Beherrschen der Standardsprache ein ausdrückliches Ziel der Bildungsstandards ist. Auch Sprachförderung orientiert sich üblicherweise an der Standardsprache (Spiekermann 2007), wobei formale Korrektheit in diesem Zusammenhang häufig ein ausdrückliches Ziel v.a. formfokussierter Ansätze darstellt (Rösch & Stanat 2011, 155). In Bezug auf die medial mündliche Realisierungsform von Schulsprache sind neben der Beschränkung auf Phänomene, die Hennigs Gemeinsamer Grammatik des Systems bzw. der Norm zuzuordnen sind (vgl. Kap. 2.3.3), lautlich bedingte Unterschiede zur Schriftsprache zu berücksichtigen, die besonders morphologische Strukturen betreffen können. So kann es z.B. bei der mündlichen Produktion von Flexionsendungen trotz einer gemeinsamen zugrundeliegenden Grammatik zu Assimilationen und Elisionen kommen, wie sie im schriftsprachlichen Standard nicht vorkommen. Da es für die Lautung gesprochener Sprache keine kodifizierte Norm gibt (Schwitalla 2006: 48; Fiehler 2006a), kann in diesem Bereich nur das kollektive muttersprachliche Sprachgefühl als Maßstab dienen (vgl. dazu auch Rug 2008: 346–347). Der zweite Gesichtspunkt (B), der sich auf die Schwierigkeit der objektiven Rekonstruierbarkeit der ‚intendierten‘ bzw. zielsprachlichen Äußerungen be-

106 | Deutsch-als-Zweitsprache-Erwerb: Theorie und Forschungsstand zieht, ist sowohl für Spracherwerbsstudien als auch für diagnostische Instrumente im Rahmen von Evaluationsstudien äußerst bedeutsam. Aus Gründen der Objektivität sollten gerade bei letzteren deshalb nur eindeutig rekonstruierbare und klassifizierbare Strukturen berücksichtigt werden, was dazu führen kann, dass nicht alle abweichenden Strukturen erfasst werden. Diese Problematik betrifft insbesondere frühe Lernervarietäten, bei denen die Rekonstruktion aufgrund der sehr eingeschränkten sprachlichen Mittel der Sprecher oft besonders interpretativ ist. Handelt es sich jedoch um fortgeschrittene Lerner, ist zu erwarten, dass sich die zielsprachliche Variante einer fehlerhaften Äußerung in vielen Fällen gut rekonstruieren lässt (z.B. „*Die haben die Segel ausgeschneiden“  „Die haben die Segel ausgeschnitten“).

3.4 Stolpersteine des DaZ-Erwerbs Wie in Kap. 2.4.1 deutlich wurde, stellt formale Genauigkeit im Sinne der standardsprachlichen Kerngrammatik und Lexik eine wichtige Grundlage schulsprachlicher Kommunikation dar. Um Lernfortschritte in diesen Bereichen zu erfassen, ist zu klären, an welchen Stellen überhaupt Erwerbsschwierigkeiten zu erwarten sind. In diesem Zusammenhang sind vor allem Ergebnisse der Zweitspracherwerbsforschung von Interesse. Die vordergründige Frage lautet: In welchen sprachlichen Bereichen sind bei DaZ-Schülern auch nach mind. 3–4 Kontaktjahren mit der deutschen Sprache noch Schwierigkeiten erwartbar? Aus den in Kap. 1 genannte Gründen liegt der Fokus dabei auf lexikalischen und grammatikalischen Bereichen. Als erste Orientierung kann Heidi Röschs Übersicht über die „Stolpersteine“ der deutschen Sprache dienen (Rösch & Ahrens 2003: 213–215; Rösch 2005b: 231–232), die auch in BeFo für „die Vorauswahl der zu fokussierenden Formen und Strukturen“ herangezogen wurden (Rösch & Rotter 2010: 225). In Bezug auf die im Fokus stehende Zielgruppe und das zu untersuchende sprachliche Register (gesprochene Schulsprache) sind jedoch nicht alle Stolpersteine gleichermaßen bedeutsam. So werden in Rösch & Ahrens (2003: 213–215) und Rösch (2005b: 231–232) die einzelnen Phänomene nicht nach Schwierigkeit oder Erwerbsfolge differenziert. Dies erfolgt in gewisser Weise in der Berliner Handreichung für Deutsch als Zweitsprache, in der die einzelnen sprachlichen Themen soweit es geht progressiv geordnet sind (Rösch 2001: 63–65). Doch auch hier liegt keine Differenzierung nach Altersstufen bzw. Kontaktjahren vor. Weiterhin können nicht alle Stolpersteine als empirisch gesichert gelten und sind für die vorliegende Arbeit von unterschiedlicher Relevanz.

Stolpersteine des DaZ-Erwerbs | 107

Ein Großteil der Studien zum DaZ-Erwerb bestimmter sprachlicher Mittel basiert auf relativ keinen Stichproben oder Einzelfällen und untersucht spezifische sprachliche Teilbereiche oder individuelle Profile (Ahrenholz 2008e: 69). Dabei konzentrieren sich viele der Untersuchungen entweder auf sehr frühe L2Erwerbsphasen (vgl. Ehlich 2007: 67–69) oder den L2-Erwerb jugendlicher oder erwachsener Lerner (z.B. Clahsen, Meisel & Pienemann 1983; Dittmar, Reich & Schumacher 1990; Perdue 1993; Ahrenholz 2007b; Baur &Nickel 2008). Zum Erwerb grammatikalischer Strukturen bei fortgeschrittenen Lernervarietäten im (Grund-)schulalter ist dagegen wenig bekannt (Bredel et al. 2008: 262). Bis auf einige Fallstudien (z.B. Apeltauer 1987; Karasu 1995; Kuhberg 1990) ist auch der Wortschatzerwerb von Kindern mit Deutsch als Zweitsprache im Schulalter bislang kaum untersucht (Ahrenholz 2011: 119; Apeltauer 2008: 243; Komor & Reich 2008: 55). Von den Langzeitstudien, die den Erwerb verschiedener sprachlicher Bereiche bei mehr als 10 DaZ-Lernern im Grundschulalter untersuchen, sind vor allem die folgenden zu nennen 36: 35F







Förderunterricht und Deutsch-als-Zweitsprache-Erwerb (FöDaZ) vgl. Ahrenholz (2003a, 2007a): qualitative Longitudinalstudie, 2003–2006, n = 29 Kinder mit Migrationshintergrund, 3.-4. Klasse Deutsch & PC (vgl. Hessisches Kultusministerium (2008), Grießhaber (2007): qualitative Longitudinalstudie, 2002–2006, Datenerhebung schriftlicher Sprachproben in den Klassen 1–4 dreier Grundschulen Deutsch in Genfer Schulen (DiGS), vgl. Diehl (1998), Diehl, Christen & Leuenberger (2000): qualitative Longitudinalstudie, 1995–1998, Korpus: 1800 Aufsätze von 220 DaF-Schülern mit L1 Französisch, 4. Klasse bis Ende Sek II 37 Kindlicher Zweitspracherwerb – Untersuchungen zur Morphologie des Deutschen und ihrem Erwerb durch Kinder mit polnischer, russischer und türkischer Erstsprache vgl. Wegener (1992, 1995b): qualitative Longitudinalstudie, 1989–1992, n = 12 Kinder mit Deutsch als Zweitsprache, Alter der Kinder zu Beginn der Studie: 6–9 Jahre. Teilstudie zum Erwerb der Verbstellungsregeln durch Haberzettl (2005): n = 4 Kinder mit L1 Türkisch und Russisch, Alter der Kinder zu Beginn der Studie: 6–8 Jahre 36F



|| 36 Im weiteren Verlauf der Arbeit wird immer wieder auf diese Studien Bezug genommen. 37 Da in dieser Studie Genfer DaF-Lerner mit L1 Französisch untersucht wurden, die erst in der 4. Klasse erstmals Deutschunterricht erhielten, handelt es sich um eine gesteuerte Erwerbsbzw. Lernsituation, die nur bedingt auf DaZ-Schüler mit Migrationshintergrund an deutschen Grundschulen übertragbar ist.

108 | Deutsch-als-Zweitsprache-Erwerb: Theorie und Forschungsstand Für die vorliegende Arbeit ist außerdem die Untersuchung von Schlemmer (2001) von Interesse, bei der mithilfe einer Bildergeschichte insgesamt 186 schriftliche Texte von 9 bis 14-jährigen Grund- und Hauptschülern mit Migrationshintergrund erhoben wurden. Die bisherige Auswertung konzentriert sich auf orthographische und grammatikalische Aspekte von 91 Texten türkischsprachiger Schüler. Auch wenn die Ergebnisse der DaZ-Forschung aufgrund der meist kleinen Stichprobenzahlen und der fast ausschließlich qualitativen Herangehensweise nicht oder nur eingeschränkt verallgemeinerbar sind (vgl. Eckhardt 2008: 74), liefern sie in ihrer Gesamtheit doch wichtige Ansatzpunkte in Bezug auf Erwerbsmerkmale und -verläufe. Durch das BMBF-geförderte Projekt „Altersspezifische Sprachaneignung – ein Referenzrahmen (PROSA)“ konnte der „wissenschaftliche Kenntnisstand in Bezug auf kindliche Sprachaneignung in seinen Grundzügen“ erstmals zusammengefasst und Desiderate in diesem Bereich offengelegt werden (Ehlich, Bredel & Reich 2008c: 12). Der so entstandene Referenzrahmen zur altersspezifischen Sprachaneignung (vgl. Ehlich, Bredel & Reich 2008a, 2008b) wird daher auch als Grundlage für die Entwicklung neuer sprachdiagnostischer Verfahren empfohlen (Gogolin 2010: 1308). Dabei gehen Landua, Maier-Lohmann & Reich (2008: 172) davon aus, dass es bisherigen Forschungsergebnissen zufolge strukturelle Ähnlichkeiten zwischen Erst- und Zweitspracherwerb gibt, so dass „zumindest hypothetisch Lücken der Zweitspracherwerbsforschung durch Ergebnisse der Erstspracherwerbsforschung“ gefüllt werden könnten. Die durch das PROSA-Projekt erfolgte Zusammenfassung des Kenntnisstandes der Spracherwerbsforschung liefert eine wichtige Grundlage für die Entwicklung von Testverfahren und diente auch bei der vorliegenden Arbeit als primäres Referenzwerk für die Ermittlung der sprachlichen Stolpersteine. 3.4.1 Wortschatz (semantische Basisqualifikation) 3.4.1.1 Grundlegende Erkenntnisse zum zweitsprachlichen Wortschatzerwerb Die Untersuchung der Wortschatzentwicklung ist schon deshalb von großem Interesse, weil lexikalisch-semantische Kompetenzen das ganze Leben lang ausgebaut werden können. Nach der Aneignung des grundlegenden Alltagswortschatzes beginnt mit Eintritt in die Schule gerade in Bezug auf bildungs- und fachsprachliche Ausdrücke ein massiver Auf- und Ausbau im Bereich der Begriffsbildung, der sich bis in die Sekundarstufe fortsetzt. Auch scheint sich die Struktur des Wortschatzes bei Kindern zwischen sieben und elf Jahren zu ändern, was sich u.a. in einer erhöhten lexikalischen Varianz äußert. Neben einer Zunahme des Wortschatzumfangs insgesamt kommt es dabei vor

Stolpersteine des DaZ-Erwerbs | 109

allem zu semantischen Veränderungen und Umstrukturierungen (Schmidlin 1999, zit. nach Komor 2008: 56–57). Dies hat vor allem damit zu tun, dass in der Schule zunehmend über Dinge und Sachverhalte gesprochen wird, die nicht der direkten Beobachtung zugänglich sind und für die einerseits neue (Fach-) begiffe angeeignet und andererseits alltäglichen Konzepten neue Bedeutungsdimensionen hinzugefügt werden müssen (Komor & Reich 2008: 57). Insgesamt scheint auch bei muttersprachlich deutschen Kindern „erst im Alter von zehn bis zwölf Jahren […] der Prozess der Begriffsbildung soweit voran geschritten [zu sein], dass alltägliche Begriffe von Kindern zunehmend denen Erwachsener ähneln“ (Komor 2009: 46; vgl. auch Komor & Reich 2008: 57–58). Vermutlich vor allem aufgrund der kürzeren Zeit, die Kindern mit Deutsch als Zweitsprache vor der Einschulung für die Aneignung deutscher Begriffe zur Verfügung steht, verfügen sie bei der Einschulung über einen deutlich geringeren Wortschatz als ihre einsprachigen Mitschüler (Komor & Reich 2008: 54). Dieser Rückstand kann von vielen Kindern nicht aufgeholt werden, so dass in verschiedenen Untersuchungen am Ende der Grundschulzeit große lexikalische Lücken festgestellt wurden (Landua, Maier-Lohmann & Reich 2008: 176; Jeuk 2010: 59–60; Lütke 2008: 166; Ahrenholz 2008b: 177). Die niedrigeren Leistungen von Schülern mit mehrsprachigem bzw. nichtDeutschem Hintergrund im Bereich des Wortschatzes scheinen sich in der Sekundarstufe noch zu verschärfen, wie die Ergebnisse der DESI-Studie, in der Neuntklässler untersucht wurden, belegen (vgl. Abb. 19):

Abb. 19. Kontraste der Leistungen von Mehrsprachigen und nicht deutsch Erstsprachigen gegenüber deutsch Erstsprachigen zum Ende des neunten Jahrgangs (vgl. DESIKonsortium 2006: 26)

110 | Deutsch-als-Zweitsprache-Erwerb: Theorie und Forschungsstand Wenn es um die Untersuchung von Wortschatzkenntnissen geht, ist zwischen produktivem und rezeptivem Wortschatz zu unterscheiden. Während es mittlerweile (vor allem für den englischsprachigen Raum) diverse Verfahren zur Ermittlung rezeptiver Wortschatzkenntnisse gibt, existieren bislang keine allgemein anerkannten standardisierten Verfahren, die umfassend den produktiven Wortschatz messen (Milton 2009: 146). An den existierenden Verfahren wird kritisiert, dass mit kontrollierten „elicitation tasks“, die auch die deutschen Wortschatztests dominieren (z.B. Glück 2011; Kiese-Himmel 2005), nicht die Fähigkeit der freien Wortschatzproduktion in unterschiedlichen kommunikativen Kontexten überprüft werden könnte, während Aufgaben mit freier Sprachproduktion niemals die Gesamtheit des Wortschatzwissens abbilden könnten (Milton 2009: 141). Denn das, was ein Lerner spontan produziert, spiegelt immer nur einen Teil seiner Kompetenz wider. Auch über den Zusammenhang von produktivem und rezeptivem Wortschatz liegen bis auf die Tatsache, dass ersterer umfangreicher ist als letzterer, bislang keine Ergebnisse vor (Landua, Maier-Lohmann & Reich 2008: 176), so dass durch die Untersuchung des einen Teilwortschatzes keine Aussagen über den anderen Teilwortschatz getroffen werden können. Neben produktiven und rezeptiven Aspekten ist außerdem zwischen der Aneignung neuer Wortformen und der Aneignung semantischer Konzepte im Sinne von Begriffsbildung und Bedeutungsdifferenzierung zu unterscheiden. So hat sich ein Kind, das irgendwann das Verb akzeptieren verwendet, zwar offensichtlich ein neues Lexem angeeignet, doch welche verschiedenen Bedeutungen bzw. Konzepte mit diesem Begriff verbunden sind und wie er in bestimmten Bedeutungszusammenhängen verwendet und verstanden wird, wird vermutlich erst nach und nach erschlossen. Die Untersuchung von Wortschatzkenntnissen ist somit äußerst komplex, zumal die Kenntnis eines Wortes neben semantischen auch phonologische, grammatische, pragmatische und diskursive Ebenen betrifft (Tracy 2008b: 69; Grießhaber 2010c: 31–38). Tab. 11 fasst zusammen, welche Teilaspekte die Aneignung eines Wortes beinhaltet:

Stolpersteine des DaZ-Erwerbs | 111

Tab. 11. What is involved in knowing a word (Nation 2005: 27)

Auch wenn der Bereich der Bedeutungsentwicklung bei Kindern mit Deutsch als Zweitsprache bislang wenig systematisch erforscht wurde (Ahrenholz 2008b: 177), deuten erste Untersuchungsergebnisse darauf hin, dass die Entwicklungsverläufe häufig diskontinuierlich (nicht-linear) zu verlaufen scheinen und individuell sehr unterschiedlich sein können (Apeltauer 2006: 51). Dabei sind fließende Übergänge zu verzeichnen, die sich z.B. in Näherungsbegriffen oder Überdehnungen zeigen können. Bei letzterem Phänomen verbinden die Kinder mit einem Begriff mehr und z.T. andere Bedeutungen als dies in der Erwachsenensprache der Fall ist (Landua, Maier-Lohmann & Reich 2008: 179–180). Diese prozesshaften und äußerst variablen Eigenschaften des Aufbaus semantischer Kenntnisse führen dazu, dass die Aneignungsschritte mit quantitativen Methoden nur schwer fassbar sind (Reich 2008a: 166)39. Im Gegensatz zum Zweitspracherwerb ist die erstsprachliche Aneignung semantischer Fähigkeiten zumindest für die ersten drei Lebensjahre recht gut untersucht (Bredel et al. 2008: 259), und es werden Parallelen bei der Begriffs-

112 | Deutsch-als-Zweitsprache-Erwerb: Theorie und Forschungsstand bildung in Erst- und Zweitsprache angenommen (Komor & Reich 2008: 58; Landua, Maier-Lohmann & Reich 2008: 179). Semantische Aneignungsprozesse von älteren Kindern, d.h. nach dem dritten Lebensjahr, sind dagegen auch für den erstsprachlichen Erwerb nur wenig erforscht. Dazu gehört neben der Aneignung von Bedeutungsübertragungen, Redewendungen und Funktionswörtern vor allem auch die Aneignung bildungssprachlicher lexikalischer Mittel, zu der es bislang m. E. keine empirischen Untersuchungen gibt (Komor 2009: 46). In Bezug auf Forschungsergebnisse zur Konzeptualisierung bzw. Konzeptbildung beim kindlichen Wortschatzerwerb führt die Fokussierung wissenschaftlicher Untersuchungen auf die ersten Lebensjahre dazu, dass die Untersuchung der Aneignung abstrakter Begriffe bisher fast gar nicht erfolgte. Die wenigen vorhandenen Studien beziehen sich zum größten Teil auf das Englische und sind nur sehr eingeschränkt auf das Deutsche übertragbar (Komor 2008: 67). Ein weiteres Desiderat besteht in der Untersuchung „des Zusammenspiels von Lexikerwerb und anderen involvierten Sprachbereichen“ (Ahrenholz 2008b: 177). Nachdem für den frühen Erstspracherwerb gezeigt werden konnte, dass Wortschatz- und Grammatikerwerb miteinander korrelieren; „Wortschatzerwerb [also] in hohem Maßen den Grammatikerwerb vorhersagt“ (Szagun 2010: 126), wird auch für den Zweitspracherwerb ein positiver Zusammenhang zwischen Wortschatzzuwachs und Grammatikerwerb bzw. allgemeiner Sprachkompetenz angenommen (Jeuk 2007a: 72; Landua, Maier-Lohmann & Reich. 2008: 176; Daller & Xue 2007: 150). So stellt z.B. Ahrenholz (2008b: 179) fest, dass „mündliche Produktionen von SmM [Schüler mit Migrationshintergrund] […] im Vergleich zu denen monolingual deutschsprachiger Kinder häufiger durch geringeren Umfang gekennzeichnet“ sind. Auch Grießhaber (2008: 36) kommt zu diesem Ergebnis und stellt darüber hinaus fest, dass ein Zusammenhang zwischen dem Umfang und der Zielsprachlichkeit der Produktionen zu bestehen scheint, was er als Beleg für konnektionistische Erwerbsmodelle (vgl. 3.1) wertet: Aus diesen Parametern lässt sich als sicherer Zusammenhang ableiten, dass Flexionskorrektheit und Äußerungsmenge korrelieren: je höher die Zahl der produzierten syntaktischen Einheiten, umso weniger Fehler werden gemacht. Dies steht im Einklang mit konnektionistischen Erklärungen des Spracherwerbs, die annehmen, dass die Lerner aus den Strukturen der erworbenen sprachlichen Mittel Netze bilden, die den Strukturen entsprechen (s. (Penke 2006). Wer viele Strukturen erwirbt, kann differenzierte Netze ausbilden, während derjenige, der weniger Strukturen erwirbt, nur unzureichend differenzierte Regelnetzwerke ausbilden kann. (Grießhaber 2008: 36)

Andere Autoren wie z.B. Möller (2009: 72) weisen jedoch auf diverse Faktoren wie Geschlecht, Motivation, Persönlichkeit und Thema hin, die die Textlänge

Stolpersteine des DaZ-Erwerbs | 113

beeinflussen können und daher ihre Eignung als Indikator für Kompetenzzuwächse einschränken. Auch das Medium (mündlich vs. schriftlich) sowie das Register (Alltagssprache vs. Schulsprache) dürften einen großen Einfluss auf die Äußerungsmenge ausüben. Zusammenfassend scheint die Untersuchung semantischer Entwicklungen zwar durchaus möglich, befindet sich aber insbesondere für Deutsch als Zweitsprache noch sehr am Anfang, so dass wir bis heute nicht wissen, „wie neue Wörter (und das Wissen, das mit ihnen verbunden ist), konsolidiert werden“ (Apeltauer 2008: 243) und „die Forschung von verallgemeinerbaren Erkenntnissen und einer Systematik der Erhebungs- und Auswertungsmethoden noch weit entfernt ist“ (Landua, Maier-Lohmann & Reich 2008: 180). Neben den bereits angesprochenen methodischen Schwierigkeiten ist die Untersuchung von Wortschatzkenntnissen gerade in freien Sprachproben auch deshalb problematisch, weil Lerner bei Wortschatzlücken verschiedene Kompensationsstrategien einsetzen, die in Komor & Reich (2008: 56) wie folgt zusammengefasst werden: –

Verstummen



ja als Floskel



Bekunden von Nichtwissen



gestisch-mimische Kommunikation



Lautmalerei



sprachliche Joker (auch: Globalwörter, Passepartout-Wörter)



Einfügen erstsprachiger Wörter



Fragen nach Wörtern



Verwendung von Näherungsbegriffen



Umschreibungen



Neubildungen (Komor & Reich 2008: 56)

Gerade die Tatsache, dass einige dieser Phänomene auch andere Ursachen als lexikalische Lücken haben können (z.B. Leistungsangst, Konzentrationsschwierigkeiten, Persönlichkeitsmerkmale etc.), stellt für die eindeutige Ermittlung von Kompetenzen und Defiziten eine Herausforderung dar. Dabei erschweren besonders Strategien, die dazu führen, dass das Kind sich gar nicht äußert oder bestimmte Themen vermeidet, die Diagnose produktiver Wortschatzkenntnisse. In diesem Zusammenhang weist Jeuk (2007a: 70) außerdem darauf hin, dass sich bei erfolgreichen und weniger erfolgreichen Lernern Unterschiede bezüglich der Wahl der eingesetzten Strategien beobachten lassen: Während schwä-

114 | Deutsch-als-Zweitsprache-Erwerb: Theorie und Forschungsstand chere Lerner vorwiegend Vermeidungsstrategien wie gestische Mittel, Pausenfüller, Wiederholungen oder Lautmalereien einzusetzen scheinen, verwenden die erfolgreicheren Lerner eher Näherungsbegriffe und Neologismen (Jeuk 2003, zit. nach Landua, Maier-Lohmann & Reich 2008: 180). Aus diesen Gründen werden lexikalisch-semantische Fähigkeiten meist nicht anhand freier Sprachproben, sondern durch relativ enge Testformate (z.B. WWT 6–10, Glück 2011) zu erfassen versucht. Doch gerade bei der ‚Tiefe‘ („depth“) semantischen Wissens handelt es sich um eine schwer definierbare Dimension, die kaum mit metrischen Mitteln erfassbar ist (Milton 2009: 148). Es überrascht daher nicht, dass für den deutschen Raum bislang keine validierten Verfahren zur Analyse semantischen Wissens in freien Sprachproben vorliegen, wobei grundsätzlich die Frage ist, ob sich diese Dimension überhaupt anhand spontansprachlicher Daten messen lässt (vgl. auch Milton 2009: 146). Während die Forschungslage zur Entwicklung semantischer Kompetenzen bei Kindern mit Deutsch als Zweitsprache im Schulalter als äußert lückenhaft einzustufen ist, werden quantitative Aspekte des zweitsprachlichen Lexikerwerbs wie Häufigkeit und Varianz der Wortarten deutlich intensiver diskutiert (Komor & Reich 2008: 55). Insgesamt ist davon auszugehen, dass der Wortschatz sukzessive wächst (Landua, Maier-Lohmann & Reich 2008: 176), wobei u.a. das Ausmaß des Wortschatzreichtums als Indikator für Entwicklungen im Bereich der Lexik gilt. So deuten verschiedene Studien darauf hin, dass sich der Wortschatz bei fortgeschrittenen Lernern durch eine größere Vielfalt auszeichnet als bei schwächeren Lernern (Milton 2009: 126– 127). Zu Wortschatzreichtum oder lexical richness gehören neben der lexikalischen Vielfalt (lexical diversity) auch die Häufigkeit niedrig-frequenter Wörter (lexical sophistication) sowie die lexikalische Dichte (lexical density), worunter das Verhältnis von Inhaltswörtern zu Funktionswörtern zu verstehen ist (Daller & Xue 2007: 150). Die meisten Forschungsarbeiten zur Wortschatzentwicklung im Deutschen als Zweitsprache beschäftigen sich jedoch weniger mit dem Wortschatzreichtum insgesamt als mit den Anteilen verschiedener Wortarten in den lernersprachlichen Texten. Diese Herangehensweise scheint sich auch bei der Untersuchung anderer Zweitsprachen zu bewähren (Milton 2009: 140). Die meisten Arbeiten beziehen sich dabei (hinsichtlich Deutsch als Zweitsprache) auf die frühen Phasen der Aneignung, wobei die Befundlage nicht immer übereinstimmt (Landua, Maier-Lohmann & Reich 2008: 177; Komor & Reich 2008: 55). Tendenziell scheint vor Schuleintritt bei Kindern mit Deutsch als Zweitsprache der nominale Anteil des Wortschatzes zu überwiegen. Mit Schuleintritt steigt vor allem der verbale und adjektivische Wortschatz an,

Stolpersteine des DaZ-Erwerbs | 115

während Adverbien eher abzunehmen scheinen (Karasu 1995, zit. nach Landua, Maier-Lohmann & Reich 2008: 178). Komor & Reich (2008: 55) schlussfolgern daher, dass sich Entwicklungsverläufe am ehestens anhand der Zunahme von Verben und ab dem zweiten Kontaktjahr von Adjektiven ablesen zu lassen 38. Für das (Grund-)Schulalter wird für diagnostische Zwecke daher vor allem die Zahl unterschiedlicher Verben bzw. Adjektive (types) als Indikator für den Sprachstand angesehen. Für fortgeschrittene Lerner könnte sich auch die Zahl der verwendeten Funktionswörter als geeigneter Indikator erweisen, was jedoch noch weiter zu untersuchen ist (Landua, Maier-Lohmann & Reich 2008: 178– 179; Komor & Reich 2008: 60). 37F

3.4.1.2 Verbaler Wortschatz Beim Forschungsstand zum verbalen Wortschatz ist zwischen Arbeiten zu unterscheiden, die vorwiegend semantische Merkmale von Verben untersuchen (meist Einzelfallstudien, z.B. Kostyuk 2005), und solchen, die sich primär auf Aspekte der Wortbildung konzentrieren. Die Ergebnisse letzterer fassen Komor & Reich (2008: 55) wie folgt zusammen: So ist bei den Verben eine Abfolge von der Kopula sein über Vollverben mit sehr allgemeiner Bedeutung, wie haben, machen, kommen, gehen, dann einfache Vollverben und Verben mit trennbarem Präfix hin zu Verben mit untrennbarem Präfix und schließlich reflexiven Verben anzunehmen. Eine genauere Differenzierung nach den einzelnen Präfixen wäre wünschenswert, doch liegen hierzu noch keine hinreichenden Ergebnisse vor. (Komor & Reich 2008: 55)

Bei DaZ-Kindern im Grundschulalter scheinen sich vor allem bei den Präfixverben Entwicklungen beobachten zu lassen. Die Schwierigkeiten dabei betreffen dann weniger syntaktische Kriterien wie z.B. die Satzklammer (vgl. 3.4.2.1) als vielmehr semantische Aspekte der Verbzusätze, was häufig zu einer Vermeidung von Präfixverben führt (Harnisch 1993: 321). Auch Grießhaber (2010c: 305) stellt fest, dass deutschsprachige Grundschüler und DaZGrundschüler mit guten Deutschkenntnissen deutlich mehr Präfixverben verwenden als DaZ-Grundschüler mit mittleren Deutschkenntnissen. Weiterhin scheint auch der vermehrte Gebrauch von Modalverben ein Merkmal fortgeschrittener Lernervarietäten zu sein (Ahrenholz 2011: 119). Eine weitere Be|| 38 Hier lassen sich - zumindest in Bezug auf bestimmte Sprachen - Parallelen zwischen Zweitspracherwerb und Fremdsprachenlernen beobachten. So zeigte sich z.B. auch bei den Französisch- und Spanischlernern in der Studie von Marsden/David (2008) bei den frühen Lernersprachen ein relativ hoher nominaler Anteil, der bei fortgeschrittenen Lernersprachen zugunsten des verbalen und adjektivischen Anteils niedriger ausfiel.

116 | Deutsch-als-Zweitsprache-Erwerb: Theorie und Forschungsstand obachtung betrifft den häufigen Gebrauch des Verbs machen bei Kindern mit Deutsch als Zweitsprache (Apeltauer 1987: 215; Oomen-Welke 1987: 117–118). 3.4.1.3 Funktionswortschatz Auch wenn bislang kein ausreichender empirischer Nachweis dafür erbracht wurde, dass sich Funktions- bzw. Strukturwörter als Sprachstandsindikatoren eignen, gibt es doch etliche Befunde, die darauf schließen lassen, dass Entwicklungen in diesem Bereich kennzeichnend für den fortgeschrittenen Spracherwerb sind. Zunächst ist darauf hinzuweisen, dass Funktionswörtern (Synsemantika) aufgrund ihrer primär grammatikalischen Bedeutung eine Sonderstellung zukommt. Im Gegensatz zu Inhaltswörtern (Autosemantika) verfügen sie über keine eigene Semantik, sondern ihre Bedeutung erschließt sich aus dem grammatikalischen Kontext (Jeuk 2010: 59–60, 2010: 71). Verschiedene Untersuchungen deuten darauf hin, dass die richtige Verwendung von Funktionswörtern auch fortgeschrittenen DaZ-Lernern noch Schwierigkeiten bereitet (vgl. Forschungsüberblick in Eckhardt & Andrea G. 2008: 76–79), so dass auch am Ende der Grundschulzeit noch große Lücken beim Strukturwortschatz zu beobachten sind (Ahrenholz 2008b: 177; Lütke 2010b: 38). Als Grund wird vermutet, dass in der Alltagssprache vor allem die Inhaltswörter für das Gelingen der Kommunikation relevant seien, während fehlende grammatikalische Informationen durch das gemeinsame Kontextwissen kompensiert werden könnten. Dies führe dazu, dass Kinder mit Deutsch als Zweitsprache Strukturwörtern nicht genug Aufmerksamkeit schenkten (Günther 2007a: 156; Rösch 2003a; Belke 2008: 190). Ehlich (2007: 63) fordert deshalb, dass den Funktionswörtern in Sprachdiagnose und -förderung verstärkt Beachtung geschenkt werden müsse. Von den Strukturwörtern sind für Deutsch als Zweitsprache vor allem Konjunktionen und Präpositionen recht gut untersucht. Artikel und Pronomen werden dagegen weniger unter lexikalischen als unter grammatikalischen Aspekten wie der Markierung der Nominalflexion erforscht (vgl. 3.4.2.3). Zum Partikelerwerb von Kindern mit Deutsch als Zweitsprache gibt es nur wenige empirische Forschungsarbeiten anhand sehr kleiner Stichproben (z.B. Kutsch 1985; Rost-Roth 2000) 39. Dabei wird wiederholt festgestellt, dass sich Lernersprachen durch „Partikelarmut“ auszeichnen (Rost-Roth 2000: 298; Ahrenholz 2008b: 182), woraus abgeleitet wird, dass „auch für fortgeschrittene Lerner noch Lern- oder Anwendungsschwierigkeiten vorzuliegen scheinen“ (Rost-Roth 38F

|| 39 Eine Auflistung der relevanten Arbeiten findet sich in Rost-Roth (2000: 287).

Stolpersteine des DaZ-Erwerbs | 117

2000: 294). In diesem Zusammenhang ist zu beachten, dass der Gebrauch von Partikeln in einem engen Zusammenhang mit der Diskursform sowie dem Sprachstil steht (Landua, Maier-Lohmann & Reich 2008: 178, 2008: 197). Insgesamt sind Modalpartikeln stark kontextabhängig und deshalb nur schwer fassbar (Rost-Roth 2000: 285). Kutsch (1985: 137) betont deshalb, dass bei der Untersuchung von Modalpartikeln immer auch die pragmatische Ebene von Gesprächen berücksichtigt werden müsse, was mit quantitativen Verfahren kaum möglich sei. Denn eine wesentliche Funktion von Partikeln bestehe darin, „Äußerungen interaktionsspezifisch kommunikativ zu gestalten“ (Kutsch 1985: 119). Deshalb sind sie für die tendenziell monologische und formelle Schulbzw. Distanzsprache weniger bedeutsam und werden im Rahmen dieser Arbeit nicht weiter untersucht. Konjunktionen Bei der Verwendung von Konjunktionen konnte im Rahmen des Projekts FöDaZ (vgl. Kap. 3.4) nachgewiesen werden, dass ihre Zahl im Laufe des Aneignungsprozesses während der Grundschulzeit zunimmt, wobei vor allem die subordinierenden Konjunktionen als, dass, weil und die nebensatzeinleitende Fragepartikel wo häufig auftreten (Landua, Maier-Lohmann & Reich 2008: 193–194). Im Gegensatz zu Schülern mit Deutsch als Muttersprache verwenden Schüler mit Deutsch als Zweitsprache vermehrt nebenordnende bzw. serialisierende Verknüpfungen wie und/und da/dann und weniger subordinierende Konjunktionen, die sie zudem für ein erweitertes Funktionsspektrum einsetzen. Beispiele sind der temporale Gebrauch von wo (z.B. „Wo er das gesehen hat, ist er weggegangen.“) oder die Verwendung von dass im Sinne von damit, womit und so dass (Ahrenholz 2007a: 12, 2007c: 229). Insgesamt ist „die Verfügung über Konjunktionen […] beschränkt […] und durch extensive Nutzung einiger Konjunktionen gekennzeichnet“ (Ahrenholz 2008b: 178). Auch wenn bislang keine festgelegte Abfolge für den Erwerb von Konjunktionen nachgewiesen werden konnte, gibt es doch einige Hinweise auf typische Erwerbsschritte: Bei Sprechern des Deutschen als Zweitsprache stellt das Auftauchen von Satzverbindungen einen wichtigen Fortschritt in der Sprachbeherrschung dar. Die einfachsten und geläufigsten Verbindungen mit und, dann, und dann können zu Beginn des zweiten Kontaktjahrs (aber nicht vor der Mitte des vierten Lebensjahres) angeeignet sein. Danach verschränken sich die Aneignungsprozesse für die semantisch anspruchsvolleren gleichordnenden Konjunktionen, wie aber oder denn, und die unterordnenden Konjunktionen. Die Endstellung des Verbs ist auch hier das entscheidende Kriterium, im Übergang können unterordnende Konjunktionen ohne Endstellung des Verbs im Nebensatz erscheinen (Er will, dass die Mama kauft die Bonbons). Eine feste Aneignungsreihenfolge ist nicht etabliert. Der Konnektor „weil“ taucht früh auf, zunächst in Antworten auf warum-Fragen, dann auch in vollständigen

118 | Deutsch-als-Zweitsprache-Erwerb: Theorie und Forschungsstand Satzgefügen. Früh erscheinen auch Nebensätze mit wenn (Wenn die Mutter arbeitet, passt der Vater auf die Kinder auf) und dass sowie die sog. indirekten Fragesätze mit Fragepartikeln (wie, wann, wer etc.) oder mit ob als Nebensatzeinleitung (Ich weiß nicht, ob ich in deutsche oder türkische Klasse gehe). Es folgen Stück um Stück die weiteren Konjunktionen. Relativ spät kommen die Relativsätze dazu. (Kemp, Bredel & Reich 2008: 78–79)

Präpositionen Deutlich intensiver erforscht als der Erwerb der Konjunktionen ist die Aneignung der Präpositionen, wobei der Schwerpunkt auf der Untersuchung lokaler Präpositionen liegt (für einen umfassenden Forschungsüberblick vgl. Lütke 2011a: 103–112). Besonders aussagekräftig sind in diesem Zusammenhang vor allem die Untersuchungen von Grießhaber (1999), Lütke (2008: 2010b) und Becker (2006). Insgesamt herrscht Einigkeit darüber, dass sich bei DaZ-Lernern über längere Zeit Schwierigkeiten beim Erwerb der Präpositionen beobachten lassen (Kemp, Bredel & Reich 2008: 71; Schlemmer 2001: 44–45), weil es sich um einen „schwer zugänglichen“ Lerngegenstand handelt (Barkowski 2003, zit. nach Lütke 2011a: 111). Neben Schwierigkeiten in Bezug auf die Kasusmarkierung werden vor allem lexikalische Probleme hervorgehoben (Becker 2006: 164). Dazu zählen neben der „mangelnden Verfügbarkeit spezifischer Präpositionen […] auch die Unsicherheiten bei der Bestimmung von Thema und Relatum“ (Lütke 2011a: 112). Dass DaZ-Lernern der richtige Gebrauch von Präpositionen Probleme bereitet, zeigt sich zum Beispiel daran, dass Präpositionen bzw. Präpositionalphrasen häufig ausgelassen und z.T. durch einfachere adverbiale Strukturen ersetzt werden (Lütke 2008: 153, 2011a: 112). Auch wird von vielen Fehlern im Zusammenhang mit Präpositionen berichtet 40 (z.B. Cantone & Haberzettl 2008: 101), die aber im Laufe der Grundschulzeit abzunehmen scheinen (Landua, MaierLohmann & Reich 2008: 189). Als Hauptgründe für diese Schwierigkeiten werden die oft schwer durchschaubare Bedeutung, die wenig durchsichtige Rektion sowie L1-Einflüsse angenommen (Ahrenholz 2010e). Weiterhin wird mit Bezug auf Slobins operationale Prinzipien (vgl. Kap. 3.1) die eher unauffällige Position im Satz für die Erwerbsprobleme verantwortlich gemacht. (Becker 2006: 160). Prinzipiell werden nach Apeltauer (1987, zit. nach Lütke 2010b: 38) drei Schritte beim Erwerb von Präpositionen angenommen: 39F

|| 40 Dazu zählen ganz zentral auch Fehler im Bereich der Kasusrektion (vgl. Kap. 3.4.2.3 )

Stolpersteine des DaZ-Erwerbs | 119

1. 2. 3.

Auslassung der Präposition Einheitspräposition in Verwendung von zwei und mehr Präpositionen

Danach ist das Repertoire zunächst auf wenige auffällige und/oder besonders frequente Präpositionen beschränkt, die dafür umso häufiger eingesetzt werden (Ahrenholz 2008b: 177). Zu den recht früh und häufig verwendeten Präpositionen scheinen in und auf zu gehören. Zur Frequenz der anderen Präpositionen bestehen unterschiedliche Befunde, die sich auch aufgrund der angenommenen erstsprachlichen Einflüsse nicht verallgemeinern lassen. Festzuhalten bleibt, dass sich auch am Ende der Grundschulzeit noch ein deutlicher Unterschied bei der Verwendung von Präpositionen zwischen Kindern mit Deutsch als Erstbzw. Zweitsprache feststellen lässt, wobei von der 3. zur 4. Klasse Zuwächse beobachtet werden konnten (Lütke 2008: 156). Auffällig ist auch, dass es beim Gebrauch der Präpositionen häufig zu Übergeneralisierungen und Überdehnungen kommt (Kaltenbacher & Klages 2007: 88–89). So beobachtet Grießhaber (1999) bei den von ihm untersuchten deutsch-türkischen Viertklässlern eine besonders häufige Verwendung der Präpositionen zu und in. Dabei kann gerade die vermehrte Verwendung von zu u.a. darauf zurückgeführt werden, dass sie zur Vermeidung von Wechselpräpositionen eingesetzt wird. Denn Wechselpräpositionen sind in ihrer Semantik durch die Abhängigkeit vom Kasus weniger eindeutig und werden deshalb gerne vermieden (Grießhaber 2007: 165, 2008: 42–43). Auch an anderen Stellen wird auf die besondere Schwierigkeit von Wechselpräpositionen hingewiesen (z.B. Lütke 2011a: 111; Jeuk 2010: 71; Rösch 2005c: 118). Auch die von Becker untersuchten 15 türkisch-deutschen Zweitklässler hatten offensichtlich Schwierigkeiten bei der Wahl der semantisch passenden „Bewegungspräposition“. Bei den lokalen Präpositionen schien die Semantik dagegen weniger ein Problem zu sein, dafür trat aber „die Schwierigkeit auf, dass Akkusativ statt Dativ gesetzt wurde“ (Becker 2006: 163) (zur Kasusrektion vgl. Kap. 3.4.2.3). Auch in DaF-Kontexten scheinen lokale Präpositionen weniger Probleme zu bereiten als direktive (Studer 2000b: 283, zit. nach Lütke 2011a: 111). Zur Erklärung dieser Schwierigkeiten werden auch Einflüsse der Erstsprache diskutiert, die vor allem in Bezug auf die türkische Sprache überzeugen, in der es keine Präpositionen gibt und Raumkonzepte anders versprachlicht werden (z.B. Ahrenholz 2008b: 177; Kaltenbacher & Klages 2007: 88–89; Schlemmer 2001: 43– 44): Untersuchungen zum Gebrauch lokaler Präpositionen von kindlichen Lernenden der L2 Deutsch lassen vermuten, dass der Erwerb präpositionaler Wendungen für Lernende, die

120 | Deutsch-als-Zweitsprache-Erwerb: Theorie und Forschungsstand eine typologisch entfernte L1 wie das Türkische sprechen, deutlich schwieriger ist. Anders angelegte semantische Konzepte, die Artikellosigkeit, das fehlende Genus und die postpositionale Realisierung von raumbezogenen Informationen in einer agglutinierenden Sprache wie der Türkischen führen zum Auftreten von Interferenzen. (Lütke 2011a: 111)

Artikel Die wissenschaftliche Untersuchung des Artikelerwerbs hat erst relativ spät begonnen, so dass noch weitgehend ungeklärt ist, ob „Artikel Kindern mit Deutsch als Muttersprache […] in gleichem Ausmaß und in gleicher Weise Probleme bereiten wir Kindern mit nichtdeutscher Muttersprache“ (Ose & Schulz 2010: 79). Inzwischen wird davon ausgegangen, dass nach einer frühen Phase der „Nichtverwendung des Artikels“ eine Phase mit der Verwendung eines Einheitsartikels folgt, bevor erste Genus- und Kasusdifferenzierungen vorgenommen werden (Landua, Maier-Lohmann & Reich 2008: 182; Kemp, Bredel & Reich 2008: 72). Für Kinder im Schulalter kann davon ausgegangen werden, dass Artikel fast immer gesetzt werden und die Probleme eher im Bereich der Genusund Kasusmarkierung liegen (Kemp, Bredel & Reich 2008: 72; Schlemmer 2001: 42). Artikelauslassungen sind zwar auch noch nach mehreren Kontaktjahren zu beobachten, diese treten aber parallel zu der zielsprachlichen Setzung von Artikeln auf und könnten auch auf eine Strategie zur Vermeidung von Genus- und Kasusmarkierungen zurückgeführt werden (vgl. Lütke 2010b: 38). Auch der Erwerb der Unterscheidung von definitem und indefinitem Artikel wurde bislang nicht empirisch untersucht (Ose & Schulz 2010: 79). Die Pilotstudie von Ose & Schulz (2010) deutet darauf hin, dass „die Verwendung indefiniter und definiter Artikel Kindern mit DaM und Kindern mit DaZ im Alter von fünf Jahren noch schwer fällt“ und DaZ-Kinder vor allem die Semantik definiter Artikel noch nicht vollständig beherrschen (Ose & Schulz 2010: 93–94). Diese Ergebnisse können jedoch aufgrund der Elizitierungsweise, die die Autoren selbst kritisch reflektieren (Ose & Schulz 2010: 94), allenfalls als Tendenz gewertet werden, die durch weitere Untersuchungen zu bestätigen ist. Ein widersprüchliches Ergebnis findet sich z.B. bei Wegener (2000a: 520), die für die Aneignung des Artikels feststellt, dass DaZ-Lerner bereits auf Stufe 2 Artikel für die Unterscheidung definit-indefinit verwenden. Eine methodische Schwierigkeit bei der Untersuchung des Erwerbs der Kategorie Definitheit besteht dabei grundsätzlich darin, dass schwer zu entscheiden ist, ob eine fehlerhafte Artikelsetzung auf die unzureichende Beherrschung der Semantik definiter bzw. indefiniter Artikel zurückzuführen ist oder auf eine falsche

Stolpersteine des DaZ-Erwerbs | 121

Einschätzung des kommunikativen Kontextes bzw. den Kontextwissens des Gesprächspartners. Pronomen Auch die Pronomen gelten als „Stolperstein“ der deutschen Sprache (Jeuk 2009: 65), für die wie bei den Präpositionen L1-Einflüsse angenommen werden (Ahrenholz 2003b: 229–230). Während die deiktischen Pronomen, die direkt auf die außersprachliche Welt verweisen (z.B. „Siehst du das?“), recht schnell erworben werden, scheint der Erwerb der anaphorischen Pronomen, die sich auch etwas bereits Gesagtes bzw. Geschriebenes beziehen, mit mehr Schwierigkeiten verbunden zu sein (Ahrenholz 2003b: 229, 2007b: 146–147). Insgesamt ist die Forschungslage zum Erwerb der Pronomen jedoch recht dünn, so dass bislang unklar ist, „auf welcher Stufe […] 'der, die, das' als Demonstrativpronomen, ab wann als Artikel gebraucht werden und welche pronominalen Formen parallel dazu schon Verwendung finden“ (Ahrenholz 2007b: 143). Die wenigen existierenden Untersuchungen deuten jedoch darauf hin, dass die Personalpronomen nach relativ kurzer Kontaktzeit erworben werden, während Reflexiv- und Possessivpronomen erst später hinzukommen (Landua, Maier-Lohmann & Reich 2008: 178). Letztere können sich (vermutlich auch in Abhängigkeit von der Erstsprache) noch bei Sekundarschülern mit Deutsch als Zweitsprache als besonders fehleranfällig erweisen, weil sie neben ihrer pronominalen (d.h. personenbezogenen) Funktion zugleich die Funktion des Determinierers mit den entsprechenden Numerus-, Genus- und Kasusmarkierungen übernehmen (Schlemmer 2001: 43, 45). Schwierigkeiten in Bezug auf die Genus- und Kasusmarkierung treten wie bei den Artikeln auch bei den anderen Pronomen über einen langen Zeitraum auf (vgl. Kap. 3.4.2.3). 3.4.2 Grammatik (morphosyntaktische Basisqualifikation) 3.4.2.1 Satzmodelle Der Erwerb verschiedener morpho-syntaktischer Phänomene ist für das Deutsche als Zweitsprache vergleichsweise gut untersucht (Landua, Maier-Lohmann & Reich 2008: 171), wobei ein Schwerpunkt bei der Aneignung der Satzmodelle und der Nominalflexion festzustellen ist. In Bezug auf den Erwerb der Satzmodelle kommen verschiedene Studien zu dem Ergebnis, dass Kinder mit Deutsch als Zweitsprache bereits nach maximal 3–4 Kontaktjahren über die elementare Syntax verfügen (Landua, Maier-Lohmann & Reich 2008: 181). Unter günstigen Erwerbsbedingungen kann dies sogar schon nach 2 Jahren der Fall sein (Antos

122 | Deutsch-als-Zweitsprache-Erwerb: Theorie und Forschungsstand 1988: 13–14; Ahrenholz 2008b: 178–179) 41. So konnten auch fast alle im Rahmen des FöDaZ-Projekts untersuchten zweisprachigen Grundschulkinder „Sätze mit Inversion, Satzklammern und Nebensätze mit Endstellung des Verbs verwenden“ (Landua, Maier-Lohmann & Reich 2008: 191). Auch die von Kaltenbacher & Klages (2007: 83) untersuchten Vorschulkinder eigneten sich die „grundlegenden Aspekte der Syntax – die Konstituenten der Satzstruktur und ihre Reihenfolge – in der Regel relativ schnell und problemlos an“. Die zuletzt erworbenen Stellungsvarianten der grundlegenden Satzmodelle sind die Subjekt-VerbInversion und die Verbletztstellung im Nebensatz, wobei die Studien in Bezug auf die Reihenfolge dieser beiden letzten Erwerbsstufen zu unterschiedlichen Ergebnissen kommen (vgl. vor allem Meisel, Clahsen & Pienemann 1981 bzw. Clahsen, Meisel & Pienemann 1983 und Diehl 2000b). Auch wenn die elementare Syntax bereits nach kurzer Zeit erworben wird, weist Wegener (1993: 105) zu Recht darauf hin, „dass die Kinder nach 2 bzw. 4 Jahren noch keineswegs ‚die Syntax‘ des Deutschen beherrschen“. So äußerten sich selbst fortgeschrittene Lerner „fast nur in parataktischen Hauptsatzkonstruktionen“, während „markierte Abfolgen, komplexe Einbettungen, AcIKonstruktionen 42 oder gar erweiterte Partizipialattribute“ völlig fehlten. Auch Grießhaber (2010c: 154) geht in seiner erweiterten Fassung der Profilanalyse davon aus, dass die Einbettung von Nebensätzen (Relativsätzen) sowie die Integration erweiterter Partizipialattribute über den grundlegenden Erwerb der Satzmodelle hinausgeht und somit als Merkmal fortgeschrittener Lernervarietäten angesehen werden kann. Aufgrund der durch die Zeitlichkeit gegebenen Restriktionen mündlicher Sprachproduktion (vgl. Kap. 2.3.2) sind solche Konstruktionen jedoch eher in schriftlichen Texten zu erwarten. Weiterhin beobachtet Ahrenholz (2007a) vom 3. zum 4. Schuljahr einen deutlichen Anstieg der Zahl an Nebensätzen (Landua, Maier-Lohmann & Reich 2008: 193). Auch die Komplexität der Nebensatzkonstruktionen scheint sich in Abhängigkeit vom Sprachstand zu unterscheiden. So konnten im Rahmen des FöDaZ-Projekts bei Schülern mit Deutsch als Erstsprache deutlich mehr komplexe Nebensatzstrukturen als bei Schülern mit Deutsch als Zweitsprache beobachtet werden (Ahrenholz 2007c: 236–237, 2008c: 173). Auch wird auf Schwierigkeiten im Zusammenhang mit dem Gebrauch von Relativsätzen hingewiesen (Ahrenholz 2007a: 10). Ein weiteres Merkmal für einen höheren Komplexitätsgrad scheinen Sätze mit Akkusativ- und Dativobjekt sowie Sätze mit Akkusativ40F

41F

|| 41 Für eine Übersicht über die Schritte beim Erwerb der elementaren Satzmodelle siehe Kemp et al. (2008: 77) 42 AcI = Accusativus cum infinitivo (z.B. „Ich höre die Lehrerin kommen.“)

Stolpersteine des DaZ-Erwerbs | 123

objekt und Präpositionalphrase zu sein (Landua, Maier-Lohmann & Reich 2008: 188), wobei auch hier Unterschiede zwischen mündlichen und schriftlichen Realisierungsformen erwartbar sind. Eine syntaktische Besonderheit zweitsprachlicher Produktionen scheint weiterhin die häufige, nicht-zielsprachliche Verwendung von Verb-Erststellung in Aussagesätzen zu sein (z.B. „Kommt der Junge und sieht die.“), bei der es sich evtl. um ein Übergangsphänomen einer sich umstrukturierenden Syntax handelt (Ahrenholz 2010a: 21–22, 2008c: 173). Eine weitere Schwierigkeit fortgeschrittener DaZ-Kinder besteht Ahrenholz (2007c: 232–233) zufolge in den Restriktionen, die mit Subjektauslassungen verbunden sind, so dass DaZ-Lerner Subjekte häufig realisieren, obwohl „Verb-Erst in Verbindung mit Subjektauslassung als Koordinationsellipse naheliegend wäre“ (z.B. „Der Junge kommt und er sieht die Kinder.“). Insgesamt gibt es jedoch zum Erwerb komplexer syntaktischer Phänomene für das Deutsche als Zweitsprache nur wenige Untersuchungen (Ahrenholz 2007a: 5), so dass die beschriebenen Beobachtungen noch durch weitere Studien zu bestätigen sind. 3.4.2.2 Verbalflexion Neben den Satzmodellen deuten verschiedene Arbeiten darauf hin, dass auch die Personalformen des Verbs nach relativ kurzer Zeit beherrscht werden und im Grundschulalter kein großes Problem mehr darstellen (Dimroth & Haberzettl 2008: 234–235, 2008: 232–234; Grießhaber 2007: 163). Dabei werden folgende Erwerbsschritte angenommen: Zu Beginn des Zweitspracherwerbs vermutet Grießhaber (2005) eine Phase chaotischer Flexion (Stufe 0), in der Verben mit irgendeinem Flexiv versehen werden, ohne die infinite Grundform zu berücksichtigen. Als typisches Anzeichen für den Erwerbsprozess in dieser Phase nennt Grießhaber die regulär gebildeten Formen unregelmäßiger Verben, wie z.B. nehmt, schlaft oder geschlagt. Auf der folgenden Stufe (Stufe 1) kann Grießhaber hauptsächlich Äußerungen mit Finitum beobachten, wobei alle Verben in einer flektierten Form verwendet werden. Später (Stufe 3) beobachtet Grießhaber die korrekte Formbildung aller Verben, auch der Partizipien. Er stellt auf dieser Stufe außerdem die korrekte Verwendung von Hilfsverben und eine zunehmende Verwendung von Verben mit trennbarem Präfix, die korrekt separiert werden, fest. (Landua, Maier-Lohmann & Reich 2008: 185)

Anders verhält es sich bei den Präteritumsformen v.a. der starken Verben. Denn da das Präteritum vorwiegend in schriftlichen Texten verwendet wird und die unregelmäßigen Verbformen einzelheitlich gelernt werden müssen, ist ihr Erwerb abhängig von Leseverhalten und Lesekompetenz (Ahrenholz 2010e; Kemp, Bredel & Reich 2008: 74). Da das Lesen schriftlicher Texte im Laufe der

124 | Deutsch-als-Zweitsprache-Erwerb: Theorie und Forschungsstand Schulzeit zunimmt, überrascht es nicht, dass in schriftlichen Texten vom 2. bis zum 4. Schuljahr eine stetige Zunahme von Präteritumsformen festzustellen ist (Landua, Maier-Lohmann & Reich 2008: 186). Defizite in Bezug auf die Formenbildung lassen sich jedoch auch noch bei Sekundarschülern beobachten (Domenech 2010: 91). Weiterhin zeigen sich hier wie auch bei den Partizip-IIFormen U-förmige Erwerbsverläufe (Kemp, Bedel & Reich 2008: 73) (vgl. 3.1). Generell werden folgende Aneignungsschritte bei den Tempusformen angenommen: –

Präsens von sein und haben



Präsens der Voll- und Modalverben



Perfekt (zahlreiche Übergangsformen)



Präteritum von sein



Präteritum der Modalverben



Futur



Präteritum der Vollverben (Kemp, Bredel & Reich 2008: 72)

Dabei wird die relativ späte Aneignung des Futurs vor allem auf den seltenen Gebrauch dieser Tempusform im Deutschen zurückgeführt (Kemp, Bredel & Reich 2008: 73). Ein später Erwerb wird auch für den Konjunktiv sowie das Passiv angenommen, wobei zum Erwerb des Konjunktivs in der Zweitsprache Deutsch bisher keine wissenschaftlichen Studien vorliegen (Kemp, Bredel & Reich 2008: 72). Wohl aber wird über Schwierigkeiten von selbst fortgeschrittenen DaZSchülern bei der Redewiedergabe berichtet (Ahrenholz 2008b: 179), die u.a. auf Schwierigkeiten mit dem Konjunktiv zurückgeführt werden könnten. Auch der Erwerb des Passivs ist für das Deutsch als Zweitsprache bislang bis auf die Studien von Wegener (1998a) nicht umfassend untersucht. Ihren Ergebnissen zufolge tauchen die ersten Passivformen erst relativ spät auf (zwischen dem 14. und 20. Kontaktmonat), wobei der produktive Gebrauch des Passivs z.T. erst deutlich später stattfindet. Auch für Deutsch als Erstsprache stellt der Erwerb von Ausdrucksmöglichkeiten, bei denen das Agens nicht zugleich das Subjekt ist, eine besondere Herausforderung dar, die sich u.a. in der späten Aneignung des Passivs zeigt: Das Verständnis von Passivsätzen ist bei Beginn des Schulalters noch nicht gesichert, ihr aktiver Gebrauch ist kaum vor Ende der Primarstufe/ Anfang der Sekundarstufe zu

Stolpersteine des DaZ-Erwerbs | 125 erwarten und kann, bei Sprechern des Deutschen als Zweitsprache, frühestens nach einer zweijährigen Kontaktdauer erwartet werden. (Kemp, Bredel & Reich 2008: 79)

Landua, Maier-Lohmann & Reich (2008: 187) betrachten daher die Fähigkeit, Passivsätze zu bilden, als geeigneten Indikator für die Förderdiagnostik. Zugleich wird die Wichtigkeit des Passivs als Grundlage für die weitere Schullaufbahn in der Sekundarstufe betont (z.B. Dollnick, 28), da diese Struktur „vor allem in technischen und naturwissenschaftlichen Fachtexten eine beträchtliche Rolle“ spiele (Kemp, Bredel & Reich 2008: 79). Was die einzelnen Erwerbsschritte angeht, gehen der Studie von Wegener zufolge dem Erwerb des Vorgangspassivs Bildung und Stellung der Partizipien im Zusammenhang mit dem Perfekt sowie die Aneignung des Zustandspassivs voraus (Landua, MaierLohmann & Reich 2008: 187). 3.4.2.3 Nominalflexion Relevanz und Ursachen für Erwerbsprobleme Diverse Studien zum Erwerb des Deutschen als Zweitsprache kommen zu dem Ergebnis, dass die deutsche Nominalflexion eines der größten Lernprobleme auch für fortgeschrittene DaZ-Lerner darstellt (Ahrenholz 2008b: 180; Jeuk 2008: 135, 2010: 68; Grießhaber 2007: 165–166; Rösch 2005c: 117; Harnisch 1993: 320). Auch Turgay (2010) konnte in ihrer Querschnittsstudie mit insgesamt 56 türkisch- und italienischsprachigen und 24 deutsch-erstsprachigen Kindern im Alter von 6–11 Jahren massive Unterschiede in Bezug auf Nominalflexion und Determiniererverwendung (analysiert im Rahmen von Präpositionalphrasen) feststellen (vgl. Abb. 20). Diese Ergebnisse zeigen zudem, dass sich die Erwerbsprobleme vor allem auf die Genus- und Kasusmarkierungen beziehen, bei denen es sich Kemp, Bredel & Reich (2008: 71) zufolge um ein Problem handelt, „das oft nur mit Unterricht überwunden werden kann.“

126 | Deutsch-als-Zweitsprache-Erwerb: Theorie und Forschungsstand

Abb. 20. Sicherheit in Bezug auf Determiniererverwendung und Markierung der Nominalflexion bei Kindern mit und ohne Migrationshintergrund (Turgay 2010: 13)

Dieser Befund ist umso besorgniserregender, als den „Artikelformen […] in der sprachdidaktischen Praxis, aber auch im alltäglichen Sprachbewusstsein ein ungewöhnlich hoher Stellenwert zukommt“ (Landua, Maier-Lohmann & Reich 2008: 182). Auch Jeuk (2008: 136–137) betont die enorme Wichtigkeit der Beherrschung der Nominalflexion vor allem für schriftliche Register, in denen „Kohäsion nur hergestellt werden [kann], wenn über einen korrekten GenusKasusgebrauch die morphosyntaktischen Bezüge eindeutig sind.“ Als Ursachen für die beobachteten Erwerbsschwierigkeiten werden vor allem die Komplexität und mangelnde Transparenz der Nominalflexion, zum anderen die in der gesprochenen Sprache kaum wahrnehmbaren Formunterschiede angeführt (Landua, Maier-Lohmann & Reich 2008: 182). Dies führt zu vielen Abweichungen, da es ausgeschlossen ist, „korrekte NPs zu bilden, ohne dabei sämtliche Flexionsparadigma zu beachten“ (Wegener 1993: 105). Insgesamt ist die Nominalflexion im Deutschen […] weit komplexer und vor allem weniger transparent [als die Verbalflexion]. Sie ist kumulativ (Numerus, Kasus und Genus werden zugleich markiert) und geprägt von beidseitig uneindeutigen Form-FunktionsZusammenhängen (Allomorphe und Synkretismus) [...]. Bei der Adjektivflexion kommt die Abhängigkeit vom Determinierer erschwerend hinzu. [...] so hat das Genus – zumindest beim Determinierer – besonders wenig kommunikativen Nutzen (Dimroth 2008: 130) Zu den besonderen Herausforderungen im Deutschen gehören bekanntermaßen die Beachtung des grammatischen Geschlechts und die Markierung des Falles. Für den Erwerb des Kasus spielen nicht nur Unterschiede zwischen den Sprachen eine Rolle, sondern auch, dass im gesprochenen Deutsch die Unterschiede zwischen Akkusativ- und Dativ-

Stolpersteine des DaZ-Erwerbs | 127 formen perzeptiv oft kaum wahrnehmbar sind. Ob jemand den oder dem, ihn oder ihm sagt, ist bei schnell gesprochener Sprache kaum zu hören und wird folglich auch nicht gut wahrgenommen. Zudem vermischt sich die Kasusmarkierung mit der Kennzeichnung des grammatischen Geschlechts, für das es wiederum am Nomen nur sehr bedingt Indikatoren gibt. Bei selten verwendeten Wörtern kann man das Problem der Genuszuweisung auch bei Muttersprachlern beobachten. […] Das Genus ist im Deutschen v.a. an den Artikeln markiert, weswegen zuweilen in der Sprachdidaktik auch von der-Wörtern etc. die Rede ist. Leider ist es im natürlichen Input aber so, dass die bestimmten Artikel ein sehr unzuverlässiger Indikator sind. Da z. B. sehr viele Präpositionen den Dativ verlangen, sind im Sprachgebrauch meist mehr Verwendungen vom Typ vor der Tür, an der Wand etc. zu finden als die Nominativformen die Tür und die Wand (Ahrenholz 2009). In der Folge dauert der Erwerb des Genus- und Kasussystems im Deutschen einschließlich der Markierung von Genus und Kasus am bestimmten oder unbestimmten Artikel oder den Possessivpronomen etc. recht lange. (Ahrenholz 2010e)

Dass vor allem die uneindeutigen Form-Funktions-Zusammenhänge für die Erwerbsschwierigkeiten verantwortlich seien, lässt sich auch durch Slobins „Operating Principle E“ („Underlying semantic relations should be marked overtly and clearly“, vgl. Kap. 3.1), erklären. Denn das deutsche Deklinationssystem verstößt „in eklatanter Weise gegen das Postulat deutlicher Markierung“. So verschmelzen „in den Flexionsmorphemen die Funktionen von Genus, Kasus und Numerus miteinander“, was zu einer extremen Vieldeutigkeit des gesamten Morpheminventars führt (Diehl 2000a: 35). Erschwerend kommt hinzu, dass es sich beim Numerus um eine semantische Kategorie handelt, die auch lexikalisch realisiert werden könnte, während es sich beim Genus um eine lexikalische und beim Kasus um syntaktische Kategorien handelt, die auch durch die Wortstellung ausgedrückt werden können (Wegener 1993: 106). Erwerb der Nominalflexion Was die Aneignung der Nominalflexion angeht, liegen mittlerweile einige Forschungsarbeiten vor (z.B. Wegener 1993; Kaltenbacher & Klages 2007; Montanari 2010; Bast 2003; Christen 2000a, 2000b; Studer 2000a), aus denen sich zumindest Tendenzen bezüglich des Erwerbs ableiten lassen, auch wenn weiterhin diverse Desiderate bestehen (Landua, Maier-Lohmann & Reich 2008: 183; Belke 2008: 178). Dabei zeichnet sich ab, dass es im Gegensatz zu den Satzmodellen, für deren Erwerb in verschiedenen Studien überindividuelle Muster nachgewiesen werden konnten (vgl. 3.4.2.1), im Bereich der Nominalflexion deutliche individuelle Unterschiede zu geben scheint (Ahrenholz 2010a: 23). Als Schwierigkeit und bislang nicht gelöstes Problem der Erforschung der Erwerbszusammenhänge in diesem Kontext erscheint auch hier die Verschmelzung mehrerer Funktionen in einer Form bzw. einem Morphem (z.B. dem = Sin-

128 | Deutsch-als-Zweitsprache-Erwerb: Theorie und Forschungsstand gular + Maskulinum + Dativ) sowie die Vielzahl an Synkretismen (vgl. exemplarisch Tab. 12 für den bestimmten Artikel). So verfügt das Deutsche nur über relativ wenige Formen, dafür aber über ein vielfaches Mehr an Funktionen (Ahrenholz 2010a: 22): Tab. 12. Synkretismen beim bestimmten Artikel 43 42F

Singular Maskulinum

Plural Neutrum

Femininum

Mask./Neutr./Fem.

Nominativ

der

das

die

die

Akkusativ

den

das

die

die

Dativ

dem

dem

der

den

Genitiv

des

des

der

dem

Außerdem müsste der kategoriale und formale Erwerb von Numerus, Genus und Kasus strenggenommen immer unter Berücksichtigung der ‚Träger-Wörter‘, d.h. der unbestimmten bzw. bestimmten Artikel, Pronomen, Adjektive und Substantive, untersucht werden, was jedoch häufig nicht der Fall ist. So ist bislang nicht geklärt, „auf welcher Stufe (bezogen auf den reinen Kasus) 'der, die, das' als Demonstrativpronomen, ab wann als Artikel gebraucht werden und welche pronominalen Formen parallel dazu schon Verwendung finden“ (Apeltauer 1997, zit. nach Ahrenholz 2007b: 143). Die meisten Studien konzentrieren sich auf die Markierungen am Artikel, und dabei vor allem am bestimmten Artikel, wobei nicht immer zwischen definitem und indefinitem Artikel differenziert wird (Ose & Schulz 2010: 79). Auch wenn es dazu bislang keine DaZspezifischen empirischen Untersuchen gibt, wird die Flexion von Adjektiven in attributivem Gebrauch u.a. Schlemmer (2001: 42) zufolge immer wieder als große Herausforderung erfahren, was auch ein Grund für ihre relativ seltene Verwendung sein könnte. [Adjektivendungen] sind einerseits abhängig von dem schwer zu durchschauenden Genus- und Kasussystem, andererseits variiert ihr Gebrauch aber auch in Abhängigkeit davon, ob ein bestimmter oder ein unbestimmter Artikel vorangeht oder ein Possessivpronomen oder der Negator kein. In der Folge reduzieren Lerner die Adjektivendungen tendenziell auf ein „-e“. (Ahrenholz 2010e)

|| 43 Die verschiedenen Grauschattierungen entsprechen den vorhandenen Synkretismen.

Stolpersteine des DaZ-Erwerbs | 129

Uneinigkeit herrscht in Bezug auf die Aneignungsreihenfolge von Numerus, Genus und Kasus, wobei vor allem die Erwerbsfolge der Kategorien Genus und Kasus strittig ist. Was den Erwerb der Numerusdifferenzierung angeht, deuten mehrere Untersuchungen darauf hin, dass der Erwerb in einem relativ frühen Stadium erfolgt (Ahrenholz 2007b: 136), zumal der Numerus als Kategorie in fast allen Sprachen der Welt existiert. Größere Schwierigkeiten bereitet dagegen die formale Markierung (Landua, Maier-Lohmann & Reich 2008: 181). Doch auch hier zeigen sich weniger Probleme als beim Kasus- und Genuserwerb (Jeuk 2010: 70). Am umfassendsten hat bisher Wegener (1994: 2008a) den DaZ-Erwerb des Plurals untersucht. Ihren und Basts (2003: 67) Studien zufolge scheinen die Lerner beim Erwerb sowohl Item-basiert (holistisch) als auch regelgeleitet (produktiv) vorzugehen, wobei vor allem der Pluralmarker -en häufig übergeneralisiert wird (Wegener 2008a: 347). Eine klare Aneignungsreihenfolge konnte jedoch bislang nicht nachgewiesen werden (Landua, Maier-Lohmann & Reich 2008: 182–183). Kemp, Bredel & Reich (2008:71) fassen daher zusammen: „Die vollständige Aneignung der zielsprachlichen Formen nimmt wohl einige Zeit in Anspruch, hat aber nur geringen indikatorischen Wert.“ Während Wegener (1993, 2000a: 536), Kostyuk (2005) und auch Jeuk (2008: 140) davon ausgehen, dass nach dem Erwerb des Numerus der Erwerb des Kasus erfolgt und die Aneignung des Genus an letzter Stelle steht, bereitet in der Untersuchung von Turgay der Kasus die größten Schwierigkeiten (Turgay 2010: 25), was auch den Ergebnissen der DiGS-Studie zu entsprechen scheint (Studer 2000a: 225, zit. nach Ahrenholz 2007b: 144–145). Landua, Maier-Lohmann & Reich (2008: 182) schlussfolgern aufgrund dieser unterschiedlichen Befunde, dass die Erwerbsreihenfolge Numerus-Kasus-Genus zu einfach scheint und „den tatsächlichen Verflechtungen der Kategorien und den anzunehmenden nichtlinearen Lernprozessen der Kinder nicht gerecht“ wird. Kaltenbacher & Klages (2007) entwickeln deshalb auf Basis ihrer Daten eine Stufung, bei der Genus- und Kasusmarkierung aufeinander bezogen werden (vgl. Tab. 13).

130 | Deutsch-als-Zweitsprache-Erwerb: Theorie und Forschungsstand Tab. 13. Entwicklungssequenzen beim Genus- und Kasuserwerb nach Kaltenbacher & Klages (2007: 86) Stufe

Merkmale

Stufe1

Keine Trägerelemente (Artikel fehlen) Undifferenzierter Gebrauch von der/die:

Stufe 2

freie Variation oder Beschränkung auf eine Form Zweigliedriges Genussystem/ kein Kasussystem:

Stufe 3a

für Subjekt der und die für Objekte der und die Zweigliedriges Kasussystem/ kein Genussystem:

Stufe 3b

für Subjekt der oder die für Objekte den Zweigliedriges Genussystem (Subjekt)/ zweigliedriges Kasussystem

Stufe 4

für Subjekt der und die für Objekte den Zweigliedriges Genussystem/ zweigliedriges Kasussystem

Stufe 5

für Subjekt der und die für Objekte den und die Dreigliedriges Genussystem (Subjekt)/ zweigliedriges Kasussystem

Stufe 6

für Subjekt der, die und das für Objekte den und die

Von den von Kaltenbacher und Klages untersuchten Vorschulkindern erreichten nur wenige Stufe 6, weshalb die Autorinnen zu folgender Schlussfolgerung gelangen: Unsere Ergebnisse stützen den von Wegener (1995a) und Kostyuk (2005) berichteten Befund, dass das Genus im frühen L2-Erwerb ein wesentliches Erwerbsproblem darstellt. […] Die zweisprachigen Kinder bauen ein Kasussystem auf, ohne die Genusdifferenzierung (vollständig) mit zu berücksichtigen, d.h. ihr Kasusparadigma ist bezüglich des Genus unterspezifiziert. (Kaltenbacher & Klages 2007: 87–88)

Zu beachten ist auch, dass die Abfolge für die Personalpronomen in dieser Studie weniger eindeutig zu sein scheint als für die Artikel. Auffällig ist auch, dass

Stolpersteine des DaZ-Erwerbs | 131

phonetisch gut unterscheidbare Akkusativ- und Dativformen bei den Pronomina scheinbar recht früh erworben werden (Ahrenholz 2008b: 181) 44. Die Skala von Kaltenbachter & Klages (2007) scheint zunächst plausibel, „kann aber noch nicht als empirisch bestätigt gelten“ (Landua, Maier-Lohmann & Reich 2008: 185). 43F

Genus Eine in Bezug auf den Genuserwerb neue Perspektive nimmt Montanari (2010, 2012) ein, indem sie davon ausgeht, dass sich die Kinder beim Erwerb an der Hauptfunktion des Genus orientierten; nämlich der, die Herstellung von Referenz und Kohäsion zu unterstützen. In diesem Verständnis stellt sich der Genuserwerb als Teil der Auseinandersetzung mit Kongruenz dar: „Diejenigen Kinder, die Kongruenz gemeistert haben, erreichen auch eine hohe Zielsprachlichkeit der Genusmarkierungen“. Dies legt weiterhin die Vermutung nahe, dass ein enger Zusammenhang zwischen Genusfunktion und Schriftlichkeit besteht: Während in der konzeptionellen Mündlichkeit Zusammenhänge auch über den Kontext und nonverbale Kanäle hergestellt werden können, ist die geschriebene Sprache auf sprachliche Mittel wie z.B. Genusmarkierungen angewiesen, um Kohärenz herzustellen (Jeuk 2007b: 199). Weiterhin beobachtet Montanari ähnlich wie Wegener (1995a), Kaltenbacher & Klages (2007) und Jeuk (2008) (vgl. auch Kemp, Bredel & Reich 2008: 72), dass Kinder in einem frühen Erwerbsstadium Einheitsartikel bzw. Markierungen aus nur zwei Genusparadigmen verwenden (Montanari 2012: 26), und führt in diesem Zusammenhang den Begriff des „Architerms“ ein (Montanari 2010: 254). Dass durch die Verwendung von Architermen die Differenzierung der drei Genera aufgehoben wird, wertet Montanari als Beleg dafür, dass das Kind noch keine Genusklassifizierung bzw. -markierung vornimmt, denn Genusmarkierung sei per definitionem eine Klassifizierung. Das Vorhandensein von Artikeln belege lediglich, dass die syntaktische Position für Genusträger erkannt worden sei und durch vorläufige Platzhalter besetzt werde, wobei die Markierung willkürlich sei bzw. Kinder durch die Artikel andere (eigene) Klassifizierungen markierten (Montanari 2012: 21). Erst wenn die Genera nicht nur differenziert angewendet würden, sondern auch für dasselbe Substantiv wiederholt dasselbe Genus verwendet würde, könne von einer Genusklassi-

|| 44 Befunde wie diese zeigen, dass viele Faktoren den Erwerb der Nominalflexion beeinflussen und sich gegenseitig bedingen. Dies erklärt auch, warum die Bedingungen und Prozesse des kategorialen und formalen Erwerbs der Nominalflexion bislang nicht abschließend geklärt werden konnten.

132 | Deutsch-als-Zweitsprache-Erwerb: Theorie und Forschungsstand fizierung gesprochen werden, und „erst bei Klassifizierung hat es Sinn, die Zielsprachlichkeit zu erfassen“ (Montanari 2012: 22). Einstimmigkeit herrscht in Bezug auf die Tatsache, „dass der Genuserwerb im Zweitspracherwerb lange dauert und die Genusmarkierung oft über lange Zeit hin arbiträr bleibt“, so dass die Aneignung am Ende der Kindergartenzeit häufig noch nicht abgeschlossen ist (Landua, Maier-Lohmann & Reich 2008: 185) und sich selbst am Ende der Grundschulzeit noch fehlerhafte Genuszuweisungen beobachten lassen (Ahrenholz 2006: 100–101). Kasus Während die Erwerbsreihenfolge der Kategorien (Numerus), Genus und Kasus noch nicht abschließend geklärt werden konnte, scheint sich für den Erwerb des Kasussystems ein mehrfach beobachtetes Muster abzuzeichnen (wobei sich die Untersuchungen meist auf die Markierung am bestimmten Artikels beziehen): Nach eine Phase, in der die Artikel ausgelassen werden, folgt die Markierung von Determiniertheit mit Hilfe eines bestimmten Artikels. Anschließend werden direkte Objekte markiert. Dieses 2-Kasus-System wird in der Folge zu einem 3-Kasus-System mit Dativmarkierungen ausdifferenziert, bevor zum Schluss (vermutlich in Abhängigkeit vom Kontakt mit schriftlichen Registern) auch der Genitiv erworben wird (Ahrenholz 2008b: 181, vergleichbare Ergebnisse auch in Jeuk 2008: 146). Auch Kemp, Bredel & Reich (2008: 72) kommen in ihrem Forschungsüberblick zu einer entsprechenden Abfolge (vgl. Tab. 14): Tab. 14. Stufen bei der Aneignung der Kasusmarkierungen am Artikel nach Kemp, Bredel & Reich (2008: 72) Stufen bei der Aneignung des Artikels

Beispiele

Kinder Ball Durchgehend oder weitgehend ja du Schule artikellose Nomenverwendung Junge spiel Setzung von Artikeln

die Kinder weg die Schule ich komm der Schule komm mein Mutter ins Spielplatz

Äußerungen eines Kindes innerhalb eines Beobachtungszeitraums: Tendenz zu einem Einheitsarti- der Kind geh der Kaufmann kel der Zah is putzer hier is der Kind un der Lehrerin ich weiß noch nich der Deutsch

Stolpersteine des DaZ-Erwerbs | 133 Stufen bei der Aneignung des Artikels

Beispiele

Verwendung aller drei Nomina- Äußerungen eines Kindes innerhalb eines Beobachtungszeittiv-Formen des Artikels raums: in das Tasche ist der Buch die Lehrerin hat gegeben in der erste Klasse das Vater bring das Jack ich wollt nich gehen in der Bett oblique Kasus 45: „der“ ich wollt der Fernseh gucken ich woll sehn der Fernseh der Film 4F

Oblique Kasus: „den“ und „dem“ Verwendung des Genitivs

Und hier geht runter mit dem Fahrrad ich hab runtergefallt auf den Bauch

Das Schloss des Fees

Wenn es um den Erwerb des Kasussystems geht, ist es wichtig, zwischen Objektund Präpositionalkasus zu unterscheiden. Während der Objektkasus eine relativ klare Funktion im Sinne der semantischen Rollen bzw. der Identifikation von Satzgliedern besitzt, ist die Funktion des Präpositionalkasus eher grammatischer Natur und hat (mit Ausnahme der Wechselpräpositionen) keine klare kommunikative Funktion. Es wird immer wieder darauf hingewiesen, dass unklare Form-Funktions-Zusammenhänge den Erwerb behindern (z.B. Jeuk 2008: 136; Grießhaber 2010c: 300). Deshalb betreffen die Schwierigkeiten beim Kasuserwerb weniger die semantisch-funktionalen kategorialen Unterscheidungen, die in den meisten Sprachen der Welt vorzufinden sind, als vielmehr die formale Markierung (Landua, Maier-Lohmann & Reich 2008: 182–183; Kemp, Bredel & Reich 2008: 70; Jeuk 2008: 140). Dass der Erwerb des Kasus in der Studie von Turgay (2010) offenbar mehr Schwierigkeiten bereitete als der Genuserwerb, könnte darauf zurückzuführen sein, dass hier ausschließlich präpositionale Kontexte untersucht wurden, in denen dem Kasus oft keine klare semantische Funktion zukommt. Da die Markierung von Subjekten bzw. Objekten durch den Kasus offensichtlich eine andere Funktion hat als die präpositionale Kasusrektion, ist es erwartbar, dass dies auch Auswirkungen auf den Erwerb hat. Auch die Häufigkeit der Kasusmarkierungen variiert in Abhängigkeit vom Kasustyp. So sind indirekte Objekte, die meist durch den Dativ markiert werden, deutlich seltener als Akkusativobjekte. Beim Präpositionalkasus verhält es sich umgekehrt: Hier überwiegen die Kontexte, in denen der Dativ gefordert ist gegenüber Akkusativkontexten, weshalb der Dativ bei Präpositionen auch als der || 45 oblique Kasus = Kasus, die NICHT das Subjekt markieren. Im Deutschen also Akkusativ, Dativ und Genitiv.

134 | Deutsch-als-Zweitsprache-Erwerb: Theorie und Forschungsstand „Normalkasus“ bezeichnet wird (Nickel 2010: 60). Es überrascht daher nicht, dass DaZ-Lerner Dativformen scheinbar zuerst in Präpositionalkontexten verwenden (Ahrenholz 2008b: 181). Auch die von Jeuk (2007b) untersuchten Schulanfänger verwendeten zunächst Dative nach Präpositionen (Landua, Maier-Lohmann & Reich 2008: 184) und nicht in Objektfunktion. Eine weitere Besonderheit in diesem Zusammenhang stellt die Kasusrektion bei Wechselpräpositionen dar, die je nach Bedeutung den Akkusativ- oder Dativ regieren. Hier gibt es also eine bedeutungsdifferenzierende, d.h. semantische Funktion der Kasusmarkierung, die sich jedoch von der Funktion des Objektkasus unterscheidet. Die Schwierigkeiten, die DaZ-Lerner mit der Kasusrektion bei Wechselpräpositionen haben, sind vermutlich darauf zurückzuführen, dass die Bedeutung der Präpositionalphrase in Abhängigkeit vom Kasus variiert, obwohl die Präposition dieselbe bleibt. Grießhaber (2008: 42–43, 2007: 165) vermutet deshalb, dass türkische Schüler Wechselpräpositionen vermeiden und stattdessen „Präpositionen verwenden, die nur einen Kasus fordern, so dass die Bedeutung klar ist“ (z.B. zu) und nicht erst durch die Kasusendung realisiert werden muss. Solange die zielsprachliche Markierung des Dativobjekts noch nicht erworben wurde, scheinen Präpositionen wie zu zudem als Marker für indirekte Objekte zu funktionieren (z.B. „Der Bär schenkt die Karotte zu den Pferd“) (Landua, Maier-Lohmann & Reich 2008: 183–184), was sich wiederum durch die Präferenz eindeutiger Form-Funktions-Zusammenhänge erklären lässt 46. Doch auch wenn die Kasusrektion in Präpositionalphrasen zu Schwierigkeiten führt, scheint ein mindestens genauso großes Problem in der lexikalischsemantischen Wahl der richtigen Präposition zu liegen (vgl. Kap. 3.4.1.3). Insgesamt scheint sich in Bezug auf die Kasusaneignung die Sequenz Nominativ – Akkusativ – Dativ (– Genitiv 47) abzuzeichnen, wobei nicht immer 45F

46F

|| 46 In diesem Zusammenhang sind auch erstsprachliche Einflüsse nicht auszuschließen. So haben die Kasus in den verschiedenen Sprachen z.T. andere Funktionen. Im Türkischen gibt es z.B. einen Dativ, der die Richtung anzeigt (Richtungsdativ), damit den deutschen Präpositionen zu, nach und in entspricht und auch im Zusammenhang mit Verben des Sagens, Meinens und Denkens verwendet wird. Äußerungen wie „Sie schimpfen zu dem Sohn“ oder „Die Mutter fragt zu mein Vater“ lassen sich demnach auch als Interferenz mit der türkischen Erstsprache erklären Schlemmer (2001: 43). Zu beachten ist dabei aber, dass auch Kinder mit L1-Deutsch die Präposition zu auf Verben des Sagens, Meinens und Denkens übergeneralisieren, was auch ein Ergebnis der „innerdeutschen Suffixreduzierung (Schmitz 1999)“ sein könnte Grießhaber (2008: 42–43). 47 Zum Erwerb des Genitivs gibt es bislang keine gesonderten Studien. Laut Landua, MaierLohmann & Reich (2008: 184) sollte der Genitiv jedoch als eigene Kategorie betrachtet werden, da seine Aneignung im engen „Zusammenhang mit der Aneignung literaler Qualifikationen“

Stolpersteine des DaZ-Erwerbs | 135

zwischen Objekt- und Präpositionalkasus unterschieden wird (Landua, MaierLohmann & Reich 2008: 183) (vgl. auch Jeuk & Schäfer 2007: 39 und Ahrenholz 2010a). Gerade für den Gebrauch des Dativs zeigen sich auch in der Grundschule noch deutliche Unterschiede zwischen erst- und zweitsprachlichen Kindern. So stellt Grießhaber (2007) im Rahmen einer Longitudinalstudie, in der u.a. Dativmarkierungen am Objekt und nach Präpositionen untersucht wurden, fest, dass bei der mittleren und schwächsten Lerngruppe am Ende der vierten Klasse noch 17%-100% der Dative fehlerhaft markiert waren. Eine klare Entwicklungstendenz ließ sich jedoch nicht feststellen (Landua, Maier-Lohmann & Reich 2008: 183). Aufgrund der großen Differenzen der untersuchten Lernergruppen betont Grießhaber (2007: 160) den hohen diagnostischen Wert fehlerhafter Dativmarkierungen im Rahmen von Sprachstandsdiagnoseverfahren. Eine solche Schlussfolgerung sehen Landua et al. (2008: 183) jedoch aus methodischen Gründen als empirisch noch nicht gesichert an. Ebenso wie für die anderen Kategorien der Nominalflexion mangelt es auch bei der Erforschung des Kasuserwerbs an Studien, die die Bedeutung der Kasusträger systematisch in den Blick nähmen. So scheint einigen vorläufigen Befunden zufolge die Markierung der obliquen Kasus an Personal- und Demonstrativpronomen häufiger und früher zu gelingen als an Determinierern, was auf die wichtige kommunikative Funktion von Pronomen zur eindeutigen Identifikation von Referenten zurückgeführt wird (Jeuk 2008: 147). Weiterhin scheint die Markierung unbestimmter Artikelformen tendenziell zu mehr Unsicherheiten zu führen als die Markierung der bestimmten Artikel (Schlemmer 2001: 43; Ahrenholz 2007b: 145–146) 48. Als besondere Herausforderung wird auch die Markierung am Possessivpronomen eingestuft: 47F

Schon die Possessivpronomina als lexikalische Einheit sowie ihre Stellung vor dem Substantiv sind für die türkischen Deutschlerner ein großes Problem, da sie nur PossessivEndungen am Substantiv kennen, d.h. generell wie auch bei den Plural- und Kasusendungen auf das Nachfeld des Substantivs ausgerichtet sind. [...] Dazu kommt noch, dass die Possessivrelation im Deutschen durch ein spezielles lexikalisches Element personen- und genusspezifisch repräsentiert wird und dass das Possessiv|| steht. Der Erwerb des Genitivs setzt daher relativ spät ein und kann nur im Zusammenhang mit Schriftsprache sinnvoll untersucht werden. 48 Die zitierten Befunde zur Kasusmarkierung an Personalpronomen und Artikeln gelten auch für die Genusmarkierung; auch hier scheint die Markierung an Personalpronomen und bestimmten Artikeln schneller und besser zu gelingen als am bestimmten Artikel (Turgay 2010: 26; Jeuk 2008: 141).

136 | Deutsch-als-Zweitsprache-Erwerb: Theorie und Forschungsstand pronomen an Stelle des Artikels stehend über besondere Deklinationsendungen auch noch zum Träger für Kasussignale wird. (Schlemmer 2001: 43–45)

Ähnlich wie Jeuk für die Genusmarkierungen betont Grießhaber (2007: 165) die hohe Relevanz korrekter Markierungen für den Aufbau von Kohärenz in komplexen Texten. Auch er sieht den Grund für die Erwerbsschwierigkeiten in der fehlenden Salienz und kommunikativen Notwendigkeit von Kasusmarkierungen im Rahmen konzeptionell mündlicher Kommunikation. Die Komplexität der deutschen Nominalflexion könnte auch ein Grund für die möglicherweise erst relativ seltene bzw. späte Verwendung der Konstituentennegation mit kein sein. Zwar liegen zum Erwerb der Negation für das Deutsche als Zweitsprache bisher kaum Ergebnisse vor. Den wenigen vorhandenen Untersuchungen zufolge scheint die Satznegation mit nicht jedoch nach relativ kurzer Zeit erworben zu werden (Landua, Maier-Lohmann & Reich 2008: 187; Ahrenholz 2008b: 178–179), während die Konstituentennegation mit kein und nichts Untersuchungsergebnissen zum erstsprachlichen Erwerb zufolge erst später erworben wird (Kemp & Bredel 2008: 98). Auch Harnisch (1993: 318) beobachtete im Rahmen des Schulversuchs „Zweisprachige Erziehung“ in Berlin, dass die Negation mit kein nur von wenigen Grundschulkindern korrekt verwendet wurde. 3.4.3 Zusammenfassung In Tab. 15 werden die Stolpersteine bzw. Fehlerschwerpunkte und Indikatoren des DaZ-Erwerbs fortgeschrittener Lerner (mind. 3–4 Kontaktjahre mit der deutschen Sprache) noch einmal zusammengefasst. Dabei werden nur die grammatikalischen und lexikalischen Bereiche berücksichtigt, für deren Relevanz auch empirische Untersuchungsergebnisse vorliegen. Außerdem werden auch hier nur solche Phänomene berücksichtigt, die bei schriftlicher und mündlicher Realisierung im Sinne einer Gemeinsamen Grammatik des Systems (Hennig 2006: 120, vgl. Kap. 2.3.3) gleichermaßen relevant erscheinen, da die Besonderheiten prototypischer Nähesprache hier nicht von Interesse sind. Aufgrund der lückenhaften Forschungslage im Bereich der DaZ-Forschung erhebt die folgende Zusammenstellung keinesfalls Anspruch auf Vollständigkeit, sondern spiegelt lediglich den derzeitigen Forschungsstand wieder 49. 48F

|| 49 Die zugrundeliegenden Studien bzw. Quellen werden hier aus Gründen der Lesbarkeit nicht erneut aufgeführt, sondern sind Kap. 3.4.1 -3.4.2 zu entnehmen.

Stolpersteine des DaZ-Erwerbs | 137

Tab. 15. Stolpersteine und Indikatoren für Erwerbsfortschritte fortgeschrittener DaZ-Lerner DaZ-Stolpersteine bzw. Fehlerschwer-

mögliche Indikatoren für DaZ-

punkte

Erwerbsfortschritte

Vermeidung bzw. abweichende Ver-

Wortschatzreichtum, v.a. bezo-

wendung von Präfixverben

gen auf:

abweichende Verwendung von Funktionswörtern (Semantik) Auslassungen von Determinierern

Wortschatz

Auslassungen von Präpositionen und Vermeidung von Präpositionalphrasen abweichende Strukturen im Zusammenhang mit Präpositionen (Semantik und Kasusrektion)

verbalen Wortschatz (v.a. Präfixverben und Modalverben) adjektivischen Wortschatz Funktionswortschatz (v.a. Konjunktionen, Präpositionen)

Vermeidung von Wechselpräpositionen zu (= Überdehnung) abweichende Possessivpronomen (v.a. Flexionsmarkierung) Näherungsbegriffe/Überdehnungen, Umschreibungen,

Verbalflexion

Syntax

Passepartout-Wörter Verberststellung in Aussagesätzen

Satzgefüge (Subordination) attributive Strukturen abweichende Strukturen bei der Form-

Präteritumsformen

bildung starker Verben, v.a. bei den Präteritumsformen Konjunktivstrukturen Passivstrukturen abweichende Genus- und Ka-

Nominalflexion

Satzverbindungen (Konnektoren)

susmarkierungen, v.a.: Dativmarkierung Markierung am Possessivpronomen Vermeidung von Wechselpräpositionen Vermeidung und abweichende Strukturen bei der Konstituentennegation mit kein

Selbstkorrekturen

und/oder ersatzweise Verwendung von

138 | Sprachlehr- und -lernforschung Eine besondere Bedeutung kommt Selbstkorrekturen zu. Wie in Kap. 4.3 ausgeführt, wird angenommen, dass Selbstkorrekturen ein möglicher Indikator für Sprachbewusstheit sein könnten, deren Förderung ein erklärtes Ziel formfokussierter Ansätze wie im BeFo-Projekt darstellt (Rösch & Stanat 2011: 153). Auch wird angenommen, dass Selbstkorrekturen Hinweise darauf geben könnten, welchen sprachlichen Bereichen gerade besondere Aufmerksamkeit geschenkt wird. Sollten sich diese Annahmen durch weitere empirische Arbeiten bestätigen, käme Selbstkorrekturen bei der Evaluation formfokussierter Förderung eine zentrale Funktion zu, indem sie nicht nur als Indikator für Sprachbewusstheit genutzt werden, sondern zugleich Hinweis auf aktuelle ‚Erwerbsbaustellen‘ liefern könnten. Leider erlaubt der derzeitige Forschungsstand keine eindeutige Beurteilung der Bedeutung von Selbstkorrekturen im Spracherwerbsprozess. In Tab. 15 werden Selbstkorrekturen deshalb quer zu allen anderen Bereichen dargestellt.

Explizites und implizites Wissen | 139

4 Sprachlehr- und -lernforschung 4.1 Explizites und implizites Wissen Während sich die deutsche Spracherwerbsforschung vorwiegend mit dem ungesteuerten Erwerb beschäftigt, untersucht die Sprachlehr- und -lernforschung die Bedingungen und Prozesse des gesteuerten Spracherwerbs bzw. Sprachenlernens. Dabei ist das Ziel aller unterrichtlichen Bemühungen, den natürlichen Erwerbsprozess bestmöglich zu unterstützen bzw. an den Stellen fördernd einzugreifen, an denen der Erwerb auf ungesteuertem Wege zu Problemen führt oder gar stagniert bzw. fossiliert (Rösch & Rotter 2010: 230). Eine grundsätzliche Frage ist dabei, in welchem Zusammenhang explizites und implizites Lernen bzw. Wissen zueinander stehen. Dabei wird explizites Wissen meist als bewusst zugängliches, analysiertes Wissen und explizites Lernen entsprechend als intentionaler und reflektierter Prozess verstanden. Implizites Wissen und Lernen ist dem Bewusstsein dagegen nicht oder nur bedingt zugänglich und insgesamt eher intuitiver Natur (Ellis 1997: 110–111). Ein weiterer wichtiger Aspekt in diesem Zusammenhang ist die Unterscheidung von kontrollierter und automatisierter Sprachverarbeitung. Häufig wird Automatisierung mit flüssiger Produktion bzw. schneller, automatischer Rezeption gleichgesetzt, die wiederum nur auf der Grundlage impliziten Wissens erfolgen können. Explizites Sprachwissen wird dagegen als Grundlage kontrollierter, vorsichtiger Sprachverarbeitung verstanden. Die Übersicht in Tab. 16 zeigt jedoch, dass auch explizites Wissen automatisiert verarbeitet werden kann und umgekehrt implizit erworbene Regeln zu einer kontrollierten, langsameren Sprachverarbeitung führen können. Das übergeordnete Ziel von Sprachförderung besteht dabei natürlich darin, dass implizites Wissen unbewusst und automatisiert angewendet wird (vgl. Feld D in Tab. 16):

140 | Sprachlehr- und -lernforschung

Tab. 16. Vier-Felder-Modell zweitsprachlichen Wissens nach Ellis (1997: 112) Type of knowledge

Explicit

Controlled processing

Automatic processing

A

B

A new explicit rule is used consciously

An old explicit rule is used

and with deliberate effort.

consciously but with relative speed.

Implicit

C

D

A new implicit rule is used without aware-

A fully learnt implicit rule is

ness but is accessed slowly and incon-

used without awareness and

sistently.

without effort

Während traditionelle Ansätze der Fremdsprachendidaktik (v.a. die GrammatikÜbersetzungsmethode) von einer mehr oder weniger direkten Übertragbarkeit explizit vermittelten Wissens in implizite Wissensbestände ausgehen, vertreten die extremen Gegner dieser Annahme die Ansicht, dass explizites Wissen überhaupt nicht in implizites Wissen überführt werden kann. Der bekannteste Vertreter dieses Ansatzes ist Stephen Krashen (z.B. Krashen 1981). Krashen formulierte in seiner Spracherwerbstheorie fünf Hypothesen, von denen die input hypothesis die entscheidendste ist. Dieser Hypothese zufolge erfolgt der Spracherwerb maßgeblich durch ‚verständlichen Input‘ nach der Formel i + 1: Essentially, comprehensible input is that bit of language that is heard/read and that is slightly ahead of a learner’s current state of grammatical knowledge. Language containing structures a learner already knows essentially serves no purpose in acquisition. Similarly, language containing structures way ahead of a learner’s current knowledge is not useful. A learner does not have the ability to “do” anything with those structures. Krashen defined a learner’s current state of knowledge as i and the next stage as i + 1. Thus, the input a learner is exposed to must be at the i + 1 level in order for it to be of use in terms of acquisition. (Gass & Selinker 2008: 309)

Weiterhin unterscheidet Krashen zwischen acquisition und learning. Acquisition steht dabei für den ungesteuerten, unbewussten Erwerb einer Sprache, während sich learning auf den gesteuert vermittelten, bewussten Regelerwerb bezieht, der zu explizitem Sprachwissen führe (Krashen 1982: 10). Beide Wissensbestände, also das „erworbene“ und das „gelernte“ Sprachwissen, bleiben Krashens Auffassung zufolge voneinander getrennt und dienen unterschiedlichen Zwecken: Während das erworbene System für die (spontane) Sprachproduktion zuständig ist, hat das gelernte System die alleinige Aufgabe, die

Explizites und implizites Wissen | 141

Sprachproduktion zu überwachen und mit dem gelernten Wissen abzugleichen (monitor hypotesis) (Gass & Selinker 2008: 242). Diese wie auch die anderen Hypothesen von Krashen wurden vielfältig kritisiert und konnten bislang nicht empirisch nachgewiesen werden (für einen Überblick zu den Kritikpunkten vgl. z.B. Edmondson & House 2006). Dennoch bauen verschiedene kommunikationsorientierte Förderansätze zumindest implizit auf ähnlichen Annahmen auf, indem sie davon ausgehen, dass der Erwerb einer zweiten Sprache analog zum Erstspracherwerb am besten durch vielfältige kommunikative Anlässe in authentischen Situationen erfolgt und keine formbezogene Unterweisung nötig wäre (vgl. Focus-on-Meaning-Ansatz in Tab. 17). Während Krashens Ansatz davon ausgeht, dass es keine ‚Schnittstelle‘ (interface) zwischen expliziten und impliziten Wissensbeständen gibt, liegen inzwischen verschiedene Arbeiten vor, die zwar keine direkte Übertragbarkeit des einen Bereichs auf den anderen annehmen, dennoch aber von gewissen Schnittstellen und Verbindungen zwischen explizitem und implizitem Wissen ausgehen. Die Annahmen solcher „weak interface positions“ fasst Ellis (1997: 115) wie folgt zusammen: 1.

Explizites Wissen kann in implizites Wissen überführt werden, wenn es sich um grammatikalische Strukturen handelt, deren Erwerb keiner entwicklungsbedingten Sequenz folgt. 2. Explizites Wissen kann bei entwicklungsabhängigen Strukturen in implizites Wissen überführt werden, wenn der Lerner eine Entwicklungsstufe erreicht hat, die die Integration der neuen Struktur in das lernergrammatische System erlaubt. 3. Explizites Wissen kann bei entwicklungsabhängigen Strukturen NICHT in implizites Wissen überführt werden, wenn der Lerner die dafür erforderliche Entwicklungsstufe noch nicht erreicht hat. 4. Nicht das gesamte sprachliche Wissen hat seinen Ursprung in einer expliziten Form. Häufiger beginnt zweitsprachliches Wissen als implizites Wissen. 5. Formaler (formfokussierter) Unterricht kann dazu beitragen, explizites und implizites grammatikalisches Wissen zu automatisieren. Daran anknüpfend stellt Ellis (1997: 107–133) eine Theorie des gesteuerten Spracherwerbs vor, in der die verschiedenen Ansätze und Arbeiten zu den

142 | Sprachlehr- und -lernforschung Aneignungswegen und Schnittstellen impliziten und expliziten Wissens integriert werden (vgl. Abb. 21) 50: 49F

Abb. 21. Die Rolle expliziten Wissens beim L2-Erwerb nach Ellis (1997: 123)

Dabei beschreibt die horizontale Ebene den impliziten Erwerbsweg, während die vertikale Ebene den Einfluss formfokussierter Förderung auf die Lernergrammatik (IL-System = interlanguage system) darstellen soll. Eine wichtige theoretische Grundlage dieses Modells stellt die NoticingHypothese von Schmidt (1990) dar. Diese besagt, dass eine sprachliche Form, die im Input vorkommt, nur dann weiterverarbeitet und in das lernersprachliche System integriert werden kann, wenn sie zunächst einmal registriert (‚noticed‘) wird. Während Schmidt (2010: 721) davon ausgeht, dass noticing bewusst erfolgen muss und dabei verschiedene Bewusstseinsdimensionen bzw. -formen unterscheidet (z.B. awareness, intention, knowledge, vgl. Schmidt 1990), herrscht bei anderen Autoren Uneinigkeit in der Frage, ob das Aufmerksamwerden im Sinne des noticing bewusst erfolgen muss (Ellis 1997: 118). Ob eine bestimmte Struktur im sprachlichen Input registriert wird, hängt von verschiedenen Faktoren ab. Dazu zählen externe Faktoren wie z.B. die Konzentrationsfähigkeit des Rezipienten oder das (Nicht-)Vorhandensein von Störgeräuschen. Auch die kommunikative Relevanz sprachlicher Formen und die || 50 Für eine umfassende Darstellung der verschiedenen Interface-Positionen und ihrer Annahmen zum Zusammenhang von explizitem und implizitem Wissen vgl. Ellis (1997, 2008) sowie Edmondson & House (2006).

Explizites und implizites Wissen | 143

Eindeutigkeit von Form-Funktions-Zusammenhängen spielen eine Rolle. So wird ein Lerner vor allem solche Formen registrieren, die für das Verständnis des Inhalts bedeutsam sind und eine eindeutige Funktion haben. Ist der Input jedoch inhaltlich und/oder sprachlich sehr anspruchsvoll, kann dies dazu führen, dass das Arbeitsgedächtnis überlastet ist und keine Kapazitäten mehr übrig bleiben, um einzelne Strukturen zu registrieren. In diesem Sinne ist auch Krashens Input-Hypothese zu verstehen: Denn dadurch, dass comprehensible input immer nur minimal über dem aktuellen Kompetenzstand des Lerners liegt, bleiben ausreichend Kapazitäten übrig, um auf einzelne Formen aufmerksam zu werden. Wird eine bestimmte Struktur im Sinne des noticing im Input registriert, findet sie als Intake 51 Eingang in das Sprachverarbeitungssystem, das durch das schwarze Rechteck in Abb. 21 symbolisiert wird. Bevor jedoch Intake in das lernergrammatiksche System integriert werden kann, muss zunächst ein Abgleich mit den vorhandenen lernergrammatischen erfolgen (comparing). Kommt es zu Differenzen zwischen vorhanden Regeln und der neu erkannten Struktur (noticing-the-gap) führt dies zur Umstrukturierung der Lernergrammatik in Richtung Zielsprache. Formfokussierter Unterricht führt Ellis‘ Modell zufolge dagegen zunächst zum Aufbau expliziten Wissens (vgl. vertikale Ebene in Abb. 21). Im Falle von Strukturen, die keiner entwicklungsbedingten Erwerbsfolge unterliegen und meist Item-basiert gelernt werden, können diese direkt in die Lernergrammatik integriert werden. Im Falle von entwicklungsabhängigen Phänomenen wie z.B. den deutschen Satzmodelle (vgl. Kap. 3.4.2.1) muss sich die Lernergrammatik auf einem Niveau befinden, das kurz vor dem natürlichen Erwerb der entsprechenden Struktur steht. Nur dann kann die explizit vermittelte Regel in die Lernergrammatik integriert werden bzw. zu einer Beschleunigung des impliziten Erwerbsprozesses führen. Darüber hinaus hat explizites Wissen jedoch auch indirekt und z.T. zeitverzögert Einfluss auf den Spracherwerb, indem es z.B. dazu führt, dass bestimmte Strukturen vom Sprachverarbeitungssystem überhaupt wahrgenommen (noticing) und/oder Differenzen zwischen Intake und Lernergrammatik erkannt werden (noticing-the-gap). Zwar fehlt auch für dieses Modell noch ein einschlägiger empirischer Nachweis, es liefert jedoch eine Erklärung für die widersprüchliche Beobachtung, dass gesteuerter Sprachunterricht oft nicht zu den erhofften schnellen Lernfortschritte führt, langfristig aber doch den Erwerbsprozess positiv beein50F

|| 51 Der Begriff Intake geht auf Corder (1967) zurück. Für eine Übersicht zu Geschichte und weiteren Modellierungen des Begriffs vgl. Chaudron (1985).

144 | Sprachlehr- und -lernforschung flussen kann. Außerdem liefert es einen Erklärungsansatz für die Phänomene des ‚flüssig-falsch-Sprechens‘ im Gegensatz zum ‚stockend-richtig-Sprechen‘: Lerner, die sich darum bemühen, ihr vorhandenes Wissen zu automatisieren, verfügen möglicherweise nicht mehr über die nötigen kognitiven Ressourcen, um noch neue Strukturen zu registrieren und/oder Differenzen zwischen Intake und Lernergrammatik zu erkennen, was zur vermehrten Produktion von abweichenden Strukturen führt. Lerner dagegen, die um Zielsprachlichkeit bemüht sind, richten ihre Aufmerksamkeit verstärkt auf neue Strukturen im Input und gleichen die Sprachdaten von Intake und Output mit dem vorhandenen expliziten Wissen ab, um mögliche Differenzen zu erkennen. Dies führt zu einer starken Beanspruchung des Arbeitsgedächtnisses, was sich auf die Flüssigkeit bei der Sprachproduktion auswirkt (Ellis 1997: 131) 52. 51F

4.2 Focus on Form Angesichts der häufig beobachteten Defizite im Bereich der deutschen Kerngrammatik bei Schülern mit Deutsch als Zweitsprache (vgl. Kap. 2.4.1) weisen Vertreter formfokussierter Förderung darauf hin, dass komplexe sprachliche Phänomene des Deutschen wie z.B. die Nominalflexion auf einem ausschließlich impliziten Weg oft nicht vollständig erworben werden. So warnt z.B. Rösch (2005c: 119) davor, dass Schüler, die schon lange in Deutschland leben und dennoch bestimmte komplexe Strukturen des Deutschen nicht erworben haben, Gefahr laufen, in ihrer lernersprachlichen Entwicklung zu fossilieren, und empfiehlt deshalb eine „induktive Bewusstmachung“ der kritischen Strukturen. Unterstützt wird diese Annahme durch die Ergebnisse der Jacobs-SommercampStudie, bei der die Effekte impliziter (theaterpädagogischer) und expliziter Sprachförderung im Sinne Röschs systematisch untersucht wurden (vgl. Kap. 1). Die Kinder, die an der expliziten Sprachförderung teilgenommen hatten, schnitten beim anschließenden Grammatiktest signifikant besser ab als die implizite Fördergruppe. Außerdem konnten positive Transfereffekte der expliziten Förderung auf die Lesekompetenz nachgewiesen werden, die auch drei Monate nach der Intervention noch signifikant waren (Rösch 2007a: 288). Explizite Sprachförderung zielt vor allem auf eine Verbesserung morphosyntaktischer Strukturen. Auch die traditionelle Grammatikvermittlung im || 52 Arbeiten, die sich verstärkt mit den Aspekten Kontrolle, Automatisierung und Analyse im Zusammenhang mit implizitem und explizitem Wissen beschäftigen, sind Bialystok (1982) und McLaughlin (1987).

Focus on Form | 145

Fremdsprachenunterricht gehört zu den formfokussierenden Ansätzen. Dieser zeichnet sich meist durch die deduktive Vermittlung von Regeln aus, die dann in isolierten Übungen eingeschliffen werden. Neuere Ansätze betonen dagegen die Wichtigkeit der Verbindung von Form und Funktion und versuchen daher, Formfokussierung in einen bedeutungsvollen Kontext einzubetten (Rösch & Rotter 2010: 218). Um diese Unterscheidung auch begrifflich zu fassen, führte Long (1988, 1991) das Begriffspaar Focus on FormS (FoFS) vs. Focus on Form (FoF) ein. In FoFS-Ansätzes geht es primär um die Vermittlung von Regelwissen und die Reproduktion dieses Wissens in entsprechende Übungen. Ausgehend von einer „strong-interface-position“, die eine direkte Übertragbarkeit expliziten Wissens in implizite Wissensbestände annimmt, wird davon ausgegangen, dass das auf diese Weise systematisch erworbene Sprachwissen in das implizite Sprachsystem des Lerners integriert würde. Rösch & Rotter (2010: 218) fassen die wesentlichen Merkmale des Focus-on-FormS-Ansatzes in Anlehnung an Housen & Pierrard (2005) wie folgt zusammen: – – – – – –

Präventive Festlegung der im Fokus stehenden Form Von ‚außen’ verursachte starke Lenkung der Aufmerksamkeit auf die Form Betrachtung der dekontextualisierten Form Längerfristiger Bruch mit der inhaltsbezogenen Kommunikation Verwendung von grammatischer Terminologie und Metasprache stark kontrollierende und analytische Übungen.

Im Gegensatz dazu geht der Focus-on-Form-Ansatz impliziter vor, indem in möglichst authentischen Sprachhandlungskontexten die Aufmerksamkeit der Lerner auf die sprachlichen Formen gelenkt wird (vgl. Kap. 4.1: NoticingHypothese). Welchen Formen verstärkt Aufmerksamkeit geschenkt wird, ergibt sich nach dem ursprünglichen Ansatz von Long/Robinson (2009, 22–23) aus der Interaktion bzw. konkreter der Bedeutungsaushandlung (negotiation for meaning) zwischen Lehrer und Schüler, wobei gerade dem korrektives Feedback eine wichtige Funktion zukommt. Denn die für die Restrukturierung des lernersprachlichen Systems notwendigen Prozesse des noticing und comparing (bzw. notice-the-gap) werden unterstützt bzw. erst ermöglicht, indem der Lerner seine Äußerung mit der zielsprachlichen Reformulierung durch den Lehrer vergleichen kann. Auch Rösch (2007b: 192) betont in diesem Zusammenhang die Wichtigkeit der Korrektur:

146 | Sprachlehr- und -lernforschung Eine sprachentfaltende Korrektur unterstützt eine Bewusstmachung und Bearbeitung des Regelverstoßes, leitet eine Sprachreflexion ein, die das Interesse der Lernenden auf den Normverstoß lenkt und Impulse zur selbsttätigen Überprüfung, Erläuterung oder auch Korrektur gibt. (Rösch 2007b: 192)

Dieser reaktive Ansatz, der die Aufmerksamkeit nur auf fehlerhafte oder abweichende Strukturen lenkt, die sich mehr oder weniger durch Zufall ergeben, wurde in der Folge durch eine „präventive Formfokussierung“ ergänzt (Rösch & Rotter 2010: 222), bei der im Vorfeld geplant wird, auf welche Formen die Aufmerksamkeit im Unterricht gelenkt wird. Dies kann z.B. durch gezielte Aufgaben, deren Lösung bestimmte sprachliche Strukturen erfordert, oder durch input enhancement erreicht werden (Wong 2005). Bei letztgenanntem werden die fraglichen Strukturen im Input besonders salient gemacht, indem sie z.B. graphisch oder akustisch hervorgehoben, an prominenter Stelle im Satz oder einfach besonders häufig verwendet werden (input flood). Je geplanter die Formfokussierung erfolgt, desto mehr nähert sich die Methodik dem FoFsAnsatz an (Rösch & Rotter 2010: 222). Ein wesentlicher Unterschied zum FoFSAnsatz besteht aber weiterhin darin, dass das Erkennen und Verarbeiten von Form-Funktions-Zusammenhängen als wesentliche Voraussetzung für erfolgreichen Spracherwerb angesehen wird (vgl. auch Ellis 1997): The fundamental assumption of focus on form instruction is that meaning and use must already be evident to the learner at the time that attention is drawn to the linguistic apparatus needed to get the meaning across. (Doughty & Williams 2009), zit. nach (Rösch & Rotter 2010: 223).

In Tab. 17 werden die Unterschiede zwischen den Ansätzen Focus on FormS, Focus on Form und Focus on Meaning tabellarisch gegenübergestellt: Tab. 17. Focus on FormS, Focus on Form, Focus on Meaning (Rösch & Stanat 2011: 155–156)

Leitgedanke

Focus on FormS das Sprachsystem wird sukzessive und als Ganzes eingeführt und eingeübt

Kontext

Inhalte dienen zur Illustration der zu erwerbenden Regel

Ziel

Regelwissen und Regelkönnen

Focus on Form ausgewählte sprachliche Strukturen werden in ihrem FormFunktionszusammenhang erworben Inhalte haben eine über die Formbetrachtung hinausgehende Bedeutung formale Korrektheit

Focus on Meaning Sprache wird durch Verstehen und erfolgreiche Kommunikation erworben

Inhalte dienen als Kommunikationsgrundlage

vorwiegend impliziter Spracherwerb

Language Awareness | 147

Input

Prozess

Focus on FormS Focus on Form gibt Beispiele für die etabliert thematische Formenvermittlung vor Rahmen, verbindet Form mit Bedeutung Anleitung zu regelkon- Lenkung der Aufmerkformer und situations- samkeit auf die Form unabhängiger Sprachverwendung direkt, metasprachlich, entfaltend, reaktiv, outformbezogen put-fordernd

Feedback in Bezug auf sprachstrukturelle Aspekte Rolle der Instruk- die Instruktion thematition und Metasiert die Sprachstruktusprache ren in toto, stark lenkend, folgt grammatischer Progression, Metasprache im Feedback und in den Aufgaben Aufgaben Aufgaben zum Verstehen, Übern und Anwenden der Regel, Distanzierung vom Inhalt

die Instruktion reagiert auf ein rezeptives oder produktives Sprachproblem, lenkt je nach Lernstand, Verwendung von Metasprache nur bei tragfähigen Regeln

Focus on Meaning liefert verständlichen Input, dessen Bedeutung ggfs. ausgehandelt wird Orientierung an thematischen Inhalten bei hohem Redeanteil der Lernenden indirekt durch Recasts

die Instruktion bezieht sich ausschließlich auf die Inhalte und das Erfassen sowie Kommunizieren von Konzepten und Begriffen, keine Verwendung von Metasprache

Aktivität zum Bemerken inhaltsbezogene kommuder „Lücke“ und Erkennikative Aktivitäten nen von Form-FunktionsZusammenhängen

4.3 Language Awareness Entsprechend der Ausführungen in Kap. 4.1 und 4.2 wird der Aufmerksamkeit für sprachliche Phänomene eine große Bedeutung für einen erfolgreichen Spracherwerb beigemessen. Diese Annahme findet sich auch im Rahmen des Konzepts der Language Awareness (LA) (z.B. Rösch & Rotter 2010: 224). Das LAKonzept wurde in den 70er Jahren in Großbritannien entwickelt und zielte ursprünglich darauf ab, ein Bewusstsein für die große Relevanz von Sprache für alle schulischen Lernbereiche zu schaffen (Luchtenberg 2002: 29). In den folgenden Jahren gab es diverse Weiterentwicklungen, wobei den verschiedenen englischen Ansätzen gemeinsam ist, „ein höheres Interesse an und eine größere Sensibilisierung für Sprache, Sprachen, sprachliche Phänomene und dem Umgang mit Sprache und Sprachen wecken zu wollen bzw. die vorhandenen metalinguistischen Fähigkeiten und Interessen zu vertiefen“ (Luchtenberg 1998: 140). James & Garrett (1991) unterscheiden verschiedene Ebenen von Language Awareness, die Wolff (2006: 58) wie folgt zusammenfasst und von denen im

148 | Sprachlehr- und -lernforschung Zusammenhang mit Sprachfördermaßnahmen vor allem die ersten beiden bedeutsam sind: 1.

Die kognitive Domäne, in der es um die Entwicklung von Bewusstheit für Muster, Kontraste, Kategorien, Regeln und Systeme geht.

2.

Die Domäne der Performanz, in der es um die Herausbildung einer Bewusstheit für die Verarbeitung von Sprache, aber auch um die Herausbildung einer Bewusstheit für das Lernen im Allgemeinen und das Sprachlernen im Besonderen geht. Für letztere wird auch der Begriff Sprachlernbewusstheit gebraucht.

3.

Die affektive Domäne, die sich auf die Herausbildung von Haltungen, Aufmerksamkeit, Neugier, Interesse und ästhetisches Einführungsvermögen bezieht.

4.

Die soziale Domäne, in der es um die Entwicklung von Verständnis für andere Sprache, um Toleranz für Minoritäten und ihre Sprachen geht.

5.

Die Domäne der Macht, die sich auf das Vermögen, Sprache im Hinblick auf die ihr unterliegenden Möglichkeiten der Beeinflussung und Manipulation anderer zu durchschauen, bezieht. (Wolff 2006: 58)

Die 1992 gegründete Association for Language Awareness (ALA) definiert das Konzept wie folgt: Language Awareness can be defined as explicit knowledge about language and conscious perception and sensitivity in language learning, language teaching and language use. (ALA Homepage, zit. nach (Luchtenberg 2008: 108)

Auch im deutschen Raum wird Language Awareness seit einigen Jahren unter verschiedenen Perspektiven diskutiert, wobei es neben Aspekten der interkulturellen Kommunikation, kommunikativem Wissen und interkultureller Landeskunde vor allem um Bedeutung, Differenzierung und Zusammenhang von explizitem und implizitem Sprachwissen geht (Luchtenberg 2008: 109) 53. Für die Förderung zweitsprachlicher Fähigkeiten sieht Luchtenberg (2008: 110) vor allem in den folgenden Aspekten von Language Awareness ein großes Potential: 52F

|| 53 Im Zuge dessen wurden verschiedene Begriffe wie „Sprachaufmerksamkeit“, „Sprachbewusstheit“, „Sprachbewusstsein“, „Sprachbetrachtung“, Sprachlernbewusstsein“, „Sprachwissen“, „Sprachsensibilisierung“ etc. eingeführt. Eine klare Abgrenzung der Begriffe und ihrer Konzepte, die sich vor allem in Bezug auf den Grad der Bewusstheit und der Abrufbarkeit sprachlichen Wissens unterscheiden, ist bislang nicht erfolgt. Der status quo dieser theoretischen Diskussion kann in Hug (2007) nachgelesen werden; eine etwas kürzere Darstellung findet sich auch in Lütke (2010a) und Lütke (2010a: 72–73).

Language Awareness | 149

– – – – – –

Aufbau metasprachlichen Bewusstseins zweisprachig aufwachsender Kinder zur Schulung ihrer sprachlichen Analysefähigkeiten Anbahnung von Sprachreflexion Sprechen über Sprache Förderung metasprachlicher Kompetenzen zur Erleichterung inter- und intrakultureller Interaktionen Koordination von Sprachlernen in allen Fächern Unterstützung für den Tertiärsprachenerwerb und den bilingualen Sachfachunterricht

Die Nutzung dieses Potential scheint umso naheliegender, als Kinder mit mehrsprachigem Hintergrund „über ein erhöhtes Maß an Sprachaufmerksamkeit“ zu verfügen scheinen (Lütke 2010a: 78,79). Auch die Ergebnisse aus der DESIStudie scheinen diesen Befund zu stützen (Keßler & Paulick 2010: 266). Der Grund dafür wird darin gesehen, dass „Lernende über den Vergleich der eigenen lernersprachlichen Varietät mit der Zielsprache (comparing) automatisch Aufmerksamkeit auf sprachliche Phänomene lenken“ (Klein 1992, zit. nach Lütke 2010a: 79). Im Rahmen von Sprachlehr- und lernprozessen lässt sich das Potential von Language Awareness insofern erklären, als die gezielte Lenkung der Aufmerksamkeit auf sprachliche Problembereiche die natürlichen noticingund comparing-Prozesse unterstützen kann. So kann eine Bewusstmachung sprachlicher Phänomene dazu führen, dass diese im immensen sprachlichen Input, dem DaZ-Schüler gewöhnlich ausgesetzt sind, überhaupt wahrgenommen und weiterverarbeitet werden bzw. Differenzen zur eigenen Lernergrammatik erkannt werden können (vgl. Kap. 4.1). Sprachliche Phänomene von Medien bis Lauten müssen in den – überwiegend ungesteuerten – Sprachlernprozesse eingeordnet werden. Hier kann die Bewusstmachung sprachlicher Phänomene eine große Hilfe sein, was auch für die Grammatik gilt. (Luchtenberg 2008: 113)

Auch Bredel (2007: 97) sieht in der Förderung von Sprachbewusstheit die große Chance, Schülern das Erkennen einer „qualitativen Differenz zwischen einer aktuell getätigten und einer angezielten Äußerung“ (noticing-the-gap“) zu ermöglichen, so dass „durch gezielte Intervention eine selbstgesteuerte Förderung [...] angeregt werden“ kann. Die Förderung von Sprachbewusstheit ist daher auch erklärtes Ziel des formfokussierten Ansatzes im BeFo-Projekt (Rösch & Stanat 2011: 153, 158).

150 | Sprachstandsdiagnose Weiterhin wird davon ausgegangen, dass sich Sprachbewusstheit im Sprachhandeln beobachten lässt. So zeugten beispielsweise spontane Selbstkorrekturen, die Vermeidung oder Paraphrasierung schwieriger Wendungen oder auch Nachfragen von einer Sensibilität und (z.T. unbewussten) Wahrnehmung sprachlicher Phänomene (Klein 1992, zit, nach Lütke 2010a: 79, 2010a: 72). Auch im englischsprachigen Raum werden Selbstkorrekturen im Sinne des monitoring als Zeichen von metasprachlicher Kompetenz und damit von Sprachbewusstheit gewertet (Ricard & Snow 1990). Selbstkorrekturen können in diesem Verständnis ein Hinweis auf comparing- und noticing-the-gap“Prozesse sein und eignen sie dadurch als „Indikator für sprachliche Bereiche, denen jeweils die Aufmerksamkeit im Lernprozess gilt“ (Ahrenholz 2008e: 68; vgl. auch Klein 1992: 171 und Apeltauer 1987: 230). Auch scheint die Fähigkeit zur erfolgreichen Selbstkorrektur mit zunehmenden Sprachkompetenzen zu steigen (Apeltauer 1987: 230; Landua et al. 2008: 174).

Hintergründe und Anforderungen | 151

5 Sprachstandsdiagnose 5.1 Hintergründe und Anforderungen Ausgelöst durch die alarmierenden PISA-Ergebnisse um die Jahrtausendwende erlebt neben der Entwicklung geeigneter Fördermaßnahmen gegenwärtig auch die Entwicklung verschiedener Verfahren zur Diagnose sprachlicher Kompetenzen einen neuen Boom54. Doch wie der gleichnamige Aufsatz von Reich (2005) zusammenfasst, haben „auch die Verfahren zur Sprachstandsanalyse bei Kindern und Jugendlichen mit Migrationshintergrund […] ihre Geschichte“. Der Anfang dieser Geschichte wird meist im Zusammenhang mit der großen Zahl an Arbeitsmigranten gesehen, die im Zuge des ‚Wirtschaftswunders‘ der 50er-70er Jahre von der BRD angeworben wurden. Nachdem sich spätestens Mitte der 70er Jahre abzeichnete, dass ein Großteil der sogenannten ‚Gastarbeiter‘ und ihrer Familien dauerhaft in Deutschland bleiben würden, wurden die Fragen nach Integration vs. Assimilation, Möglichkeiten der Sprachförderung und eben auch der Sprachstandsdiagnose zunehmend dringlicher gestellt. Den „Drängeleien aus der Praxis“ (Reich 2005: 88) folgte die z.T. überstürzte Entwicklung erster Diagnoseverfahren, zu denen der PI-Test (Fliegner & Gogolin 1980), das soziolinguistische Erhebungsinstrument SES von Portz & Pfaff (1981), PLAV (Bruche-Schulz, Heß & Steinmüller 1985) sowie die SESAM-Ratingskalen von Freese & Stell (1986), ein deutscher C-Test (Süßmilch 1985) und das Verfahren der Profilanalyse (Clahsen 1985) gehörten (vgl. Reich 2005). Verschiedene Gründe, darunter eine generelle Testabneigung, der wissenschaftliche Drang nach Perfektion bei gleichzeitig unzureichender Grundlagenforschung und methodische Mängel führten dazu, dass keines dieser Instrumente dauerhaft eingesetzt wurde und es Ende der 80er Jahre „still, ganz still um die Analyse des Sprachstandes von Migrantenschülern geworden“ war (Reich 2005: 91). Mit Beginn des 21. Jahrhunderts ist eine Vielzahl an neuen Sprachstandsdiagnoseverfahren auf den Markt gekommen, von denen sich jedoch ein Großteil auf den Elementarbereich konzentriert (vgl. Ehlich 2007: 46). So werden mittlerweile in allen Bundesländern noch vor Schuleintritt verschiedene Verfahren zur Diagnose und Förderung des Sprachstandes eingesetzt, um Förderbedarfe mög-

|| 54 Teile dieses Kapitels sind Webersik (2013b) entnommen.

152 | Sprachstandsdiagnose lichst früh zu erkennen und Defizite noch vor Schuleintritt durch geeignete Fördermaßnahmen kompensieren zu können (für einen Überblick siehe Dietz & Lisker 2008; Fried 2004; Schnieders & Komor 2007). Wie jedoch in Kap. 2.4.1 und 3.4 deutlich wurde, weisen auch fortgeschrittene DaZ-Lerner im Grundschulalter noch sprachliche Defizite auf, die nur durch eine „durchgängige Sprachbildung“ während der gesamten Schulzeit behoben werden können (vgl. Gogolin et al. 2010). Sowohl für die Entscheidung. ob eine zusätzliche Sprachförderung notwendig ist (Selektionsdiagnosik) als auch für die Frage, worin genau der Förderbedarf besteht (Förderdiagnostik), werden geeignete Diagnoseverfahren benötigt. Auch die Forderung nach vergleichbaren Diagnoseergebnissen und der dafür notwendigen Standardisierung spielt eine wichtige Rolle. Der Cartoon in Abb. 22 veranschaulicht jedoch treffend, dass neben der Objektivität auch Reliabilität und Validität eines Testverfahrens eine zentrale Rolle spielen (zu den Gütekriterien vgl. Kap. 6.1.3). So kann es kein Sprachstandsdiagnoseverfahren geben, das für alle Personen und Kontexte zugleich geeignet wäre.

Abb. 22. Cartoon zu standardisierten Diagnoseverfahren 55 54F

Sprachstandsdiagnose im Elementarbereich erfordert andere Herangehensweisen als in der Primar- und Sekundarstufe, genauso wie auch der jeweilige sprachliche Hintergrund berücksichtigt werden muss. Zu beachten sind auch || 55 Der Cartoon kursiert vielfach im Internet (z.B. http://morelearning4morestudents.com/ tag/multicultural-learning-and-teaching); die ursprüngliche Quelle konnte jedoch auch nach ausgiebiger Recherche nicht mehr ausfindig gemacht werden.

Hintergründe und Anforderungen | 153

die unterschiedlichen Ziele und Erwerbskontexte: Wird ein Diagnoseverfahren eingesetzt, um grundsätzlich zu prüfen, ob ein Kind die nötigen Voraussetzungen besitzt, um am Regelunterricht teilzunehmen, könnten die Anforderungen des Regelunterrichts als Maßstab gesetzt werden. Diese entspräche dem Baum im Cartoon, wobei man auch die Frage stellen könnte, ob nicht auch der Baum angepasst werden könnte, so dass er den besonderen Eigenschaften und Fähigkeiten aller Tiere entspricht und damit jeder eine faire Chance bekommt, ihn zu erklettern. Geht es jedoch darum, zu überprüfen, ob ein mehrsprachiges Kind sich ‚normal‘ entwickelt, kann nicht der einsprachige Baum (im übertragenen Sinne) die Norm darstellen. Darüber hinaus stellt die Fähigkeit, einen Baum zu erklettern, nur eine Teilkompetenz dar. Ein Diagnoseverfahren, das die Fähigkeit des Bäumekletterns überprüft, sagt demnach noch nichts über die motorische Entwicklung insgesamt aus – auch wenn dies intuitiv naheliegend erscheint. Ähnlich verhält es sich bei Sprachstandsdiagnoseverfahren, die immer nur für die Bereiche valide sind, für die sie konzipiert wurden. So wird von verschiedenen Autoren „die Notwendigkeit der Relevanz und des Nutzens von Testkonstrukten für ihren Anwendungsbereich“ betont. „Denn nicht jeder Test kann für jeden Zweck benutzt werden, gleichgültig wie in sich stimmig er konzipiert ist“ (McNamara 2007: 177, vgl. auch Schmidt-Atzert & Amelang 2012: 143). Neben Kaltenbacher (2011) warnt deshalb auch Ehlich (2007) davor, Tests in Bereichen einzusetzen, für die sie nicht validiert sind: Die große gesellschaftliche Faszination, die von Tests ausgeht, führt leicht dazu, dass einmal entwickelte Verfahren analoghaft auf andere Bereiche übertragen werden. Dies gehört zu den vielleicht gefährlichsten Aspekten der gegenwärtigen Testkultur. [...] Gerade die Hoffnung auf ein objektives Verfahren befördert gegenüber den als subjektivistisch und unzuverlässig wahrgenommenen schulischen Notengebungen eine unkritische Ausdehnung der Anwendung einmal entwickelter Tests über ihren argumentative wohlbegründeten ursprünglichen Zusammenhang hinaus. (Ehlich 2007: 53)

So verführerisch vergleichbare und möglichst einfache Verfahren der Sprachstandsdiagnose sein mögen, entsprechen sie doch selten der Komplexität und Variabilität von Sprache, Sprachkompetenz und Sprachaneignung. Die Anforderungen an Verfahren zur Sprachstandsfeststellung werden derzeit viel diskutiert und wurden in einer umfassenden Expertise zusammengefasst (Ehlich 2005: 2007). Wesentliche Aspekte betreffen u.a. die spracherwerbstheoretische Fundierung, die gezielte Berücksichtigung von Mehrsprachigkeit sowie Fragen der Validierung und Normierung. Für alle drei Punkte werden große Desiderate festgestellt (vgl. auch Döll & Dirim 2011). Dies ist zum einen auf die

154 | Sprachstandsdiagnose Komplexität des Untersuchungsgegenstandes zurückzuführen, zum anderen auf die z.T. schwer vereinbaren Perspektiven von Bildungspolitik, Schulpraxis und unterschiedlichen wissenschaftlichen Disziplinen (v.a. Testpsychologie und Linguistik, vgl. Webersik 2012a: 187–188). So stellt Sprachkompetenz und ihre Aneignung aus linguistischer Sicht ein hochkomplexes, mehrdimensionales Gebilde dar, das am ehesten als „Qualifikationsfächer“ (Ehlich 2005) zu beschreiben ist, bei dem die unterschiedlichen Qualifikationen bzw. Ebenen miteinander interagieren und kaum losgelöst voneinander betrachtet werden können. Diese komplexen Merkmale und Prozesse des Spracherwerbs erfordern aus linguistischer Sicht eine sehr differenzierte und fachlich fundierte (Individual-)Diagnose. Praktiker hingegen fordern möglichst ökonomische, einfach zu handhabende Instrumente. Gerade wenn es um grundlegende Förderentscheidungen bzw. Selektionsdiagnostik geht, ist weiterhin die Objektivität und Vergleichbarkeit der Ergebnisse unabdingbar. Deshalb müssen zumindest solche Verfahren, die zu diesen Zwecken eingesetzt werden, hinsichtlich ihrer Güte überprüft werden. Dies erfordert eine weitgehende Standardisierung der Erhebungs- und Auswertungsmethoden, was die Authentizität der Kommunikation gefährden kann (vgl. Kap. 6.1.3: „externe Validität“). Zudem können standardisierte Verfahren aufgrund der Komplexität von Sprachkompetenz immer nur einen Ausschnitt aus dem Qualifikationsfächer überprüfen, so dass solche Verfahren Kritikern zufolge der „Dynamik kindlicher Entwicklung“ nicht gerecht würden (vgl. Jeuk & Junk-Deppenmeier 2012: 210). Neben den genannten Gründen sind z.T. auch unzureichende methodische Kenntnisse auf linguistischer Seite dafür verantwortlich, dass bisher bei kaum einem Verfahren eine ausreichende Überprüfung der Testgüte erfolgt ist (vgl. Riemer 2008). Da es sich bei der Erforschung des Zweitspracherwerbs um eine recht junge Disziplin handelt, fehlt es zudem in vielen Bereichen noch an Grundlagenforschung. Dies betrifft vor allem pragmatische, diskursive und semantische Bereiche des Spracherwerbs (Bredel et al. 2008). Im Vergleich dazu relativ gut beforscht sind morpho-syntaktische und lexikalische Aspekte. Aufgrund dieser Forschungslage beziehen sich auch die meisten existierenden Diagnoseverfahren für die Primarstufe auf diese Bereiche (vgl. Ehlich 2007: 47), während für die Diagnostik pragmatischer, diskursiver und semantischer Fähigkeiten große Desiderate festgestellt werden (Reich 2009: 16).

Sprachstandsdiagnoseverfahren | 155

5.2 Sprachstandsdiagnoseverfahren Im Rahmen der vorliegenden Arbeit ist zu prüfen, ob sich die existierenden Diagnoseverfahren für die Evaluation sprachlicher Fördermaßnahmen eignen. Dabei ist es aus Gründen der Vergleichbarkeit von großer Bedeutung, dass die Instrumente objektiv, reliable und valide sind, damit die Ergebnisse auch im Kontext didaktischer und bildungspolitischer Entscheidungen verwertbar sind. Auch geht es bei der Evaluation von Fördermaßnahmen im Gegensatz zu Individualdiagnostik nicht darum, den Sprachentwicklungsstand einzelner Schüler möglichst differenziert zu erfassen, sondern darum, Aussagen über die Wirksamkeit einer Fördermaßnahme für die untersuchte Stichprobe treffen zu können. Die Forderung, den methodischen Standards der Testpsychologie gerecht zu werden, ist daher für Instrumente im Rahmen von Evaluationsstudien unabdingbar. Die Validität, die oft als wichtigstes Gütekriterium aufgeführt wird, betrifft die Frage danach, ob ein Instrument das misst, was es messen soll. Ein Sprachstandsdiagnoseverfahren, bei dem die Versuchsteilnehmer beispielsweise Fragen zu dem Märchen „Der gestiefelte Kater“ beantworten sollen, würde zunächst erfassen, ob die Versuchspersonen das Märchen kennen, und nicht, ob sie die Fragen verstehen, bzw. ob sie ausreichend Deutsch können, um die Fragen zu beantworten. Untersuchungsgegenstand der vorliegenden Arbeit ist die produktive, medial mündliche schulsprachliche Kompetenz von Primarschülern, deren wesentliche Voraussetzung das Beherrschen der deutschen Kerngrammatik und Lexik darstellt. Da diese Voraussetzung bei vielen Primarschülern mit Deutsch als Zweitsprache noch nicht gegeben ist (vgl. Kap. 2.4.1), müssen gerade in Bezug auf morpho-syntaktische und lexikalische Phänomene die besonderen Merkmale und Prozesse des Zweitspracherwerbs berücksichtigt werden (= spracherwerbswissenschaftliche Fundierung). Weiterhin sollte das Verfahren ökonomisch sein. Bei dem Kriterium der Ökonomie handelt es sich nach Lienert & Raatz (1998) um ein Nebengütekriterium, das aber bei (experimentellen) (Feld)studien mit großen Stichproben sehr bedeutsam sein kann. Denn eine detaillierte und differenzierte Analyse, wie sie bei der Ermittlung individueller Sprachentwicklungsverläufe erforderlich ist, ist sehr zeit- und personalaufwändig und lässt sich bei großen Fallzahlen nur schwer umsetzen. Außerdem geht es wie oben beschrieben bei der Evaluation von Fördermaßnahmen um generelle Befunde zur Wirksamkeit der untersuchten Fördermaßnahmen und weder um linguistische Grundlagenforschung, die individuelle Merkmale von Spracherwerbsprozessen ermittelt soll, noch um eine differenzierte Förderdiagnostik.

156 | Sprachstandsdiagnose Ein Diagnoseverfahren, das sich in diesem Sinne für die Zielsetzung der vorliegenden Arbeit eignen soll, muss demnach die folgenden Kriterien erfüllen: – – –

Spracherwerbswissenschaftliche Fundierung Erfüllung der psychodiagnostischen Testgütekriterien Geltungsbereich (Untersuchungsgegenstand und Zielgruppe): 1. 2. 3.

produktive, medial mündliche schulsprachliche Kompetenz Morphologisch-syntaktische Basisqualifikation (Kerngrammatik) und Lexik fortgeschrittene DaZ-Lerner (mind. 3–4 Kontaktjahre, 2. Hälfte der Primarstufe)

Untersucht man die existierenden Verfahren nach ihrer Testgüte, so stellt man fest, dass die wenigsten Verfahren hinsichtlich der Kriterien Validität, Objektivität und Reliabilität überprüft wurden (Schöler & Grabowski 2007: 545). Ein Blick in die Zusammenstellung von Schnieders und Komor bestätigt dies (Schnieders & Komor 2007). Darüber hinaus berufen sich einige Diagnosverfahren zwar auf die klassischen Gütekriterien, weisen diese aber nur unzureichend oder gar nicht nach (Gräfe-Bentzien 2000: 26). Aus psychologischer Sicht liegen daher selbst für den Bereich der Morpho-Syntax, der als relativ gut beforscht angesehen wird, praktisch keine „eigenständigen standardisierten Tests“ vor, was primär auf die Vorbehalte von Seiten der Linguistik gegenüber Tests zurückgeführt wird (Schöler 2006: 907). Doch auch hinsichtlich der spracherwerbswissenschaftlichen Fundierung werden bezogen auf Sprachstandsdiagnoseverfahren große Desiderate festgestellt (vgl. Schnieders & Komor 2007: 321–330). Auch wenn fast alle Diagnoseverfahren in Teilen auch morphologischsyntaktische Aspekte berücksichtigen, liegen nach Schöler & Grabowski (2007: 545) „für die Prüfung grammatischer Fähigkeiten […] so gut wie keine eigenständigen standardisierten Tests vor“. Auch Rösch (2011) weist auf die Notwendigkeit hin, Diagnoseinstrumente zu entwickeln, die die „Feinheiten des Spracherwerbs“ v.a. im morphologischen Bereich angemessen untersuchen. Weiterhin wird meist nicht explizit zwischen gesprochener und geschriebener Sprache unterschieden (vgl. Bredel 2007: 95). Auch Eriksson kommt zu dem Ergebnis, dass „keine standardisierten Tests zur Erfassung mündlicher Sprachkompetenzen“ vorliegen (Eriksson 2006: 69). Die Tests, die auch gesprochene Sprache untersuchen, berücksichtigen nicht ausreichend die Textsorten- oder Registerspezifik der jeweiligen Gesprächssituation (Ricard & Snow 1990: 251; Ahrenholz 2003a: 295). Dabei ist es für eine linguistisch fundierte Analyse von

Sprachstandsdiagnoseverfahren | 157

entscheidender Bedeutung, ob es sich z.B. um ein alltägliches, umgangssprachliches oder ein formelles Register handelt. Die Grundlage der Verfahren, in denen Spontansprache untersucht wird, bilden meist alltagssprachliche Sprachproben. Dies ist primär darauf zurückzuführen, dass sich die meisten Diagnoseverfahren auf den vorschulischen Bereich konzentrieren, wo andere Register kaum zu erwarten sind (Reich 2009: 16). Für die gezielte Erfassung produktiver, medial mündlicher schulsprachlicher Kompetenz liegt daher bislang kein Diagnoseverfahren vor. Von den wenigen Verfahren, die als standardisiert oder zumindest halbstandardisiert angesehen werden können 56 eignen sich nur das Sprachstandserhebungsverfahren für Kinder im Alter zwischen 5 und 10 Jahren (SET 5–10) von Petermann (2010), der Heidelberger Sprachentwicklungstest (HSET) von Grimm, der Potsdam-Illinois Test für psycholinguistische Fähigkeiten (P-IPTA), der Allgemeine deutsche Sprachtest (ADST) von Steinert (2011) und die Sprachstandsüberprüfung und Förderdiagnostik für Ausländer- und Aussiedlerkinder (SFD) von Hobusch et al. (2002) auch für Kinder in der zweiten Hälfte der Primarstufe. Das Hamburger Verfahren zur Analyse des Sprachstandes bei 5-jährigen (HAVAS 5) von Reich (2003), das ebenfalls als halbstandardisiertes Verfahren betrachtet werden kann, wurde zuletzt aufgrund seiner wissenschaftlichen Fundierung und mehrsprachigen Ausrichtung positiv hervorgehoben. Doch auch dieses Verfahren richtet sich an Kinder im Vorschulalter, und es gibt bisher keine Veröffentlichung zur Testgüte, sondern lediglich einen inoffiziellen Bericht von May (o.J.). Mit dem Verfahren Linguistische Sprachstandserhebung – Deutsch als Zweitsprache (LiSe-DaZ) (Schulz 2011) liegt erstmals ein ausreichend normiertes und spracherwerbstheoretisch fundiertes Diagnoseverfahren vor, das die besonderen Merkmale des Zweitspracherwerbs berücksichtigt. Doch auch LiSe-DaZ ist primär für den vorschulischen Bereich konzipiert und lässt sich nur bei Schülern bis zu einem Alter von 7; 11 Jahren und 0–71 Kontaktmonaten mit der deutschen Sprache einsetzen. Während die Verfahren HSET und ADST für Kinder mit Deutsch als Erstsprache konzipiert sind und daher für die Zielgruppe der vorliegenden Arbeit nicht in Frage kommen, eignen sich die Verfahren SET 5–10 und SFD zumindest den Angaben der Testautoren zufolge auch für Schüler mit Migrationshintergrund. Auch das Verfahren P-IPTA schließt die Zielgruppe zwei- und mehrsprachiger Schüler insofern mit ein, als in der Normstichprobe auch mehrsprachige Kinder enthalten sind. 5F

|| 56 vgl. die Übersicht in Jeuk (2010: 83–93)

158 | Sprachstandsdiagnose In Tab. 18–20 werden die Subtests dieser drei Verfahren tabellarisch zusammengefasst: Tab. 18. Subtests des Sprachstandsdiagnoseverfahren SET 5–10 (Petermann 2010) SET 5–10

Auf Bildkarten dargestellte Begriffe und Handlungen benennen (z.B. Erdbeere, Auto waschen) Lexik/ Semantik Kategorienbildung: Bezogen auf Abbildungen das übergeordnete Konzept erkennen und verbalisieren (z.B. Pflaume, Ananas, Orange, Banane  Obst) Handlungsanweisungen mithilfe von kleinen Figuren umsetzen (z.B. „Der Junge steht neben der Bank.“ „Der Junge, der über das Schaf springt, hat Hörverständnis die Ente auf dem Kopf.“) Multiple-Choice-Fragen zu kurzen Texten beantworten Pluralformen zu vorgelesenen existierenden und erfundenen Substantiven angeben (z.B. „Das ist eine Katze. Das sind viele….“, „Das ist eine Girame. Das sind viele…“) Erkennen inkorrekter Sätze (5–6 Jahre) bzw. Erkennen + Korrektur inkorGrammatik rekter Sätze (7–10 Jahre). Fehler liegen größtenteils bei den verbalen Bestandteilen und den Artikelformen, z.B. *„Ich habe ausgetrinkt.“, *„Das Kind freut sich auf die Ausflug.“) Bildergeschichte versprachlichen. Auswertung nach inhaltlichen und grammatischen Kriterien (Gebrauch von Artikeln und Pronomen, Flexion, Lexik, Kohärenz, Flüssigkeit, Abbrüche) Sprachproduktion Aus vorgegebenen Wörtern einen korrekten Satz bilden (z.B. fliegen, Vogel  „Ein Vogel kann fliegen.“) Auditive Merkfä- Kunstwörter nachsprechen (z.B. fatong, sichlanop) (5–6 Jahre) higkeit Sternsuche: Strukturiert angebotene Symbolreihen werden präsentiert, und innerhalb einer festgesetzten Zeit soll das Zielbild (Stern) abgestrichen Verarbeitungswerden, z.B. geschwindigkeit

Sprachstandsdiagnoseverfahren | 159

Tab. 19. Subtests des Sprachstandsdiagnoseverfahren SFD (Hobusch, Lutz & Wiest 2002) SFD Lexik/ Semantik Hörverständnis

Grammatik

Sprachproduktion

Bilder identifizieren (1. Kl.) bzw. Synonyme/Ober-/Unterbegriffe erkennen Farbenkenntnisse (z.B. „Welche Farbe hat dieser Stift?“) (1. Klasse) Vorgelesene Sätze Abbildungen zuordnen (1. Klasse) Fragen zu einer kurzen Geschichte beantworten (1. und 3./4. Klasse) Pluralformen zu vorgegebenen Substantiven, die zusätzlich auf Bildern abgebildet sind, angeben (z.B. „Das ist ein Haus. Das sind viele…“) (1. Klasse) Aufforderungen mit Präpositionen umsetzen (z.B. „Setze den Teddy auf den Stuhl“), ab Klasse 3 Lückentext, in dem Präpositionen ergänzt werden müssen Fragen nach der Positionierung von Kuscheltieren unter Verwendung von Präpositionen beantworten (z.B. „Wo sitzt der Teddy?“ Antwort: „Auf dem Stuhl.“) (2.-4. Klasse) Durch die Auswahl des Artikels Genus und Kasus bestimmen (ab 2. Klasse) Bildergeschichte versprachlichen (qualitative, inhaltlich orientierte Auswertung)

Tab. 20. Subtests des Sprachstandsdiagnoseverfahren P-ITPA (Esser & Wyschkon 2010) P-ITPA Lexik/ Semantik Hörverständnis

Grammatik

Auditive Merkfähigkeit

Sprachliche Analogien bilden (z.B. „Im Winter ist es kalt, im Sommer ist es…“) Anhand einer Umschreibung passende Wörter benennen (z.B. „Ich denke an etwas, das hat einen Schwanz. Was könnte das sein?“) Mit Unterstützung von Bildern Sätze vervollständigen, durch die Pluralformen, Adjektivsteigerungen, Perfekt- und Präteritums- sowie Kasusformen abgefragt werden (z.B. „Das ist eine Katze [Bild zeigen], „das sind zwei [Bild zeigen]…“) Semantisch inkorrekte, aber grammatisch fehlerfreie Sätze nachsprechen (z.B. „Häuser können fliegen.“)

Immer länger werdende, schnell vorgetragene Reimfolgen korrekt wiederholen (z.B. sagen, tragen, schlagen) Reimwörter finden (nur Vorschulkinder) Phonologische Vokale ersetzen (z.B. „Mach aus dem ‚o‘ in ‚Hose‘ ein ‚a‘ und sag‘ das neue Bewusstheit Wort.“) Konsonanten auslassen (z.B. „Sag mal Gras ohne ‚r‘.“) Wortabruf, Buch- Lautes Vorlesen sinnvoller und sinnfreier Wörter stabensynthese Aufschreiben diktierter Wörter (älteren Kindern werden sinnfreie PseudoRechtschreibung Wörter diktiert) Lesefähigkeiten Einzelne sinnvolle und sinnfreie Wörter (z.B. graben, burkeln) laut vorlesen

160 | Sprachstandsdiagnose Schon dieser knappe Überblick der Subtests offenbart, dass es allen drei Verfahren zumindest hinsichtlich der besonderen Bedingungen des Zweitspracherwerbs mehrsprachiger Schüler an spracherwerbswissenschaftlicher Fundierung mangelt. So scheint sich beim SET 5–10 und beim P-ITPA die Berücksichtigung von Mehrsprachigkeit darin zu erschöpfen, dass die Normstichproben auch einen kleinen Anteil mehrsprachiger Kinder enthalten: In keinem der beiden Verfahren sind die Normdaten im Hinblick auf diese mehrsprachigen Kinder differenziert aufgeführt, noch wird das Thema der Mehrsprachigkeit behandelt. Gleichwohl erhebt der SET 5–10 den Anspruch, gerade auch für diese KlientInnengruppe geeignet zu sein (Petermann, 2010, Umschlagtext). Im Handbuch des SET 5–10 werden jedoch keinerlei Aussagen darüber gemacht, ob sich der Test nur zur Beurteilung von monolingualen Kindern eignet oder ob er auch sinnvoll bei mehrsprachigen Kindern eingesetzt werden kann. Eine Begründung für die Aufnahme von mehrsprachigen Kindern in die Normstichproben fehlt bei beiden Verfahren ebenso wie ein Hinweis zum Umgang mit mehrsprachigen Kindern in der Diagnostik und zur Interpretation der Ergebnisse. (Lüke 2011: 167)

Auch die SFD basiert Schnieders & Komor (2007: 273–274) zufolge lediglich auf einer Alltagsauffassung von Sprache, wodurch nach Jeuk (2009: 76) zwar viele Bereiche der Morphosyntax abgedeckt würden, die für mehrsprachige Kinder bedeutsam sind, andere Bereiche wie die Wortschatzuntersuchung aber kritisch zu beurteilen seien, da sich diese fast ausschließlich auf Nomen beschränke, obwohl Studien zum fortgeschrittenen Zweitspracherwerb den verbalen und adjektivischen Wortschatz als aussagekräftigeren Indikator einschätzen (vgl. Kap. 3.4.1) 57. Durch einige der Subtests (z.B. zu Präpositionen und Artikelformen) werden in den drei Verfahren auch sprachliche Bereiche berücksichtigt, die Grundschülern mit Deutsch als Zweitsprache erwiesenermaßen Schwierigkeiten bereiten. Die Auswertungsmethode erscheint jedoch wenig differenziert und wird der Komplexität von Spracherwerbsprozessen nicht gerecht. So wird in den grammatikalischen Subtests wie z.B. der Korrektur inkorrekter Sätze (SET 5–10) bei der Auswertung nicht zwischen den verschiedenen zu korrigierenden sprachlichen Phänomenen differenziert, obwohl diese ganz unterschiedliche linguistische Bereiche betreffen können. Kritisch zu sehen ist außerdem, dass die grammatikalische Analyse vorwiegend durch enge Testaufgaben in Form von Lückentexten durchgeführt wird. Zwar werden in der SFD und dem SET 5–10 anhand einer Bildergeschichte auch freie Sprachproben erhoben, für deren 56F

|| 57 Positiv hervorzuheben ist jedoch, dass zumindest die Wortschatzüberprüfung für die 1. Klasse auch in diversen Erstsprachen der Schüler möglich ist Hobusch et al. (2002: 6).

Sprachstandsdiagnoseverfahren | 161

Analyse dann aber entweder gar kein standardisiertes Auswertungsverfahren zur Verfügung steht (SFD) oder die Objektivität des Kodierverfahrens (Auswertungsobjektivität) nicht geprüft wurde (SET 5–10). Auch die besonderen Merkmale schulsprachlicher Kompetenz finden in keinem der Verfahren Berücksichtigung. Ein weiterer kritischer Punkt betrifft die Güte der vorgestellten Verfahren. So wird gerade in Bezug auf die SFD die geringe Größe der Normstichprobe, die zudem nur Erstklässler berücksichtigt, kritisiert (Roth 2010: 36). Für den SET 5– 10 und den P-ITPA konnte die Testgüte zufriedenstellend nachgewiesen werden und auch die Normierungen erfolgten anhand ausreichend großer Stichproben (vgl. www.testzentrale.de). Zu hinterfragen ist jedoch die Validität dieser Verfahren für die Diagnose des Sprachentwicklungsstandes mehrsprachiger Schüler, die mehr oder weniger undifferenziert mit aphasisch oder entwicklungsgestörten bzw. -verzögerten Kindern in einen Topf geworfen werden. So heißt es bezogen auf die Zielgruppe des SET 5–10: Das Verfahren richtet sich an Kinder mit Sprachentwicklungsverzögerungen oder störungen sowie an Kinder mit Lernbehinderungen, Aphasien oder Kinder mit Migrationshintergrund. (Petermann 2010: 8)

Abgesehen davon, dass es auch aus ethischen Gründen problematisch ist, Kinder mit Migrationshintergrund auf die gleiche Stufe mit entwicklungs- bzw. aphasisch gestörten und/oder lernbehinderten Kindern zu setzen, werden hier sehr unterschiedliche Zielgruppen zusammengefasst, auf die jedoch weder bezogen auf die konkrete Durchführung des Tests noch bezogen auf die Interpretation der Ergebnisse differenziert wird. Sowohl beim SET 5–10 als auch beim P-ITPA scheinen klinische Zwecke, d.h. die Diagnose von Sprachentwicklungsstörungen, im Vordergrund zu stehen, was sich, wie oben dargestellt, v.a. in der Auswahl der sprachlichen Bereiche und ihrer Auswertung widerspiegelt. So wird darauf hingewiesen, dass Fehlerschwerpunkte bei Kindern mit Sprachentwicklungsstörungen u.a. im Bereich der Subjekt-Verb-Kongruenz (vgl. Clahsen et al. 2014; Rothweiler et al. 2012) und der (regelmäßigen) Verbflexion liegen, während diese Bereiche im ungesteuerten Zweitspracherwerb relativ schnell erworben werden (Jeuk (2007b: 198, vgl. auch Kap. 3.4.2.2). Für die Diagnose des Sprachstandes in der Zweitsprache Deutsch sind diese Verfahren daher nicht oder allenfalls eingeschränkt valide Ein weiteres Verfahren, dessen Güte zwar bislang noch nicht nachgewiesen wurde, das aber aufgrund des Untersuchungsgegenstandes und der Zielgruppe für das vorliegende Verfahren von Interesse ist, ist Tulpenbeet von Reich et al.

162 | Sprachstandsdiagnose (2008). Neben pragmatischen und semantischen werden vor allem solche sprachlichen Phänomene untersucht, die als Merkmale konzeptioneller Schriftlichkeit Auskunft über schulsprachliche Fähigkeiten geben. Insgesamt stehen textbezogene Kriterien im Vordergrund, da Tulpenbeet am Ende der Grundschulzeit, d.h. am Übergang in die Sekundarstufe eingesetzt werden soll, und die Autoren davon ausgehen, dass es zu diesem Zeitpunkt eher um institutsspezifische Anforderungen im Sinne der „Pragmatischen Basisqualifikation II“ (vgl. Ehlich et al. 2008a) als um grammatikalische Wohlgeformtheit geht (Gantefort & Roth 2010: 583). Wie HAVAS 5 (Reich 2003), auf dessen Grundlage Tulpenbeet entwickelt wurde, liegt auch dieses Verfahren in weiteren Sprachen (Russisch und Türkisch) vor. Die Datengrundlage des Verfahrens bilden schriftliche Schülertexte, die mit Hilfe einer Bildergeschichte elizitiert wurden. Die Sprachproben werden anschließend anhand der in Abb. 23 dargestellten „Indikatoren ausgewertet und ergeben dann ein individuelles schriftsprachliches Kompetenzprofil“ (Reich, Roth & Gantefort 2008, 1 Anhang) 58: 57F

Abb. 23. Sprachliche Dimensionen und Indikatoren von Tulpenbeet nach Gantefort & Roth (2008: 31)

Die Darstellung der theoretisch in Frage kommenden Diagnoseverfahren zeigt, dass sich keines der Instrumente für die Evaluierung von Fördereffekten im Sinne der Zielsetzung der vorliegenden Arbeit eignet. Den wenigen existieren|| 58 Für eine ausführlichere Beschreibung des Verfahrens siehe Gantefort & Roth (2008); Reich et al. (2008)

Sprachstandsdiagnoseverfahren | 163

den standardisierten Verfahren mangelt es an spracherwerbswissenschaftlicher Fundierung. Darüber hinaus untersucht keines der Verfahren gesprochene Schulsprache. Die Tatsache, dass es kaum standardisierte Sprachstandsdiagnoseverfahren gibt, lässt sich auch auf die Komplexität und Mehrdimensionalität von Spracherwerbsprozessen zurückführen, deren Abbildung durch quantifizierende Verfahren eine besondere Herausforderung darstellt. Anders verhält es sich bei Instrumenten zur „Leistungs- bzw. Lernfortschrittsmessung“ (Glaboniat 2010: 1289), bei denen sich die Bereiche, in denen Effekte zu erwarten sind, relativ klar eingrenzen und definieren lassen: Quantifizierende Tests überprüfen genau eingrenzbare und definierbare Bereiche [...] Diese analytische Selbstbeschränkung und die damit verbundene Reduktion des Beobachtungsgegenstandes auf einzelne Merkmale ist einer Analyse des Sprachstandes nicht angemessen. Denn es kann bei einer Analyse des Zweitspracherwerbs ausländischer Kinder nicht darum gehen, erreichte Lernziele wie z. B. beim kontrollierbaren Fremdsprachenunterricht zu testen, sondern die Ergebnisse und den bereits erreichten Stand eines unkontrollierten und wegen seiner unüberschaubaren Beeinflussungen auch unkontrollierbaren Erwerbsprozesses […] zu erfassen und zu beschreiben. Der Sprachstand läßt sich daher nicht als Leistung in einer Prüfungssituation messen, sondern kann nur als tatsächlicher Sprachgebrauch in möglichst natürlichen Kommunikationssituationen beobachtet werden. Darüber hinaus geht es darum, ein möglichst umfassendes Bild des erreichten Sprachstandes einschließlich seiner Defizite und Lücken zu erhalten und nicht nur einen definitorisch begrenzten Ausschnitt zu überblicken. (Steinmüller 1984: 314–315)

Geht es um Fördereffekte im Bereich Deutsch als Zweitsprache spielen gesteuerte und ungesteuerte Aspekte des Spracherwerbs- bzw. -lernens zusammen. Zwar geht es ausdrücklich nicht um die Diagnose individueller Sprachstände, aber eben auch nicht um kontrollierbaren Fremdsprachenunterricht. Bei der Erfassung von Fördereffekten geht es weniger um den einzelnen Schüler als die gesamte geförderte Gruppe, denn Fördermaßnahmen werden im Regelfall für größere Gruppen konzipiert und können nur bedingt individualisiert werden. Um solche Effekte nachweisen zu können, muss eine ausreichend große Stichprobe untersucht werden, und die Versuchspersonen sollten zufällig Treatment- und Kontrollgruppen zugewiesen werden. Weiterhin müssen die Instrumente verlässlich, objektiv und valide sein, damit belastbare Evaluationsergebnisse erzielt werden können (Felbrich et al. 2012: 160; vgl. auch Settinieri 2012: 48). Letztere werden u.a. als Grundlage für didaktische und bildungspolitische Entscheidungen dringend benötigt (vgl. Kap. 1). Wichtig ist in diesem Zusammenhang auch die Kontrolle von Störfaktoren bzw. Drittvariablen, die die Untersuchungsergebnisse beeinflussen können. Nur so lassen sich die Veränderungen der abhängigen Variablen (d.h. der Sprachkompetenz der

164 | Sprachstandsdiagnose Förderschüler) möglichst eindeutig auf den Einfluss der unabhängigen Variablen (d.h. der Förderintervention) zurückführen. Während teststatistisch geprüfte Instrumente in vielen wissenschaftlichen Disziplinen zum Standard gehören, sind sie in der Linguistik und Spracherwerbsforschung bislang eher die Ausnahme. Dies liegt zum einen an der Komplexität und Mehrdimensionalität der Untersuchungsgegenstände Sprache bzw. Sprachkompetenz und Spracherwerb/-lernen, zum anderen an einer lückenhaften Grundlagenforschung, zu einem großen Teil aber auch an fachspezifischen Traditionen. So beinhalten linguistische Studiengänge z.T. bis heute keine methodisch-statistische Ausbildung. Psychologen, Sozialwissenschaftlern und Bildungsforschern fehlt dagegen bezogen auf Sprachkompetenz und Spracherwerb die fachbezogene Ausbildung. Im Zusammenhang mit Verfahren zur Sprachstandsdiagnose wird in der aktuellen wissenschaftlichen Literatur deshalb zu Recht immer wieder die Notwendigkeit einer interdisziplinären Kooperation zwischen Linguistik, Didaktik und Psychologie hervorgehoben bzw. das Fehlen einer solchen Kooperation kritisiert (Reich 2009: 15; Jeuk 2010: 79; Schöler & Grabowski 2007; Settinieri 2012, 49). Auch Bredel (2007) kommt in ihrem Überblicksartikel zu Formen der Sprachstandsmessung zu diesem Ergebnis: Eine interdisziplinäre Kultur zwischen Sprachwissenschaft, Sprachdidaktik und Psychologie konnte sich weder theoretisch noch institutionell etablieren. (Bredel 2007: 77)

In diesem Zusammenhang weist Riemer zu Recht darauf hin, dass „forschungsmethodologisch kontrollierte empirische Forschung, massiv die Zukunft des Fachs [Deutsch als Zweit- und Fremdssprache] als akademische Disziplin bestimmen wird.“ (Riemer 2008: 2) Umso besorgniserregender ist die folgende Feststellung: Empirische Forschung im Bereich DaF/DaZ ist dadurch gekennzeichnet, dass in anderen Disziplinen erreichte Standards (z.B. in der Psychologie und dabei v.a. in der pädagogischen Psychologie, in empirischer Erziehungswissenschaft und Sozialwissenschaft) in unserem Fach nicht durchgängig eingehalten werden, oft gar nicht eingehalten werden können – und dies gilt sowohl für quantitative als auch für qualitative Forschung. (Riemer 2008: 2)

Die existierenden Testverfahren werden meist in psychologischen Forschungskontexten entwickelt, in denen sprachwissenschaftliche und spracherwerbsbezogene Erkenntnisse nicht oder nur unzureichend berücksichtigt werden (Bredel 2007: 77), so dass es den Verfahren an der nötigen linguistischen Fundierung mangelt (Reich 2009, 15) und sie daher nur als eingeschränkt valide einzuschätzen sind. „Die Spracherwerbsforschung ihrerseits hat sich in der

Sprachstandsdiagnoseverfahren | 165

Regel wenig um die konkrete Anwendbarkeit ihrer Forschungsergebnisse gekümmert“ (Jeuk 2009: 63). Im Vordergrund linguistischer Untersuchungen stand weniger die Frage nach der Messbarkeit sprachlicher Kompetenz als die möglichst genaue Analyse sprachsystematischer Strukturen, die Erforschung von Spracherwerbsprozessen oder die detaillierte Analyse individueller Sprachprofile. Viele sprachwissenschaftliche Studien sind daher „als mehr oder weniger umfassende Fallstudien zu betrachten, deren Verallgemeinerbarkeit problematisch erscheint“ (Ahrenholz 2008e: 69). Dies führte auf Seiten der Testpsychologen wiederum dazu, dass die von Sprachwissenschaftlern entwickelten Verfahren „als wenig praxistauglich, unökonomisch und nicht den Gütekriterien entsprechend eingeschätzt“ werden (Bredel 2005: 78f, zit. nach Jeuk & Junk-Deppenmeier 2012: 211–212). Wenn die Wirksamkeit von Sprachfördermaßnahmen untersucht werden soll, um als Grundlage für pädagogische, bildungs- oder gesellschaftspolitische Entscheidungen zu dienen, ist die adäquate Berücksichtigung linguistischdidaktischer und methodisch-diagnostischer Erkenntnisse unverzichtbar: Während Sprachwissenschaft, Spracherwerbsforschung, Sprachlehr- und lernforschung sowie Sprachdidaktik das Wissen über zweitsprachliche Erwerbsund Lernprozesse bereitstellen, liefern traditionell empirisch orientierte Disziplinen, insbesondere die (Test-)Psychologie, die methodischen Standards sowie das nötige Handwerkszeug zur Planung, Durchführung und statistischen Auswertung empirischer Studien (vgl. auch Söhn 2005). Gerade weil die Ergebnisse von Evaluationen große Auswirkungen auf Menschen haben können, müssen sie höchsten Anforderungen und methodischen Standards genügen (Moosbrugger & Schweizer 2002: 20).

166 | Entwicklung eines empirischen Verfahrens zur Evaluation von Fördereffekten

6 Entwicklung eines empirischen Verfahrens zur Evaluation von Fördereffekten 6.1 Methodische Grundlagen Wesentliche Kriterien für die Messgenauigkeit diagnostischer Verfahren wurden im Rahmen der klassischen Testtheorie (KTT) entwickelt. Was unter Test zu verstehen ist, wird dabei unterschiedlich definiert (vgl. die Auflistung diverser Definitionen in Schmidt-Atzert & Amelang 2012: 37). Im Rahmen der vorliegenden Arbeit scheint die Definition von Kubinger (2009) passend: Ein psychologisch-diagnostisches Verfahren (vereinfacht oft „Test“ genannt) erhebt unter standardisierten Bedingungen eine Informationsstichprobe über einen (oder mehrere) Menschen, indem systematisch erstellte Fragen/Aufgaben interessierende Verhaltensweisen oder psychische Vorgänge auslösen; Ziel ist es, die fragliche Merkmalsausprägung zu bestimmen. (Kubinger 2009: 10)

In diesem Sinne kann auch eine Untersuchung als Test gelten, wenn sie neben anderen Faktoren eine relative Positionsbestimmung des untersuchten Individuums innerhalb einer Gruppe von Individuen oder in Bezug auf ein bestimmtes Kriterium, z.B. ein Lehrziel, ermöglicht; und […] bestimmte empirisch [...] abgrenzbare Eigenschaften, Verhaltensdispositionen, Fähigkeiten, Fertigkeiten oder Kenntnisse prüft. (Lienert & Raatz 1998: 1)

6.1.1 Merkmal und Konstrukt Vor der Testkonstruktion sollte das zu untersuchende Merkmal angemessen definiert bzw. beschrieben werden, um daraus abgeleitet Testitems konstruieren zu können, die das Merkmal in geeigneter Weise abbilden. Während es sich beim Merkmal um tatsächliche (wahre) Verhaltensweisen oder Eigenschaften handelt, stellt das Konstrukt eine theoretische Modellierung des Merkmals dar. Letztere ist notwendig, wenn das eigentlichen Merkmal nicht direkt beobachtbar ist. So lassen sich konkrete Merkmale wie Größe oder Gewicht direkt erfassen, komplexere Merkmale wie Intelligenz oder Sprachkompetenz sind der direkten Beobachtung dagegen nicht zugänglich. Bezogen auf die Fragestellung der vorliegenden Untersuchung ist das eigentliche Merkmal die produktive, medial mündliche schulsprachliche Kompetenz

Methodische Grundlagen | 167

von Primarschülern mit Deutsch als Zweitsprache. Dieses Merkmal ist der direkten Beobachtung jedoch nicht zugänglich. Auch gibt es kein Kriterium, das zweifelsfrei als valides Maß fungieren könnte, so dass das Merkmal anhand eines theoretischen Konstrukts beschrieben werden muss. Da bislang keine umfassende Konzeptualisierung von gesprochener Schulsprache vorliegt, wurde das zu untersuchende Konstrukt in Kap. 2.3.5 unter Rückgriff auf Modellierungen der Konzepte Mündlichkeit und Schriftlichkeit sowie die vorliegenden Arbeiten zu Merkmalen von Schul- bzw. Bildungssprache beschrieben. Als grundlegende Voraussetzung für schulsprachliche Kommunikation wurde die Beherrschung der Kerngrammatik und Lexik im Sinne der Standardsprache identifiziert (vgl. Kap. 2.4.1). Da diese Kompetenz bei DaZ-Schüler im Primarschulalter noch nicht vorausgesetzt werden kann, wurden in Kap. 3.4.3 sprachliche Mittel zusammengefasst, die auch DaZ-Schülern im Primarschulalter häufig noch Schwierigkeiten bereiten. Sowohl die Erforschung des Registers Schul- bzw. Bildungssprache als auch die Erforschung der Merkmale, Prozesse und Stolpersteine des DaZ-Erwerbs weisen in vielen Bereichen noch diverse Desiderate auf (vgl. Kap. 1 und 1), so dass Ehlich (2007: 31) zufolge „viele testtheoretisch unabdingbare Voraussetzungen beim bisherigen Kenntnisstand nur schwer zu erfüllen sind.“ Auch Schmidt-Atzert & Amelang (2012: 39–40) weisen darauf hin, dass nur für solche Merkmale Tests entwickelt werden können, die bereits ausreichend erforscht sind. Dabei räumen sie jedoch ein, „dass die Konstruktion und der gezielte Einsatz von Tests auch dazu beitragen können, ein Konstrukt zu präzisieren. Solche Tests sind vorerst [jedoch] ausschließlich für die Forschung geeignet“. 6.1.2 Testitems Werden die Testitems aus den vorhandenen wissenschaftlichen Erkenntnissen und Theorien zum interessierenden Merkmal abgeleitet, entspricht dies der deduktiven Methode (auch „rationale Methode“) für die Testkonstruktion, die i.d.R. als das angemessenste Vorgehen angesehen wird. Nur in besonderen Fällen (z.B. wenn die Modellentwicklung zu einem Merkmal noch nicht abgeschlossen ist), darf von dieser Methode abgewichen werden (Schmidt-Atzert & Amelang 2012: 97–98). Eine alternative Möglichkeit stellt dann die induktive Methode dar, bei der mittels explorativer Faktorenanalysen eine Vielzahl von Items ausgewertet wird (vgl. Kap. 6.6.3.3), um auf diesem Wege Dimensionen zu finden, die den Itemantworten zugrunde liegen. Zu Beginn liegt also außer einer Idee, dass bestimmte Items dieselben Konstrukte erfassen könnten, keine theoretische Ausarbeitung vor. Vielmehr wird nach der Datenanalyse aufgrund der gefundenen Dimensionen ein theoretisches Modell entwickelt. (Bühner 2011: 93–94)

168 | Entwicklung eines empirischen Verfahrens zur Evaluation von Fördereffekten Auch die externale bzw. kriteriumsorientierte Methode stellt eine konstruktunabhängige Möglichkeit der Textkonstruktion dar. Dabei wird den Testpersonen „eine möglichst große und inhaltlich breit gefächerte Zahl von Items vorgelegt, in der Hoffnung, dass sich darunter einige befinden werden, die zwischen den Gruppen empirisch diskriminieren, also verschiedene Beantwortungsrichtungen oder Losungswahrscheinlichkeiten zeigen“ (SchmidtAtzert & Amelang 2012: 103). Anschließend werden die Items herausgefiltert, durch die möglichst gut zwischen Gruppen differenziert werden kann. Im Gegensatz zu deduktiv konstruierten Items, können external gewonnene Items häufig aus inhaltlich sehr unterschiedlichen Bereichen stammen (Bühner 2011: 93–94). Schmidt-Atzert & Amelang (2012: 103) sehen in der externalen Konstruktion vor allem den Vorteil, dass „die Validität bereits durch die Skalenkonstruktion gewährleistet ist“, weisen jedoch darauf hin, dass die Validität strenggenommen „nur für die Unterscheidung derjenigen Gruppen voneinander [gilt], die der Itemauswahl zugrunde lagen“. Auch seien die Skalen häufig intern wenig konsistent und inhaltlich schwer interpretierbar. Im Gegensatz zur deduktiven Methode, bei der die Items basierend auf theoretischen Modellen im Vorfeld der Untersuchung generiert werden, erfolgt bei der induktiven und externalen Methode die Auswahl der eigentlichen Items erst nachdem der (vorläufige) Test mindestens einmal eingesetzt wurde. Die Wahl des methodischen Vorgehens ergibt sich zunächst aus der Fragestellung bzw. Zielsetzung. Im Rahmen der vorliegenden Arbeit geht es um die Untersuchung von Fördereffekten auf die gesprochene Schulsprache von Primarschülern mit Deutsch als Zweitsprache. Da sich mündliche Sprachfähigkeiten nur sehr bedingt durch geschlossene Testaufgaben messen lassen und es außerdem um die Frage geht, ob die Sprachförderung zu einer automatisierten Verwendung neu erworbenen expliziten und impliziten Wissens geführt hat (vgl. Kap. 4.1), müssen mündliche spontansprachliche Daten erhoben und anschließend analysiert (kodiert) werden. Deshalb werden in dem Verfahren keine Testitems im klassischen Sinne verwendet, sondern Kategorien bestimmt, anhand derer die Sprachproben analysiert werden (vgl. Kap. 6.5). Aufgrund des z.T. lückenhaften Erkenntnisstands bezüglich des Untersuchungsgegenstandes (vgl. Kap. 1), wird bei der Auswahl und Modellierung dieser Kategorien eine Kombination aus deduktiver und induktiver Methode angewandt (vgl. Kap. 6.5.1). 6.1.3 Gütekriterien Mithilfe der Testgütekriterien kann die Qualität eines diagnostischen Verfahrens beurteilt und überprüft werden. Meist werden diese Kriterien in Haupt- und

Methodische Grundlagen | 169

Nebengütekriterien unterteilt, wobei Validität, Reliabilität und Objektivität die Hauptgütekriterien darstellen.

Abb. 24. Zusammenfassende Übersicht über Gütekriterien in Anlehnung an Bühner & Ziegler (2012: 84)

Die verschiedenen Gütekriterien beeinflussen sich dabei wechselseitig und stehen in einem hierarchischen Verhältnis zueinander. So kann ein Verfahren nur dann reliabel sein, wenn es objektiv ist, wobei Objektivität allein noch nicht die Reliabilität gewährleistet. In dem gleichen Sinne muss die Reliabilität gesichert sein, damit ein Verfahren valide sein kann, wobei die Validität noch von weiteren Faktoren abhängt als nur von der Reliabilität. An dieser Stelle der Arbeit sollen die Gütekriterien überblickartig beschrieben werden, da sie von zentraler Bedeutung für das methodische Vorgehen bei der Datenerhebung und -auswertung sind. Die konkreten Methoden zum Nachweis der Gütekriterien werden im letzten Teil der Arbeit im Rahmen der Güteprüfung des vorliegenden Verfahrens (Kap. 6.6) genauer erläutert. Validität Die Validität wird oft als das wichtigste Gütekriterium bezeichnet und bezieht sich darauf, ob der Test das misst, was er messen soll, so dass Schlussfolgerungen vom Testergebnis auf das tatsächliche Merkmal bzw. Verhalten der Testper-

170 | Entwicklung eines empirischen Verfahrens zur Evaluation von Fördereffekten son gezogen werden können (vgl. z.B. Schmidt-Atzert & Amelang 2012: 142–143; Bühner 2011: 36–41; vgl. auch Kap. 5.1). Validity is an integrated evaluative judgment of the degree to which empirical evidence and theoretical rationales support the adequacy and appropriateness of inferences and actions based on test scores or other modes of assessment. (Messick 1989: 13)

Um zu überprüfen, ob ein Test das jeweilige Merkmal bzw. Konstrukt in angemessener Weise abbildet, werden verschiedene Validitätsarten unterschieden. Die inhaltliche Validität („content validity“) ist gegeben, wenn die Inhalte des Tests, d.h. die Items bzw. Aufgaben oder Auswertungskategorien inkl. des gesamten Stimulusmaterials das zu messende Merkmal in geeigneter Weise abbilden. Die Inhaltsvalidität wird normalerweise nicht numerisch bestimmt, sondern aufgrund „logischer und fachlicher Überlegungen“ durch Experten (Moosbrugger & Kelava 2012a: 15). Dafür ist es wichtig, das Konzept der Itemgenerierung und -auswahl ausführlich darzulegen (vgl. Kap. 6.5.1). „Mit inhaltlicher Validität leicht zu verwechseln […] ist die Augenscheinvalidität“ (Moosbrugger & Kelava 2012a: 15). Sie gibt an, inwiefern für den Laien (z.B. die Testperson) nachvollziehbar ist, dass der Test das zu erfassende Merkmal misst. Dies kann für die Akzeptanz und das Vertrauen in ein Verfahren bedeutsam sein. Für die Unverfälschbarkeit der Ergebnisse kann eine hohe „face validity“ jedoch auch abträglich sein (z.B. Schmidt-Atzert & Amelang 2012: 169), weil dadurch Antworten z.B. im Sinne der sozialen Erwünschtheit möglich werden. Je nach zu erfassendem Merkmal kann eine solche Durchschaubarkeit des Tests auch zu Leistungsangst führen, die sich negativ auf die Testergebnisse auswirken kann. Wenn Schüler z.B. sofort merken, dass überprüft werden soll, wie viele grammatikalische Fehler sie beim Sprechen begehen, könnte dies dazu führen, dass sie deutlich weniger sprechen und schwierige Sprachstrukturen vermeiden. Orientiert sich die Validierung an den theoretischen Überlegungen zum Konstrukt wird auch von interner (innerer) Validität besprochen. Geht es um die Beurteilung der externen Validität interessiert dagegen die Frage, ob sich die Testergebnisse auf andere Kontexte (z.B. andere Personen, Situationen, Zeitpunkte) als die Testsituation übertragen lassen. Hier geht es also um das Kriterium der Generalisierbarkeit der Ergebnisse (Bortz & Döring 2010: 33). Denn auch wenn eine Studie sehr gut geplant, kontrolliert und intern valide ist, kann es trotzdem sein, dass sie nicht extern valide ist, weil z.B. der Zwang der Kontrollierbarkeit dazu führt, dass die Studie künstlich wird und sich zu weit von der realen Welt entfernt. Auch die Testsituation als solche kann das Verhalten beeinflussen, indem z.B. die durch die Testsituation ausgelöste Leistungsangst

Methodische Grundlagen | 171

die Leistungen der Teilnehmer positiv oder negativ beeinflusst. Grundsätzlich kann ein Verfahren jedoch nur dann eine hohe externe Validität besitzen, wenn auch die interne Validität hoch ist (Bortz & Döring 2010: 53). Die Testergebnisse sollten außerdem mit einem oder mehreren externen Kriterien, die dem theoretischen Konstrukt bzw. dem zu messenden Merkmal entsprechen zusammenhängen (= konvergente Validität). Wenn es sich bei dem Kriterium um konkrete Leistungen bzw. ein konkretes Verhalten außerhalb der Testsituation handelt, wird auch von „äußerer kriterienbezogener Validität“ gesprochen (Lienert & Raatz 1998: 222). Auch wenn Zusammenhänge zwischen den Ergebnissen unterschiedlicher Messverfahren wie z.B. der Kodierung von Sprachproben und traditionellen Sprachtests nachgewiesen werden, spricht man von externer Validität bzw. Kriteriumsvalidität. Kriteriumsvalidität (kriterienbezogene Validität) liegt vor, wenn das Ergebnis eines Tests zur Messung eines latenten Merkmals bzw. Konstrukts (z. B. Berufseignung) mit Messungen eines korrespondierenden manifesten Merkmals bzw. Kriteriums übereinstimmt (z. B. beruflicher Erfolg). Die Kriteriumsvalidität ist definiert als Korrelation […] zwischen den Testwerten und den Kriteriumswerten einer Stichprobe. (Bortz & Döring 2010: 200)

Untersucht man dagegen den Zusammenhang der Ergebnisse eines Tests mit den Ergebnissen eines zweiten Tests, der dasselbe Merkmal bzw. Konstrukt erfasst, so geht es um den Nachweis innerer Validität (vgl. Lienert & Raatz 1998: 222). Sollen die Werte eines anderen Tests als Kriterium verwendet werden, müssen beide Verfahren zum einen dasselbe Merkmal erfassen, zum anderen muss die Validität des zweiten Tests gesichert sein. Meistens erfassen zwei verschiedene Diagnoseinstrumente jedoch nicht genau dasselbe Merkmal, denn dann wäre die Entwicklung eines weiteren Tests nicht erforderlich – es sei denn, das vorhandene Verfahren ist nicht ausreichend validiert, womit es jedoch auch als Kriterium ausscheiden würde (vgl. Kubinger 2009: 62). Häufig ist der Nachweis der Kriteriumsvalidität schwierig, weil sich z.B. bei mehrdimensionalen Konstrukten bzw. Merkmalen kein angemessenes externes Kriterium finden lässt oder ein Kriterium nicht messgenau operationalisierbar ist (Bortz & Döring 2010: 201) 59. Zum Nachweis der divergenten bzw. diskriminanten Validität werden die Ergebnisse des Testverfahrens zusätzlich mit den Ergebnissen von Tests korreliert, die andere Merkmale erfassen, wobei Moosbrugger & Kelava (2012b: 17) empfeh58F

|| 59 Auch Lienert & Raatz (1998: 228) betonen die Schwierigkeit der Auswahl eines repräsentativen bzw. validen Kriteriums. In ihrem Überblickskapitel zum Validitätskriterium unterscheiden sie mehrere Kriterienarten und stellen verschiedene Wege zur Gewinnung von Validitätskriterien vor, auf die an dieser Stelle jedoch nicht weiter eingegangen werden kann.

172 | Entwicklung eines empirischen Verfahrens zur Evaluation von Fördereffekten len, den Test zum Nachweis der divergenten Validität auch „zu relativ konstruktnahen Tests in Beziehung“ zu setzen. Zwischen divergenten Tests bestehen keine signifikanten Korrelationen. Unterschieden wird weiterhin zwischen prognostischer- bzw. Vorhersagevalidität, die bemisst, ob der Testwert das spätere Verhalten vorhersagt, und konkurrenter- bzw. Übereinstimmungsvalidität, „bei der Testwert und Kriteriumswert zum selben Zeitpunkt erhoben werden“ (Bortz & Döring 2010: 200– 201). Wenn das Ergebnis der Auswertung mündlicher Spontansprache z.B. treffend vorhersagt, welches Ergebnis ein Schüler bei einem deutlich später eingesetzten schriftlichen Grammatiktest erzielen wird, wäre dies ein Nachweis für die prognostische Validität. Werden die beiden Werte, also A) die Auswertung der mündlichen Sprachproben und B) der Grammatiktest gleichzeitig erhoben und korrelieren miteinander, so handelte es sich um Übereinstimmungsvalidität. Nach Bühner (2011: 63) wird Konstruktvalidität häufig als Überbegriff für alle Validitätsarten verstanden. „Fasst man Konstruktvalidität enger, fallen darunter lediglich konvergente, diskriminante und faktorielle Validität“ (Bühner 2011: 63). Da die Bedeutung konvergenter und diskriminanter Validität bereits im Zusammenhang mit der Kriteriumsvalidierung beschrieben wurde, soll hier nur auf die faktorielle bzw. strukturelle Validität eingegangen werden. Bei letzterer geht es um die Frage, ob „das einer Messung explizit oder implizit zugrundeliegende Messmodell mit den Strukturen des Konstrukts übereinstimmt“ (Pietsch 2011: 16). Zu diesem Zweck werden häufig Faktorenanalysen durchgeführt. Ziel ist es dabei, rechnerisch die Zusammenhangsstruktur der Items zu untersuchen, um übergeordnete Faktoren bzw. Komponenten zu identifizieren, die sich im Sinne des Konstrukts inhaltlich interpretieren lassen (vgl. Kap. 6.6.3.3). Können bereits im Vorfeld auf der Grundlage theoretischer Überlegungen Hypothesen zur Zusammenhangsstruktur des Merkmals getroffen werden, lassen sich diese mittels konfirmatorischer Faktorenanalysen überprüfen. Außerdem können mithilfe von Faktorenanalysen die Zusammenhänge zwischen verschiedenen Tests untersucht werden (Bühner 2011: 64). Die Ladungsmuster sollten dann so gestaltet sein, dass „der zu validierende Test sowie die validitätsverwandten Tests und Kriterien […] in [demselben] Faktor hohe Ladungen aufweisen“, während konstruktferne auf einem anderen Faktor laden (Lienert & Raatz 1998, 227) 60 (vgl. Kap. 6.6.3.7). 59F

|| 60 Die Bedeutung explorativer Faktorenanalysen wird im Rahmen der Evaluierung des Kodierverfahrens in Kap. 6.6.3.3 noch genauer erläutert.

Methodische Grundlagen | 173

Reliabilität Die Reliabilität gibt Auskunft über die Genauigkeit oder Verlässlichkeit eines Tests, unabhängig davon, was gemessen werden soll (darum geht es bei der Frage der Validität). Die Grundannahmen zur Reliabilität sowie die Verfahren zur Schätzung ihres Ausmaßes basieren auf der klassischen Testtheorie (KTT). Diese geht davon aus, dass es bei jedem Test zu unsystematischen Störfaktoren bzw. zufälligen Fehlern kommt, die das Ergebnis beeinflussen. Die Reliabilität gibt darüber Auskunft, wie groß der geschätzte Einfluss dieses Messfehlers auf den Testwert ist bzw. umgekehrt, wie hoch „der Anteil der wahren Varianz an der Gesamtvarianz der Testwerte“ ausfällt (Moosbrugger & Kelava 2012a: 11) (vgl. auch Bortz & Döring 2010: 196). Wird z.B. bei 100 Personen ein Test zur allgemeinen Sprachkompetenz durchgeführt, erhält man 100 verschiedene Testergebnisse. Die Frage ist nun, ob die unterschiedlichen Testwerte (Varianz) auf die unterschiedlichen Ausprägungen des durch den Test erfassten Merkmals zurückzuführen sind – in diesem Fall also auf eine unterschiedlich ausgeprägte Sprachkompetenz im Sinne des zugrunde gelegten Konstrukts – oder auf andere Faktoren bzw. Einflüsse (z.B. Müdigkeit, Motivation, subjektive Bewertung, Missverständnisse). Ein Reliabilitätskoeffizient von .80 würde z.B. bedeuten, dass sich 80% der Unterschiede (Varianz) auf die unterschiedliche Sprachkompetenz im Sinne des Konstrukts zurückführen lassen, während 20% der Unterschiede auf anderen Einflussfaktoren beruhen (Fehlervarianz bzw. Messfehler) (vgl. Schmidt-Atzert & Amelang 2012: 45). Je kleiner der Messfehler ist, desto höher fällt die Reliabilität aus. Objektivität Das Kriterium der Objektivität bezieht sich auf die Unabhängigkeit der Testergebnisse von Testleiter und Testauswerter: Zusammenfassend kann man sagen, dass das Gütekriterium Objektivität dann erfüllt ist, wenn das Testverfahren, bestehend aus Testunterlagen, Testdarbietung, Testauswertung und Testinterpretation so genau festgelegt ist, dass der Test unabhängig von Ort, Zeit, Testleiter und Auswerter durchgeführt werden könnte und für eine bestimmte Testperson bzgl. des untersuchten Merkmals dennoch dasselbe Ergebnis zeigen würde. (Moosbrugger & Kelava 2012a: 10)

Entsprechend der im obigen Zitat aufgelisteten Bestandteile eines Testverfahrens wird zwischen Durchführungs-, Auswertungs- und Interpretationsobjektivität unterschieden. Moosbrugger & Kelava (2012a: 9) zufolge liegt Durchführungsobjektivität vor, wenn „das Testergebnis nicht davon abhängt, welcher Testleiter den Test mit der Testperson durchführt“. Dies kann durch eine standardisierte Durchfüh-

174 | Entwicklung eines empirischen Verfahrens zur Evaluation von Fördereffekten rung des Verfahrens erreicht werden. Wie das Verfahren durchzuführen ist, welche Materialien eingesetzt werden (dürfen), welche Anweisungen der Testleiter geben muss und wie er ggfs. auf Fragen der Testpersonen reagieren soll, wird im Testmanual festgehalten. Schmidt-Atzert & Amelang (2012: 133) weisen in diesem Zusammenhang jedoch zu Recht darauf hin, dass „eine maximale Standardisierung der Durchführung“ nicht immer möglich oder erwünscht ist. Gerade bei Interviews ist es nicht möglich, das Verhalten des Testleiters vollkommen zu standardisieren, weil die unterschiedlichen Reaktionen der Testpersonen eine gewisse Flexibilität auf Seiten des Versuchsleiters erfordern. Außerdem widerspricht gerade bei Kindern eine zu starre Orientierung an Vorgaben einer natürlichen Kommunikationssituation, was das Verhalten der Teilnehmer negativ beeinflussen könnte. Die angestrebte Standardisierung besteht in solchen Fällen nicht darin, „dass der Auftrag mit den gleichen Worten vorgetragen wird“, sondern „dass die Testpersonen den Auftrag gleich verstehen“ (Schmidt-Atzert & Amelang 2012: 133). Die Auswertungsobjektivität bezieht sich auf die Genauigkeit der Auswertung in Abhängigkeit von vorgegebenen Regeln. Während bei vorgegebenen Antwortmöglichkeiten und einer entsprechenden Auswertungsschablone (z.B. nach „richtig“ und „falsch“) die Objektivität der Auswertung besonders hoch ist, weil der Testauswerter keinen Interpretationsspielraum hat, ist dies bei offenen Antwortformaten oder Interviews nicht automatisch der Fall. Wie bei der Durchführung des Testverfahrens muss auch das Vorgehen bei der Auswertung einem standardisierten Muster folgen, das im Testmanual festzuhalten ist. Gerade bei Schätz- oder Beobachtungsverfahren sollten die Rater nach einer Einführung in Theorie und Konzept der Untersuchung zusätzlich für die Beobachtung trainiert werden. Neben einer Einweisung in die Benutzung technischer und sonstiger Hilfsmittel, empfiehlt Pinther (1980, zit. nach Bortz & Döring 2010: 272–273) folgenden Maßnahmen: – – –



Ohne Vorkenntnisse im Untersuchungsfeld beobachten Beobachtungsindikatoren und -kategorien darstellen, begründen und diskutieren Beobachtungsindikatoren und -kategorien anhand einer Aufnahme oder gestellten Situation überprüfen, dabei Ursachen unterschiedlicher Kategorisierungen bei gleichen Ergebnissen klären Generalprobe unter weitgehenden „Ernstbedingungen“ und ggfs. Überarbeitung des Beobachtungsplans

Bei der Interpretationsobjektivität geht es darum, ob die Interpretation der Ergebnisse eindeutig ist und nicht von der interpretierenden Person abhängt.

Methodische Grundlagen | 175

Wenn also zwei Versuchsteilnehmer die gleichen Ergebnisse erzielen, sollte dies von Seiten der interpretierenden Person auch zu den gleichen Schlussfolgerungen führen (Lienert & Raatz 1998: 8). Diese Schlussfolgerungen orientieren sich bei normierten Verfahren an entsprechenden Normtabellen, die über die Position des Probanden in Bezug zu andere Personen (z.B. Eichstichprobe Gleichaltriger) Auskunft geben. Nebengütekriterien Zu den Nebengütekriterien zählen Normierung, Vergleichbarkeit, Ökonomie, Nützlichkeit, Zumutbarkeit, Fairness und Nicht-Verfälschbarkeit (vgl. Abb. 24). Die Normierung eines Tests bezieht sich darauf, ob normierte Werte für einen Test vorliegen, mit denen man die Testergebnisse der Probanden vergleichen kann (vgl. auch „Interpretationsobjektivität“). Dies ist vor allem wichtig, um die Bedeutung eines Testergebnisses beurteilen zu können. Andernfalls sind nur Vergleiche innerhalb der erhobenen Stichprobe möglich, nicht jedoch allgemeingültige Aussagen (Bühner 2011: 71). Die Vergleichbarkeit eines Tests ist nach Bühner (2011: 72) dann gegeben, wenn „ein oder mehrere Parallelformen oder Tests mit denselben Gültigkeitsbereichen vorhanden sind“. Das Nebengütekriterium der Ökonomie bezieht sich auf die Notwendigkeit, dass ein diagnostisches Verfahren in einem angemessenen finanziellen und zeitlichen Rahmen umsetzbar sein muss. Dabei ist jedoch darauf zu achten, dass geringe Kosten bzw. ein geringer organisatorischer Aufwand nicht zu Lasten der nötigen diagnostischen Erkenntnisse gehen: Außer Frage muss stehen, dass die Sachlichkeit vorrangig ist, die Aufwandsminimierung nachrangig: Die Wirtschaftlichkeit eines Tests kann bei einer konkreten Fragestellung erst dann zu Buche schlagen und mit der eines anderen konkurrieren, wenn der Einsatz gerade dieses Tests sachlich gerechtfertigt ist, er die gestellte Frage tatsächlich beantwortet, d.h., der Test valide (gültig) ist. (Kubinger & Proyer 2010: 177)

In engem Zusammenhang mit der Ökonomie eines Tests ist die Zumutbarkeit eines Tests zu sehen. Ein Test ist dann als zumutbar einzustufen, wenn er „die zu testende Person in zeitlicher, psychischer sowie körperlicher Hinsicht nicht über Gebühr belastet“, wobei auch dies nur in Abhängigkeit vom Nutzen des Tests zu bewerten ist (Moosbrugger & Kelava 2012b: 22). Die Nützlichkeit eines Tests ist dann gegeben, wenn dieser ein Merkmal erfasst, für dessen „Untersuchung ein praktisches Bedürfnis besteht“, z.B. weil bisher kein validiertes Verfahren existiert, das das interessierende Merkmal untersucht (Bühner 2011: 72).

176 | Entwicklung eines empirischen Verfahrens zur Evaluation von Fördereffekten Beim Nebengütekriterium Fairness geht es darum, dass bei einem Test niemand aufgrund bestimmter persönlicher Eigenschaften benachteiligt werden darf. Wenn Testpersonen also hinsichtlich des wahren Merkmals identisch sind, dürfen sich die Testergebnisse nicht aufgrund anderer Eigenschaften wie Geschlechtszugehörigkeit oder Alter systematisch unterscheiden (Kubinger 2009: 123). Die Nicht-Verfälschbarkeit eines Tests meint schließlich, dass das Testergebnis „durch die getestete Person nicht willentlich oder unwillentlich in eine gewünschte Richtung verfälscht werden“ kann (Bühner 2011: 73).

6.2 Stichprobe 6.2.1 Stichprobe der Pilotierung Um sicherzugehen, dass sich Stimulusmaterial und Aufgabenstellung zur Elizitierung ausreichend umfangreicher und monologischer Sprachproben eignen, wurde das Elizitierungsverfahren (vgl. Kap. 6.3.2) anhand einer Stichprobe von 15 DaZ-Kindern einer Bruchsaler Grundschule erprobt (zu den Ergebnissen vgl. Kap. 6.6.1). Die Stichprobe setzte sich aus neun Mädchen und sechs Jungen zusammen, die im Durchschnitt acht Jahre alt waren. Die Herkunftssprachen wurden nicht erfragt. Die Auswahl der Kinder für die Pilotierung richtete sich zum einen danach, ob das Kind nach Meinung des Klassenlehrers sprachlichen Förderbedarf hatte, zum anderen danach, ob die Eltern sich damit einverstanden erklärten, dass ihr Kind an der Pilotierungsstudie teilnahm. Die Sprachproben der Pilotierungsstudie wurden transkribiert, aber nicht systematisch ausgewertet. Im Vordergrund stand die Frage nach der Eignung des Elizitierungsverfahrens. Die Daten aus der Pilotierung wurden außerdem für Probeanalysen im Rahmen der Kodierer-Schulungen und als ‚Beispiellieferanten‘ für die Instruktionsmaterialien (siehe Anhang, Kap. 8) verwendet. Darüber hinaus wurden sie auch im Rahmen der Variablenauswahl für das Kodierverfahren eingesetzt (vgl. Kap. 6.5.1). Alle Berechnungen im Rahmen der Evaluation des Kodierverfahrens (vgl. Kap. 6.6.3) basieren jedoch auf der Hauptstichprobe, die in Kap. 6.2.2 beschrieben wird. 6.2.2 Hauptstichprobe Das gesamte Verfahren wurde anhand einer zufällig ausgewählten Substichprobe aus BeFo (vgl. Kap. 1) erprobt und validiert. Entsprechend der BeFoStichprobe handelt es sich ausschließlich um Kinder, die in ihrer Familie (auch)

Stichprobe | 177

eine andere Sprache als Deutsch verwenden. Außerdem nahmen nur solche Kinder am BeFo-Projekt teil, bei denen A) im Rahmen eines ScreeningVerfahrens sprachlicher Förderbedarf diagnostiziert worden war, und die B) von ihren Eltern zur Teilnahme angemeldet wurden. Bei der Substichprobe der vorliegenden Arbeit handelt es sich um insgesamt 150 BeFo-Kinder von sieben zufällig ausgewählten Schulen, die am BeFo-Projekt teilnahmen. Die Datenerhebung fand zu Beginn der Förderintervention am Anfang des 3. Schuljahrs statt. Die Stichprobe setzt sich aus 69 Jungen und 81 Mädchen zusammen, die zum Zeitpunkt der Erhebung durchschnittlich 8.5 Jahre alt waren. Die am häufigsten vertretenen Herkunftssprachen der Stichprobe sind Türkisch (41%) und Arabisch (27%) (vgl. Abb. 25).

Abb. 25. Herkunftssprachen der getesteten Schüler

Hinsichtlich der Dauer und Häufigkeit des Gebrauchs des Deutschen bzw. der Herkunftssprache können leider keine exakten Angaben gemacht werden, da die Fragebogen dazu in vielen Fällen nicht vollständig ausgefüllt wurden. Zur Dauer der Kita-Zeit liegen immerhin von 114 der 150 Kinder Angaben vor, die belegen, dass die meisten Kinder (knapp 70%) länger als zwei Jahre eine Kindertagesstätte besucht haben (vgl. Abb. 26). Unklar ist natürlich, wie der Sprachgebrauch in den jeweiligen Kitas gestaltet war.

178 | Entwicklung eines empirischen Verfahrens zur Evaluation von Fördereffekten

Abb. 26. Angaben der Eltern zur Dauer der Kitazeit ihrer Kinder

6.3 Datenerhebung 6.3.1 Zielsetzung61 Ein wesentliches Ziel von Sprachförderung (so auch im BeFo-Projekt) ist es, den Erwerb prozeduralen Sprachwissens 62 zu unterstützen (Rösch & Stanat 2011: 159). In diesem Zusammenhang warnt z.B. Bredel (2007: 95) mit einem Zitat von Schöler (2006: 901) davor, „Können und sprachliches Wissen oder auch automatisierte und kontrollierte Sprachverarbeitung“ in Testverfahren und Aufgabenstellungen zu konfundieren. Prozedurales Sprachwissen lässt sich nur schwer über enge Testformate erheben. Denn geschlossene Items (z.B. MultipleChoice-Aufgaben oder das Ausfüllen von Lücken) begünstigen eine stärker kontrollierte Sprachverwendung, bei der auch deklarative Wissensbestände (z.B. explizites Regelwissen) abgerufen werden können. Sprachliches Können 61F

|| 61 Die Zielsetzung und das Verfahren zur Datenerhebung wurden teilweise bereits in Webersik (2012) publiziert. 62 Zur Unterscheidung von prozeduralem (automatisierten, impliziten) und deklarativem (kontrollierten, explizitem) Sprachwissen vgl. Kap. 4.1 .

Datenerhebung | 179

zeigt sich dagegen erst in der spontanen Sprachverwendung und dabei insbesondere in der gesprochenen Sprache, die aufgrund der Gleichzeitigkeit von Planung und Produktion auf eine automatisierte Sprachverwendung angewiesen ist. Ziel der vorliegenden Arbeit ist es daher, möglichst umfangreiche und vergleichbare mündliche spontansprachliche Daten zu elizitieren, die sich für eine Analyse im Sinne der Fragestellung eignen. Um vergleichbare und möglichst generalisierbare Ergebnisse zu erzielen, muss sich bereits das Elizitierungsverfahren an den klassischen Gütekriterien orientieren. Validität Die zugrundeliegende Frage lautet: Wie können Sprachproben elizitiert werden, die Aufschluss über das interessierende Merkmal, d.h. also gesprochene Schulsprache von Primarschülern geben? Ausgangspunkt der Überlegungen ist deshalb zunächst, möglichst authentische schulsprachliche Kommunikationssituationen zu schaffen. Den theoretischen Überlegungen in Kap. 2.2 zufolge zeichnet sich schulsprachliche Kommunikation in der Primarstufe vor allem durch Distanzsprachlichkeit aus. Die von Koch & Oesterreicher (1985) aufgestellten und im Modell von Ágel & Hennig (2006b) weiterentwickelten Merkmale und Bedingungen distanzsprachlicher Kommunikationssituationen wurden in Kap. 2.3.5 in Hinblick auf ihre Relevanz für die gesprochene Schulsprache von Primarschülern reflektiert. Demnach können die folgenden Kriterien als charakteristische Bedingungen mündlicher distanzsprachlicher Kommunikationssituationen in der Primarstufe angesehen werden: –

Situationsentbindung (Situationsparameter) 1. 2. 3.



Themenfixierung Fremdheit der Kommunikationspartner Institutionalität (Öffentlichkeit)

Rollenstabilität bzw. Monologizität (Rollenparameter) 63 62F

|| 63 Wie in Kap. 2.2 beschrieben findet Kommunikation in der Schule natürlich häufig auch dialogisch statt. Wenn es aber um die besonderen Herausforderungen von Schulsprache geht, wird mit Bezug zur konzeptionellen Schriftlichkeit immer wieder ihr monologischer Charakter hervorgehoben. Konkret kann dies z.B. bei einer Buchpräsentation oder der Beschreibung eines Experiments der Fall sein, bei denen ein Schüler ohne Hilfe längere zusammenhängende Redebeiträge produzieren muss.

180 | Entwicklung eines empirischen Verfahrens zur Evaluation von Fördereffekten –

Eingeschränkter Codes/Mediums)

Einsatz

nonverbaler

Mittel

(Parameter

des

Die für die Datenerhebung evozierten Kommunikationssituationen oder „kommunikativen Praktiken“ müssen eine Operationalisierung dieser Kriterien darstellen. Reliabilität Um ein Merkmal möglichst genau zu messen und den Messfehler klein zu halten, müssen mögliche Einflussfaktoren reduziert bzw. kontrolliert werden. Dazu gehört auch, dass die Kenntnis des Verfahrens beim wiederholten Einsatz wie er in Prä-Post-Erhebungen üblich ist, zu keiner Verbesserung des zu messenden Merkmals führen darf. Bei der Erhebung spontansprachlicher mündlicher Sprachproben anhand von Videoclips können außerdem folgende Störfaktoren zu Messfehlern führen: – – – – – –

Motivation/ Interesse Konzentration Gedächtnis Hintergrundwissen Beobachterparadox Persönlichkeit (Extrovertiertheit/Introvertiertheit)

Objektivität Objektivität bezieht sich hier vor allem auf die Objektivität der Durchführung (vgl. Kap. 6.1.3), womit bezogen auf die Datenerhebung gemeint ist, dass Qualität und Quantität der Daten nicht durch den Testleiter beeinflusst werden dürfen. Nebengütekriterien Von den in Kap. 6.1.3 genannten Nebengütekriterien sind vor allem die Kriterien der Fairness, Nicht-Verfälschbarkeit, Zumutbarkeit und Ökonomie für die Datenerhebung bedeutsam. So darf das Erhebungsverfahren keine Personen benachteiligen, die Teilnehmer sollten nicht gezielt das Testergebnis beeinflussen können, das Verfahren darf die Teilnehmer nicht übermäßig belasten, und es muss in einem angemessenen zeitlichen und finanziellen Rahmen durchführbar sein.

Datenerhebung | 181

6.3.2 Elizitierungsverfahren Den Rahmen für die Datenerhebung bilden Einzelinterviews, die insgesamt jeweils 20–30 min dauern (Aufwärmphase 5–10 min, Erhebungsphase 15–20 min) und mit einer Videokamera aufgezeichnet werden. Idealerweise werden diese Interviews während der Unterrichtszeit in einem separaten Raum in der Schule durchgeführt. Der Testleiter holt die Kinder dafür nacheinander aus dem Unterricht. Der Gesprächsablauf ist standardisiert und folgt einem genauen Verlaufsplan 64 (vgl. Testheft in Anhang 65 8.1.4). Damit die Testleiter sich an den Ablauf halten, ist zur Vorbereitung eine gezielte Schulung notwendig, die nicht länger als 1–2 Stunden in Anspruch nimmt. Im Folgenden werden zunächst die einzelnen Phasen, Aufgabenstellungen und Stimuli beschrieben 66. Eine Reflexion hinsichtlich der geforderten Gütekriterien erfolgt im Rahmen der Evaluierung des gesamten Verfahrens (vgl. Kap. 6.6.1). 63F

64F

65F

6.3.2.1 Aufwärmphase Da die spontane Sprachproduktion in starkem Maße davon abhängen kann, wie sicher sich ein Sprecher in einer gegebenen Kommunikationssituation fühlt und die isolierte Aufnahmesituation gerade bei Kindern dazu führen kann, dass diese mit Leistungsangst reagieren und deshalb nur wenig oder gar nichts sagen, findet vor der eigentlichen Erhebung eine 5–10 minütige Aufwärmphase ähnlich dem Vorgehen in TestDaF bzw. dem Simulated Oral Proficiency Interview (SOPI) des ACTFL (vgl. Kniffka & Üstünsöz-Beurer 2001; Kniffka & Üstünsöz-Beurer 2001; Tschirner 2005) statt, in der sich Testleiter und Schüler kennenlernen und frei über beliebige, den Schüler interessierende Themen sprechen. Dabei soll der Testleiter gegen Ende der Aufwärmphase auch die Themen der Videoclips ansprechen. Ziel der Aufwärmphase ist es, den Schülern ggfs. die Angst vor der Aufnahmesituation zu nehmen bzw. schüchterne Schüler ‚aufzuwärmen‘ und sie langsam auf die Erhebung vorzubereiten. Indem die Themen der Clips im Vorfeld angesprochen werden, wird zudem das Vorwissen aktiviert und Neugier auf die Filme geweckt. Da hier bewusst ein eher alltagssprachlicher Dialog mit dem Schüler geführt wird, der sich an den individuellen Interessen des Schülers orientiert, gehen die Äußerungen aus diese Phase nicht mit in die Datenerhebung ein. Trotzdem läuft schon während der Aufwärmphase die Kamera, damit die Schüler sich an die Aufnahmesituation ge|| 64 vgl. „völlig strukturiertes Interview“ bei Bühner & Ziegler (2012: 81) 65 Der Anhang zu diesem Buch ist ausschließlich online über den folgenden Link verfügbar: http://dx.doi.org/10.1515/9783110403015.suppl. 66 Das Elizitierungsverfahren wurde in Auszügen bereits in Webersik (2012a) vorgestellt.

182 | Entwicklung eines empirischen Verfahrens zur Evaluation von Fördereffekten wöhnen und während der Erhebung ein authentisches Gesprächsverhalten zeigen. Denn es ist davon auszugehen, dass die Versuchspersonen nach ein paar Minuten „das Faktum der Aufnahme nicht mehr registrieren“ und „ein weitgehend unbeeinflusstes Gesprächsverhalten zeigen“ (Fiehler 2006a: 1198). Am Ende der Aufwärmphase wird dem Schüler das Vorgehen für den weiteren Verlauf der Erhebung erläutert. Im Gegensatz zu den konkreten Aufgabenstellungen muss der Testleiter sich hierbei noch nicht wortwörtlich an die vorgegebene Erklärung halten. Auch dürfen die Schüler an dieser Stelle Fragen stellen, wenn etwas unklar ist. Denn Objektivität besteht an dieser Stelle nicht darin, dass die Erklärungen exakt identisch sind, sondern dass die Schüler die Aufgabenstellung alle möglichst gleich verstehen (vgl. Schmidt-Atzert & Amelang 2012: 133). 6.3.2.2 Erhebungsphase Zu den Aufgabenstellungen Von den acht Diskursfunktionen, denen nach Vollmer (2011: 2–3) im Kontext Schule eine besondere Bedeutung zukommt (vgl. Kap. 2.2), scheinen sich vor allem das Erzählen und Erklären für die Elizitierung längerer monologischer Redebeiträge zu eignen. Zudem wird diesen beiden Diskursformen eine besonders wichtige Funktion bei der Aneignung bildungssprachlicher Kompetenzen zugesprochen. So hebt Dehn (2011: 142) hervor, dass „für das Erzählen Distanz zur augenblicklichen Situation konstitutiv ist“, und Schramm (2007: 201) sieht im Erzählen das große Potential, „längere, kohärente Gesprächsbeiträge zu leisten“. Auch Ahrenholz (2007a: 6) zufolge eignen sich Erzählungen in besonderem Maße zur Elizitierung komplexer Äußerungsstrukturen. Das Erklären ist nach Neumann (2008: 37) und Dehn (2011: 142) vor allem im Sachunterricht bedeutsam, „wenn Phänomene beschrieben“ werden, deren „Kontexte und kausale Bezüge der Erklärung“ bedürften. Bei den Aufgabenstellungen des vorliegenden Elizitierungsverfahrens liegt der Schwerpunkt auf dem (Nach-) erzählen bzw. Beschreiben. Denn die Diskursfunktion des Erklärens würde das inhaltliche Verständnis des zu Erklärenden voraussetzen, was zusätzlich kontrolliert werden müsste. Ähnlich dem Vorgehen im FöDaZ-Projekt (Ahrenholz 2005: 115) (vgl. Kap. 3.4) ist es deshalb die Aufgabe der Schüler, den Inhalt von drei kurzen, tonlos präsentierten Filmsequenzen nachzuerzählen (zu den Stimuli s.u.), wobei der Testleiter jeweils vorgibt, den Film nicht zu kennen und sich deshalb umdreht, während die Clips abgespielt werden. Dieses Vorgehen dient vor allem der Herstellung einer dekontextualisierten Kommunikationssituation, aufgrund derer die Inhalte des Films möglichst genau und explizit wiedergeben werden müs-

Datenerhebung | 183

sen. Außerdem wird dadurch plausibel, warum die Testleiter den Schülern nicht helfen dürfen bzw. können. Ursprünglich war es aus Gründen der Authentizität vorgesehen, mit zwei Testleitern zu arbeiten, wobei sich einer der beiden mit den Schülern die Clips ansehen sollte und die Schüler dann dem anderen Testleiter die Inhalte erzählen sollten. Dies ließ sich aus ökonomischen Gründen jedoch nicht umsetzen. Doch selbst wenn die Schüler durchschauen, dass die Testleiter die Filminhalte in Wirklichkeit doch kennen, ist angesichts der Tatsache, dass die Schüler aus ihrem Unterrichtsalltag daran gewöhnt sind, regelmäßig Sachverhalte wiederzugeben oder Antworten geben zu müssen, deren Inhalte der Lehrer schon kennt (vgl. auch Snow & Uccelli 2009: 124), davon auszugehen, dass die Aufgabenstellung in der gewünschten Weise verstanden und umgesetzt wird. Je nach Clip gibt es kleine Unterschiede bei den Aufgabenstellungen, wobei sich die Schüler in jedem Fall in eine dekontextualisierte Kommunikationssituation hineinversetzen sollen (vgl. „situative Fragen“ bei Bühner & Ziegler 2012: 81–82) 67: Beim Videoclip Zivilcourage sollen sich die Schüler vorstellen, dass sie den Film Zuhause gesehen hätten und nun ihrer Klasse, die den Film nicht kennt, erzählen sollen, was in dem Film passiert ist. Außerdem wird der Clip in zwei Teilen präsentiert, wobei die beiden Teile nicht nur nacherzählt, sondern nach Ablauf des ersten Teils auch Vermutungen über den weiteren Verlauf des Geschehens angestellt werden sollen. Bei den anderen beiden Videoclips sollen sich die Schüler vorstellen, dass ihre Nacherzählung später Schülern einer anderen Schule vorgespielt würde, die dann den Versuch bzw. die Bastelei nachmachen sollen. Bei diesen Nacherzählungen werden die Schüler ausdrücklich dazu aufgefordert, möglichst wenig gestische Mittel zu verwenden, da die Schüler der anderen Schule sie ja nicht sehen könnten. Den deiktischen Sprachgebrauch auf diese Weise in der gegebenen Kommunikationssituation mit dem Testleiter zu reduzieren ist in gewisser Weise konstruiert und wenig authentisch. Das Vorgehen lässt sich jedoch dadurch rechtfertigen, dass es die Schüler dazu bringen soll, die Inhalte im Sinne von Distanzsprachlichkeit (vgl. Kap. 2.3.2) tatsächlich möglichst exakt zu versprachlichen und nicht etwa mehr oder weniger pantomimisch darzustellen. Da in den Bildungsstandards für die 3./4. Klasse der Primarstufe ähnliche Anforderungen wie in den Aufgabenformaten des Elizitierungsverfahrens beschrieben werden, ist davon auszugehen, dass die Schüler mit den Aufgabenstellungen grundsätzlich vertraut sind und diese zudem für den schulischen 6F

|| 67 Die genauen Erklärungen, Aufgaben- und Fragestellungen sind dem Testheft, Anhang 8.1.4 zu entnehmen.

184 | Entwicklung eines empirischen Verfahrens zur Evaluation von Fördereffekten Erfolg unmittelbar relevant sind. So wird in den Bildungsstandards des Faches Deutsch im Kompetenzbereich Sprechen und Zuhören ausdrücklich die Kompetenz „funktionsangemessen zu sprechen“ aufgeführt, wozu u.a. das Erzählen zählt (Sekretariat der KMK 2005: 10). Weiterhin zählt zu den Standards, „an der gesprochenen Standardsprache orientiert und artikuliert“ zu sprechen (Sekretariat der KMK 2005: 9). Auch die entsprechenden Ausdifferenzierungen in den Curricula der Länder zeigen, dass dem mündlichen (Nach-)erzählen, Berichten und Beschreiben eine wichtige Rolle zugesprochen wird. So heißt es beispielsweise im Berliner Rahmenlehrplan für das Fach Deutsch in der Primarstufe, dass „regelmäßige Gespräche über alltägliche Situationen des Klassen- und Schullebens und zu anderen bedeutsamen Inhalten“ stattfinden sollen und sich „aus „realen oder fiktiven, spontanen oder gelenkten Situationen […] erlebnis- und sachorientierte Sprachaufgaben [ergeben], die zum Erzählen, Beschreiben, Berichten und Appellieren veranlassen“. Auch soll die Fähigkeit erworben werden, „in zusammenhängender Rede“ über Sachverhalte zu informieren. Weiterhin heißt es: „Um [die] Erzählfähigkeit zu stärken, bedarf es altersgerechter Erzählimpulse und ausreichender Erzählzeit“ (Senatsverwaltung für Bildung 2004: 25). Auch die Aufgabenbereiche, die der Berliner Rahmenplan zur Umsetzung dieser Ziele aufführt, weisen starke Parallelen zu den Aufgabenformaten des Elizitierungsverfahrens auf. So wird schon für die Jahrgangsstufen 1 und 2 gefordert, dass die Schüler „Geschichten erzählen, nacherzählen und weitererzählen“, „Beobachtungen wiedergeben“ und „Sachverhalte beschreiben“ können. Als Inhalte werden „Geschichten aus verschiedenen Medien“, „Experimente, Naturphänomene [und] Situationen“ aufgeführt (Senatsverwaltung für Bildung 2004: 31). In den Aufgabenbereichen für die 3. und 4. Jahrgangsstufe heißt es außerdem, dass die Schüler „themenbezogen und zusammenhängend erzählen“, sowie „Sachverhalte vortragen“ können. Als mögliche Inhalte werden Buchund Medienvorstellungen genannt (Senatsverwaltung für Bildung 2004: 36). Neben den aufgeführten Anforderungen der Bildungsstandards und Curricula bestätigt auch eine Befragung von Grundschullehrern, dass „das Erzählen […] im Unterrichtsalltag der Grundschule einen festen Platz hat“, wobei die Kinder vor allem eigene Erlebnisse erzählten oder Nacherzählungen lieferten (Schramm 2007: 200). Natürlich werden in den Bildungsstandards und Curricula im Kompetenzbereich „Sprechen und Zuhören“ noch diverse andere Kompetenzen aufgeführt. Ziel der vorliegenden Arbeit ist es jedoch nicht, Kompetenzene im Bereich Sprechen und Zuhören oder im Bereich Umgang mit Texten und Medien abzubilden, sondern lediglich ausgewählte lexikalische und morpho-syntaktische Phäno-

Datenerhebung | 185

mene, die als grundlegend für gesprochene Schulsprache angesehen werden, erfassbar zu machen. Deshalb geht es bei der durch das Elizitierungsverfahren gesteuerten mündlichen Sprachproduktion der Schüler weder darum, bestimmte Diskursarten oder Textsorten möglichst gut umzusetzen, noch darum, die Filme inhaltlich möglichst treffend wiederzugeben. Videomaterial und Aufgabenstellungen verfolgen vor allem das Ziel, dass die Schüler möglichst viel und im Sinne schulsprachlicher Kommunikation möglichst genau und differenziert, d.h. elaboriert sprechen. Die aufgeführten Anforderungen und Aufgabenbereiche der Bildungsstandards/Curricula sind im Rahmen der vorliegenden Arbeit deshalb bedeutsam, weil sie zeigen, dass es sich um authentische, schulisch unmittelbar relevante Aufgabenstellungen handelt, die den Schülern in ähnlicher Form bekannt sein dürften, so dass sie schnell verstehen sollten, was von ihnen erwartet wird und Unterschiede bei der Sprachproduktion nicht auf ein mangelndes Verständnis der Aufgabenstellung zurückzuführen sind. Die konkreten Aufgabenstellungen sind vom Testleiter wörtlich vorzulesen. In diesem Zusammenhang weist Rösch (2011: 36) zu Recht darauf hin, dass „die Testsituation so gestaltet sein [muss], dass es kommunikativ nötig ist, die erwünschten Sprachmittel zu produzieren“. Deshalb sind die Aufgabenstellungen und Fragen so gestaltet, dass Konstruktionsübernahmen wie z.B. „Was haben die Jungs gemacht? – „Wurst gegessen.“ (vgl. auch Adjazenzstrukturen, Kap. 2.3.2 und 2.3.5) nicht möglich sind. Außerdem wurden die Aufgabenstellungen bewusst im Perfekt formuliert, damit die Schüler nach Möglichkeit auch Vergangenheitstempora verwenden, auch wenn dies in der gesprochenen Sprache nicht zwingend erforderlich ist. Die Testleiter müssen sich streng an den vorgegebenen Ablauf halten, wobei sie die Schüler zwischendurch immer wieder loben sollen. Inhaltliche Fragen der Schüler zu den Clips oder sprachliche Fragen (z.B. „Wie heißt das nochmal?“) dürfen nicht beantwortet werden. Hier sollen sich die Testleiter darauf berufen, dass sie die Filme nicht kennen und die Schüler ermutigen, die Inhalte einfach so gut wiederzugeben, wie sie können. Um sicherzugehen, dass die Schüler in jedem Fall genug Sprachmaterial für die spätere Analyse produzierten, stellen die Testleiter den Schülern nach der Nacherzählung noch zusätzliche Fragen zum Inhalt der Clips. Wenn der Schüler auf die Fragen bzw. Aufforderungen durch den Testleiter nicht gleich antwortet, zählt der Testleiter innerlich langsam bis 20 und wiederholt die Frage dann noch einmal. Sollte der Schüler bei den Fragen „Was ist in dem Film passiert?“ gar nichts sagen, darf er sich den entsprechenden Teil des Films ein zweites Mal anschauen.

186 | Entwicklung eines empirischen Verfahrens zur Evaluation von Fördereffekten Damit die Testleiter den hier skizzierten Ablauf in der gewünschten Form umsetzen, erhalten sie für die Erhebungen Testhefte, in denen der genaue Ablauf und die Aufgabenstellungen festgehalten sind (vgl. Anhang 8.1.4). Zu den Stimuli Als Stimuli für die Datenerhebung werden kurze Filmsequenzen verwendet, die ohne Ton präsentiert werden. Der Vorteil gegenüber anderen Stimuli wie z.B. Bildergeschichten ist vor allem, dass Filme zum Gesprächszeitpunkt nicht mehr vorliegen (Dekontextualisierung). Stimuli wie Bildergeschichten sind auch insofern problematisch, als kognitive Leistungen im Sinne einer Handlungskonstruktion Einfluss auf die Sprachproduktion haben können. So berichtet Knapp (1997: 27–28), dass Kinder „den eigentlichen Inhalt, die Beziehungen zwischen den Gegenständen“ „nur selten zum Ausdruck“ brächten, weil die Bilder die Kinder zu wenig anregten 68. Im Vergleich zum FöDaZ-Projekt sind die hier eingesetzten Videoclips deutlich kürzer (Magnetschiffe und Wasserflasche je 1 min, Zivilcourage 2 min). Auch inhaltlich unterscheiden sich die Clips von anderen im Rahmen von DaZStudien verwendeten Filmen. So wurden bewusst keine komischen bzw. eher kindlich ausgerichtete Filme verwendet, sondern Videoclips gewählt, deren Inhalte in dieser oder ähnlicher Form auch Unterrichtsgegenstände der Primarstufe darstellen könnten. Die drei Filmsequenzen sprechen außerdem verschiedene potentielle Interessensgebiete von Grundschülern an. Alle Videoclips wurden in der ursprünglichen Fassung auf der Internetseite YouTube gefunden und lediglich an einigen Stellen etwas gekürzt. Außerdem wurden sie den Schülern ohne Ton präsentiert. Die im Folgenden vorgestellten Videoclips wurden den Schülern in unterschiedlicher Reihenfolge präsentiert, damit Unterschiede bei den Sprachproben nicht darauf zurückgeführt werden können, zu welchem Zeitpunkt der Film gezeigt wurde (z.B. eine ausführlichere Versprachlichung des zuerst gezeigten Clips, weil die Konzentrationsfähigkeit zu Beginn am höchsten ist). 67F

|| 68 Weitere Kritikpunkte zum Einsatz von Bildergeschichten zur Elizitierung freier Sprachproben finden sich in Gräfe-Bentzien 2000: 29, 32, 34 und Bredel 2001: 13–18.

Datenerhebung | 187

Zivilcourage In dem etwa zweiminütigen Clip Zivilcourage 69 geht es in Form einer kurzen Filmhandlung mit Star-Wars-Elementen um das Verhalten zweier ca. 15-jähriger Jungen, die beobachten, wie ein fremdländisch aussehender Grundschüler von älteren Jugendlichen bedrängt wird. Im Folgenden sollen die einzelnen Szenen kurz beschrieben werden: 68F

Szene 1: Fernsehabteilung eines Elektronikfachmarktes In dieser Szene sieht man zwei jugendliche Jungen, von denen einer mit Begeisterung an einer Spielkonsole (vermutlich Nintendo Wii) ein Star-Wars-Spiel spielt und sich offensichtlich als Held fühlt, während sein Freund nach kurzer Zeit die Augen verdreht und mit Blick auf die Uhr drängt, das Geschäft zu verlassen. Szene 2: Am Imbissstand Nachdem die beiden Freunde sich angeregt unterhaltend das Geschäft verlassen haben, sieht man in dieser Szene, wie sie sich an einem Imbissstand eine Currywurst kaufen. Anschließend sieht man sie eine Rolltreppe nach unten fahren. Szene 3: Belästigung im U-Bahnhof Im U-Bahnhof angekommen bemerken sie, wie mehrere Jugendliche einen fremdländisch und verängstigt aussehenden Grundschüler hin und her schubsen. Szene 4: Flucht Als der Junge, der eben noch mit Begeisterung Star-Wars gespielt hat, dies bemerkt, reagiert er offensichtlich unsicher und verwandelt sich in eine Star-WarsFigur, die im nächsten Moment fluchtartig den U-Bahnhof verlässt. Szene 5: Idee Sein Freund beobachtet die Szene noch einen Moment und wirft dann einen nachdenklichen Blick auf seine Currywurst, woraufhin sein Gesichtsausdruck darauf schließen lässt, dass er offensichtlich eine Idee entwickelt hat.

|| 69 Originalclip: Ricke (2010)

188 | Entwicklung eines empirischen Verfahrens zur Evaluation von Fördereffekten Szene 6: Die Rettung In der nächsten Szene sieht man den Jugendlichen mit scheinbar blutender Nase und Mund, wie er dem kleinen Jungen 20 Euro in die Hand drückt und panisch auf ihn einredet, bevor er dann offensichtlich verängstigt verschwindet. Szene 7: Die Jugendlichen verschwinden Im nächsten Moment schauen sich die Jugendlichen unsicher an, geben dem kleinen Jungen das Handy wieder, das sie ihm zuvor weggenommen haben, klopfen ihm auf die Schulter und verschwinden. Der kleine Junge bleibt ratlos mit dem Handy in der einen und dem 20-Euro-Schein in der anderen Hand zurück. Szene 8: Auflösung Als der kleine Junge um die Ecke geht, sieht er seinen Retter in Ruhe seine Currywurst essen. Das Blut bzw. die Currysoße an Nase und Mund hat er sich inzwischen abgewischt. Szene 9: Wahrer Held Im nächsten Moment sieht man, wie sich der Jugendliche in eine positiv belegte Star-Wars-Figur verwandelt, bevor beide gemeinsam den U-Bahnhof verlassen und der kleine Junge dem Jugendlichen den 20-Euro-Schein zurückgibt. Die Relevanz des Themas Zivilcourage im Kontext Schule zeigt sich gleich zu Beginn der Rahmenlehrpläne der Berliner Grundschule für alle Fächer: Die Aufgabe der Grundschule ist es, Schülerinnen und Schüler bei der Entwicklung ihrer individuellen Persönlichkeit zu unterstützen und ihnen eine aktive Teilnahme am gesellschaftlichen Leben zu ermöglichen. In der Grundschule lernen sie durch aktives Mitwirken demokratisches Handeln, das heißt im Unterricht und im Schulleben mitzugestalten, mitzubestimmen und Mitverantwortung zu übernehmen. […] Grundlegende Bildung zielt auf die Bewältigung und Gestaltung von Lebenssituationen. […] Die Schülerinnen und Schüler lernen, sich mit sich selbst und der sie umgebenden Welt und den gesellschaftlichen Schlüsselproblemen auseinander zu setzen. Zur grundlegenden Bildung gehören insbesondere: 1.

Auseinandersetzung mit Grundfragen des menschlichen Zusammenlebens und das Anbahnen von Wertorientierungen, […]

2.

Fähigkeit und Bereitschaft zur Selbst- und Mitbestimmung sowie zum solidarischen Handeln […] (Senatsverwaltung für Bildung 2004: 7–8)

Datenerhebung | 189

Für diese Zielsetzungen eignet sich der Film in besonderem Maße, da er eine sehr authentische Situation zeigt, die – auch durch die fiktionalen Star-WarsElemente – direkt an die Lebenswelt der Schüler anknüpft und vielfältige Identifizierungsmöglichkeiten anbietet. Auch die spannende Handlung mit der überraschenden Wendung trägt dazu bei, dass der Film als sehr ansprechend für Primarschüler eingestuft werden kann. Was das Verständnis der Handlung angeht, ist zu erwarten, dass nicht alle Schüler den Ketchup-Blut-Trick durchschauen und der Handlungsablauf für sie deshalb nicht gänzlich nachvollziehbar ist. Da es aber weder um das Verständnis des Filmes noch eine inhaltliche Auseinandersetzung mit der Thematik geht, ist darin kein Problem zu sehen. Wasserflasche In dem einminütigen Clip Wasserflasche 70 wird ein kurzes Wasser-Experiment zum Thema Luftdruck vorgeführt. 69F

Szenen 1–3: Materialien Zu Beginn werden die benötigten Materialien für das Experiment gezeigt: – – –

eine leere Wasserflasche ein Stück Alufolie mit einem kleinen Loch darin ein Zahnstocher

Szenen 4–6: Experiment Teil I In den nächsten Szenen wird die Wasserflasche zunächst mit Wasser gefüllt und dann mit dem Stück Alufolie abgedeckt. Danach wird die Wasserflasche umgedreht und es zeigt sich, dass kein Wasser entweichen kann, obwohl die Alufolie ein Loch enthält und nur lose befestigt wurde: Szene 5: Experiment Teil II Anschließend wird gezeigt, wie ein Zahnstocher durch das Loch in der Alufolie gesteckt wird und dann in der Flasche nach oben schwimmt, während das Wasser weiterhin in der Flasche verbleibt.

|| 70 Das Originalvideo, das 2010 auf YouTube öffentlich abrufbar war, ist dort mittlerweile nicht mehr verfügbar. Der damalige Link (http://www.youtube.com/watch?v=k9CxNhJBLfo&feature=related) funktioniert daher nicht mehr. Aufgrund der anonymen Quelle können keine Angaben zum Urheber gemacht werden.

190 | Entwicklung eines empirischen Verfahrens zur Evaluation von Fördereffekten Szene 6: Ende Zum Schluss sieht man, wie ein leichtes Klopfen auf die Unterseite der Flasche dazu führt, dass das Wasser herausläuft. Magnetschiffe Szene 1: Materialien Zu Beginn des Videos 71 sieht man einige Sekunden lang die wichtigsten Materialien für das Basteln der Magnetschiffe: 70F

– – – – – –

Kleber Styroporstückchen kleiner Magnet Reiszwecken dünne und dickere Holzstäbchen Tonpapier mit Ausschneidevorlage

Szenen 2–6: Basteln der Magnetschiffe In den folgenden Einstellungen sieht man, wie die Magnetschiffe gebastelt werden: Zuerst werden die auf dem Tonpapier vorgezeichneten Segel ausgeschnitten und ein dünnes Holzstäbchen (Zahnstocher) in das zugeschnittene Styroporstückchen gesteckt. Anschließend wird das ausgeschnittene Papiersegel mit Kleber an dem Holzstäbchen befestigt und von unten eine Reißzwecke in das Styroporboot gesteckt. Szene 7: Schiffe schwimmen lassen In der letzten Szene werden die Schiffe schwimmen gelassen. Dabei sieht man, wie zunächst eine Auflaufform, die auf zwei Holzstäben steht, mit Wasser gefüllt wird, so dass die Schiffe auf dem Wasser schwimmen. In der nächsten Einstellung ist zu erkennen, dass ein Holzstäbchen, an dessen einem Ende ein Magnet befestigt wurde, unter die Auflaufform geschoben wird. Aufgrund der Reißzwecke unter den Schiffchen werden die Boote vom Magneten angezogen und lassen sich dadurch mit Hilfe der Holzstäbchen hin und her bewegen. Auch das Durchführen, Beobachten und Beschreiben von Experimenten gehört laut Berliner Rahmenlehrplan zu den Zielen des Sachunterrichts der Grund|| 71 Original: http://www.youtube.com/watch?v=ClyfNMAS0Mw&list=PLFC0F7AD82CE7A56E, zuletzt geprüft am 15.01.2015. Abgesehen vom Verweis auf die Website www.MalvorlageBilder.de sind keine genaueren Angaben zum Urheber vorhanden. Für den Einsatz als Stimulus wurden die eingeblendeten Textzeilen entfernt und die Szene 1 („Materialien“) verlängert.

Datenerhebung | 191

schule (Senatsverwaltung für Bildung 2004: 23–24). Die mündliche Beschreibung oder Wiedergabe eines solchen Experiments erfordert eine exakte und elaborierte Sprachverwendung mit Ausdrucksmitteln, die über alltagssprachliche Kommunikationsmittel hinausgehen (z.B. präzise Verwendung von Funktionswörtern). Auch das Basteln von Magnetschiffen kann als eine Art Experiment im Rahmen einer Unterrichtseinheit zum Thema Magnetismus durchgeführt werden. Dabei ist es sowohl denkbar, dass die Schüler die Vorgänge genau beobachten und beschreiben, als auch, dass sie das Vorgehen anderen Schülern erklären sollen. Wie schon beim Videoclip Zivilcourage ist davon auszugehen, dass nicht alle Schüler die Zusammenhänge vollständig erfassen. Auch hier geht es jedoch nicht um ein inhaltliches Verständnis. Ziel ist es, dass die Schüler möglichst genau beschreiben, was sie gesehen haben. Die besondere Herausforderung ergibt sich aus den zu beschreibenden Vorgängen, die zwar Bezüge zu alltäglichen Erfahrungen aus der Lebenswelt der Schüler enthalten, in der alltäglichen Kommunikation jedoch normalerweise nicht so differenziert versprachlicht werden müssen. Eine Grundvoraussetzung für die angemessene Umsetzung dieser Aufgabe ist natürlich, dass die Schüler die distanzsprachlichen Bedingungen der Kommunikationssituation erkennen. Hier sei noch einmal auf die Untersuchungen von Ricard & Snow (1990), Temple (1991) und Herman (1997) verwiesen (vgl. Kap. 2.1), in denen bestätigt werden konnte, dass Primarschüler distanzsprachlichen Kommunikationssituationen angemessen als solche erkennen und versuchen, ihre Sprache entsprechend anzupassen. Dem gegenwärtigen Forschungsstand zur Aneignung pragmatischer Fähigkeiten zufolge ist zudem davon auszugehen, dass die in den Aufgabenstellungen erwarteten produktiven und rezeptiven pragmatischen Fähigkeiten („Basisqualifikationen“) bei 9 bis 10-Jährigen als vorausgesetzt angesehen werden können bzw. ähnliche kommunikative Situationen aus der Schule bekannt sind (vgl. Trautmann & Reich 2008; Trautmann 2008). Entwicklungsbedingte Unterschiede sind jedoch hinsichtlich der Hörerorientierung zu erwarten. So wurde in einer Untersuchung beobachtet, dass Schüler zwischen sieben und neun Jahren bestimmte Beobachtungen oder Handlungen sprachlich zwar viel detaillierter wiedergeben, dies aber „in der Form einer Nacherzählung“ tun, „bei der der Hörer nicht im Blick ist“ (Weber 1975/1982, zit. nach Trautmann 2008: 46–47). In der vorliegenden Untersuchung stehen jedoch keine pragmatischen Fähigkeiten im Vordergrund, so dass es ausreicht, wenn von den Schülern erwartet werden kann, dass sie distanzsprachliche Kommunikationssituationen als solche erkennen und wissen, dass diese eine elaboriertere, d.h. explizite und differenzierte Versprachlichung erfordern.

192 | Entwicklung eines empirischen Verfahrens zur Evaluation von Fördereffekten

6.4 Transkription Gemäß des methodischen Dreischritts bei der Untersuchung gesprochener Sprache („Aufzeichnung“, „Verschriftlichung“, „Analyse“, Fiehler 2006a: 1198) müssen die aufgezeichneten Sprachproben im nächsten Schritt transkribiert werden. Denn nur, wenn gesprochene Sprache verschriftlicht wird, ist sie für eine detaillierte Analyse zugänglich. Das Paradoxon in dieser Bedingung besteht darin, dass auch die besonderen Eigenschaften der gesprochenen Sprache nur in einer verschrifteten Form untersucht werden können. Dabei darf der Untersucher jedoch nicht in die „Textfalle“ tappen, indem er die Transkripte wie schriftliche Texte liest (Fiehler 2006a: 1199). Eine sorgfältige Transkription ist eine unabdingbare Voraussetzung für spätere objektive Auswertungsergebnisse. Je nach Zielsetzung stehen unterschiedliche Transkriptionssysteme zur Verfügung 72. Allen gemein ist, dass die Transkription gesprochener Sprache ein sehr zeitaufwändiger Vorgang ist. So beträgt der Zeitaufwand für das Transkribieren je nach Feinheitsgrad Fiehler (2006a: 1199) zufolge das 30 bis 60fache der Dauer der Aufzeichnung. Bei einer fünfminütigen Sprachprobe würde die Verschriftlichung demnach mindestens 2,5 Stunden dauern. Hier ist jedoch zu berücksichtigen, dass Fiehler aus der Perspektive der Gesprochenen-Sprache-Forschung argumentiert, die sich vor allem für die Besonderheiten und Feinheiten prototypischer Nähesprache interessiert und zu diesem Zweck eher qualitative Analysen relativ kleiner Stichproben bzw. Fallstudien durchführt. Für das vorliegende Verfahren muss dagegen eine Verschriftlichungsmethode gefunden werden, die eine objektive Analyse der interessierenden schulsprachlichen Merkmale ermöglicht – nicht weniger, aber auch nicht mehr. Denn aufgrund der relativ großen Stichprobe darf die Transkription einer Sprachprobe aus ökonomischen Gründen im Durchschnitt nicht länger als 100 min. benötigen. Weiterhin müssen das Transkribiersystem und die dazugehörige Software leicht verständlich und handhabbar sein, damit die Transkriptionen gut von studentischen Hilfskräften durchgeführt werden können. Unter diesen Bedingungen erweist sich das Transkribierformat CHAT (Codes für Human Analysis of Transcripts) im Zusammenhang mit der Software CLAN (Child Language Analysis) als besonders geeignet und soll im Folgenden kurz vorgestellt werden. 71F

|| 72 Für einen vergleichenden Überblick siehe Dittmar 2009.

Transkription | 193

6.4.1 Zum Transkriptionssystem CHAT Das Transkriptionssystem CHAT wurde zusammen mit der entsprechenden Software CLAN im Rahmen des CHILDES-Projekts (Child Language Data Exchange System) entwickelt, das in den 80er Jahren von Brian MacWhinney begonnen und 2002 in das TalkBank-System integriert wurde 73. Das CHILDESProjekt verfolgt das Ziel, eine internationale Datenbank für den Erst- und Zweitspracherwerb aufzubauen. Um den gegenseitigen Austausch der Daten zu ermöglichen, arbeitet es mit dem einheitlichen Transkribierformat CHAT (vgl. MacWhinney 1991: 2000). In den vergangenen Jahrzehnten hat sich dieses Transkribiersystem sehr erfolgreich durchgesetzt, so dass es auf internationaler Ebene mittlerweile „das meistgewählte Transkriptionsmodell für Erst- und Zweitspracherwerbsforscher“ ist (Dittmar 2009: 103). Auch im deutschen Raum arbeiten mittlerweile viele Forschergruppen im Kontext von Mehrsprachigkeit und DaM-/DaZ-/DaF-Erwerb mit CHAT (z.B. Ahrenholz 2005; Pfaff 2009: 219; Stephany et al. 2001). Unterstützt wird CHAT durch elaborierte Auswertungsprogramme v.a. im Rahmen der Software CLAN (MacWhinney 2000). „Dieses Design will nicht-normativem, nicht-muttersprachlichem und entwicklungsbedingtem Kommunikationsverhalten gerecht werden und hat auf diesem Hintergrund Kodierkonventionen und -ebenen, die sich von den anderen Systemen unterscheiden“ (Dittmar 2009: 103). Eine besondere Stärke von CHAT besteht verschiedenen Forschern zufolge in seiner Anpassungsfähigkeit (Meakins 2007: 111; Dittmar 2009: 145–146): 72F

Die Besonderheit des Systems CHAT besteht in den Anspruch, verschiedenste Analyseniveaus durch die Ausdifferenzierung von Teilsystemen zu ermöglichen und dennoch die Handhabbarkeit des Gesamtsystems zu garantieren. Das System unterstützt Optionen für die Transkription pragmatischer diskurslinguistischer Bedingungen genauso gut wie Optionen für detaillierte lexikalische, phonologische und morphosyntaktische Analysen. Je nach Forschungsansatz kann der Anwender des CHAT-Systems ein nahezu beliebig großes Aufgebot an Kodieroptionen für eine vielschichtige Analyse nutzen und darüber hinaus nach Bedarf eigenen Untersuchungskriterien hinzufügen. [...] Das Hauptziel der Transkription besteht darin, die vom Lerner produzierten Wortformen so authentisch wie möglich wiederzugeben. Dabei bestehen Abweichungen in Lernersprachen aus einer Vielzahl an Merkmalen und Charakteristika, die durch das reiche Zeicheninventar des CHAT-Systems hinreichend erfasst werden können. (Dittmar 2009: 148)

|| 73 vgl. http://childes.psy.cmu.edu/

194 | Entwicklung eines empirischen Verfahrens zur Evaluation von Fördereffekten CLAN steht ebenso wie das dazugehörige umfangreiche und detaillierte Handbuch kostenfrei als Download für Windows und Apple zur Verfügung (http://childes.psy.cmu.edu). Weiterhin zeichnet es sich durch eine große Bedienerfreundlichkeit aus, so dass auch unerfahrene Transkribenten auf der Basis von Videodateien, die man während des Transkribierens sehen kann, sehr schnell und problemlos Basistranskripte erstellen können (Meakins 2007: 109; Dittmar 2009: 194). CHAT basiert auf einer sequentiellen Struktur, bei der Sprecherbeiträge mit einer neuen Zeile beginnen. Dadurch eignet sich das Transkribiersystem vor allem „zur Analyse von Gesprächen mit wenigen Beteiligten (z.B. 'Zweiergespräche', Interviews) und kurzen Beiträgen“, während sich zur Analyse von „Mehrparteiengesprächen“ (z.B. Diskussionen im Unterricht) eher Partiturschreibweisen anbieten, die in CHAT jedoch nicht möglich sind (Dittmar 2009: 94–95). In CHAT muss jede Äußerung mit einem Punkt, Fragezeichen oder Ausrufezeichen abgeschlossen werden, wobei diese Markierungen nicht mit den klassischen Satzzeichen zu verwechseln sind. Zwar soll durch die Markierung des Äußerungsendes auf der Grundlage des „generellen Hörereindrucks“ des Transkribenten eine Unterscheidung in Aussage, Frage oder Aufforderung erfolgen, aber es muss sich dabei nicht notwendigerweise um grammatikalisch wohlgeformte bzw. vollständige Sätze handeln. Dass auf diese Weise eine Segmentierung der Äußerungen erzwungen wird, lässt sich dadurch begründen, dass die kindlichen bzw. lernersprachlichen Äußerungen ohne diese Äußerungsbegrenzung sonst häufig nicht verständlich und entsprechend für die weitere Analyse nicht brauchbar sind (Dittmar 2009: 152). CHAT ist verschiedentlich kritisiert worden, wobei es sich vor allem um diskursanalytische und funktional-pragmatische Aspekte handelt, die für die Analyse typisch gesprochensprachlicher und frühkindlicher Phänomene bedeutsam sind (Edwards 1989) 74. Da durch das vorliegenden Verfahren vor allem Merkmale einer konzeptionell schriftlichen Sprachform (Schulsprache) erfasst werden sollen, sind diese Kritikpunkte zu vernachlässigen. 73F

6.4.2 Transkriptionskonventionen Wie oben beschrieben bietet CHAT eine Vielzahl an Kodieroptionen für praktisch alle sprachlichen Bereiche. In diesem Zusammenhang wird jedoch auch kritisiert, dass „das Transkriptionssystem […] überladen [ist], d.h. es gibt zu || 74 Für einen Überblick siehe auch Dittmar 2009: 156–157.

Transkription | 195

viele Kategorien für teilweise sehr nuancierte feine Unterschiede“ (Dittmar 2009: 156–157). Aufgrund seiner Anpassungsfähigkeit ist es jedoch auch möglich, sehr einfach gestaltete Basistranskripte zu erstellen und diese mithilfe eigener Kodierungen zu versehen, die später dank der Software CLAN computerbasiert automatisch ausgezählt werden können. Auch ist es möglich, unterschiedliche Teile in einem Transkript zu markieren, um diese später separat auszuwerten. Schon bei der Entwicklung der Transkriptionskonventionen ist daher die Zielsetzung der späteren Analyse entscheidend. Diese bezieht sich im vorliegenden Fall auf die Analyse relevanter morpho-syntaktischer und lexikalisch-semantischer Phänomene der gesprochenen Schulsprache. Den spezifischen Aspekten, die sich durch die mündliche Realisierungsform ergeben, muss nur insofern Rechnung getragen werden, als sie bei der späteren Analyse nicht vorschnell als fehlerhafte Abweichung – gemessen am geschriebenen Standard – gewertet werden dürfen. Dies betrifft vor allem syntaktische Aspekte, die in besonderem Maße durch die Produktionsbedingungen gesprochener Sprache betroffen sind (vgl. Kap. 2.3.2). Die durch das CHAT-Format erforderliche Segmentierung der Schüleräußerungen dient deshalb allein der Lesbarkeit bzw. Verständlichkeit der Transkripte, sie darf jedoch nicht als Einteilung in Sätze missverstanden werden. Ein weiterer Bereich, bei dem gesprochenensprachliche Phänomene berücksichtigt werden müssen, betrifft Aussprachephänomene. So kommt es aufgrund der besonderen Produktionsbedingungen in der gesprochenen Sprache immer wieder zu Assimilationen, Elisionen („Abschleifungen“) und Enklisen bzw. Klitisierungen (vgl. Kap. 2.3.5). Auch diese Phänomene müssen bei der Transkription berücksichtigt werden, so dass zum einen eine einheitliche Verschriftlichung gewährleistet ist, zum anderen unsere schriftsprachlich geprägte Wahrnehmung (Fiehler 2006a: 1178) nicht dazu führt, dass bei der Verschriftlichung Vervollständigungen bzw. Anpassungen vorgenommen werden. So ist gerade die möglichst lautgetreue Verschriftlichung von Flexionsmarkierungen für die spätere Analyse bedeutsam (z.B. „*Der gibt das ein Jung“ und nicht: „Der gibt das einem Jungen“). Bei der späteren Analyse ist dann zwischen ‚normalen‘ Abschleifungen wie „Der sieht ein Jung“ und fehlerhaften Strukturen, die auch in der gesprochenen Sprache als Abweichung beurteilt werden (z.B. „*Der sieht ne Junge“) zu differenzieren 75. Ein grundlegendes Prinzip der Datenaufbereitung und -analyse des vorliegenden Verfahrens besteht darin, die ausführenden Hilfskräfte für spezifische Aufgaben zu schulen, für die sie dann Experten sind. So wird die Kodierung von 74F

|| 75 Vgl. dazu Corders Differenzierung von „errors“ und „lapses“ in Kap. 3.3.2 .

196 | Entwicklung eines empirischen Verfahrens zur Evaluation von Fördereffekten Studierenden durchgeführt, die über fundierte systemlinguistische Kenntnisse verfügen und zusätzlich für ihren jeweiligen Auswertungsschritt geschult werden. Die Transkription erfolgt dagegen durch studentische Hilfskräfte, die über eine gute auditive Wahrnehmung verfügen und zudem möglichst schnell und sicher tippen können. Die Transkriptionen orientieren sich an der gängigen Orthographie, wobei jedoch Verschleifungen aus den oben genannten Gründen möglichst lautgetreu verschriftlicht werden sollen. Da sich die Transkribenten auf eine möglichst genaue Verschriftlichung der Sprachproben konzentrieren sollen, sollten sie „möglichst wenig über später durchzuführende Datenauswertungen praktisch entscheiden müssen; dies sollte den Analytikern vorbehalten bleiben“ (Dittmar 2009: 157). Die Zahl der zusätzlichen Markierungen bzw. Kodierungen wurde deshalb bewusst gering gehalten. Nur solche Phänomene, die eine notwendige Zusatzinformation zur Interpretation und Verständlichkeit des Transkripts für den Kodierer darstellen, werden entsprechend markiert. Dies betrifft neben der grundsätzlichen Segmentierung der Äußerungen vor allem die folgenden Merkmale: – – – – –

Einsatz von gestischen Mitteln Markierung von Pausen (vorläufige) Markierung von Wiederholungen und Selbstkorrekturen Markierung unverständlicher Passagen Besondere Vorkommnisse während der Aufnahme (z.B. Unterbrechungen, laute Störgeräusche etc.)

Aus zeitlichen Gründen werden nur die Äußerungen der Schüler transkribiert, da die Interviewer die vorgegebenen Fragen vorlesen und daher keine Unterschiede erwartbar sind. Nur wenn ein Interviewer vom vorgegebenen Vorgehen abweicht, muss dies vermerkt und die entsprechenden Äußerungen des Interviewers verschriftlicht werden. Weiterhin werden nur die Abschnitte verschriftlicht, die die Grundlage für die spätere Auswertung bilden. Nicht transkribiert wurden im Rahmen der vorliegenden Arbeit daher die Dialoge während der Aufwärmphase und die zusätzlichen Fragen zu den Videoclips, die nur als Sicherheit dienten, falls die Schüler nicht genug von sich aus sprechen würden (vgl. Kap. 6.3.2). Für die Transkription liegt den Transkribenten ein Leitfaden und ein Dokument mit ergänzenden Hinweisen vor, in denen neben dem Ablauf der Interviews alle Schritte und Konventionen des Transkriptionsvorgehens enthalten sind (vgl. Anhang 8.2). Darauf ist auch vermerkt, welche Passagen zu transkribieren sind. Der grundsätzliche Aufbau und die Kodierungen der Transkripte werden anhand der Beispiel-Transkription in Tab. 21 verdeutlicht:

Transkription | 197

Tab. 21. Exemplarischer Aufbau einer Transkription Transkript

Kodierung

Erklärung

@media

Verknüpfung zu Videoda-

@Begin

@Begin

Anfang des Transkripts

@Languag- de

@Languages

@Media

pre123456

tei

es: @Partici-

INT Mustermann, SCH pre123456,

pants:

Student

Sprache

@Participants Gesprächsteilnehmer: INT = Interviewer, SCH = Schüler-ID

@ID:

de/BeFo/SCH/male/pre123456

@ID

Merkmale des Schülers

@ID:

de/BeFo/INT/male

@ID

Merkmale des Interviewers

@Coder:

Musterfrau

@Coder

Transkribent

%com:

Aufwärmphase.

%com

erklärender Kommentar

%com:

Aufwärmphase.

*INT:

Erklärung 1 Zivil.

*INT

Äußerung des Interviewers. Hier nur Verweis auf Erklärung 1 Zivil.

%com:

Film anschauen.

@Bg:

Zivil

*INT:

Frage 1 Zivil.

*SCH:

Hm # der Film hat angefang.

@Bg: Zivil

Beginn des Abschnitts zum Clip Zivilcourage

*SCH:

xxx da hat ein Junge.

*SCH

Äußerung des Schülers

#

kurze Pause (ca. 1 sek)

xxx

unverständliche Passage, Grund: undeutliche Aussprache

*SCH:

ein xxx et gespielt.

*SCH:

so Star Wars.

*SCH:

da war noch ein Jung.

*SCH:

er hat gesagt darf ich auch mal?

*SCH:

xxx xxx xxx xxx t.

*SCH:

Also ich konnte nich hörn.

*SCH:

aber die haben dann xxx dann ham die weitergemacht.

*SCH:

danach sind sie rausgegang.

198 | Entwicklung eines empirischen Verfahrens zur Evaluation von Fördereffekten Transkript *SCH: *SCH:

Kodierung

Erklärung

[//]

Selbstkorrektur

und der Junge hat erzählt und erzählt. sie ham sich dann Würstchen gekauft.

*SCH:

da hat der xxx ge xxx.

*SCH:

xxx und dann xxx.

*SCH:

xxx auch und in der U Bahn auch.

*SCH:

da ham sie ein Jung gesehn die von

großen Jungs [//] Taschengeld Taschengeld von ihm wolltn. *SCH: *SCH:

# da [//] hat der sein Kapuze

[//]

hochgemacht danach..

hat

Wiederholung

hat der sich umge xxx da war so ne Maske da.

*SCH:

da is er weggerannt.

*SCH:

da hat der Junge zu d xxx Würstchen xxx.

*SCH:

seiner Gabel gegriffn.

*INT:

Frage 2 Zivil.

*SCH:

### hm ### dass der Junge die Gabel ###

längere Pause (mind. 2

wohin wirft.

sek.)

*SCH:

# oder dass der andere Junge kommt.

*SCH:

# und ihn rettet.

*INT:

Okay # prima.

*INT:

Erklärung 2 Zivil.

%com:

Film anschauen.

*INT:

Frage 3 Zivil.

*SCH:

Da hat der Würstchen xxx.

*SCH:

www da hat der xxx xx irgendwie sah s aus wie Blut da.

*SCH: *SCH:

der gesagt de. kleine Junge hat xxx ge hat ihn dann zwanzig Euro gegebn und is dann weggerannt.

*SCH:

da sind die anderen Jungs.

*SCH:

auch ham die ge xxx xxx.

*SCH:

xxx xxx xxx.

*SCH:

und sind dann weggerannt.

*SCH:

da # is der weitergelaufn zu den

Transkription | 199 Transkript

Kodierung

Erklärung

Treppen. *SCH:

da war der Junge hat den Würstchen weggeworfn.

*SCH:

# und danach sah er aus wie ein Star Wars Krieger und dann xxx [//] runter xxx..

*SCH:

also # hm mit dem Jung [//].

*SCH:

sind sie die Treppen also runtergegang zur U Bahn oder zur S Bahn wieder eingestiegn..

*INT:

# super # spannender Film # okay jetzt.

*INT:

Erklärung 3 Zivil.

%com:

INT stellt Fragen zu Film.

*:

*:

*:

transkribiert wurden

*: @Eg:

Passagen, die nicht

Zivil

@Eg: Zivil

Ende des Abschnitts zum Clip Zivilcourage

*: *INT:

Erklärung 1 Schiffe.

%com:

Film anschauen.

@Bg:

Schiffe

@Bg: Schiffe

Beginn des Abschnitts zum Clip Magnetschiffe

*INT: *SCH:

Frage 1 Schiffe. # äh die haben # Dreiecke ausgeschnittn # in grün # in blau?

*SCH:

sie haben dann # was weiches genomm ham ein Zahnstocher reingemacht haben dann wieder Dreiecke an # das Zahnstocher angeklebt.

*SCH:

und [//] sie haben dann [//] eine Nadel [//] # in jedem Schiff rangemacht damit s nich untergeht..

200 | Entwicklung eines empirischen Verfahrens zur Evaluation von Fördereffekten Transkript *SCH:

Kodierung

Erklärung

# und sie ham dann in [//] # ein [//] richtig großen Teller Wasser xxx.

*SCH: *SCH:

da warn auch Hölzer drin. und sie ham da so Wasser reingemacht.

*SCH:

www sind sie geschwomm.

www

unverständliche Passage, Grund: technische Probleme, Nebengeräusche

*SCH:

### als wo das Wasser war.

*SCH:

als sie das gießen wolltn [//] äh war s gar nich dort.

*SCH:

da kam gar nichts mehr weil das xxx war noch da.

*INT:

Erklärung 2 Schiffe.

*:

*:

*:

transkribiert werden

*: %com:

Passagen, die nicht

Eventuell hat Film vor dem eigentli-

Eventuell hat

chen Ende schon gestoppt.

Film vor dem eigentlichen Ende schon gestoppt.

@Eg:

Schiffe

*INT:

Erklärung 1 Wasser.

@Eg: Schiffe

Ende des Abschnitts zum Clip Magnetschiffe

%com:

Film anschauen.

@Bg:

Wasser

@Bg: Wasser

Beginn des Abschnitts zum Clip Wasserflasche

*INT:

Frage 1 Wasser.

*SCH:

Sie ham in eine Flasche Wasser

*SCH:

sie ham eine # [//] Alufolie

reigemacht. benutzt. *SCH:

ein Loch darin gemacht.

Transkription | 201 Transkript *SCH:

Kodierung

Erklärung

sie haben in die Flasche Wasser reingegossen.

*SCH:

ham dann das auf die Alufolie an der Flasche befestigt.

*SCH: *SCH:

da ham sie ein Zahnstocher genomm. [//] dann haben sie s von unten da reingesteckt.

*SCH:

und dann is der Zahnstocher sogar nach oben geflogn..

*SCH:

und [//] # als der Mann oder die Frau oder das Kind äh # auf die Flasche gehaun hat dann is das irgendwie abgegang.

*SCH:

und als sie ganze Zeit geschüttelt ham is das Wasser trotzdem nich rausgekomm.

*INT:

Erklärung 2 Wasser.

%com:

INT stellt Fragen zu Film.

*:

*:

*:

transkribiert werden

*: @Eg:

Passagen, die nicht

Wasser

@Eg: Wasser

Ende des Abschnitts zum

@End

Ende des Transkripts

Clip Wasserflasche @End

Die meisten Markierungen sind intuitiv nachvollziehbar und können problemlos umgesetzt werden. Nur bei der Markierung von Selbstkorrekturen ist eine vertiefte Sachkenntnis erforderlich. An dieser Stelle ist jedoch zu beachten, dass die Selbstkorrekturen zu Beginn des späteren Kodiervorgangs noch einmal systematisch kontrolliert und kodiert werden (vgl. Kap. 6.5.2.1). Die Markierung durch die Transkribenten dient vor allem als Unterstützung bzw. Vorentlastung für die Kodierer, denen prosodische Merkmale als Indikatoren für Selbstkorrekturen nur eingeschränkt zur Verfügung stehen. Bei der Definition und Identifikation von Selbstkorrekturen orientiert sich das Verfahren an Egbert (2009). Diese unterscheidet in Anlehnung an Schegloff, Jefferson & Sacks (1977) zwischen „self-initiated self-completed repair“ und „self-initiated other-competed repair“. Im Rahmen der vorliegenden Arbeit

202 | Entwicklung eines empirischen Verfahrens zur Evaluation von Fördereffekten interessiert jedoch nur der erstgenannte Reparaturmodus, bei dem die Reparatur vom Sprecher selbst eingeleitet und behoben wird. Abb. 27 zeigt die möglichen Bestandteile solcher selbst-initiierten Reparaturen:

Abb. 27. Mögliche Bestandteile der Selbstreparatur nach Egbert (2009: 55)

Um Selbstreparaturen zu markieren, verwenden Sprecher verschiedene Formen der Reparatur-Initiierung wie Lautdehnungen, Verzögerungssignale (z.B. äh, hm) oder lexikalische Mittel (z.B. ich mein, oder) (Schegloff, Jefferson & Sacks 1977, zit. nach Egbert 2009: 56–60). Werden solche Merkmale produziert, können Selbstkorrekturen von den Transkribenten leicht identifiziert werden. Oft erfolgt eine Korrektur jedoch auch ohne eine solche „Initiierung“ (Egbert 2009: 60). Ohne eine intensive Konversationsanalyse können Selbstkorrekturen dann nur erkannt werden, wenn sich eine eindeutige Reparatur-Operation feststellen lässt. Reparatur-Operationen unterschieden sich zum einen dahingehend, dass im Rahmen der Reparatur ein zuvor produziertes Fragment wiederholt wird (= „Recycling“, Schegloff 1987) oder nicht. Zum anderen gibt es Reparaturen mit und ohne Umstrukturierung der zunächst geplanten Äußerung. Die folgenden Beispiele sind Egbert (2009, 61–63) entnommen: 1.

Vervollständigung ohne Recycling: nä wir warn bei: (0.1) eh michael bahr und deliard.

2.

Umstrukturierung ohne Recycling: has du- eh war tür zugemacht vom büro.

3.

Vervollständigung mit Recycling: in somalia oder so da- da sichern se einfach nur…

4.

Umstrukturierung mit Recycling: eh barbara was is denn- was nehm wir denn jetzt mal als kerze?

Da im Rahmen des vorliegenden Verfahrens keine qualitativen konversationsanalytischen Vorgehensweisen angewandt werden sollen, waren

Transkription | 203

zur Identifikation von Selbstkorrekturen möglichst eindeutige Kriterien zu definieren. Aus diesem Grund werden bei der Kodierung der Sprachproben nur Umstrukturierungen mit Recycling berücksichtigt. Wenn kein Recycling erkennbar ist, werden nur direkte Ersetzungen bei gleichbleibender Wortart als Korrektur gewertet (z.B. „Der Mann [//] ruft dann die Polizei.“). Bezieht sich die Wiederaufnahme und/oder Umstrukturierung ausschließlich auf Gesprächspartikeln (z.B. hm, naja, so), wird dies nicht als Selbstkorrektur gewertet. Gleiches gilt für die Wörter und, da, dann, danach, und da/dann/danach, denn diese werden in der mündlichen Sprachproduktion häufig synonym und als Füllwörter bzw. Gesprächspartikeln eingesetzt, die zwar teilweise Selbstkorrekturen initiieren, aber nicht als primärer Gegenstand der Selbstkorrektur zu bewerten sind (vgl. Beispiele in Anhang 8.2.2.5). Die Markierung des korrigierten Teils der Äußerung (= „Reparandum“, vgl. Levelt 1983) erfolgt auf die gleiche Weise wie die Einklammerung von Wiederholungen (vgl. Tab. 21) 76. Neben der theoretischen Erklärung, was Selbstkorrekturen kennzeichnet, erwies sich bei der Identifikation von Selbstkorrekturen vor allem die folgende Faustformel als besonders hilfreich: „Markiere genau die Teile als Wiederholung bzw. Selbstkorrektur, die der Schüler beim Schreiben durchstreichen würde“. Im Rahmen der Transkription werden Selbstkorrekturen nur identifiziert und markiert. Die differenzierte Kodierung der Selbstkorrekturen nach sprachlicher Ebene erfolgt während des eigentlichen Kodiervorgangs (vgl. Kap. 6.5.2.1). Um eine möglichst objektive Identifizierung der Selbstkorrekturen zu gewährleisten, sollten sich die Transkribenten in Zweifelsfällen an den in Abb. 28 dargestellten Algorithmus halten. Die Ziffern beziehen sich dabei auf Beispiele, die im Instruktionsmanual zu finden sind (vgl. Anhang 8.2.2.5, Tab. A-2:). 75F

|| 76 Wortmaterial, das als Wiederholung bzw. Reparandum markiert wurde, wird bei der weiteren Auswertung nicht berücksichtigt. Dieses Vorgehen schließt sich dem Verfahren in anderen Studien an, in denen Schüleräußerungen vor der Datenauswertung ebenfalls von Wiederholungen und Selbstkorrekturen „bereinigt“ werden (z.B. Nickel 2010: 62; Clahsen, Meisel & Pienemann 1983: 70.

204 | Entwicklung eines empirischen Verfahrens zur Evaluation von Fördereffekten

Abb. 28. Algorithmus A zur Identifikation von Wiederholungen und Selbstkorrekturen (Transkription)

Kodierung | 205

In dem Beispieltranskript in Tab. 21 wird weiterhin deutlich, dass sich die Verschriftlichungen zwar an der regulären Orthographie orientieren, zugleich aber viele Abweichungen festzustellen sind. Dies liegt einerseits daran, dass bestimmte Abschleifungen (gerade wenn Flexionsmarkierungen betroffen sind), möglichst lautgetreu verschriftlicht werden sollten. Zum anderen lässt es der zeitlich-finanzielle Rahmen der meisten Evaluationsprojekte nicht zu, die Transkripte nachträglich auf Rechtschreibfehler hin zu untersuchen. Da die Verständlichkeit und Analyse der Transkripte dadurch aber auch nicht beeinflusst wird, ist dieses Vorgehen unproblematisch. Für die spätere automatische Berechnung von Gesamtwortzahl und Wortschatzvielfalt ist eine einheitliche Verschriftlichung wichtig. Zu diesem Zweck erhalten die Transkribenten Vorgaben für die Verschriftlichung besonders häufige Verschleifungen und Gesprächspartikel (vgl. Anhang 8.2.2.4, Tab. A-1:. Nicht vorkommende Formen müssen in jedem Fall einheitlich transkribiert werden, wobei es irrelevant ist, wie die Verschriftlichung aussieht. Vor der eigentlichen Verschriftlichung der Sprachproben erhalten die Transkribenten eine drei bis vierstündige Schulung, in der sie mit der Software und dem grundlegenden Vorgehen vertraut gemacht werden. Weiterhin erhalten sie folgende Instruktionsmaterialien: 1. 2. 3. 4.

Leitfaden (vgl. Anhang 8.2.1) Zusätzliche Hinweise (vgl. Anhang 8.2.2) Dokument Ablauf Interview (vgl. Anhang 8.2.3) Beispieltranskript (vgl. Anhang 8.2.4)

Mit Hilfe dieser Materialien werden zunächst einige Probetranskripte angefertigt, die durch den Projektleiter zu überprüfen sind. Dieser kann die Transkribenten dann bei Bedarf entsprechend nachschulen.

6.5 Kodierung 6.5.1 Variablenauswahl Basierend auf den theoretischen Überlegungen in Kap. 1 wurden unter 2.3.5 konkrete morpho-syntaktische und lexikalische Merkmale gesprochener Schulsprache von Primarschülern zusammengefasst. In diesem Zusammenhang wurde außerdem festgestellt, dass formale Genauigkeit bzw. Korrektheit eine wesentliche Grundlage schulsprachlicher Kommunikation darstellt, eine entsprechende Sprachkompetenz jedoch bei vielen Primarschülern mit Deutsch

206 | Entwicklung eines empirischen Verfahrens zur Evaluation von Fördereffekten als Zweitsprache nicht vorausgesetzt werden kann (vgl. Kap. 2.4.1). In Kap. 3.4.3 wurden deshalb morpho-syntaktische und lexikalisch-semantische Phänomene zusammengefasst, die auch fortgeschrittenen DaZ-Schülern noch Schwierigkeiten bereiten und/oder als Indikator für fortgeschrittene Sprachkompetenz angesehen werden. Die Grundlage für die Auswahl der Variablen (vgl. Abb. 29, Kriterium 1) bilden daher 1. 2.

Indikatoren für schulsprachliche Kompetenz (vgl. Kap. 2.3.5, Tab. 10) Stolpersteine und Indikatoren des DaZ-Erwerbs fortgeschrittener Lerner (vgl. Kap. 3.4.3, Tab. 15)

Ergänzt wurden die Merkmale aus 2. durch weitere Förderschwerpunkte aus dem BeFo-Projekt (vgl. Tab. 23).

Abb. 29. Hierarchische Darstellung der Kriterien zur Variablenauswahl 77 76F

Aufgrund der lückenhaften Forschungslage und der Abhängigkeit sprachlicher Mittel vom konkreten kommunikativen Kontext (vgl. Kap. 2.3.4 und 2.3.5) wurden in einem weiteren Schritt die Sprachproben aus der Pilotierungsstichprobe des Elizitierungsverfahrens explorativ untersucht. Dadurch sollte zum einen || 77 Ein Vorläufermodell von Abb. 29 wurde bereits in Webersik (2012b) publiziert.

Kodierung | 207

überprüft werden, ob die theoretisch angenommenen Merkmale (vgl. Abb. 29, Kriterium 1) in den Sprachproben vorkommen und sich als Indikatoren eignen. Zum anderen sollte geprüft werden, ob weitere, möglicherweise aufschlussreiche Phänomene in den Sprachdaten beobachtet werden können. Dieses Vorgehen war vor allem deshalb notwendig, weil viele der Arbeiten zu Erwerb und Diagnose zweitsprachlicher bzw. schulsprachlicher Kompetenzen nur unzureichend die Medienabhängigkeit berücksichtigen 78. So gibt die derzeitige Forschungslage keine klare Antwort darauf, ob die für Schulsprache charakteristischen Merkmale (z.B. Genitivattribute, Nominalisierungen, Komposita etc.) in gleichem Maße für die gesprochene wie für die geschriebene Realisierung durch Primarschüler bedeutsam sind. Für jedes sprachliche Phänomen, das auf der Grundlage bisheriger Arbeiten als Merkmal, Indikator oder Stolperstein für Schulsprache bzw. fortgeschrittene DaZ-Kompetenz identifiziert werden konnte (vgl. Tab. 10 und Tab. 15), war daher auf der Grundlage von Erkenntnissen der Gesprochene-Sprache-Forschung und durch explorative Analyse der Pilotierungsdaten zu prüfen, ob es in dieser Form auch für die medial mündliche Realisierung bedeutsam oder ggfs. zu modifizieren ist (vgl. Abb. 29, Kriterium 2). Weiterhin richtete sich die Variablenauswahl nach der Operationalisierbarkeit der interessierenden sprachlichen Phänomene (vgl. Abb. 29, Kriterium 3). Denn aufgrund der Notwendigkeit objektiver Auswertung können nur eindeutig identifizierbare und kategorisierbare Merkmale berücksichtigt werden (vgl. Kap. 3.3.2). So ist z.B. die differenzierte Erfassung semantischer Merkmale nur bedingt quantifizierbar. Auch die Variabilität syntaktischer Merkmale (vgl. Kap. 2.3.2 und 2.3.5) führt dazu, dass eine eindeutige Klassifizierung erschwert wird, zumal die Kategorien der Schriftsprache hier nicht als Vergleichsmaßstab verwendet werden können (vgl. Kap. 2.3.4 und 3.3.2) 79. Die Notwendigkeit der 7F

78F

|| 78 Ein gutes Beispiel dafür ist die Profilanalyse von Grießhaber (2006, 2010a). Dieses qualitative Verfahren eignet sich zwar angeblich sowohl für die Analyse mündlicher als auch schriftlicher Sprachdaten, Grießhaber orientiert sich aber bereits bei der Einteilung der Schüleräußerungen in „minimale satzwertige Einheiten“ (Grießhaber 2010c: 154) eindeutig an schriftsprachlichen Strukturen. Auch die Zuordnung der Schüleräußerungen zu den Profilstufen erfolgt ausschließlich anhand syntaktischer Merkmale (Stellung des Verbs), die für mündliche Sprache nur bedingt Gültigkeit besitzen (z.B. Verbendstellung im Nebensatz). 79 Zwar sind im Rahmen der Gesprochene-Sprache-Forschung bisher verschiedene Kategorien zur Klassifizierung syntaktischer Merkmale in der gesprochenen Sprache entwickelt worden. Abgesehen davon, dass hier jedoch nach wie vor keine Einigkeit besteht, ist in Bezug auf gesprochene Schulsprache zum gegenwärtigen Stand auch nicht zu beantworten, ob aufgrund der konzeptionellen Schriftlichkeit und gleichzeitigen medialen Mündlichkeit eher gesprochensprachliche oder schriftsprachliche syntaktische Einheiten als Maßstab zu verwenden sind.

208 | Entwicklung eines empirischen Verfahrens zur Evaluation von Fördereffekten Operationalisierbarkeit und die zeitlich und finanziell beschränkten Rahmenbedingungen des Projekts führten deshalb zu einer Reduzierung linguistischer Merkmale sowohl in Bezug auf ihre Anzahl als auch ihre Differenziertheit (vgl. dazu auch das Zitat von Steinmüller 1984: 314–315 auf S. 150). 6.5.1.1 Indikatoren schulsprachlicher Kompetenz In Bezug auf die in Kap. 2.3.5, Tab. 10 zusammengefassten Merkmale von Schulsprache ergab die Analyse der Pilotierungsdaten, dass der kontrollierte Umgang mit Tempora in der mündlichen Kommunikationssituation des Elizitierungsverfahren nur bedingt notwendig ist. Denn allen Gesprächspartnern ist bekannt, dass die Filme vor dem Sprechzeitpunkt präsentiert wurden, so dass diese Information für die Wiedergabe der Inhalte weitgehend irrelevant ist. Das Erzähltempus kann daher entweder Perfekt bzw. Präteritum (in der gesprochenen Sprache eher untypisch) oder (atemporales) Präsens sein. Auch die Abfolge der Handlungsabläufe kommt ohne morphologische Tempusmarkierungen aus, da hier Satzadverbien wie danach oder später und Konjunktionen wie als oder nachdem die temporalen Bezüge ausreichend beschreiben. Selbst spontane Tempuswechsel sind in der gesprochenen Sprache üblich und werden normalerweise nicht als Abweichung beurteilt (Ágel & Hennig 2007a: 200). Der semantische Umgang mit Tempora wird deshalb nicht berücksichtigt. Auch Nominalisierungen, die immer wieder als Merkmal von Bildungssprache hervorgehoben werden, wurden in den Pilot-Daten so gut wie gar nicht verwendet 80. Nominalisierungen stellen eine Form der syntaktischen Informationsverdichtung dar, die einen erhöhten kognitiven Planungsaufwand erfordert. Diesen können Primarschüler mit Deutsch als Zweitsprache bei mündlichen Produktionen offensichtlich noch nicht leisten, da die kognitiven Kapazitäten des Arbeitsgedächtnisses bereits durch die Gleichzeitigkeit von Planung und Produktion erschöpft sind (vgl. Zeitparameter bei Ágel und Hennig 2006a, Kap. 2.3.2). Zumindest bei Primarschülern dürfe es sich daher um eine Struktur handeln, die eher für die geschriebene Schulsprache charakteristisch ist. Neben Nominalisierungen kamen auch man-Sätze (bis auf die gelegentliche Formulierung „da sieht man…“) kaum vor, was vermutlich auf die Aufgabenstellungen des Elizitierungsverfahren zurückzuführen ist. Nominalisierungen und man-Sätze werden deshalb nicht berücksichtigt. 79F

|| 80 Die einzige Ausnahme betrifft Bezeichnungen für die Jugendlichen im Clip Zivilcourage. Diese wurden häufiger als „der Große/Kleine“ bzw. „der Blonde“ etc. bezeichnet, weil die Namen der beiden Jungen nicht bekannt waren.

Kodierung | 209

Im Gegensatz zu den eben genannten Phänomenen konnten Fachbegriffe und Komposita als bildungssprachliche Merkmale m.E. zwar in den Pilotdaten beobachtet werden, problematisch erscheint jedoch ihre quantitative Erfassung und Kategorisierung. So ist die Zuordnung eines Begriffs zu den Kategorien Alltagsbegriff vs. Fachbegriff objektiv kaum möglich, da es keine entsprechenden Referenzwerke gibt. Komposita lassen sich im Gegensatz dazu zwar relativ einfach identifizieren, eine rein quantitative Erfassung wäre jedoch wenig zielführend, da es auch eine große Zahl an einfachen Komposita gibt, die eher dem Alltagwortschatz zuzuordnen sind und kaum als Merkmal von Schulsprache gelten können (z.B. Currywurst, U-Bahn, Mediamarkt). Da es auch hier kein objektives Kriterium gibt, nach dem zwischen spezifisch schulsprachlichen und eher alltagssprachlichen Komposita unterschieden werden könnte, ist eine angemessene Operationalisierung dieser Phänomene kaum möglich. Fachbegriffe und Komposita werden deshalb nicht berücksichtigt. Tab. 22 fasst sprachliche Phänomene zusammen, die auf der Grundlage der zitierten empirischen Arbeiten als Indikatoren gesprochener Schulsprache fungieren können, unter Berücksichtigung der Bedingungen mündlicher Realisierung und den Bedingungen der gegebenen Kommunikationssituation relevant erscheinen und sich zudem angemessen operationalisieren lassen: Tab. 22. Operationalisierbare Indikatoren gesprochener Schulsprache Sprachliche Bereiche

Konkrete Strukturen

verbaler Wortschatz (v.a. Präfixverben)

Lexikalische Dichte, SpeFunktionswortschatz (v.a. Präpositionen und Konjunktionen) zifik und Vielfalt Attribute Satzverbindungen und Satzgefüge (Nebensätze) Komplexität und Vollstän- komplexe Nominalphrasen (Attribute) digkeit Präpositionalphrasen Vollständigkeit des Prädikats Weitere grammatikalische Passivstrukturen Merkmale Konjunktivstrukturen

6.5.1.2 Indikatoren und Stolpersteine des DaZ-Erwerbs fortgeschrittener Lerner Alle der in Kap. 3.4.3, Tab. 15 aufgelisteten Indikatoren und Stolpersteine des DaZ-Erwerbs fortgeschrittener Lerner konnten auch in den Pilotdaten beobachtet werden. Entsprechend der theoretischen Annahme, dass der Erwerb der grundlegenden Satzmodelle bei der Zielgruppe erfolgreich abgeschlossen sein sollte, produzierten die Pilot-Schüler erwartungsgemäß häufig Inversionsstrukturen, wobei

210 | Entwicklung eines empirischen Verfahrens zur Evaluation von Fördereffekten diese vor allem nach und dann/da oder danach auftraten. Den Maßstäben von Grießhabers Profilanalyse zufolge (Grießhaber 2010a: 2010c) müssten Inversionsstrukturen daher als erworben angesehen werden. Zugleich konnte jedoch beobachtet werden, dass nach anderen Adverbien oder Nebensätzen häufig keine Inversionen realisiert wurden (z.B. „*Später der geht weg“ oder „*Als der das sieht, der will den helfn.“). Das parallele Auftreten zielsprachlicher und abweichender Strukturen lässt auf einen fortgeschrittenen Erwerbsprozess schließen. Geforderte, aber nicht realisierte Inversionsstrukturen werden deshalb zusätzlich berücksichtigt. Ergänzend zu den in Kap. 3.4.3, Tab. 15 aufgeführten Phänomenen wurden auch die in Tab. 23 zusammengefassten Schwerpunkte des formfokussierten Förderansatzes des BeFo-Projekts berücksichtigt, weil eine erfolgreiche Förderung hier zu Effekten führen sollte. Tab. 23. Zusätzliche Förderschwerpunkte im BeFo-Projekt (FoF-Ansatz) Sprachliche Bereiche Wortschatz

Konkrete Strukturen

Fragewörter

definite vs. indefinite Artikel Satzmodelle

Verbklammer Inversion

Verbalflexion

Subjekt-Verb-Kongruenz (Schwerpunkt: starke Verben)

Perfekt: Partizip-II-Bildung und Verwendung von haben und sein Imperativ

Nominalflexion

Adjektivkomparation Pluralmarkierung

Auch hier wurde jedoch geprüft, ob die Merkmale für die medial mündliche Kommunikationssituation des Elizitierungsverfahrens relevant sind und sich angemessen operationalisieren lassen. So ist z.B. die Beurteilung des Merkmals Definitheit problematisch. Denn die zielsprachliche Verwendung von definitem bzw. indefinitem Artikel ergibt sich maßgeblich aus dem angenommenen Kontextwissen der Gesprächspartner, wobei als unbekannt vorausgesetzte Referenten mit dem indefiniten Artikel eingeführt werden, während der definite Artikel die Bekanntheit des Referenten voraussetzt. Aufgrund der konstruierten Gesprächssituation des Elizitierungsverfahrens ist im konkreten Fall jedoch schwierig zu entscheiden, ob der Sprecher sich tatsächlich in die suggerierte Kommunikationssituation hineinversetzt und die „unwissende“ Schulklasse als Gesprächspartner annimmt, oder ob nicht doch der Interviewer als primärer Zuhörer angesehen wird, bei dem vielleicht voraussetzt wird, dass er die Filme bereits kennt. Während im ersten Fall die Referenten jeweils mit dem indefini-

Kodierung | 211

ten Artikel neu eingeführt werden müssten, wäre dies bei einem gemeinsamen Kontextwissen von Schüler und Interviewer nicht unbedingt notwendig. Zudem erwies sich der Versuch, die Artikel nach den Kriterien Referenzeinführung vs. Referenzerhalt zu analysieren, als sehr aufwändig und zudem schwer objektivierbar. Das Merkmal Definitheit bzw. Herstellung von Referenz wurde deshalb nicht berücksichtigt. Fragewörter und Imperative, deren Verwendung in der gegebenen Kommunikationssituation nicht erforderlich ist, konnten in den Pilotdaten erwartungsgemäß nicht beobachtet werden und werden deshalb nicht berücksichtigt. Bei allen anderen in Tab. 23 genannten Strukturen traten zumindest in einigen der Pilot-Daten abweichende Formen auf, wenn auch in den meisten Fällen relativ selten. Da sie offensichtlich als Stolpersteine während der BeFo-Förderstunden aufgefallen sind, ist es denkbar, dass sich die Unterschiede auf eine bessere Sprachkompetenz der Pilot-Kinder aus Baden-Württemberg zurückführen lassen. Aufgrund dieser Möglichkeit werden bis auf die Merkmale definite/indefinite Artikel, Fragwörter und Imperative alle FoF-Förderschwerpunkte aus BeFo berücksichtigt. 6.5.1.3 Variablenübersicht Ausgehend von den beschriebenen Indikatoren schulsprachliche Kompetenz und den Indikatoren bzw. Stolpersteinen des DaZ-Erwerbs fortgeschrittener Lerner wurden die in Tab. 24 zusammengefassten Phänomene kodiert 81. Das Merkmal Polung bezieht sich darauf, ob es sich mit Bezug auf die Sprachkompetenz um tendenziell positiv oder negativ zu bewertende Phänomene handelt. So sind abweichende Strukturen (Fehler) zunächst ein Zeichen von sprachlichen Defiziten (= negative Polung), selbst wenn sie in bestimmten Zusammenhängen auch ein Zeichen für Weiterentwicklungen der Lernersprache sein können (vgl. Kap. 1) 82. Umgekehrt ist die zielsprachliche Verwendung bestimmter Merkmale (z.B. von Präpositionen) ein Zeichen fortgeschrittener Kompetenz (= positive Polung). Bei einigen Variablen kann im Vorfeld keine eindeutige Aussage zur Polung getroffen werden. Dies betrifft z.B. einen Großteil der Selbstkorrekturen, die einerseits als mögliches Zeichen von Sprachbewusstheit positiv zu bewerten sind, andererseits aber einen Hinweis auf noch nicht sicher beherrschte Strukturen darstellen. Bei anderen Variablen (v.a. denen zur Kodierung lexikalisch80F

81F

|| 81 Welche konkreten Phänomene den Variablen im Einzelnen zugeordnet wurden, wird im Rahmen der Beschreibung des Kodierverfahrens unter 6.5.2 und den dazugehörigen Materialien im Anhang verdeutlicht. 82 Solche Prozesse lassen sich zum gegenwärtigen Zeitpunkt jedoch nur im Rahmen qualitativer Grundlagenforschung untersuchen.

212 | Entwicklung eines empirischen Verfahrens zur Evaluation von Fördereffekten semantischer Unsicherheiten) kann allenfalls von einer tendenziellen Polung gesprochen werden. So können semantisch falsche Ausdrücke und Näherungsbegriffe zwar zunächst als lexikalisch-semantische Defizite interpretiert werden (= negative Polung). Andererseits produzieren gerade solche Schüler semantisch abweichende Ausdrücke, die sich um eine möglichst genaue Wiedergabe der Filminhalte bemühen. Insbesondere die Verwendung von Näherungsbegriffen und Umschreibungen stellt in diesem Sinne auch eine positiv zu bewertende Strategie dar, lexikalische Lücken zu kompensieren (vgl. Kap. 3.4.1.1). Tab. 24. Variablenübersicht basierend auf der Hauptstichprobe Variable

Genusfehler am Determinierer, Nominativ-

Pol- Indikator Indikator/ Häufigkeit StandardStolper- (Mittelung* für abweistein des wert)** schulchung sprach- DaZErwerbs liche Kompetenz --



0,32

0,73

--



0

0

--



1,62

1,32

--



0,06

0,32

Genusfehler am Determinierer, Dativkontext

--



0,4

0,76

Genusfehler am Possessivpronomen, Dativ-

--



0,01

0,08

Genus- oder Kasusfehler am Begleiter

--



0,14

0,4

fehlende Akkusativmarkierung am Determi-

--



0,13

0,4

--



0,01

0,08

--



0,07

0,28

--



0

0

--



0,94

1,02

kontext Genusfehler am Possessivpronomen, Nominativkontext Genusfehler am Determinierer, Akkusativkontext Genusfehler am Possessivpronomen, Akkusativkontext

kontext

nierer, Regens Verb fehlende Akkusativmarkierung am Possessivpronomen, Regens Verb fehlende Dativmarkierung am Determinierer, Regens Verb fehlende Dativmarkierung am Possessivpronomen, Regens Verb fehlende Dativmarkierung am Determinierer, Regens Verb, evtl. n/m-Verschleifung

Kodierung | 213 Variable

fehlende Dativmarkierung am Possessivpro-

Pol- Indikator Indikator/ Häufigkeit StandardStolper- (Mittelabweiung* für stein des wert)** chung schulsprach- DaZErwerbs liche Kompetenz --



0

0

--



0,01

0,08

--



0

0

--



0,42

0,77

--



0,04

0,23

--



1,11

1,32

--



0,03

0,16

--



0,15

0,43

--



0,02

0,14

--



0,12

0,39

--



0,01

0,08

--



0,21

0,48

--



0

0

--



0,01

0,08

nomen, Regens Verb, evtl. n/mVerschleifung fehlende Akkusativmarkierung am Determinierer, Regens Präposition fehlende Akkusativmarkierung am Possessivpronomen, Regens Präposition fehlende Dativmarkierung am Determinierer, Regens Präposition fehlende Dativmarkierung am Possessivpronomen, Regens Präposition fehlende Dativmarkierung am Determinierer, Regens Präposition, evtl. n/m-Verschleifung fehlende Dativmarkierung am Possessivpronomen, Regens Präposition, evtl. n/mVerschleifung fehlende Akkusativmarkierung am Determinierer, Regens Wechselpräposition fehlende Akkusativmarkierung am Possessivpronomen, Regens Wechselpräposition fehlende Dativmarkierung am Determinierer, Regens Wechselpräposition fehlende Dativmarkierung am Possessivpronomen, Regens Wechselpräposition fehlende Dativmarkierung am Determinierer, Regens Wechselpräposition, evtl. n/mVerschleifung fehlende Dativmarkierung am Possessivpronomen, Regens Wechselpräposition, evtl. n/m-Verschleifung fehlerhafte Markierung der Komparation am Adjektiv

214 | Entwicklung eines empirischen Verfahrens zur Evaluation von Fördereffekten Variable

fehlende Adjektivflexion

Pol- Indikator Indikator/ Häufigkeit StandardStolper- (Mittelabweiung* für stein des wert)** chung schulsprach- DaZErwerbs liche Kompetenz --



0,14

0,37

fehlerhafte Adjektivflexion, schwache Flex.

--



0,17

0,52

fehlerhafte Adjektivflexion, gemischte Flex.

--



0,33

0,62

fehlerhafte oder eindeutig fehlende Plural-

--



0,17

0,4

--



0,12

0,42

fehlerhafte S-V-Kongruenz

--



0,54

1,03

fehlerhafte Partizip-II-Formen

--



0,4

0,66

fehlerhafte Flexion unregelmäßiger (starker)

--



0,34

0,63

markierung am Substantiv fehlerhafte oder eindeutig fehlende Dativmarkierung am Substantiv

Verben Verwechslung Hilfsverben haben-sein

--



0,44

0,72

unvollständiges Prädikat (Verbklammer)

--



1,93

1,59

fehlendes Prädikat

--



0,82

1,02

nicht-zielsprachliche V1-Strukturen

--



1,57

2,29

geforderte, aber nicht realisierte Inversion

--



1,12

2,03

fehlende Determinierer

--



2,21

2,11

fehlende Präpositionen

--



0,68

1,01

Selbstkorrekturen auf lexikalisch-

+



2,57

2,38

+/-



0,16

0,44

+



0,03

0,16

+



0,06

0,23

+/-



0,01

0,12

+



0,44

0,77

semantischer Ebene, Ergebnis zielsprachlich Selbstkorrekturen auf lexikalischsemantischer Ebene, Ergebnis nicht zielsprachlich Selbstkorrekturen Ergänzung Determinierer, Ergebnis zielsprachlich Selbstkorrekturen Ergänzung Präposition, Ergebnis zielsprachlich Selbstkorrekturen Ergänzung Präposition, Ergebnis nicht zielsprachlich Selbstkorrekturen der Nominalflexion, Ergebnis zielsprachlich

Kodierung | 215 Variable

Selbstkorrekturen der Nominalflexion, Er-

Pol- Indikator Indikator/ Häufigkeit StandardStolper- (Mittelabweiung* für stein des wert)** chung schulsprach- DaZErwerbs liche Kompetenz +/-



0,14

0,39

+



0,14

0,41

+/-



0,09

0,31

+



0,31

0,66

+/-



0,03

0,16

+



0,18

0,44

+/-



0,03

0,22

+



0,05

0,22

+/-



0,04

0,35

semantisch falsche Substantive

--



2,77

1,99

Näherungsbegriffe (Substantive)

-



3,68

2,06

semantisch falsche Verben

--



1,59

1,52

Näherungsbegriffe (Verben)

-



2,36

2,14

semantisch falsche Konjunktionen

--



0,72

1

gebnis nicht zielsprachlich Selbstkorrekturen der Verbalflexion, Ergebnis zielsprachlich Selbstkorrektur der Verbalflexion, Ergebnis nicht zielsprachlich Selbstkorrekturen Hilfsverb/Modalverb, Ergebnis zielsprachlich Selbstkorrekturen Hilfsverb/Modalverb, Ergebnis nicht zielsprachlich Selbstkorrekturen der Wortstellung, Ergebnis zielsprachlich Selbstkorrekturen der Wortstellung, Ergebnis nicht zielsprachlich sonstige Selbstkorrekturen, Ergebnis zielsprachlich sonstige Selbstkorrekturen, Ergebnis nicht zielsprachlich

semantisch falsche Präpositionen

--



1,06

1,04

semantisch falsche Wechselpräpositionen

--



0,42

0,62

Umschreibung (Paraphrase)

-/+



0,87

1,05

Passepartout-Substantive (Substantivjoker)

-/+



1,18

1,37

Konstituentennegation (kein)

++



0,65

0,97

Satzverbindungen und Satzgefüge

++





5,39

3,9

Präpositionalphrasen

++



7,45

3,71

Präpositionalphrasen (Wechselpräp.)

++



4,83

3,54

216 | Entwicklung eines empirischen Verfahrens zur Evaluation von Fördereffekten Variable

Attribute (possessiv)

Pol- Indikator Indikator/ Häufigkeit StandardStolper- (Mittelabweiung* für stein des wert)** chung schulsprach- DaZErwerbs liche Kompetenz ++





1,84

1,77

Attribute (adjektivisch)

++





7,46

4,07

Konjunktiv I/II-Strukturen

++





0,26

0,74

Konjunktiv-Ersatzformen (würde)

++





0,11

0,34

Vorgangspassive

++





0,06

0,23

Strukturen mit Modalverb

++



2,25

2,34

Präpositionen (types)

++





4,21

2,22

Wechselpräpositionen (types)

++





2,96

1,9

Konjunktionen (types)

++





3,57

2,27

Verben ohne Präfix (types)

++





23,8

5,92

Verben mit Präfix (types)

++





14,21

5,21

Modalverben (types)

++



1,54

1,41

Adjektive (types)

++





7,65

3,54

Parameter D (Wortschatzdiversität)

++





43,76

10,3

* ++ = eindeutig positiv, + = tendenziell positiv, - tendenziell negativ, -- = eindeutig negativ, +/- = unklare Polung ** Die Bedeutung der ermittelten Häufigkeiten der Variablen wird unter 6.6.3.1 diskutiert

Da die Häufigkeit der in Tab. 24 aufgeführten Phänomene immer vom Umfang der Sprachprobe abhängig ist, werden zur späteren Relativierung dieser Häufigkeiten (vgl. Kap. 6.6.3.6) die in Tab. 25 aufgeführten Kennwerte erhoben. Tab. 25. Kennwerte zur Relativierung der Variablen-Häufigkeiten Variable Vollverben (tokens) (= Summe aller Verben mit

Häufigkeit (Mittelwert) Standardabweichung 54,21

16,33

378,08

117,32

und ohne Präfix) Gesamtwortzahl

Kodierung | 217

6.5.2 Kodierverfahren: Quantitative Inhaltsanalyse Methodisch stellt das Verfahren zur Kodierung der in Tab. 24 zusammengefassten Variablen eine Form der quantitativen Inhaltsanalyse dar. Diese wird wie folgt definiert: Die quantitative Inhaltsanalyse erfasst einzelne Merkmale von Texten, indem sie Textteile in Kategorien einordnet, die Operationalisierungen der interessierenden Merkmale darstellen. Die Häufigkeiten in den einzelnen Kategorien geben Auskunft über die Merkmalsausprägungen des untersuchten Textes. […] Die Ergebnisse einer quantitativen Inhaltsanalyse bestehen aus Häufigkeitsdaten, die mit entsprechenden inferenzstatistischen Verfahren […] zu verarbeiten sind und Hypothesentests ermöglichen. (Bortz & Döring 2010: 149)

Im Gegensatz zu klassischen Tests mit geschlossenen Items und begrenzten Antwortmöglichkeiten arbeitet die quantitative Inhaltsanalyse also mit freien Sprachproben, die anhand eines standardisierten Auswertungsverfahrens analysiert und hinsichtlich bestimmter Merkmale bzw. Variablen kodiert werden. Wie anhand der Variablenübersicht in Tab. 24 deutlich wird, werden sowohl zielsprachliche als auch abweichende Merkmale berücksichtigt. Bei der Kodierung letzterer orientiert sich das Verfahren an der klassischen Fehleranalyse (vgl. Kap. 3.3.2), für die folgende Kriterien gelten sollen: –







Analysiert werden nur Abweichungen an grammatikalischen Strukturen, die der Gemeinsamen Grammatik des Systems und der Gemeinsamen Grammatik der Norm zugeordnet werden können (vgl. Kap. 2.3.3) Als Bezugsnorm für die zielsprachliche Rekonstruktion abweichender Schüleräußerungen gelten die Regeln der deutschen Standardsprache, wie sie im Duden (Duden 2006) inkl. des ergänzenden Kapitels „Gesprochene Sprache“ von Fiehler beschrieben werden. Abweichungen vom Standard, die auf die besonderen Produktionsbedingungen der gesprochenen Sprache zurückzuführen sind (vgl. „erklärbare Phänomene“, Kap. 2.3.3), werden entweder nicht berücksichtigt (z.B. Wiederholungen, Expansionen etc.), oder die als Maßstab dienenden Kategorien der Standardsprache werden entsprechend modifiziert bzw. ausdifferenziert (z.B. bei phonologischen Prozessen wie Assimilationen und Enklisen). Bei semantischen Abweichungen muss in Ermangelung eines normierten Referenzwerks das muttersprachliche Sprachgefühl der Kodierer als Maßstab dienen (vgl. Kap. 3.3.2).

218 | Entwicklung eines empirischen Verfahrens zur Evaluation von Fördereffekten – –

Berücksichtigt werden nur eindeutig identifizierbare Fehler. Identische Fehler (Wiederholungsfehler) werden markiert, bei der Auswertung jedoch nicht mitgezählt

Bei vielen der zu kodierenden Merkmale erfordert die eindeutige Zuordnung zu den Kategorien (= Variablen) spezifische Kenntnisse hinsichtlich des standardisierten Auswertungsvorgehens, das in den folgenden Kapiteln vorgestellt werden soll. Bortz & Döring (2010: 151) weisen außerdem zu Recht darauf hin, „dass mit wachsendem Umfang des Kategoriensystems (Anzahl der Merkmale und deren Ausprägungen) die Zuverlässigkeit der Kodierung leidet, weil bei den Kodierern Grenzen der Gedächtnisleistung und Aufmerksamkeit erreicht werden“. Angesichts der großen Zahl an Merkmalen wurde deshalb ein vierschrittiges Kodierverfahren entwickelt, bei dem jedes Transkript von mehreren studentischen Ratern in vier Schritten kodiert wird (vgl. Abb. 30). Dabei konzentriert sich der jeweilige Rater während eines Analyseschritts nur auf eine bestimmte Auswahl an Merkmalen, für die er zuvor speziell geschult wurde. Auch innerhalb der einzelnen Kodierschritte sieht das Verfahren mehrere Analysedurchgänge pro Transkript vor, um die Aufmerksamkeit immer nur auf eine beschränkte Anzahl an Merkmalen richten zu müssen. Dieses Vorgehen entlastet nicht nur die kognitiven Kapazitäten der Kodierer, sondern ermöglicht teilweise auch eine parallele Kodierung desselben Transkripts durch zwei Rater, was eine große Zeitersparnis darstellt. Insgesamt werden für die Kodierung eines Transkripts in Abhängigkeit von der jeweiligen Sprachprobe 45–70 min benötigt. Da durch die Kodierung der Wiederholungen und Selbstkorrekturen im ersten Analyseschritt festgelegt wird, welche Äußerungen der Schüler während der anderen Schritte zu analysieren sind, ist es wichtig, dass dieser Schritt zuerst erfolgt. Die entsprechenden Codes zur Markierung der Wiederholungen und Selbstkorrekturen werden direkt in die Transkript-Datei geschrieben 83. Diese bildet dann die Grundlage für die weiteren Analyseschritte, wobei Schritt 2 und 4 parallel durchgeführt werden können. Bei allen Kodierschritten stehen den Ratern die originale Transkriptdatei und die dazugehörige Aufnahme zur Verfü82F

|| 83 Es ist zu empfehlen, die Original-Transkriptdateien (cha-Format) per Copy & Paste in WordDokumente zu kopieren, weil die graphischen Mittel sowie die Suchfunktion in Word ausgearbeiteter sind. So kann es hilfreich sein, Anfang und Ende der zu kodierenden Abschnitte oder Auffälligkeiten farblich zu markieren. Es ist jedoch darauf zu achten, dass die Rechtschreibund Grammatikprüfung in Word deaktiviert ist. Die kodierten Word-Dokumente lassen sich für die spätere Auszählung problemlos wieder in CLAN kopieren. Zum Anhören einzelner Äußerungen ist die Originaldatei im CLAN-Programm zu verwenden.

Kodierung | 219

gung, so dass sie bei Zweifelsfällen die Äußerung des Schülers auch anhören können.

Abb. 30. Übersicht der Kodierschritte

Nach der Kodierung von Wiederholungen und Selbstkorrekturen wird das Transkript von einem anderen Rater hinsichtlich der Merkmale aus Schritt 2

220 | Entwicklung eines empirischen Verfahrens zur Evaluation von Fördereffekten analysiert. Nachdem auch hier die entsprechenden Codes direkt in die Transkript-Datei eingetragen wurden, erfolgt anhand derselben Datei durch einen weiteren Rater die Kodierung der Merkmale aus Schritt 3 84. Zum Schluss enthält die Transkript-Datei also alle Codes aus Schritt 1, 2 und 3. Die kodierten Merkmale können in einem späteren Schritt automatisch vom Transkriptionsprogramm CLAN ausgezählt werden (vgl. Kap. 6.5.2.5). Die Merkmale, die in Schritt 4 kodiert bzw. ausgezählt werden, werden in einer Excel-Datei gespeichert, da die Ermittlung von Types vs. Tokens bezogen auf einzelne Wortarten für das Deutsche mit CLAN nicht möglich ist bzw. zusätzliche Programmierungen nötig wären 85. Außerdem entsteht auf diese Weise eine übersichtliche Zusammenstellung der verwendeten lexikalischen Mittel, die als Grundlage für weitere, qualitative Analysen nützlich sein kann (vgl. Kap. 1). Die Grundlage für die anschließende Auszählung aller Merkmale bilden demnach zwei Dokumente: A) die Transkript-Datei mit den entsprechenden Codes (vgl. Kap. 6.5.2.3, Tab. 34), B) eine Excel-Datei mit den Häufigkeiten der Variablen aus Schritt 4 (vgl. Kap. 1). Die linguistische Ausrichtung des Verfahrens erfordert bei den Kodierern fundiertes grammatikalisches Vorwissen. Bei der Rekrutierung studentischer Hilfskräfte sollte deshalb darauf geachtet werden, dass es sich um Studierende des Faches Deutsch handelt, die über die entsprechenden Voraussetzungen verfügen. Um die Rater ausreichend vorzubereiten, müssen sie darüber hinaus für jeden Analyseschritt speziell geschult werden. Die Schulungen, die im Rahmen der vorliegenden Arbeit durchgeführt wurden, dauerten pro Analyseschritt drei Stunden. Zusätzlich wurden anhand der Daten aus der Pilotierungsstudie Probeanalysen angefertigt und individuell besprochen. Ergänzend zur Schu83F

84F

|| 84 Wenn nicht so viele Rater zur Verfügung stehen, besteht die Möglichkeit, die vorhandenen Rater zunächst für einen bestimmten Analyseschritt zu schulen, den sie dann für alle Transkripte durchführen. Danach erfolgt die Schulung für den nächsten Analyseschritt, der dann ebenfalls für alle Transkripte umgesetzt wird usw. Aus Gründen der Aufmerksamkeitsfokussierung ist es jedoch nicht zu empfehlen, dass die Rater transkriptweise vorgehen, also für Transkript 1 erst Analyseschritt 1, dann Analyseschritt 2 usw. durchführen, bevor sie das Gleiche beim nächsten Transkript wiederholen. 85 In CLAN können zwar Types und Tokens automatisch ausgezählt werden, allerdings werden dann alle Wörter berücksichtigt und nicht nur bestimmte Wortarten. Außerdem werden Unterschiede in den Wortformen (z.B. seh, sehe, sieht, sehen etc.) als Types gewertet. Zwar bietet das Programm zusätzliche Tools und Erweiterungsmöglichkeiten, die eine differenziertere morpho-syntaktische Analyse ermöglichen würden (vgl. MacWhinney 2009, im Rahmen der vorliegenden Arbeit erwies sich die manuelle Analyse jedoch als effektiver.

Kodierung | 221

lung gab es für jeden Analyseschritt Instruktionsmaterial mit vielen Beispielen (Benchmark-Texten) 86. 85F

6.5.2.1 Analyseschritt 1: Wiederholungen und Selbstkorrekturen Im ersten Analyseschritt werden die Markierungen von Wiederholungen und Selbstkorrekturen durch die Transkribenten überprüft und ggfs. überarbeitet. Außerdem werden die Selbstkorrekturen hinsichtlich sprachlicher Ebene und Zielsprachlichkeit analysiert und kodiert. Die wesentlichen Schritte bei der Kodierung von Wiederholungen und Selbstkorrekturen sind im Instruktionsmaterial beschrieben (vgl. Anhang 8.3.1). Dieses besteht aus: 1. 2. 3.

Leitfaden (vgl. Anhang 8.3.1.1) Algorithmus B zur Identifizierung von Wiederholungen und Selbstkorrekturen (vgl. Abb. 31 bzw. Anhang 8.3.1.2) Zusätzliche Hinweise (vgl. Anhang 8.3.1.3)

Grundsätzlich orientiert sich die Bestimmung der Selbstkorrekturen an dem unter 6.4.2 beschriebenen Modell von Egbert (2009). Weitere detailliertere Kriterien dazu, welche Strukturen als Selbstkorrektur gewertet werden, sind dem Instruktionsmaterial (insbesondere dem Dokument Zusätzliche Hinweise) zu entnehmen. Im Leitfaden sind die wesentlichen Vorgehensschritte festgehalten. Zunächst sollen die Kodierer das Transkript halblaut lesen, um auf ‚Brüche‘ in den Äußerungen (z.B. grammatikalische/lexikalische Fehler, Wiederholungen/Stammeln, Abbrüche, Korrekturen) aufmerksam zu werden. Dabei können die Kodierer in Zweifelsfällen mithilfe der Software CLAN die entsprechende Passage der Aufnahme auch anhören. Wird ein Bruch festgestellt, ist anhand von Algorithmus B (vgl. Abb. 31 bzw. Anhang 8.3.1.2) zu prüfen, ob Wiederholungen und Selbstkorrekturen von den Transkribenten in der vorgegebenen Weise markiert wurden (vgl. Kap. 6.4.2 und Anhang 8.2.2.5) und ob eine Selbstkorrektur-Feinanalyse anzuschließen ist.

|| 86 Einige Teile aus den Instruktionsmaterialien werden in Kap. 6.5.2.1 -6.5.2.5 vorgestellt. Eine vollständige Zusammenstellung aller verwendeten Materialien befindet sich im Anhang (Kap. 8).

222 | Entwicklung eines empirischen Verfahrens zur Evaluation von Fördereffekten

Abb. 31. Algorithmus B zur Identifikation von Wiederholungen und Selbstkorrekturen (Analyseschritt 1) 87 86F

|| 87 Die Ziffern in beziehen sich auf die Beispiele in Anhang, 8.3.1.2, Tab. A-4.

Kodierung | 223

In Zweifelsfällen besteht außerdem die Möglichkeit, noch einmal in die Videodatei hineinzuhören. Algorithmus B baut auf dem von den Transkribenten verwendeten Algorithmus A (vgl. Kap. 6.4.2, Abb. 28) auf, wurde aber zusätzlich um die Dimension Selbstkorrektur-Feinanalyse JA/NEIN erweitert, da nur eindeutige Selbstkorrekturen entsprechend der Überlegungen in Kap. 6.4.2 differenzierter kodiert werden sollen. Identifizierte Selbstkorrekturen werden hinsichtlich sprachlicher Ebene und Zielsprachlichkeit der Reparatur kodiert. Die berücksichtigten sprachlichen Phänomene bzw. Ebenen orientieren sich an den in Kap. 6.5.1.2 zusammengefassten Stolpersteinen und Indikatoren des DaZ-Erwerbs, so dass nur solche Selbstkorrekturen weiter spezifiziert werden, die typische Problembereiche betreffen. Bei der Beurteilung der Zielsprachlichkeit der Reparatur gelten die gleichen Kriterien wie für die Analyse abweichender Strukturen (vgl. Kap. 6.5.2). Hinweise zum Umgang mit sprachlichen Phänomenen, die in besonderem Maße durch die Produktionsbedingungen mündlicher Sprache beeinflusst sind, finden sich in den zusätzlichen Hinweisen (vgl. vgl. Anhang 8.3.1.3). In Bezug auf die Beurteilung der Zielsprachlichkeit lexikalisch-semantisch motivierter Reparaturen dienen ergänzend zum muttersprachlichen Sprachgefühl der Kodierer die Vergleichstabellen aus Analyseschritt 3c als Orientierung (vgl. Anhang 8.3.3, Tab. A-14: und Tab. A-15:). Die ermittelten Kategorien bzw. Variablen werden durch entsprechende Codes 88 im Transkript markiert (vgl. Tab. 26). Finden bei einer Umstrukturierung Korrekturen auf mehreren sprachlichen Ebenen statt, werden alle Korrekturen entsprechend kodiert (z.B. „ [//] dann hatte der Junge $skw $skl eine Idee). Auch bei mehreren Korrekturversuchen wird jeder Versuch einzeln kodiert. Handelt es sich jedoch um Korrekturen, bei denen die zweite Veränderung gegenüber der Ursprungsäußerung lediglich eine Folge der ersten Korrektur ist, ist aus dem Kontext zu entscheiden, welche Ebene korrigiert werden sollte. In der Äußerung „ [//] die Jungs ham den Kleinen gesehn“ ist z.B. davon auszugehen, dass der Schüler sich lexikalisch-semantisch korrigieren wollte („die Jungs“ statt „der Bruder“). Die Veränderung der Verbalflexion (ham statt hat) ist lediglich eine Folge dieser lexikalisch-semantischen Korrektur und wird deshalb nicht kodiert. 87F

|| 88 Alle Codes beginnen mit dem $-Zeichen. Durch diesen Marker können die Codes später von der Transkriptionssoftware CLAN von den anderen Wörtern unterschieden und ausgezählt werden.

224 | Entwicklung eines empirischen Verfahrens zur Evaluation von Fördereffekten Tab. 26. Übersicht Kodierung Analyseschritt 1 Ebene

Code bei erfolgreicher Code bei fehlerhafKorrektur

tem Ergebnis

Lexik/Semantik

$skl

$sklf

Ergänzung von Determinierern

$skd

-----*

Ergänzung von Präpositionen

$skp

$skpf

Nominalflexion

$skn

$sknf

Verbalflexion

$skv

$skvf

Wahl des Auxiliar-, Modal- oder Kopulaverbs

$skva

$skvaf

Wortstellung

$skw

$skwf

Ebene nicht eindeutig bestimmbar

$sk

$skf

*Die Semantik von Determinierern ist aufgrund der mündlichen Kommunikationssituation nicht objektiv zu beurteilen (vgl. Kap. 6.5.1.2) und wird deshalb außer Acht gelassen. Nicht erfolgreiche Korrekturen hinsichtlich der Nominalflexion werden als $sknf kodiert.

Nach der Schulung und einigen Probeanalysen funktionierte die Identifikation und Markierung von Wiederholungen und Selbstkorrekturen weitgehend problemlos. Schwierigkeiten zeigten sich jedoch z.T. bei der Bestimmung der sprachlichen Ebenen, auf die sich die Korrektur bezog. Besonders viele Zweifelsfälle tauchten bei der Abgrenzung der Ebenen „Wahl des Auxiliar-, Modal- oder Kopulaverbs“ und „Lexik/Semantik“ auf. Schwierigkeiten bereitete den Kodierern dabei v.a. die Unterscheidung von Auxiliar- und Kopulaverb. Außerdem tauchten wiederholt Korrekturen wie „Dann [//] hat der Junge die gesehen“ auf, in denen aufgrund des Black-Box-Problems (vgl. Kap. 3.3.2) nicht eindeutig entschieden werden kann, ob der Sprecher nur das Hilfsverb korrigieren wollte oder ob er zunächst ein anderes Vollverb geplant hatte (z.B. „Dann ist der Junge weggegangen“). In letzterem Fall läge die Korrektur auf lexikalischsemantischer Ebene und die Ersetzung von „ist“ durch „hat“ wäre nur eine Folge dieser Korrektur. Obwohl im Instruktionsmaterial definiert ist, dass solche Fälle als lexikalisch-semantische Selbstkorrektur kodiert werden sollten, kam es hier immer wieder zu abweichenden Kodierungen. Insgesamt zeigte sich, dass die Bestimmung der sprachlichen Ebene, auf die sich die Korrektur bezieht, ein recht interpretativer Akt ist. Auch die Beurteilung der Zielsprachlichkeit der Korrektur-Ergebnisse erwies sich in Ermangelung eines objektiven Referenzwerks mitunter als problematisch, so dass schon während der Schulung und den Probeanalysen abweichenden Kodierungen beobachtet werden konnten.

Kodierung | 225

6.5.2.2 Analyseschritt 2: Präpositional- und Nominalphrase Kodierungen, die im Rahmen von Analyseschritt 2 erfolgen, konzentrieren sich auf Abweichungen, die im Zusammenhang mit der Nominalflexion stehen. Diese zeichnet sich durch extreme Komplexität aus, der im Rahmen des Möglichen auch bei der Kodierung Rechnung getragen werden sollte. So ist es angesichts des bisherigen Kenntnisstandes zum Erwerb der Nominalflexion wichtig, zwischen den Kategorien Numerus, Genus und Kasus zu differenzieren (vgl. Kap. 3.4.2.3). Zugleich ist aber aufgrund der Verschmelzung mehrerer Funktionen (Numerus, Genus, Kasus) in einer Form bzw. einem Morphem damit zu rechnen, dass Genusfehler auch mit dem jeweiligen Kasuskontext, in dem sie begangen werden, im Zusammenhang stehen und umgekehrt. Außerdem wird wiederholt darauf hingewiesen, dass auch die Träger der Marker, d.h. die jeweiligen Wortarten, zu berücksichtigen sind, wobei v.a. die Markierung am Possessivpronomen als schwierig eingestuft wird (vgl. Kap. 3.4.2.3). In Bezug auf die Kasusmarkierung kommt zusätzlich dem jeweiligen Regens (Verb, Präposition bzw. Wechselpräposition) eine entscheidende Bedeutung zu. Eine weitere Besonderheit ergibt sich bei der Flexion von Adjektiven, deren formale Markierung neben den Kategorien Numerus, Genus und Kasus auch noch vom jeweiligen Determinierer abhängt und entsprechend andere Flexionsparadigma mit sich bringt (starke, schwache und gemischte Flexion). Auch die Besonderheiten mündlicher Produktion, die sich vor allem auf die Artikulation der Flexionsendungen auswirken, sind zu beachten. Dabei ist zwischen der Elision von Vokalen wie in ein(e)n und der lautlichen Differenzierung von Konsonanten, insbesondere [n] und [m] wie in „Das gehört den Kind“, zu unterscheiden. Während erstere ein normales Aussprachephänomen der gesprochene Sprache darstellt, ist die Verwechslung von [n] und [m] zwar durch die lautliche Ähnlichkeit der beiden Nasale zu erklären, stellt aus muttersprachlicher Sicht jedoch eine Abweichung dar, da in Bezug auf die Nominalflexion durch diese beiden Phoneme unterschiedliche grammatikalische Funktionen ausgedrückt werden (vgl. „funktionelle Oppositionen“ bei Coseriu, Kap. 2.3.3). Mit Blick auf die spätere Auswertung besteht ein weiteres Problem darin, dass Wiederholungsfehler nicht mitgezählt werden dürfen. Andernfalls würde ein Schüler, der fünf Mal das Substantiv Segel mit dem falschen Genus verwendet, ansonsten aber alle Genusmarkierungen richtig vornimmt, das gleiche Testergebnis erzielen wie ein Schüler, der bei fünf verschiedenen Substantiven das Genus falsch markiert. Basierend auf diesen Überlegungen werden die in Tab. 27 zusammengefassten Kategorien bzw. Variablen unterschieden und durch entsprechende Codes im Transkript markiert. Zusätzlich werden Wiederholungsfehler durch ein X am Ende des Codes markiert:

226 | Entwicklung eines empirischen Verfahrens zur Evaluation von Fördereffekten Tab. 27. Übersicht Kodierung Analyseschritt 2 Kategorie (Variable)

Code

fehlende Determinierer

$detf

fehlende Präpositionen

$pf

fehlende Adjektivflexion

$af

fehlerhafte Adjektivflexion, schwache Flexion

$as

fehlerhafte Adjektivflexion, gemischte Flexion

$ag

fehlerhafte Markierung der Komparation am Adjektiv

$c

fehlerhafte oder fehlende Pluralmarkierung (Substantive)

$n

fehlerhafte oder fehlende Dativmarkierung (Substantive)

$d

Genusfehler am Begleiter Nominativkontext

$gn

Genusfehler am Possessivpronomen, Nominativkontext

$gnpos

Genusfehler am Begleiter, Akkusativkontext

$ga

Genusfehler am Possessivpronomen, Akkusativkontext

$gapos

Genusfehler am Begleiter, Dativkontext

$gd

Genusfehler am Possessivpronomen, Dativkontext

$gdpos

Genus- oder Kasusfehler am Begleiter

$gk

fehlende Akkusativmarkierung am Begleiter, Regens Verb

$va

fehlende Akkusativmarkierung am Possessivpronomen, Regens Verb

$vapos

fehlende Dativmarkierung Begleiter, Regens Verb

$vd

fehlende Dativmarkierung Possessivpronomen, Regens Verb

$vdpos

fehlende Dativmarkierung am Begleiter, Regens Verb, evtl. n/m-Verschleifung

$vdn

fehlende Dativmarkierung am Possessivpronomen, Regens Verb, evtl. n/m-

$vdnpos

Verschleifung fehlende Akkusativmarkierung am Begleiter, Regens Präposition

$pa

fehlende Akkusativmarkierung am Possessivpronomen, Regens Präposition

$papos

fehlende Dativmarkierung am Begleiter, Regens Präposition

$pd

fehlende Dativmarkierung am Possessivpronomen, Regens Präposition

$pdpos

fehlende Dativmarkierung am Begleiter, Regens Präposition, evtl. n/m-Verschleifung

$pdn

fehlende Dativmarkierung am Possessivpronomen, Regens Präposition, evtl. n/m-

$pdnpos

Verschleifung fehlende Akkusativmarkierung am Possessivpronomen, Regens Wechselpräposition

$wapos

fehlende Dativmarkierung am Begleiter, Regens Wechselpräposition

$wd

fehlende Dativmarkierung am Possessivpronomen, Regens Wechselpräposition

$wdpos

fehlende Dativmarkierung am Begleiter, Regens Wechselpräposition, evtl. n/m-

$wdn

Verschleifung fehlende Dativmarkierung am Possessivpronomen, Regens Wechselpräposition, evtl. n/m-Verschleifung

$wdnpos

Kodierung | 227

Auch hier steht den Kodierern umfängliches Instruktionsmaterial zur Verfügung, das aus folgenden Dokumenten besteht: 1. 2.

Leitfaden (vgl. Anhang 8.3.2.1) Algorithmus C zur Analyse von Fehlern in der Nominalphrase (vgl. Abb. 32 bzw. Anhang 8.3.2.2) 3. Algorithmus D zur Analyse von Genus- und Kasusfehlern (vgl. Abb. 33: bzw. Anhang 8.3.2.3) 4. Word-Vorlage Wiederholungsfehler (vgl. Anhang 8.3.2.4) 5. Zusätzliche Hinweise (vgl. Anhang 8.3.2.5) Zu Beginn des Analysevorgangs lesen die Kodierer das Transkript halblaut und konzentrieren sich auf Abweichungen der Nominalflexion sowie fehlende Determinierer und Präpositionen. Das halblaute Vorlesen ist hier besonders wichtig, weil auf diese Weise Abschleifungen wie „Der sieht ein Jung“ nicht mehr als Fehler wahrgenommen werden, sondern als normales Aussprachephänomen erkannt werden. Zusätzlich ist natürlich eine entsprechende Sensibilisierung im Rahmen der Schulung notwendig. Wird ein Fehler identifiziert, ist entsprechend der klassischen Fehleranalyse (vgl. Kap. 3.3.2) und unter Berücksichtigung der unter 6.5.2 genannten Kriterien die zielsprachliche Variante der jeweiligen Äußerung zu rekonstruieren. Aus dem Vergleich der Ursprungsäußerung mit der Rekonstruktion lässt sich dann der Fehler kategorisieren (vgl. Kap. 3.3.2). Dabei orientieren sich die Kodierer an Algorithmus C (vgl. Abb. 32) zur Analyse von Fehlern in der Nominalphrase und ggfs. Algorithmus D (vgl. Tab. 28 und Tab. 29) zur Analyse von Genus- und Kasusfehlern. Diese beiden Algorithmen werden ebenso wie die Kodierung von Wiederholungsfehlern im Folgenden näher erläutert. Weitere detaillierte Hinweise zur Kodierung (z.B. zum Umgang mit Zweifelsfällen oder Klitisierungen von Präposition und Artikel) sind dem Dokument Zusätzliche Hinweise zu entnehmen (vgl. Anhang 8.3.2.5).

228 | Entwicklung eines empirischen Verfahrens zur Evaluation von Fördereffekten

Abb. 32. Algorithmus C zur Analyse von Fehlern in der Nominalphrase (Analyseschritt 2)

Kodierung | 229

Nachdem ein Fehler identifiziert wurde, ist entsprechend des Algorithmus‘ C (vgl. Abb. 32) zunächst zu entscheiden, ob es sich um eine abweichende Flexionsmarkierung handelt oder eine/n fehlende/n Determinierer bzw. Präposition. Bei einem Flexionsfehler ist im nächsten Schritt die Wortart des Trägerelements zu ermitteln. Handelt es sich um ein Substantiv ist zwischen den Kategorien fehlende oder fehlerhafte Pluralmarkierung und fehlende oder fehlerhafte Dativmarkierung zu entscheiden. Bei Adjektiven ist zu prüfen, ob es sich um eine fehlerhafte Markierung der Komparation handelt oder nicht. Ist dies nicht der Fall, ist zu analysieren, ob das Adjektiv überhaupt flektiert wurde und wenn ja, ob es sich um das schwache oder gemischte Flexionsparadigma handelt 89. Da das Flexionsparadigma vom jeweiligen Determinierer abhängt, kann es nur bestimmt werden, wenn dieser auch realisiert wurde. Andernfalls wird der Fehler fehlender Determinierer kodiert und die Flexionsendung am Adjektiv nicht weiter beachtet. Wurde bereits beim Determinierer eine abweichende Markierung festgestellt (z.B. „Der sieht die kleine Junge“), wird die Adjektivflexion ebenfalls ignoriert, weil es sich vermutlich um Folgefehler handelt. Handelt es sich beim Trägerelement um Artikel, Demonstrativpronomen, Possessivpronomen oder Personalpronomen, findet eine Analyse hinsichtlich Genus- und Kasusmarkierung statt (vgl. Abb. 33:). Da bei den Personalpronomen oft nicht eindeutig aus dem Kontext geschlossen werden kann, auf welches Substantiv sie sich beziehen, kann keine eindeutige Aussage hinsichtlich des Genus getroffen werden. Personalpronomen werden deshalb nur hinsichtlich der Kasusmarkierung untersucht und kodiert. Dass die Differenzierung von abweichenden Genus- und Kasusmarkierungen mitunter zu Problemen führt, zeigt sich sogar in wissenschaftlichen Veröffentlichungen. So wird z.B. in Benholz & Lipkowski (2010: 270–271) die abweichende Markierung des Possessivpronomens in der Schülerproduktion „*Danach hat sie mit meinem Mutter geredet“ als Dativfehler beurteilt, obwohl das Problem hier auf der Ebene des Genus zu suchen ist. Auch andere Autoren verweisen auf die Schwierigkeit der Abgrenzung von Genus- und Kasusfehlern (z.B. Nickel 2012: 249; Sahel 2010: 191, 199). Die Kriterien, die im Rahmen des vorliegenden Verfahrens zur Differenzierung verwendet wurden, werden im Folgenden erläutert. Da die Markierungen von Genus und Kasus in einem Morphem verschmelzen, müssen bei der Beurteilung der Zielsprachlichkeit jeweils alle Formen des entsprechenden Flexionsparadigmas berücksichtigt werden. Möchte man z.B. 8F

|| 89 Die starke Adjektivflexion wird hier außer Acht gelassen, weil entsprechende Kontexte bei der untersuchten Zielgruppe in mündlich realisierter Sprache kaum erwartbar sind.

230 | Entwicklung eines empirischen Verfahrens zur Evaluation von Fördereffekten beurteilen, ob durch einen gegebenen bestimmten Artikel der Dativ markiert wird OHNE dabei mögliche Genusfehler zu berücksichtigen, muss man prüfen, ob es sich bei dem gegebenen Artikel um einen möglichen Dativ-Marker handelt. Die Beispiele in Tab. 28 und Tab. 29 sollen diesen Ansatzpunkt verdeutlichen: Tab. 28. Probeverfahren „Liegt ein Kasusfehler vor?“

Beide Beispieläußerungen erfordern eine Dativmarkierung. Gemäß der oben beschriebenen Logik ist zu prüfen, ob es sich bei den realisierten Artikelformen dem bzw. die um mögliche Dativmarker handelt. Im ersten Fall ist die zutreffend, denn bei maskulinen und neutralen Substantiven markiert der Artikel dem den Dativ. Hier kann man zumindest nicht ausschließen, dass der Sprecher den Dativkontext erkannt hat und markieren wollte. Im vorliegenden Verfahren würde deshalb KEIN Kasusfehler kodiert. Im zweiten Fall ist dies dagegen nicht gegeben: Der Artikel die markiert niemals den Dativ, so dass die Kategorie fehlende Dativmarkierung zu kodieren wäre. Zusätzlich ist zu untersuchen, ob ein Genusfehler vorliegt. Dies ist in jedem Fall zu prüfen, d.h. auch dann, wenn bereits ein Kasusfehler diagnostiziert wurde. Denn es ist möglich, dass der gegebenen Logik folgend sowohl ein Kasus- als auch ein Genusfehler vorliegen. Analog zu dem Vorgehen in Tab. 28 müssen jetzt die Genusparadigmen untersucht werden (vgl. Tab. 29):

Kodierung | 231

Tab. 29. Probeverfahren „Liegt ein Genusfehler vor?“

Im ersten Fall ist das feminine Flexionsparadigma unter der Fragestellung zu untersuchen, ob dem ein möglicher Marker des Femininums ist. Dies ist nicht der Fall, so dass ein Genusfehler kodiert werden müsste. Im zweiten Beispiel lautet die Frage: Ist die ein möglicher Marker des Neutrums? Auch hier lautet die Antwort „nein“, so dass ebenfalls ein Genusfehler zu kodieren wäre. In seltenen Fällen ergibt dieses Analysevorgehen kein klares Ergebnis. So ist die abweichende Form „der“ in „*Das gehört der Junge“ sowohl ein möglicher Dativmarker (Femininum) als auch ein möglicher Marker des Maskulinums (Nominativ). Wenn nicht zu entscheiden ist, ob der Fehler auf Genus- oder Kasusebene liegt, wird die Kategorie Genus- oder Kasusfehler kodiert. Das eben beschriebene Analysevorgehen zur Differenzierung von Genusund Kasusfehlern liegt den Kodierern in Form von Algorithmus D vor (vgl. Abb. 33 bzw. Anhang 8.3.2.3). Konnte eine abweichende Genusmarkierung identifiziert werden, bleibt zu klären, um welchen Kasuskontext es sich handelt. Denn da sich die Morpheme zur Genusmarkierung je nach Kasuskontext unterscheiden, ist erwartbar, dass sich dies auch auf die Fehlerarten und -häufigkeiten auswirkt. Sollte es sich beim Trägerelement um ein Possessivpronomen handeln, wird dies durch ein zusätzliches pos am Ende des Fehlercodes markiert (vgl. Abb. 32).

232 | Entwicklung eines empirischen Verfahrens zur Evaluation von Fördereffekten

Abb. 33. Algorithmus D zur Analyse von Genus- und Kasusfehlern (Analyseschritt 2)

Kodierung | 233

Wird ein eindeutiger Kasusfehler ermittelt, ist vor allem von Interesse, um welches Regens es sich handelt. So ist zum einen zwischen Objekt- und Präpositionalkasus zu entscheiden und bei letzterem zusätzlich zwischen Präpositionen mit fester Kasusrektion und sogenannten Wechselpräpositionen (vgl. Kap. 3.4.2.3). Weiterhin ist zu entscheiden, ob im gegebenen Kontext der Akkusativ oder der Dativ gefordert ist. Handelt es sich um einen Dativkontext wird weiterhin differenziert, ob der Fehler möglicherweise auf die lautliche Ähnlichkeit von [n] und [m] zurückzuführen ist, was durch den Buchstaben n am Fehlercode kodiert wird. Handelt es sich beim Trägerelement um ein Possessivpronomen, wird auch hier der ermittelte Fehlercode zusätzlich mit pos markiert. Da die Analyse der Kasusfehler in Abhängigkeit von Regens, Akkusativ/Dativ und möglicher n/m-Verschleifung bereits sehr differenziert ausfällt, wird auf die Bestimmung des Genuskontextes verzichtet. Es ist davon auszugehen, dass sich nicht alle Kategorien gleichermaßen für die Evaluation von Fördereffekten eignen. Angesichts des lückenhaften Forschungsstandes konnte jedoch nicht im Vorfeld entschieden werden, welche Fehlertypen sich als Indikatoren eignen. Erst auf der Grundlage der späteren deskriptiven und faktoriellen Analysen werden Aussagen über Relevanz und Kombinierbarkeit einiger Kategorien möglich sein (vgl. Kap. 6.6.3.1 und 6.6.3.3). Kodierung von Wiederholungsfehlern Um Wiederholungsfehler zu erkennen und entsprechend zu kodieren, öffnen die Rater neben dem Fenster mit dem Transkript ein weiteres Dokument „Tabelle Wiederholungsfehler“ (vgl. Tab. 30 und Anhang 8.3.2.4). Wird im Transkript ein Numerus, Genus- oder Kasusfehler identifiziert, wird dieser zusammen mit dem Bezugssubstantiv bzw. Regens in diese Tabelle eingetragen. Wird der entsprechende Fehlertyp das erste Mal identifiziert, wird in der Spalte Anzahl eine 1 eingetragen. Taucht derselbe Fehlertyp erneut auf, erkennt der Kodierer dies anhand der Eintragungen in der Tabelle, markiert den nächsten Fehlercode mit einem X (z.B. $gaX) und ändert die Anzahl auf 2. Auf diese Weise werden Wiederholungsfehler eindeutig markiert und können bei Bedarf von der Auswertung ausgeschlossen werden 90. Die Wiederholungsfehler-Tabelle bietet außerdem eine mögliche Grundlage für vertiefende qualitative Analysen zu den Fördereffekten im Bereich der Nominalflexion. 89F

|| 90 Im Rahmen der Datenauswertung dieser Arbeit wurden wiederholte Genusfehler sowie wiederholt fehlerhafte Markierungen des Plurals und/oder Dativs an Substantiven nicht mitgezählt. Da es bei den wiederholten Kasusfehlern jedoch gut möglich ist, dass es sich um unterschiedliche Bezugssubstantive handelt und es dann keine 100% identischen Fehler wären, wurden hier mögliche Wiederholungsfehler mitgezählt.

234 | Entwicklung eines empirischen Verfahrens zur Evaluation von Fördereffekten

Tab. 30. Kodierung von Wiederholungsfehlern im Bereich der Nominalflexion

6.5.2.3 Analyseschritt 3: ‚Reste‘-Analyse Beim dritten Analyseschritt wird das Transkript insgesamt sechs Mal unter unterschiedlichen Gesichtspunkten analysiert und kodiert: Tab. 31. Übersicht Kodierung Analyseschritt 3 Analyseschritt 3a: Automatisierte Suche und Kodierung folgender Phänomene: Konstituentennegation (kein) Passepartout-Substantive Konjunktiversatzformen (würde) Vorgangspassive Possessivpronomen 3b: Kodierung von Konjunktiv-I/II-Formen 3c: Kodierung abweichender Semantik (Substantive und Verben): Umschreibungen semantisch falsche Substantive Näherungsbegriffe (Substantive) semantisch falsche Verben Näherungsbegriffe (Verben) 3d: Kodierung abweichender Verbformen: fehlerhafte Subjekt-Verb-Kongruenz

Code $kein $ding $kje $ps $pos $kj $um $lxs $lxsn $lxv $lxvn $sv

Kodierung | 235 Analyseschritt fehlerhafte Partizip II-Bildung sonstige Fehlbildungen unregelmäßiger Verben Verwechslung haben-sein 3e: Kodierung syntaktischer Abweichungen: geforderte, aber nicht realisierte Inversion nicht zielsprachliche V1-Strukturen unvollständiges Prädikat (Verbklammer) fehlendes Prädikat 3f: Kodierung von Wiederholungsfehlern Wiederholungsfehler: fehlerhafte Partizip II-Bildung Wiederholungsfehler: sonstige Fehlbildungen unregelmäßiger Verben Wiederholungsfehler: Verwechslung haben-sein Wiederholungsfehler: semantisch falsche Substantive Wiederholungsfehler: Näherungsbegriffe (Substantive) Wiederholungsfehler: semantisch falsche Verben Wiederholungsfehler: Näherungsbegriffe (Verben)

Code $ppf $vxf $hs $invf $ve $vkf $vf $ppfX $vxfX $hsX $lxsX $lxsnX $lxvX $lxvnX

Auch für diesen Analyseschritt liegt detailliertes Instruktionsmaterial vor, das sich aus folgenden Dokumenten zusammensetzt: 1. 2. 3.

Leitfaden (vgl. Anhang 8.3.3.1) Algorithmus E zur syntaktischen Fehleranalyse (vgl. Abb. 34 bzw. Anhang 8.3.3.2) Zusätzliche Hinweise (vgl. Anhang 8.3.3.3)

Analyseschritte 3a und 3b Über die Suchfunktion von Word lassen sich bestimmte Wörter bzw. Buchstabenfolgen automatisch suchen, durch die die jeweils interessierenden Phänomene sehr zuverlässig identifiziert werden können. Deshalb wird das Transkript in einem ersten Schritt (3a) nach den Begriffen in Tab. 32 durchsucht, wobei die Groß-/Kleinschreibung ignoriert wird. Bei einem „Treffer“ braucht der Kodierer nur noch kurz überprüfen, ob es sich tatsächlich um das gesuchte Phänomen handelt, was fast immer der Fall ist, und kann dann den entsprechenden Code ins Transkript schreiben.

236 | Entwicklung eines empirischen Verfahrens zur Evaluation von Fördereffekten

Tab. 32. Suchbegriffe für die automatisierte Suche (Analyseschritt 3) Interessierendes Phänomen Konstituentennegation (kein) Passepartout-Substantive Konjunktiversatzformen (würde) Vorgangspassive Possessivpronomen

Suchbegriffe kein ding, teil, sache würd wird, werd, wurd, gewor, wirst mein, dein, sein, ihr, unser, euer

Der nächste Analyseschritt (3b) lässt sich nicht automatisieren. Hier geht es um die Kodierung von Konjunktiv-I/II-Formen. Da nur die Frage 2 in Bezug auf den Clip Zivilcourage einen kommunikativen Rahmen öffnet, bei dem Konjunktivformen erwartbar sind (vgl. Kap. 6.3.2.2), bezieht sich die Analyse nur auf die Antworten auf diese Frage. Analyseschritte 3c und 3d Bei Analyseschritt 3c wird das Transkript erstmals von Anfang bis Ende halblaut gelesen. Bei Abweichungen hinsichtlich lexikalisch-semantischer Aspekte wird die Schüleräußerung entsprechend der klassischen Fehleranalyse (vgl. Kap. 3.3.2) und unter Berücksichtigung der unter 6.5.2 genannten Kriterien zielsprachlich rekonstruiert. Nur wenn sich beim Vergleich der Ursprungsäußerung mit der Rekonstruktion zeigt, dass die Abweichung etwas mit der Lexik bzw. Semantik von Substantiven oder Verben zu tun hat, wird diese entsprechend kodiert. In Ermangelung eines normierten Referenzwerks zur Beurteilung semantischer Angemessenheit wurden auf der Grundlage der Pilotierungsdaten in einem Expertenteam Beispieltabellen erstellt. Diese enthalten zur Differenzierung von semantisch falschen Substantiven bzw. Verben und Näherungsbegriffen beispielhafte Zuordnungen von Begriffen, deren Klassifizierung häufig zu Schwierigkeiten führte. In Tab. 33 wird dies beispielhaft für das Substantiv Alufolie und das Verb sich anziehen vorgestellt. Die vollständigen Tabellen sind dem Instruktionsmaterial in Anhang 8.3.3 (Tab. A-14: und Tab. A-15:) zu entnehmen. An dieser Stelle ist jedoch darauf hinzuweisen, dass es selbst im Expertenteam kaum möglich war, diese drei Kategorien eindeutig voneinander zu trennen. So gab es immer wieder Fälle, bei denen sich die Experten uneinig waren, welcher Kategorie der jeweilige Begriff zuzuordnen sei. Die Tabellen stellen daher einen Kompromiss und eine Orientierungshilfe dar, wobei die einzelnen Zuordnungen aus fachlicher Sicht strittig sind. Auch die Rückmeldungen während der Schulung sowie die Ergebnisse der Probeanalysen zeigten deutlich,

Kodierung | 237

dass die Beurteilung lexikalisch-semantischer Wohlgeformtheit auch unter Muttersprachlern sehr subjektiv erfolgt. Toleranzunterschiede zeigten sich dabei nicht nur zwischen Personen, sondern auch von Begriff zu Begriff. Besonders schwierig schien die objektive Beurteilung der verbalen Semantik. Tab. 33. Ausschnitt der Tabellen zur Differenzierung von semantisch falschen Substantiven bzw. Verben und Näherungsbegriffen Fachbegriff + tolerierte Alter- Näherungsbegriffe ($lxsn) nativen

nicht tolerierte Alternativen ($lxs)

Alufolie

Papier, Blatt

Metall-/Silber-/Glitzerfolie, Folie sich anziehen (z.B. Magnet + kleben Reißzwecke)

rangehen

Nach der Analyse semantischer Abweichungen im Zusammenhang mit Substantiven und Verben wird das Transkript erneut halblaut gelesen, wobei dieses Mal die Aufmerksamkeit auf abweichende Verbformen zu richten ist (Analyseschritt 3d). Werden Fehler identifiziert, ist die Äußerung erneut zielsprachlich zu rekonstruieren und die Abweichung entsprechend zu kodieren. Auch hier gilt entsprechend der unter 6.5.2 aufgeführten Kriterien für die Fehleranalyse, dass gesprochensprachlich normale Abschleifungen der Verbalflexion (z.B. ich glaub statt ich glaube oder gegang statt gegangen) nicht als Fehler gewertet werden. Die gesuchten Phänomene sind leicht zu erkennen und zu klassifizieren. Einige Hinweise und Beispiele finden sich im Dokument Zusätzliche Hinweise (vgl. Anhang 8.3.3.3). Analyseschritte 3e und 3f Beim Analyseschritt 3e ist das Transkript zum dritten Mal halblaut zu lesen. Diesmal liegt die Aufmerksamkeit auf syntaktischen Abweichungen, die die Wortstellung und syntaktische Vollständigkeit betreffen. Da gerade syntaktische Phänomene von den besonderen Bedingungen mündlicher Sprachproduktion betroffen sind, werden hier ausdrücklich nur solche Phänomene berücksichtigt, die im Sinne einer „Gemeinsamen Grammatik des Systems“ bzw. „der Norm“ (vgl. Kap. 2.3.3) sowohl für die gesprochene als auch die geschriebene Sprache Gültigkeit besitzen. Um eine eindeutige und objektive Identifikation der gesuchten Phänomene zu ermöglichen, wurde für diesen Analyseschritt ein Algorithmus E entwickelt (vgl. Abb. 34).

238 | Entwicklung eines empirischen Verfahrens zur Evaluation von Fördereffekten

Abb. 34. Algorithmus E zur syntaktischen Fehleranalyse (Analyseschritt 3)

Kodierung | 239

Algorithmus E (vgl. Abb. 34) knüpft an das Vorgehen der klassischen Fehleranalyse an (Vergleich der Schüleräußerung mit der zielsprachlichen Rekonstruktion), wobei auch hier die unter 6.5.2 aufgeführten Kriterien gelten. Die Ziffern in Abb. 34 beziehen sich auf Textbeispiele, die in einem weiteren Dokument zusammengefasst sind (vgl. Anhang 8.3.3.2, Tab. A-13:). Zusätzlich zu diesem Algorithmus erwies es sich als notwendig, die Kodierer intensiv in Bezug auf Wortstellungsmuster zu schulen. Denn die Voraussetzung für die Identifikation von abweichenden Verberst-Stellungen und (nicht realisierten) Inversionsstrukturen setzt u.a. voraus, dass zum einen Satzglieder als solche erkannt werden, zum anderen die Stellungsfelder Vorfeld, linke Verbklammer und Mittelfeld des von Drach (1937) entwickelten topologischen Modells bekannt sind. Die Erklärungen und Hinweise zu diesen Bereichen fallen deshalb im Instruktionsmaterial relativ ausführlich aus (vgl. Anhang 8.3.3.3). Die Beurteilung syntaktischer Vollständigkeit gilt in der gesprochenen Spontansprache als äußerst problematisch und wurde deshalb auf die Analyse der Vollständigkeit des Prädikats beschränkt (vgl. Kap. 6.5.1). Doch auch diese ist vor dem Hintergrund der ungeklärten Einheitenfrage (vgl. Kap. 2.3.3) schwierig. Zwar spielt die Einheit „Satz“, die typischerweise ein Prädikat erfordert, gerade in konzeptionell schriftlichen Registern der gesprochenen Sprache ebenfalls eine wichtige Rolle (vgl. Rath 1992; Kindt 1994; Stein 2003). Dennoch ist die eindeutige Identifikation satzwertiger Einheiten aufgrund von fragmentarischen Äußerungen, Abbrüchen, Neuansätzen und Wiederholungen oft schwierig. Hinzu kommt, dass aufgrund des Transkriptionsformats Äußerungen häufig durch einen Punkt am Ende der Zeile geteilt werden, obwohl sie in der folgenden Zeile fortgesetzt werden (vgl. Kap. 6.4.1). Hier erfordert es auf Seiten der Kodierer etwas Übung, in den Zeichen am Zeilenende keine Satzschlusszeichen zu lesen, sondern lediglich eine Markierung des Zeilenendes. Die Kriterien zur Beurteilung der Vollständigkeit des Prädikats sind Algorithmus E in Abb. 34 sowie den zusätzlichen Hinweisen und Beispielen im Instruktionsmaterial zu entnehmen (vgl. Anhang 8.3.3.2 und 8.3.3.3) Nach der Kodierung syntaktischer Abweichungen erfolgt im letzten Schritt (3f) die automatisierte Suche nach Wiederholungsfehlern. Zu diesem Zweck werden die Fehlercodes $ppf, $vxf, $hs, $lxs, $lxsn, $lxv und $lxvn (vgl. Tab. 31) als Suchbegriffe in der Suchfunktion von Word verwendet, so dass die entsprechend markierten Fehler schnell gefunden und verglichen werden können. Handelt es sich bei den Fehlertypen zur Verbform um dieselbe formale Abweichung an demselben Verb, werden wie bei Analyseschritt 2 die wiederholten Fehler mit einem X am Ende des Codes markiert (z.B. $ppfX). Bei den semantischen Abweichungen von Substantiven und Verben ist zu beachten, dass nicht das abweichend verwendete Lexem relevant ist, sondern der zielsprachliche

240 | Entwicklung eines empirischen Verfahrens zur Evaluation von Fördereffekten Begriff, der durch den bzw. die entsprechenden Ersatzbegriffe ersetzt wird. In den Äußerungen „*Dann steckt er Nagel da rein“ (gemeint: Reißzwecke) und „*Dann klebt er Nagel da dran“ (gemeint: Magnet) wird zwar derselbe Ersatzbegriff verwendet, die so kompensierten lexikalischen Lücken betreffen aber unterschiedliche Lexeme („Reißzwecke“ und „Magnet“). Aus diesem Grunde werden solche Fälle NICHT als Wiederholungsfehler gewertet. Andererseits können auch unterschiedliche Ersatzbegriffe für dieselbe lexikalische Lücke verwendet werden, z.B.: „*Dann steckt er Nagel da rein“ (gemeint: Reißzwecke) und „*Die Nadel (gemeint: Reißzwecke) klebt an dem Magnet“. In einem solchen Fall wäre die zweite Abweichung als Wiederholungsfehler zu kodieren. In den meisten Fällen scheinen die Kinder jedoch für eine lexikalische Lücke wiederholt dieselben Ersatzbegriffe zu verwenden. Nach diesem Kodierschritt ist die Transkript-Datei fertig kodiert, denn im letzten Analyseschritt (4) werden keine weiteren Codes in das Transkript eingetragen. In Tab. 34 ist ein solchermaßen kodiertes Transkript zur Veranschaulichung eingefügt: Tab. 34. Beispiel für ein kodiertes Transkript (Analyseschritte 1–3) @media: pre0720412 @Begin @Languages: de @Participants: INT Observer, SCH pre0720412, Student @ID: de/BeFo/SCH/male/pre0720412 @ID: de/BeFo/INT/male @Coder: Kröger *: %com: Aufwärmphase. %com: Film anschauen. *SCH:

Ich weiß des is Galaxy oder?

@Bg:

Zivil

%com: INT geht ganz kurz auf Frage von SCH ein und stellt dann Frage 1. *INT:

Frage 1 Zivil.

*SCH:

Äh [//] $skl ein Junge $vf.

*SCH:

# sie haben zwei Freunde.

*SCH:

[//] die haben [//] $skl.

*SCH:

drei Freunde gesehn die ein kleinen Jung ärgern.

*SCH:

und danach der andere hat $invf sich so klein gemacht.

*SCH:

und is abgehaun.

Kodierung | 241 *SCH:

[//] er hat immer so geredet.

*SCH:

und hat immer so gegessn.

*SCH:

xxx er steht auf Spiele.

*SCH:

die ham $vkf und der andere.

*SCH:

er s ganz ruhig.

*SCH:

und er sagte.

*SCH:

hör auf lieber [//] mit spieln.

*SCH:

[//] vielleicht wirst du dann noch süchtig.

*INT:

Frage 2 Zivil.

%com: INT lobt SCH. *SCH:

ich glaube danach [//].

*SCH:

kommt er zurück der immer redet.

*SCH:

und danach [//].

*SCH:

er gibt $invf xxx xxx diesen drei Freundn die den Jungen ärgern.

*SCH:

# und danach kommt der andere Freund und der hilft ihn $vdn.

*SCH:

und danach xxx dem seine $pos Mutter xxx damit die glücklich weiter lebn könn.

*INT:

Erklärung 2 Zivil.

%com: Film anschauen. *SCH:

Ich wusste nich dass das so spannend werdn kann.

*INT:

Frage 3 Zivil.

*SCH:

[//] # und dieser normale der ruhig war.

*SCH:

er war sein $pos Partner.

*SCH:

und hat die anderen ausgetrickst.

*SCH:

und dieser Partner.

*SCH:

hat den $vdn kleinen Jung zwanzig Euro gegebm.

*SCH:

[//] $skw [//].

*SCH:

[//].

*SCH:

danach hat er ihn $vdnX den $ga Handy gegebm sein $pos.

*SCH:

Handy der andere Junge.

*SCH:

und danach hat er wieder genomm hat ihm wieder gegebm.

*SCH:

okay und danach sind die zusamm gegang.

*SCH:

[//] $skl dann is er gegang.

*SCH:

[//] und hat ihn gesehn und.

*SCH:

er hat sich verwandelt [//].

242 | Entwicklung eines empirischen Verfahrens zur Evaluation von Fördereffekten *SCH:

# danach sind die runtergekomm und danach war s zu Ende.

*SCH:

und [//] $skl die großen drei sind abgehaun.

*SCH:

und die hatte $sv Angst vor ihn $wdn.

*SCH:

weil er hatte gesagt # dieser kleine Junge hatte ihn so geschlagn.

*SCH:

dass er alles Blut $vf und er hatte so ne dicke xxx im Mund.

%com: INT lobt SCH. @Eg:

Zivil

*INT:

Erklärung 3 Zivil.

%com: Film anschauen. *INT:

Erklärung 4 Zivil.

%com: INT stellt Fragen zu Film. *: *: *: *INT:

Erklärung 1 Wasser.

%com: Film asnchauen. @Bg:

Wasser

*INT:

Frage 1 Wasser.

*SCH:

[//] sie haben eine [//] Alufolie diese Folie geholt.

*SCH:

die silberne sie haben ein Loch gepiekst.

*SCH:

dann ham sie eine Flasche $vkf.

*SCH:

ham die voll Wasser $vkf.

*SCH:

danach ham sie dies $ga Alufolie.

*SCH:

mit den $gd $pdn Loch drübergelegt.

*SCH:

danach ham sie [//] gedrückt.

*SCH:

[//] danach hat der Junge mit die $pd Flasche.

*SCH:

# auf seine $pos Hand gelegt also danach.

*SCH:

hat er gedrückt und.

*SCH:

danach hat er sie langsam $vkf und $detf Wasser s nich rausgetropft.

*SCH:

danach hat er so ne # spitze Nadel $lxsn geholt.

*SCH:

und hat sie reingestochn und s Wasser mit die $pdX Alufolie $vf.

*SCH:

damit man merkt [//] das Loch s immernoch da.

*SCH:

[//] und s hat geklappt.

@Eg:

Wasser

Kodierung | 243 *INT:

Erklärung 2 Wasser.

%com: INT stellt Fragen zu Film. *: *: *: *INT:

Erklärung 1 Schiffe.

%com: Film anschauen. @Bg:

Schiffe

*INT:

Frage 1 Schiffe.

*SCH:

Die haben so äh.

*SCH:

# fast wie ein Wattestäbchen aber des s so dick $um.

*SCH:

und danach [//] die haben $invf.

*SCH:

# ein Stock $lxs oder so darein gepiekt.

*SCH:

und danach ham sie $detf Fahne $lxsn rauf geklebt.

*SCH:

und danach untn ham sie [//].

*SCH:

# eine Schraube $lxs noch untn gelegt $lxv.

*SCH:

danach ham sie ein Stock $lxsn genomm.

*SCH:

s immer so geschobn.

*SCH:

und da war glaub ich ein Magnet in den $wdn Stock.

*SCH:

wie man immer bei xxx Fische angelt.

%com: INT stimmt SCH zu. @Eg:

Schiffe

%com: INT stellt Fragen zu Film, lässt Erklärung 2 Schiffe allerdings weg. *: *: *: @End

6.5.2.4 Analyseschritt 4: Lexikalische Mittel und syntaktische Komplexität Bei diesem Schritt steht die differenzierte Auswertung schulsprachlich relevanter Wortarten und damit verbundener syntaktischer Strukturen im Vordergrund:

244 | Entwicklung eines empirischen Verfahrens zur Evaluation von Fördereffekten

Tab. 35. Übersicht Kodierung Analyseschritt 4 Schulsprachlich Relevante Wortarten und syntaktische Strukturen

Vollverben ohne Präfix Vollverben mit Präfix Modalverben attributiv verwendete Adjektive bzw. als solche gebrauchte Partizipien nicht attributiv verwendete Adjektive bzw. als solche gebrauchte Partizipien semantisch zielsprachliche Präpositionen semantisch falsche Präpositionen semantisch zielsprachliche Wechselpräpositionen semantisch falsche Wechselpräpositionen semantisch zielsprachliche Konnektoren (Satzverbindungen/-gefüge) semantisch falsche Konnektoren (Satzverbindungen/-gefüge)

Das recht aufwändige Kodierverfahren dient vor allem der späteren Ermittlung der Types und Tokens der ausgewählten Wortarten. Zwar lässt sich in CLAN mit Parameter D auch automatisch ein Maß für Wortschatzdiversität ermitteln (vgl. Kap. 6.5.2.5), dieses Maß ist jedoch relativ unspezifisch, weil es alle verwendeten Lexeme berücksichtigt und unterschiedliche Wortformen wie geh, gehe, gehen, gegangen als Types wertet. Da sich lexikalisch-semantische Merkmale nur begrenzt quantifizieren lassen, bietet der Output dieses Kodierschritts zudem eine Grundlage für vertiefende qualitative Auswertungen. Das Instruktionsmaterial für Analyseschritt 4 besteht aus folgenden Dokumenten: 1. 2. 3.

Leitfaden (vgl. Anhang 8.3.4.1) Excel-Datei Vorlage_Analyse (vgl. Anhang 8.3.4.2) Zusätzliche Hinweise (vgl. Anhang 8.3.4.3)

Wie bei den anderen Analyseschritten auch erfolgt die Kodierung am PC. Berücksichtigt wird nur Wortmaterial, das in Analyseschritt 1 (vgl. Kap. 6.5.2.1) nicht als Wiederholung bzw. Reparandum markiert wurde. Anders als bei den anderen Kodierschritten werden hier jedoch keine Codes in das Transkript eingetragen. Stattdessen wird neben dem Fenster mit der Transkript-Datei aus Analyseschritt 1 die Excel-Datei mit der Auswertungsvorlage geöffnet (vgl. Abb. 35).

Kodierung | 245

Abb. 35. Transkript und Auswertungsvorlage Wortschatzanalyse (Analyseschritt 4)

In den vorgegebenen Listen der Inhaltswörter (Verben und Adjektive) sind Begriffe enthalten, die in den Pilotierungsdaten häufig verwendet wurden und/oder deren Verwendung im Kontext der Aufgabenstellung wahrscheinlich erscheint 91. Wenn in den Sprachproben nicht gelistete Verben bzw. Adjektive benutzt wurden, werden diese von den Kodierern entsprechend ergänzt. Bezogen auf die Synsemantika bzw. Funktionswörter ist die Liste der Modalverben und Wechselpräpositionen vollständig, während bei den deutlich umfangreicheren Klassen der Präpositionen und Konnektoren nur solche Lexeme verwendet wurden, die in den Sprachproben der Pilotierung beobachtet werden konnten. Bei den Konnektoren wurde die Auswahl außerdem dahinge90F

|| 91 Die vollständigen Listen aller berücksichtigen Wortarten sind Anhang 8.3.4.2 zu entnehmen.

246 | Entwicklung eines empirischen Verfahrens zur Evaluation von Fördereffekten hend eingeschränkt, dass vorwiegend subordinierende Konnektoren und nur einige typische semantisch anspruchsvollere gleichordnende Konjunktionen, deren Aneignungsprozesse sich Kemp, Bredel & Reich (2008: 78–79) zufolge mit denen der subordinierenden Konjunktionen verschränken, berücksichtigt werden (vgl. dazu Kap. 3.4.1.3). Tab. 36 fasst die berücksichtigten Präpositionen und Konnektoren zusammen: Tab. 36. Berücksichtigte Präpositionen und Konnektoren bzw. Satzverbindungen/-gefüge (Analyseschritt 4) Wechselpräpositionen

Präpositionen

an auf hinter in neben über untee vor zwischen

aus bei bis durch für gegen mit nach ohne um (NICHT um…zu) von zu

Konnektoren (Satzverbindungen und -gefüge) aber denn als (temporal) als (ob) damit (final) (so) dass darum ob obwohl weil wenn (temporal) wenn (konditional) Relativanschlüsse W-Sätze Erweiterte Infinitive

Im Gegensatz zu den Inhaltswörtern dürfen die Listen mit den Funktionswörtern nicht erweitert werden. Zum einen ist davon auszugehen, dass in der großen Mehrzahl der Fälle alle verwendeten Funktionswörter auch in den Listen auftauchen, weil es sich im Gegensatz zur offenen Klasse der Inhaltswörter um eine geschlossene Klasse mit einer geringeren Gesamtzahl handelt. Zum anderen wäre für eine objektive Kodierung nicht gelisteter Funktionswörter eine deutlich intensivere Schulung erforderlich, denn die Unterscheidung von Präpositionen, Partikeln, Adverbien und Konjunktionen stellt erfahrungsgemäß auch für Studierende des Faches Deutsch immer wieder eine große Herausforderung dar. Der konkrete Kodiervorgang besteht aus insgesamt 4 Teilschritten, die im Folgenden näher beschrieben werden.

Kodierung | 247

Analyseschritt 4a Im Analyseschritt 4a konzentrieren sich die Kodierer zunächst nur auf die Identifikation der gesuchten Inhaltswörter (Verben und Adjektive bzw. als solche gebrauchte Partizipien) in der Transkript-Datei und markieren diese gelb (vgl. Abb. 36).

Abb. 36. Transkriptausschnitt mit Markierung von Verben und Adjektiven

Mitgezählt werden auch semantisch abweichende Lexeme. Bei den Verben ist dies sinnvoll, weil die Gesamtzahl der Verben genau wie die Gesamtwortzahl bei der späteren Auswertung als Relativierungsmaß verwendet wird (vgl. Kap. 6.6.3.6). Dies ist möglich, weil jede satzwertige Äußerung normalerweise ein Prädikat enthält, so dass die Zahl der Prädikate ein verlässliches Maß für den Gesamtumfang der Sprachprobe darstellt. Damit die Gesamtzahl der gezählten Verben in diesem Sinne der Zahl der satzwertigen Einheiten entspricht, müssen auch semantisch abweichende Formen berücksichtigt werden. Aus demselben Grund wird hier auch das Kopulaverb sein mitgezählt, das im Gegensatz zu allen anderen Verben nicht zu den Vollverben zählt. Die Beurteilung der verbalen Semantik erfolgt in Analyseschritt 3c (vgl. Kap. 6.5.2.3). Bei den Adjektiven wäre eine Differenzierung nach Zielsprachlichkeit zwar theoretisch möglich gewesen. Da die Analyse der Pilotierungsdaten jedoch ergab, dass die verwendeten Adjektive in der überwiegenden Zahl semantisch angemessen gebraucht

248 | Entwicklung eines empirischen Verfahrens zur Evaluation von Fördereffekten wurden (Abweichungen betrafen hier eher die Flexion) 92, wurde auf die Beurteilung der adjektivischen Semantik verzichtet, um das Kodierverfahren nicht unnötig zu verkomplizieren. 91F

Analyseschritt 4b: Auszählung der Inhaltswörter In Analyseschritt 4b werden die gelb markierten Begriffe aus Analyseschritt 4a (vgl. Abb. 36) gezählt, d.h. die jeweilige Anzahl in der entsprechenden Spalte der Excel-Datei aktualisiert (vgl. Abb. 37).

Abb. 37. Screenshot Auszählung Inhaltswörter (Analyseschritt 4b)

Begriffe, die nicht gelistet sind, werden unter die entsprechende Spalte geschrieben. Um den Überblick zu behalten, welche Begriffe bereits gezählt wur|| 92 Dies bedeutet nicht, dass der adjektivische Wortschatz besonders gut entwickelt ist, sondern lediglich, dass die verwendeten Adjektive semantisch angemessen gebraucht wurden. Insgesamt wurden jedoch nicht viele (verschiedene) Adjektive produziert (vgl. Kap. 6.6.3.1 ), was darauf schließen lässt, dass Unsicherheiten beim adjektivischen Wortschatz eher zu einer Vermeidung von Adjektiven führten als zu einer semantisch abweichenden Verwendung.

Kodierung | 249

den und welche noch nicht, wird die Markierung, sobald ein Begriff gezählt wurde, jeweils auf pink geändert (Abb. 37). Beim Zählen ist unbedingt zu beachten, dass für jeden Transkriptausschnitt ein eigenes Tabellenblatt auszufüllen ist (vgl. Abb. 37). Zwar werden im quantitativen Teil der Auswertung die Häufigkeiten pro Transkriptausschnitt wieder summiert. Eine nach Abschnitten differenzierte Datengrundlage kann jedoch z.B. für qualitative Analysen der Wortschatzkenntnisse in Abhängigkeit von den Themen der Videoclips bedeutsam sein kann. In einigen Fällen kam es im Vorfeld zu Schwierigkeiten bei der Identifikation bzw. Abgrenzung bestimmter Wortarten. Dies betraf vor allem die folgenden Phänomene: 1.

Abgrenzung von Vollverben, Hilfsverben, Modalverben und Kopulaverben 2. Identifikation von substantivierten Verben (werden nicht gezählt) 3. Identifikation von Präfixverben 4. Identifikation von Adjektiven und adjektivisch gebrauchten Partizipien in Abgrenzung zu Adverbien und Zahlwörtern 5. Abgrenzung attributiver vs. nicht attributiver Gebrauch von Adjektiven und adjektivisch gebrauchten Partizipien Hier zeigte sich die Wichtigkeit einer gezielten Kodierer-Schulung. Außerdem werden die wesentlichen Merkmale und Kriterien sowie einige Beispiele in dem Dokument Zusätzliche Hinweise zusammengefasst (vgl. Anhang 8.3.4.3). Analyseschritte 4c und 4d In Analyseschritt 4c wird das Transkript erneut gelesen und analog zum Analyseschritt 4a werden jetzt die in der Excel-Datei gelisteten Präpositionen, Wechselpräpositionen und Konnektoren (bzw. Satzverbindungen/-gefüge) gelb markiert. Die Anzahl dieser Wörter ist im nächsten Schritt (4d) wieder in die ExcelTabelle einzutragen, wobei zwischen einer semantisch zielsprachlichen bzw. nicht zielsprachlichen Verwendung zu unterscheiden ist (vgl. Abb. 35). Sollten in einigen seltenen Fällen Präpositionen oder Konnektoren verwendet werden, die nicht in den Listen aufgeführt sind, werden diese aus den oben genannten Gründen ignoriert. Wie in Analyseschritt 4b wird auch hier jeder Begriff, sobald er gezählt wurde, pink markiert. Die pinken Markierungen in der Word-Datei dokumentieren auf diese Weise genau, welche Begriffe tatsächlich erfasst wurden und ermöglichen eine entsprechende Kontrolle.

250 | Entwicklung eines empirischen Verfahrens zur Evaluation von Fördereffekten Auch bei diesem Analyseschritt ist eine gezielte Schulung und entsprechendes Instruktionsmaterial hinsichtlich einiger spezieller Phänomene notwendig: 1.

Unterscheidung von Präpositionen und Konnektoren vs. Modal- und Verbpartikeln 2. Identifikation von Relativanschlüssen in Abgrenzung zu syntaktisch ähnlichen Strukturen (z.B. Infinitivkonstruktionen und ReferenzAussage-Strukturen) 3. Identifikation von W-Sätzen 4. Zuordnung von Satzanschlüssen mit wo (Relativanschluss vs. W-Satz) 5. Identifikation von erweiterten Infinitiven 6.5.2.5 Auszählung und Dateneingabe Die Grundlage für die Ermittlung der Häufigkeiten der kodierten Merkmale bzw. Variablen bilden zwei Dokumente: 1. 2.

Transkript-Datei mit den entsprechenden Codes aus den Analyseschritten 1–3 (vgl. Tab. 34) Excel-Datei mit den Auszählungen aus Analyseschritt 4 (vgl. Abb. 37)

Der Zeitaufwand für die Ermittlung der Häufigkeiten und die Dateneingabe der Variablen aus 1. und 2. beträgt pro Transkript ca. 15 min. Auszählung der Ergebnisse aus den Analyseschritten 1–3 und Berechnung von Parameter D Vor der Dateneingabe müssen die Codes in der Transkript-Datei ausgezählt werden. Zu diesem Zweck ist die Word-Datei mit der transkribierten und kodierten Sprachprobe per Copy & Paste wieder in eine cha-Datei zu konvertieren, die von der Transkriptionssoftware CLAN nach bestimmten Kriterien ausgewertet werden kann. Dabei werden folgende Werte berechnet, wobei eingeklammertes Material (Selbstkorrekturen und Wiederholungen) von der Analyse ausgeschlossen werden 93: 92F

1. 2.

Häufigkeiten der Codes pro Abschnitt (Zivilcourage, Wasserflasche, Magnetschiffe) Gesamtwortzahl pro Abschnitt

|| 93 Das genaue Vorgehen zur Berechnung dieser Werte ist dem Instruktionsmaterial in Anhang 8.4.2 zu entnehmen.

Kodierung | 251

3. Gesamtwortzahl der summierten drei Abschnitte 94 4. Parameter D pro Abschnitt 5. Parameter D der summierten drei Abschnitte 93F

Bei Parameter D handelt es sich um ein Maß für die Wortschatzdiversität, das auf der Berechnung der Type-Token-Relation (TTR) basiert. Die Berechnung der TTR geht auf Johnson (1944) zurück. Dabei wird die Anzahl aller verschiedenen Wörter zur Anzahl aller Wörter in Bezug gesetzt. Die Äußerung „Dann gehn die zu Pommesbude und dann gehn die zu U-Bahn“ enthält z.B. insgesamt 11 Wörter (Tokens), davon aber nur sieben verschiedene Wörter (Types): dann, gehn, die, zu, Pommesbude, und, U-Bahn. Je höher der Quotient aus Types und Tokens (=Type-Token-Relation) ausfällt, desto mehr verschiedene Wörter hat der Sprecher gemessen an der Gesamtwortzahl verwendet: A TTR of 0.01, for example, could characterize a child repeating the same 99 word 100 times. In contrast, a TTR of 1.00 would describe the unnatural situation in which all 100 words of the sample were different. (Silverman & Ratner 2002: 291)

Ein Problem bei diesem Maß besteht darin, dass Wortschatzkenntnisse immer themen- und textsortenabhängig sind, so dass TTR-Ergebnisse verschiedener Sprecher bzw. Schreiber nur verglichen werden können, wenn auch die zugrundeliegenden Texte vergleichbar sind (Milton 2009: 129–130; Landua, MaierLohmann & Reich 2008: 179). Diese Bedingung ist aufgrund des standardisierten Erhebungsverfahrens im Rahmen der vorliegenden Arbeit erfüllt. Eine andere Einschränkung der Reliabilität der Type-Token-Relation ergibt sich jedoch aus ihrer Abhängigkeit von der Textlänge (Milton 2009: 126). So ist irgendwann der Wortschatz ‚verbraucht‘ und wiederholt sich notgedrungen. Mit anderen Worten: Je länger der Text, desto niedriger die TTR (vgl. Silverman & Ratner 2002; McKee et al. 2000). Da sich die Sprachproben, die durch das vorliegende Verfahren elizitiert werden, erheblich in ihrer Länge unterscheiden (vgl. Kap. 6.6.1, Tab. 39), stellt die TTR hier kein verlässliches Maß für Wortschatzreichtum dar. Auch wenn die verschiedenen Methoden zur Berechnung der lexikalischen Vielfalt nach wie vor kontrovers diskutiert werden 95, wird als 94F

|| 94 Da die Transkripte z.T. auch Verschriftlichungen von Schüleräußerungen enthalten, die nicht mit in die Datenauswertung eingehen (z.B. Fragen zur Aufgabenstellung), wird nicht die Gesamtwortzahl des gesamten Transkripts berechnet, sondern nur die summierte Gesamtwortzahl der markierten Abschnitte. 95 Für einen Überblick siehe Milton 2009: 125–130; Daller & Xue 2007 und Malvern & Richards 2002.

252 | Entwicklung eines empirischen Verfahrens zur Evaluation von Fördereffekten beste Alternative zur TTR die Berechnung von Parameter D hervorgehoben (Daller & Xue 2007: 151–152). Dieses auf Malvern & Richards (1997) zurückgehende Maß basiert auf der Beobachtung, dass die TTR bei zunehmender Textlänge auf systematische Weise sinkt. Die Wahrscheinlichkeit, mit der neue Wörter in länger und länger werdenden Sprachproben produziert werden, lässt sich daher mathematisch modellieren: The model is a mathematical equation that relates TTR to token size (N) in terms of a third variable, a parameter referred to as ‘D’

��� �

D N ���� � � � � �� N D

(Malvern & Richards 2002: 89):

Weiterhin gilt, dass die TTR-Werte bei Sprechern bzw. Schreibern mit geringem Wortschatzreichtum bei zunehmender Textlänge schneller sinken als bei Sprechern bzw. Schreibern mit großem Wortschatzreichtum (vgl. Abb. 38):

Abb. 38. Kurvengruppe zur Veranschaulichung des Zusammenhangs von Wortschatzreichtum und Parameter D (Malvern & Richards 2002: 89)

Parameter D stellt damit einen verlässlicheren Index für Wortschatzdiversität dar als die TTR und wird wie folgt berechnet: The method for obtaining D values from transcripts depends on producing a graph of the way the TTR in a given transcript falls with increasing token size within the language sample, and comparing this empirical graph with the theoretical curves obtained from the mathematical model, i.e., from the equation. The best fit between the two, obtained by ad-

Kodierung | 253 justing the value of D until the theoretical curve matches the empirical curve as closely as possible, yields a measure of the person’s vocabulary diversity represented by the value of D for optimum fit. A higher D represents greater diversity and values have been found to range from D = 5 for a five-year-old language impaired child to D = 120 for a sample of academic writing (Richards & Malvern, 1999).

Die Validität von Parameter D konnte mittlerweile in zahlreichen Studien bestätigt werden (vgl. McKee, Malvern & Richards 2000: 326–327). Über die VOCDAnalyse in der Transkriptionssoftware CLAN lässt sich Parameter D bei einer Mindestzahl von 50 Tokens automatisch berechnen 96. Eingeklammertes Wortmaterial (= Wiederholungen und Selbstkorrekturen) sowie die Codes werden dabei im Rahmen der vorliegenden Arbeit von der Analyse ausgeschlossen. 95F

Dateneingabe des CLAN-Outputs Der Output zur Häufigkeitsanalyse der Codes, der VOCD-Analyse und der Berechnung der Gesamtwortzahlen liegt in insgesamt sieben Dateien pro Transkript vor: 1. 2. 3. 4. 5. 6. 7.

Häufigkeiten der Codes, Abschnitt Zivilcourage Häufigkeiten der Codes, Abschnitt Wasserflasche Häufigkeiten der Codes, Abschnitt Magnetschiffe Gesamtwortzahl und Parameter D, Abschnitt Zivilcourage Gesamtwortzahl und Parameter D, Abschnitt Wasserflasche Gesamtwortzahl und Parameter D, Abschnitt Magnetschiffe Gesamtwortzahl und Parameter D der summierten drei Abschnitte

Der Output mit den Häufigkeiten der Codes (1–3) lässt sich in Excel exportieren, so dass eine teilautomatisierte Dateneingabe, die gegenüber einer manuellen Eingabe deutlich weniger fehleranfällig ist, möglich ist 97. Die Werte von Gesamtwortzahl und Parameter D lassen sich nicht exportieren, weshalb sie zusammen mit den Daten aus Analyseschritt 4 manuell eingegeben werden (vgl. Anhang 8.4.4). 96F

Auszählung und Dateneingabe der Ergebnisse aus Analyseschritt 4 Die in Analyseschritt 4 ermittelten Häufigkeiten stellen die Grundlage für die Berechnung der Type- und Token-Werte dar. Neben Informationen über die Diversität der untersuchten Wortarten, für die v.a. die Type-Werte von Interesse || 96 Für eine genaue Darstellung des mathematischen Modells, das bei der VOCD-Analyse angewandt wird, sei auf McKee, Malvern & Richards 2000 verwiesen. 97 Das genaue Vorgehen ist dem Instruktionsmaterial in Anhang 8.4.2 zu entnehmen.

254 | Entwicklung eines empirischen Verfahrens zur Evaluation von Fördereffekten sind, geben einige der Token-Werte indirekt auch Auskunft über die Verwendung bestimmter syntaktischer Strukturen. Um die entsprechenden Variablen im Datensatz den Rohdaten zuordnen zu können, seien diese hier kurz gegenübergestellt: Tab. 37. Token-Werte und syntaktische Strukturen (Analyseschritt 4) Tokens Tokens Verben ohne Präfix + Tokens Verben mit Präfix Tokens Modalverben Tokens attributive Adjektive Tokens Präpositionen (zielsprachlich + nicht zielsprachlich) Tokens Wechselpräpositionen (zielsprachlich + nicht zielsprachlich) Tokens Konnektoren (zielsprachlich + nicht zielsprachlich)

Syntaktische Strukturen (Indikator für) satzwertige Äußerungseinheiten Satzstrukturen mit Modalverb (komplexes Prädikat) adjektivische Attribute (komplexe Nominalphrase) Präpositionalphrasen Präpositionalphrasen mit Wechselpräposition Satzgefüge und -verbindungen

Die Häufigkeit der Tokens wird berechnet, indem die notierten Häufigkeiten summiert werden. Die Anzahl der Types ergibt sich dagegen aus der Summe der Zeilen, in denen ein Wert notiert wurde. Während die Anzahl der Types vom Auswerter selbst berechnet werden muss, lässt sich die Summe der Häufigkeiten von Excel automatisch berechnen. Die ermittelten Werte werden jeweils unter den entsprechenden Spalten notiert (vgl. Abb. 39) müssen dann später per Hand in die jeweilige Auswertungssoftware eingegeben werden 98. 97F

|| 98 Im Rahmen der vorliegenden Arbeit wurde SPSS 20 verwendet, wobei die Daten zuvor über die Eingabesoftware WEingabe (Rimmele 2005) eingegeben wurden.

Kodierung | 255

Abb. 39. Ergebnisse aus Analyseschritt 4 mit Type-Token-Berechnung

256 | Entwicklung eines empirischen Verfahrens zur Evaluation von Fördereffekten

6.6 Evaluierung: Prüfung der Gütekriterien Bei der Evaluation des vorliegenden Verfahrens sind sowohl Datenerhebung und Transkription als auch Datenanalyse (Kodierung) zu berücksichtigen. Dabei ist jedoch zu beachten, dass die statistische Prüfung der Gütekriterien sich primär auf die Daten bzw. Variablen konzentriert, die im Zuge der Kodierung erfasst wurden (vgl. Kap. 6.5.1.3). Diese geben indirekt natürlich auch Auskunft über die Güte des Elizitierungs- und Transkribierverfahrens. So würden sich Störfaktoren, die die Objektivität der Elizitierung und/oder Transkription beeinträchtigen, auch auf das Ergebnis der Kodierung auswirken und dadurch die Reliabilität der Auswertungskategorien (Variablen) bzw. Skalen und damit die Validität negativ beeinflussen. Wenn z.B. einige Testleiter den Kindern bei lexikalischen Lücken helfen und die unbekannten Begriffe vorsagen würden, während andere dies nicht täten, könnten die Variablen zur Kodierung semantischlexikalischer Unsicherheiten dieses Merkmal nicht mehr verlässlich erfassen, weil die Testleiter-Einflüsse zu groß wären. Gleiches wäre bei individuellen Einflüssen der Transkribenten auf die Transkription der Fall. 6.6.1 Güteprüfung des Elizitierungsverfahrens In Kap. 6.3.1 wurde ausgeführt, welche Bedingungen das Elizitierungsverfahren in Hinblick auf Validität, Reliabilität, Objektivität und einige Nebengütekriterien erfüllen sollte. Tab. 38 fasst zusammen, auf welche Weise das Verfahren den genannten Bedingungen Rechnung trägt:

Evaluierung: Prüfung der Gütekriterien | 257

Tab. 38. Güteprüfung des Elizitierungsverfahrens

Merkmale schulsprachlicher Kommunikationssituationen (vgl. Kap. 2.3.5):

Validität

Situationsentbindung

- Gesprächsthema entspricht nicht dem situativen Kontext der Kommunikation - Gesprächsgegenstand (Videoclip) liegt während der Kommunikation nicht mehr vor - keine gemeinsame Kenntnis des Filminhaltes (Testleiter gibt vor, den Film nicht zu kennen und dreht sich um, während der Clip läuft) - Personen der suggerierten Kommunikationssituationen kennen den Inhalt der Filme nicht (Klasse bzw. fremde Schulklasse und Lehrerin haben den Film nicht gesehen) Themenfixierung - Vorgabe schulrelevanter Themen - standardisierter Gesprächsablauf verhindert Themenwechsel Fremdheit der Kommu- - Testleiter und Schüler kennen sich nicht nikationspartner - z.T. kennen sich die Personen der suggerierten Kommunikationssituationen nicht (Äußerungen des Schülers sollen einer fremden Schulklasse vorgespielt werden) Institutionalität (Öffent- - Die Erhebung findet innerhalb der Institution Schule lichkeit) statt - Aufnahme mit einer Videokamera - Aufgabenstellungen suggerieren eine spätere öffentliche Wiedergabe der Schüleräußerungen vor einer fremden Klasse Rollenstabilität - standardisierter Ablauf der Erhebungsphase schließt (Monologizität) eine dialogische Kommunikation zwischen Testleiter und Schüler weitgehend aus - Aufgabenstellungen fordern eine ausführliche und monologische Antwort des Schülers - Nachdem das Verständnis der Aufgabenstellung gesichert ist, darf der Testleiter darf keine Fragen beantworten eingeschränkter Einsatz - dekontextualisierte Kommunikationssituation nonverbaler Mittel - Aufforderung, möglichst wenig „die Hände zu benutzen“

Mögliche Einflussfaktoren:

Reliabilität

258 | Entwicklung eines empirischen Verfahrens zur Evaluation von Fördereffekten Aufgabenverständnis - Schüler werden gefragt, ob sie die Aufgaben verstanden haben und können ggfs. Nachfragen stellen. Motivation/ Interes- - in der Aufwärmphase werden die Themen der Filme se angesprochen, um Neugierde zu wecken und Vorwissen zu aktivieren - Videoclips, die auf unterschiedliche Weise an die Lebenswelt der Schüler anknüpfen, bieten Identifikationsmöglichkeiten und sprechen verschiedene Interessensgebiete an - Handlungsverlauf mit überraschender Wendung im Clip Zivilcourage - Experiment Wasserflasche widerspricht der alltäglichen Erfahrung zum Verhalten von Wasser und Schwerkraft und erinnert an einen spannenden Zaubertrick - Clip Magnetschiffe zeigt eine Bastelei, die zum Nachmachen motiviert Konzentration - Die Erhebungsphase dauert insgesamt nicht länger als 20–25 min. - kurze Filmsequenzen (je ca. 1 min, Clip Zivilcourage wird in zwei einminütigen Teilen präsentiert) - unterschiedliche Reihenfolge der Clips ( bezogen auf die gesamte Stichprobe wird auf diese Weise kontrolliert, dass der Zeitpunkt, zu dem der Film präsentiert wird, keinen Einfluss auf die Sprachproduktion hat) Gedächtnis - Kürze der Videoclips - inhaltliche Korrektheit und Vollständigkeit der Schüleräußerungen spielen bei der Auswertung keine Rolle Hintergrundwissen - Ausführlichkeit der Beschreibung der Handlungsabläufe ist weitgehend unabhängig vom Hintergrundwissen - inhaltliche Korrektheit und Vollständigkeit der Schüleräußerungen spielen bei der Auswertung keine Rolle - Vorwissen wird während der Aufwärmphase bei allen Schülern aktiviert Beobachterparadox - Aufnahmesituation beeinflusst das Gesprächsverhalten positiv in Richtung eines formellen, standardnahen Registers - Aufwärmphase, um ggfs. Leistungsangst abzubauen Persönlichkeit (Int- - Aufwärmphase zur Auflockerung rovertiertheit, Leis- - Wiederholtes Lob/ Ermutigung durch den Testleiter tungsangst)

Evaluierung: Prüfung der Gütekriterien | 259

Objektivität

- standardisiertes Vorgehen - Testleiterschulung - Testheft - Protokoll, in dem Zwischenfälle notiert werden - Dokumentation durch Videoaufnahme

Nebengütekriterien

Fairness

Nicht-Verfälschbarkeit

Zumutbarkeit

Ökonomie

- standardisiertes Vorgehen - Clips sprechen unterschiedliche Interessensgebiete an - Aufgabenformate stellen keine Benachteiligung für bestimmte Teilnehmer(gruppen) dar - Schüler wissen nicht, dass es um ihre schulsprachliche bzw. formalsprachliche Kompetenz geht (es wird ihnen gesagt, dass es um ihre Erzählkompetenz geht), so dass sie das Ergebnis nicht willentlich beeinflussen können. - Erhebung findet während der Schulzeit statt - Zeitaufwand pro Schüler max. 30 min - ansprechende Stimuli - positive Rückmeldungen vieler Schüler - Zeitaufwand von 30min/pro Schüler ist angesichts der gegebenen Fragestellung angemessen - Erhebung während der Unterrichtszeit möglich - geringer Materialaufwand

Zusammenfassend lässt sich sagen, dass durch die beschriebenen Aufgabenformate und Stimuli eine weitgehende Situationsentbindung erreicht wird. Weiterhin veranlassen die Aufgabenformate und das zurückhaltende Verhalten der Testleiter die Schüler zu einer in weiten Teilen monologischen und elaborierten Sprachverwendung. Auch die anderen Bedingungen dekontextualisierter Kommunikationssituationen (Themenfixierung, Fremdheit der Gesprächspartner, Öffentlichkeit) werden operationalisiert. Die verschiedenen kurzen und spannenden Videoclips sprechen unterschiedliche Interessen an und liefern vielfältige Stimuli zur anschließenden Versprachlichung. Die Aufnahmesituation, die bei anderen Erhebungen die Ergebnisse verfälschen kann (Beobachterparadox), beeinflusst in dem vorliegenden Kontext die Sprachproduktion in gewünschter Weise in Richtung eines formellen, standardnahen Registers. Um jedoch zu verhindern, dass die Aufnahmesituation die Schüler zu sehr einschüchtern und damit die Sprachproduktion behindern könnte, beginnt das Einzelinterview mit der beschriebenen Aufwärmphase (vgl. Kap. 6.3.2.1). Beim wiederholten Einsatz des Verfahrens (2. Messzeitpunkt) sind Einflüsse auf den Umfang der Sprachprobe und das inhaltliche Verständnis erwartbar. Da diese Aspekte jedoch bei der Auswertung keine Rolle spielen, können diese vernachlässigt werden.

260 | Entwicklung eines empirischen Verfahrens zur Evaluation von Fördereffekten Durch den standardisierten Ablauf ist die Durchführung des Verfahrens objektiv. Auch die Nebengütekriterien werden in ausreichendem Maße erfüllt. Ein im Zusammenhang mit freier Sprachproduktion grundsätzlich möglicher Einflussfaktor besteht jedoch darin, dass es den Schülern freigestellt ist, welche Inhalte bzw. inhaltlichen Details sie tatsächlich versprachlichen. Auch wenn durch die Kürze der Filmclips und die wechselnde Reihenfolge ihrer Präsentation Konzentrations- und Gedächtniseffekte weitgehend reduziert werden, ist es möglich und erwartbar, dass spezifische inhaltliche Aspekte, deren Versprachlichung differenzierte sprachliche Mittel (z.B. Fach- und Funktionswortschatz) erfordern würde, von den Schülern weggelassen werden. Dies sollte bei der späteren Auswertung berücksichtigt werden. Um zu prüfen, ob sich das Elizitierungsverfahren wie geplant umsetzen lässt und zu der gewünschten Sprachproduktion führt, wurde es im Juni 2010 mit 15 DaZ-Schülern einer Bruchsaler Grundschule pilotiert 99. Auf der Grundlage einer qualitativen Analyse der Aufnahmen aus der Pilotierung sowie 20 zufällig ausgewählter Aufnahmen und Transkriptionen der Hauptstichprobe kann bestätigt werden, dass sich das Verfahren sehr gut implementieren lässt: Alle Schulen konnten einen separaten Raum für die Interviews bereitstellen. Da die Schüler nacheinander für die Interviews aus dem Unterricht geholt wurden, musste kein Unterricht ausfallen. Auch stellten die Schulleiter ihre Schüler gern für diesen Zweck frei. Weiterhin ergaben die Analyse sowie die Rückmeldungen der Kodierer, dass sich die Testleiter sehr genau an die Vorgaben hielten, so dass der Einfluss des „Versuchsleiterartefakts“ (vgl. Bortz & Döring 2010: 82–83) als gering einzustufen ist. In allen untersuchten Interviews gaben die Schüler an, die jeweilige Aufgabe verstanden zu haben. Die Sprachproduktionen der Schüler bestätigen dies insofern, als alle Schüler sich in ihren Äußerungen auf die Filminhalte bezogen. Unterschiede zeigten sich erwartungsgemäß in der inhaltlichen und sprachlichen Genauigkeit. Zur Veranschaulichung werden im Folgenden zwei prototypische Ausschnitte aus einem Interview mit einer Drittklässlerin (L1 Albanisch) vorgestellt 100. Der erste Ausschnitt bezieht sich auf den ersten Teil des Clips Zivilcourage, der zweite Ausschnitt auf den Clip Wasserflasche: 98F

9F

|| 99 Zur Beschreibung der Pilotierungsstichprobe siehe Kap. 6.2.1 100 Zu den Transkriptionskonventionen siehe Kap. 6.4.2

Evaluierung: Prüfung der Gütekriterien | 261

Clip Zivilcourage: *INT: So, jetzt stell dir vor, dass du in der Schule bist. *INT: Bitte erzähl jetzt ganz genau, was in dem Film passiert. *INT: Und denk dran: Die Lehrerin und deine Klassenkameraden haben den Film noch nie gesehen. Du musst alles ganz genau erzählen. *SCH: Auf diesem Film war passiert [//] zwei Jungs sind in ein Ladn eingegang. *SCH: Und da gib s Fernseher. *SCH: Und die beidn ham gelach und geredn xxx. *SCH: Dann sind die wieder aus die Lade rausgegang. *SCH: Und dann sind die beidn etwas [//] zum essen gekaufn. *SCH: Und da sind sie [//] wieder rausgegang. *SCH: Und dann sind die bei O-Bahn runtergegang. *SCH: Und # ich weiß nicht [//] wie viel Junge da war. *SCH: Und [///] xxx ein Junge äh wollte nach Hause gehn. *SCH: Und die ich glaube sechs Junge warn da. *SCH: Den ham die geschlagn. *SCH: Und die zwei Junge. *SCH: Ein Junge hat ein so umgekleidert. *SCH: Und auf sein Kopf etwas gemacht nur dass die Auge ma sieht. %com: Erklärt wieder ausgiebig mit den Händen. *SCH: Und dann äh ist der obm gegang. *SCH: Und dann er hat auf den Essen zugeguckt. *SCH: Dann hat den Löffel weggemacht auf den Erde.

Clip Wasserflasche: *INT: Dann beschreib jetzt bitte, was du in dem Film gesehen hast. *INT: Und denk daran, dass du es möglichst genau erklärst, sodass die Schüler von der anderen Schule das Experiment selbst ausprobieren können. *SCH: Das war eine Flasche. *SCH: Und äh [//] in die Flasche war ein Ding. *SCH: Und da war ein Loch. *SCH: Und dann äh in die Flasche ist der Wasser reingegang. *SCH: Dann hat diese xxx mit den Loch in die Flasche rauf [//] gemacht. *SCH: Und dann hat etwa ein Stock in die Flasche so gemach. %com: SCH verdeutlicht die Erklärungen sehr stark durch Gesten. *SCH: Und der Stock ist in die Flasche oben gega.

262 | Entwicklung eines empirischen Verfahrens zur Evaluation von Fördereffekten *SCH: Und dann hat [//] mit dem Flasche in sein Hand so gemach. *SCH: Und dann da ist Wasser rausgegang. *SCH: Und wenn er s so gemacht hat, dann is alles Wasser rausgegang. %com: SCH zeigt mit Händen, was sie meint. *SCH: Und dies Ding ist nicht rausgegang.

Die Ausschnitte zeigen, dass Clips und Aufgabenstellung dazu geführt haben, dass die Schülerin versucht, die Inhalte der Filme wiederzugeben. Hinsichtlich der sprachlichen Umsetzung führte die dekontextualisierte Aufgabenstellung entsprechend der Beobachtungen von Ricard & Snow (1990) wie gewünscht zu längeren, zusammenhängenden Redebeiträgen. Zugleich zeigen sich die erwarteten Schwierigkeiten bei der konkreten Versprachlichung. Dies führte bei vielen Schülern vor allem bei der Beschreibung der Clips Magnetschiffe und Wasserflasche dazu, dass trotz der Aufgabenstellung immer wieder die Hände eingesetzt wurden, um sich verständlich zu machen. Im obigen Beispiel fehlte es neben grammatikalischen Fähigkeiten offensichtlich vor allem an der Kenntnis spezifischer Fachbegriffe (z.B. Maske, Zahnstocher). Auch die häufige Verwendung von Passepartout-Wörtern wie Ding und machen sowie Wortneuschöpfungen wie umgekleidert lassen vermuten, dass diese Schülerin Schwierigkeiten hatte, die kognitiv erfassten Zusammenhänge sprachlich angemessen zu verbalisieren. Als besonders hilfreich erwies es sich, dass die Testleiter sich während der Filme umdrehten. Denn auf diese Weise konnten sich die Interviewer bei Fragen wie „Wie heißt das nochmal“ immer darauf berufen, dass sie die Filme auch nicht kennen würden. Sicherlich entbehrt ein solches Verhalten einer gewissen Natürlichkeit. Es würde jedoch zum einen die Objektivität der Daten gefährden, wenn ein Kind mehr Hilfe einforderte und erhielte als ein anderes. Zum anderen geht es ja gerade darum, zu untersuchen, wie sich die Schüler in kontextarmen Situationen ohne Unterstützung eines Gesprächspartners ausdrücken können. Insgesamt kann bestätigt werden, dass die Stimuli die Kinder offensichtlich ansprachen. Dies zeigt sich vor allem anhand des Umfangs der Sprachproben. Da alle Schüler schon der Aufforderung, die Inhalte der Clips wiederzugeben, mit längeren Redebeiträgen nachkamen, wurden die Antworten der Schüler auf die zusätzlichen Fragen (vgl. Kap. 6.3.2.2) zwar mit aufgenommen, aus ökonomischen Gründen jedoch nicht transkribiert. Tab. 39 gibt das Ergebnis der Häufigkeitsanalyse der Variablen Gesamtwortzahl der 150 Sprachproben wieder, wobei die Antworten auf die zusätzlichen Fragen nicht berücksichtigt wurden:

Evaluierung: Prüfung der Gütekriterien | 263

Tab. 39. Häufigkeitsanalyse der Gesamtwortzahl (n = 150)

N Mittelwert

Gültig

Zivilcourage: Wasserflasche: Magnetschiffe: Gesamtwortzahl Gesamtwortzahl Gesamtwortzahl Gesamtwortzahl (Summe aller Teile) 149 150 150 149

Fehlend

1

0

0

1

191,6

91,27

88,57

371,7651

Median

178

89

82

355

Modus

127

89

66

284,00

Standardabweichung 71,623

32,723

37,46

122,69471

Varianz

5129,903

1070,801

1403,227

15053,992

Minimum

34

2

6

78

Maximum

412

243

209

796

Es zeigt sich, dass die Kinder im Durchschnitt 372 Wörter produzierten, um die Inhalte der Clips zu versprachlichen. Der fehlende Wert beim Teil Zivilcourage geht auf technische Probleme während einer Aufnahme zurück, wegen derer die Erhebung vorzeitig abgebrochen werden musste. Auch bei einem weiteren Kind sind die sehr geringen Wortzahlen auf Aufnahmeprobleme zurückzuführen. Diese beiden Fälle werden von der weiteren Auswertung ausgeschlossen. Bei drei weiteren Schülern liegt die Äußerungsmenge mit insgesamt weniger als 150 bzw. weniger als 100 Wörtern deutlich unter dem Durchschnitt. Aufgrund der Erhebungsprotokolle kann dies bei einem Schüler auf Leistungsangst bzw. Introvertiertheit und bei den anderen beiden Schülern auf Arbeitsverweigerung zurückgeführt werden. Da beide Ursachen nicht auf sprachliche Defizite zurückzuführen sind, die durch das Auswertungsverfahren erfasst werden könnten, müssen auch diese Fälle von der weiteren Auswertung ausgeschlossen werden. Für die verbleibenden 145 Fälle können die in Tab. 40 aufgeführten Häufigkeiten ermittelt werden:

264 | Entwicklung eines empirischen Verfahrens zur Evaluation von Fördereffekten

Tab. 40. Häufigkeitsanalyse der Gesamtwortzahl (n = 145)

Gültig

Zivilcourage: Wasserflasche: Magnetschiffe: Gesamtwortzahl Gesamtwortzahl Gesamtwortzahl Gesamtwortzahl (Summe aller Teile) 145 145 145 145

Fehlend

0

0

0

0

Mittelwert

194,97

93,12

89,99

378,0828

Median

180

89

83

360

Modus

136

89

66

284,00

N

Standardabweichung 69,373

31,21

36,813

117,31827

Varianz

4812,603

974,054

1355,174

13763,576

Minimum

57

27

15

174

Maximum

412

243

209

796

Insgesamt zeigt sich, dass das Elizitierungsverfahren bei der großen Mehrzahl der getesteten Schüler zur Produktion umfangreicher Sprachproben führte und damit ein wesentliches Ziel erreicht wurde. Weiterhin wird deutlich, dass die Kinder ungefähr die doppelte Anzahl von Wörtern zu dem Clip Zivilcourage wie zu den anderen beiden Filmsequenzen äußerten. Dies liegt zum einen daran, dass Zivilcourage doppelt so lang ist wie die anderen beiden Clips, zum anderen daran, dass drei Redeaufforderungen bzw. Fragen dazu gestellt werden, während bei den anderen beiden Clips nur einmal dazu aufgefordert wird, den Inhalt wiederzugeben. Weiterhin scheint Zivilcourage die Kinder aber auch besonders angesprochen zu haben. Denn im Rahmen der Pilotierung wurden die Schüler nach der Erhebung befragt, welcher der Filme ihnen am besten gefallen hätte, und es zeigte sich, dass etwa die Hälfte der Schüler den Clip Zivilcourage bevorzugte und die andere Hälfte entweder das Experiment Wasserflasche oder die Bastelanleitung Magnetschiffe angab. Offensichtlich fühlten sich viele Schüler von dem überraschenden Handlungsverlauf mit unterschiedlichen Identifikationsmöglichkeiten in Zivilcourage besonders angesprochen. Da jedoch auch viele Schüler einen der anderen Filme als besonders interessant angaben, kann davon ausgegangen werden, dass durch die Auswahl der Filme wie gewünscht unterschiedliche Interessensgebiete berücksichtigt werden. Um die Durchführungsobjektivität der Datenerhebung zu überprüfen, waren die Transkribenten und Kodierer der Daten aus der Hauptstichprobe dazu aufgefordert, Abweichungen bei der Durchführung der Interviews (z.B. falls

Evaluierung: Prüfung der Gütekriterien | 265

sich ein Testleiter nicht an die vorgegebene Formulierung gehalten hätte) sofort zu melden. Bis auf kleinere, zu vernachlässigende Abweichungen, kann bestätigt werden, dass dies nicht der Fall war und alle Interviews nach dem standardisierten Vorgehen durchgeführt wurden. In einem Reflexionsgespräch mit den Testleitern nach der Datenerhebung hoben diese die große Bedeutung der Aufwärmphase hervor. Viele Schüler, die sich anfangs schüchtern und unsicher zeigten, verloren während dieser Phase schnell ihre Hemmungen. Weiterhin gaben die Testleiter an, dass ihnen durch die Aufwärmphase die Einhaltung des standardisierten Vorgehens leichter gefallen sei, weil sie so die Möglichkeit hatten, trotz des standardisierten Ablaufs für eine angenehme Atmosphäre zu sorgen und den Schülern das weitere Vorgehen persönlich zu erklären. 6.6.2 Güteprüfung des Transkriptionsverfahrens Die Güte der Transkriptionen basiert vor allem darauf, dass die Verschriftlichungen der zu erfassenden sprachlichen Phänomene dem tatsächlich Gesagten entsprechen müssen. Für objektive Auswertungsergebnisse ist weiterhin entscheidend, dass die Transkriptionskonventionen eingehalten werden. Zu diesem Zweck wurden die Transkribierer in einer gezielten Schulung, im Rahmen derer auch mehrere Probetranskripte angefertigt und überprüft wurden, mit den Transkriptionskonventionen vertraut gemacht. Zusätzlich lag ein detailliertes Instruktionsmanual vor (vgl. Anhang 8.2). Der qualitative Vergleich von 20 zufällig ausgewählten Aufnahmen und Transkripten ergab, dass die Verschriftlichungen der interessierenden Merkmale dem tatsächlich Gesagten voll entsprechen und die Transkriptionskonventionen befolgt wurden. Auch die insgesamt hohe Intraklassenkorrelation der meisten im Rahmen der Kodierung erfassten Variablen (vgl. Kap. 6.6.3.2) kann als Bestätigung für die Objektivität der Transkriptionen gelten. In Bezug auf die Nebengütekriterien kann bestätigt werden, dass sich das Transkriptionssystem in Kombination mit der Software CLAN als sehr gut umsetzbar erwies. Das kostenlose Programm lässt sich innerhalb weniger Minuten auf allen gängigen Rechnern installieren und konnte von allen studentischen Hilfskräften nach der Schulung problemlos bedient werden (vgl. Nebengütekriterium Ökonomie). Nach ein bisschen Übung wurden auch die Konventionen konsequent eingehalten. Der zeitliche Umfang von max. 100 min/Transkript ist im Vergleich zu Transkriptionen in anderen Kontexten als sehr ökonomisch einzustufen (vgl. Kap. 6.4). Weiterhin wird durch das Transkriptionsverfahren niemand systematisch benachteiligt (vgl. Nebengütekriterium Fairness). In Bezug auf das Kriterium der Nicht-Verfälschbarkeit der Verschriftlichungen

266 | Entwicklung eines empirischen Verfahrens zur Evaluation von Fördereffekten besteht theoretisch die Möglichkeit, dass die Testpersonen durch eine sehr undeutliche bzw. leise Aussprache verhindern können, dass bestimmte lautliche Unterschiede vom Transkribenten wahrgenommen und verschriftlicht werden können. Dies kann dann bei der Auswertung dazu führen, dass sich bestimmte abweichende Strukturen (z.B. bei den Flexionsendungen) nicht eindeutig identifizieren lassen. Ist dies der Fall, wird dies auf der Basis der Transkriptionskonventionen jedoch gut dokumentiert und Fälle mit zu geringen Wortzahlen (z.B. aufgrund unverständlicher Äußerungen) von der weiteren Analyse ausgeschlossen (vgl. Kap. 6.6.1). 6.6.3 Güteprüfung des Kodierverfahrens 6.6.3.1 Deskriptive Häufigkeitsanalyse Basierend auf den in Kap. 6.5.1.1 identifizierten Indikatoren schulsprachlicher Kompetenz und den Indikatoren und Stolpersteinen des DaZ-Erwerbs fortgeschrittener Lerner (vgl. Kap. 6.5.1.2) konnte eine Vielzahl von Variablen zur Kodierung der Sprachproben ausgewählt werden (vgl. Kap. 6.5.1.3). Angesichts der Spezifik einiger Variablen ist zu prüfen, ob die entsprechenden Merkmale ausreichend häufig kodiert werden konnten. Variablen mit zu geringen Häufigkeiten, d.h. meist auch zu geringer Varianz, sollten nach Möglichkeit zu inhaltlich sinnvollen Kategorien zusammengefasst werden. Auch bei den weniger spezifischen Variablen ist eine Analyse der Häufigkeiten sinnvoll, um Aufschluss über ihre tatsächliche, d.h. empirische Relevanz für die Beurteilung von Fördereffekten zu erhalten. So ergibt z.B. die Analyse einzelner Fehlerkategorien nur Sinn, wenn diese Fehlertypen in den Sprachdaten überhaupt vorkommen. Angesichts des beschränkten Umfangs der Sprachproben ist es durchaus wahrscheinlich, dass nicht alle Fehlertypen häufig produziert werden, zumal bei freien Sprachproben Fehler auch mehr oder weniger bewusst vermieden werden können. Dennoch ist davon auszugehen, dass die Summe aller bzw. bestimmter Kategorien formalsprachlicher Abweichungen durchaus Aufschluss über Kompetenzzuwächse geben kann – zumindest wenn sie zu bestimmten zielsprachlichen Strukturen in Bezug gesetzt wird (vgl. dazu Kap. 6.6.3.6). Bei den zielsprachlichen Strukturen ist ggfs. zu überprüfen, ob geringe Häufigkeiten auf das Elizitierungsverfahren zurückzuführen sind, weil z.B. das Stimulusmaterial und/oder die Aufgabenstellungen die Produktion der jeweiligen Phänomene nicht erfordern und diese deshalb für die Analyse von Lernzuwächsen ungeeignet sind. Die Häufigkeitsanalyse wurde wie auch alle weiteren Schritte zur Evaluierung des Kodierverfahrens anhand der Hauptstichprobe durchgeführt. Zu diesem Zweck wurden zunächst für alle Variablen Scores über die drei Teile

Evaluierung: Prüfung der Gütekriterien | 267

der Sprachprobe gebildet. Hintergrund ist die Tatsache, dass die drei Teile getrennt kodiert werden, so dass es für jede Kategorie eine Variable pro Teil gibt (z.B. Präpositionen-Zivilcourage, Präpositionen-Wasserflasche, PräpositionenMagnetschiffe). Diese Differenzierung kann für spätere, eher qualitativ ausgerichtete Analysen von Interesse sein. Für die quantitative Auswertung ist sie weniger relevant, da der Einsatz der unterschiedlichen Stimuli vor allem dazu dient, unterschiedliche Themen- und Interessensgebiete anzusprechen, um bei den Versuchspersonen faire Ausgangsbedingungen zu gewährleisten und den Einfluss unterschiedlicher Inhalte auf die Sprachproduktion möglichst gering zu halten (vgl. Kap. 6.3.2). Für eine quantitative Auswertung der Variablen sind die Sprachproben der einzelnen Teile jedoch nicht umfangreich genug. Alle rechnerischen Analysen im Rahmen der Evaluierung des Kodierverfahrens beziehen sich daher auf die summierten Scores. Items zur Kodierung formalsprachlicher Abweichungen Die Ergebnisse der Häufigkeitsanalyse (vgl. Tab. 41 und Tab. 42) zeigen, dass die meisten Variablen zur Kodierung formalsprachlicher Abweichungen im grammatikalischen Bereich sehr geringe Häufigkeiten aufweisen. Dies kann vor allem auf die folgenden Ursachen zurückgeführt werden. 1.

2.

Im Gegensatz zu stark kontrollierten Testformaten können in der Spontansprache schwierige bzw. unsicher beherrschte Strukturen und damit auch Fehler vermieden werden: „Like tests, controlled productive material is error-provoking whereas spontaneous production is erroravoiding“ (Allen & Corder 1974: 126). Wenn z.B. keine Wechselpräpositionen verwendet werden, wird dadurch das Risiko abweichender Kasusmarkierungen deutlich reduziert. Auch in anderen Bereichen wie z.B. der Flexion starker Verben oder der Semantik können Fehler vermieden werden, indem z.B. auf spezifische (Fach-)begriffe und inhaltliche Vollständigkeit und Genauigkeit wie eine exakte zeitliche Verortung der beschriebenen Vorgänge verzichtet wird (vgl. Domenech 2010: 81). Die Kategorien sind so spezifisch, dass sie nur selten identifiziert werden konnten. Dies betrifft vermutlich vor allem die Fehlerkategorien der Nominalflexion, bei denen nach Wortart, Regens, Genus und Kasus differenziert wird (z.B. fehlende Kasusmarkierung am Possessivpronomen, Regens Verb, gefordert: Dativ). Diese Variablen lassen sich jedoch zu inhaltlich begründbaren übergeordneten Kategorien zusammenfassen (vgl. Tab. 41).

268 | Entwicklung eines empirischen Verfahrens zur Evaluation von Fördereffekten 3.

Das standardisierte Kodierverfahren berücksichtigt aus Gründen der Objektivität nur eindeutig identifizierbare und kategorisierbare Merkmale (vgl. Kap. 6.5.1 und 6.5.2). Dies führt dazu, dass nicht alle abweichenden Strukturen erfasst werden können. So können bestimmte Merkmale u.a. aufgrund der Produktionsbedingungen mündlicher Sprache nicht zweifelsfrei als Abweichungen klassifiziert und daher nicht kodiert werden. Dies betrifft vor allem möglicherweise abweichende Strukturen bei der Markierung der Nominalflexion, die auch auf Assimilation (Abschleifung) zurückgeführt werden können und deshalb nicht als Fehler gewertet werden (z.B. „Der sieht ein Jung“). Auch die Tatsache, dass Wiederholungs- und Folge- bzw. abhängige Fehler nicht mitgezählt werden, führt zu einer Reduzierung der Fehlerhäufigkeiten. Ein Beispiel ist die Adjektivflexion, die neben Numerus, Genus und Kasus des attribuierten Substantivs auch davon beeinflusst wird, ob und wenn ja welcher Begleiter verwendetet wird (starke vs. schwache oder gemischte Adjektivflexion). Abweichungen sind daher nur kodierbar, wenn ein zielsprachlich flektierter Begleiter verwendet wird. So wird bei Äußerungen wie „*der sieht die große Junge“ nur die abweichende Kasusmarkierung am Begleiter kodiert, während die Adjektivflexion als Folgefehler nicht berücksichtigt wird. 4. In einigen sprachlichen Bereichen könnte die lernersprachliche Entwicklung bereits weiter fortgeschritten sein als ursprünglich angenommen. So scheint entgegen der Förderschwerpunkte im BeFo-Projekt die Subjekt-Verb-Kongruenz für die untersuchten Lerner kein Problem mehr darzustellen. Dies entspricht zudem Erkenntnissen der Zweitspracherwerbsforschung (vgl. Kap. 3.4.2.2). Auch die Markierung des Genus in Nominativkontexten erfolgt weitgehend fehlerfrei. 5. Die kommunikative Aufgabe erfordert bestimmte Strukturen nicht. Dies betrifft vor allem die Kategorie fehlerhafte Markierung der Komparation am Adjektiv, aber auch teilweise die Variablen zur Kodierung verbaler Flexionsfehler. So sind Abweichungen bei der Verbalflexion vor allem bei der Bildung von Partizip- und Präteritumsformen erwartbar. Wenn die Wiedergabe der Filminhalte jedoch im Präsens erfolgt, was durchaus möglich ist (vgl. Kap. 6.5.1.1), sind Abweichungen eher unwahrscheinlich. Im Bereich der Nominalflexion legen die Ergebnisse offen, wo die Fehlerschwerpunkte innerhalb dieses Bereichs liegen (vgl. Tab. 41). So zeigt z.B. die Differenzierung der Kategorie Genusfehler, dass fehlerhafte Genusmarkierungen vorwiegend in Akkusativkontexten produziert werden (z.B. „*Der sieht die Jun-

Evaluierung: Prüfung der Gütekriterien | 269

ge.“), in Nominativ- und Dativkontexten dagegen deutlich seltener. Da praktisch jeder Satz ein Subjekt erfordert, das immer im Nominativ steht, kann die geringe Fehlerzahl in diesem Kontext so interpretiert werden, dass die zielsprachliche Markierung des Genus im Nominativ bei der hier untersuchten Schülergruppe in der freien Sprachproduktion keine Schwierigkeit mehr darstellt. Vor diesem Hintergrund kann die vergleichsweise häufig identifizierte fehlerhafte Genusmarkierung in Akkusativkontexten nicht bzw. nicht nur auf Schwierigkeiten mit dem Genus zurückgeführt werden. Wahrscheinlicher ist vielmehr, dass hier die Kombination aus Genus- und Kasusmarkierung zu Fehlern führt 101. Auffällig sind weiterhin die besonders niedrigen Häufigkeiten von fehlenden Akkusativmarkierungen. Angesichts der Tatsache, dass die Zahl der Akkusativkontexte diejenige der Dativkontexte „in allen Arten von deutschen Texten um ein Mehrfaches übersteigt“ (Studer 2000a: 230–231) bestätigt dieses Ergebnis die in Kap. 3.4.2.2 ausgeführte Annahme, dass der Erwerb des Akkusativs weniger Schwierigkeiten bereitet als der des Dativs. Dies ist u. a. auf die klare kommunikative Funktion des Akkusativs als Objekt- bzw. Patiensmarker zurückzuführen. Ein weiterer Grund dafür, dass nur wenige fehlende Akkusativmarkierungen produziert wurden, liegt jedoch vermutlich auch in der Formengleichheit vieler Artikel im Nominativ und Akkusativ, besonders in der gesprochenen Sprache (z.B. Nominativ: „Das Kind/die Frau/ein Mann hat Angst“, Akkusativ: „Der Junge sieht das Kind/die Frau/ein‘ Mann“). Formunterschiede bestehen lediglich bei der Markierung maskuliner bestimmter Artikel (z.B. der Mann vs. den Mann). Aufgrund der Gleichheit von Nominativ- und Akkusativformen besteht sozusagen eine höherer ‚Trefferchance‘. Die niedrige Zahl an Genusfehlern in Dativkontexten lässt sich dadurch erklären, dass in Dativkontexten vermehrt fehlende Kasusmarkierungen identifiziert werden konnten, hier also der Kasus (Dativ) das Hauptproblem darzustellen scheint, wobei auch hier Formgleichheiten und -unterschiede zu beachten sind. Auf den Dativ als ‚Problemkasus‘ wird in verschiedenen Arbeiten hingewiesen (z.B. Grießhaber 2007; Nickel 2012). 10F

|| 101 Wenn sich diese Vermutung durch weitere Untersuchungen bestätigen ließe, wäre damit ein wichtiger empirischer Nachweis dafür erbracht, dass Sprachförderung im Bereich der Nominalflexion immer verschiedene Genus- und Kasuskontexte berücksichtigen sollte. Traditionelle Ansätze der Wortschatzvermittlung, bei denen das Genus über das Memorieren des bestimmten Artikels im Nominativ erfolgen soll, greifen demnach zu kurz.

270 | Entwicklung eines empirischen Verfahrens zur Evaluation von Fördereffekten Weiterhin zeigen die Ergebnisse, dass viele fehlende Dativmarkierungen in Kontexten mit möglicher n/m-Verschleifung auftreten (z.B. „Der gibt das Handy den Kind zurück.“). Im Gegensatz zu Assimilierungen wie „Der sieht ein Jung“, die in der gesprochenen Sprache üblich sind, handelt es sich bei dem ersten Beispiel zweifelsfrei um eine abweichende Struktur. Die Ursache liegt jedoch möglicherweise in der phonologisch bedingten schwierigen Unterscheidbarkeit der Laute [n] und [m]. Da diese Unterscheidung vor allem für die Markierung des Dativs (maskulinum) bedeutsam ist, könnte dies eine Ursache für die insgesamt häufigere fehlende bzw. abweichende Markierung des Dativs im Vergleich zu fehlenden Akkusativmarkierungen sein. Die Fehlerhäufigkeiten zeigen außerdem, dass abweichende Markierungen am Possessivpronomen nur sehr selten identifiziert werden konnten, was auch auf die geringe Häufigkeit von Possessivpronomen zurückzuführen ist (vgl. Tab. 42: Attribute, possessiv). Unterschiedliche Häufigkeiten zeigen sich auch bei der fehlenden Markierung des Kasus nach Präpositionen bzw. Wechselpräpositionen. Für eine Interpretation dieser Muster müsste man durch weitere qualitative Analysen untersuchen, welche Präpositionen bzw. Wechselpräpositionen verwendet werden und welchen Kasus sie jeweils fordern. Auch wenn eine solche tiefergehende Untersuchung den Rahmen der vorliegenden Arbeit überschreitet, bietet die lexikalische Analyse (vgl. Kap. 6.5.2.4) dafür eine nützliche Grundlage. Items zur Kodierung von Selbstkorrekturen Auch die Variablen zur differenzierten Kodierung von Selbstkorrekturen weisen zum Großteil niedrige Häufigkeiten auf (vgl. Tab. 42). Bis auf Selbstkorrekturen im lexikalisch-semantischen Bereich, die im Durchschnitt zwei bis drei mal pro Transkript kodiert wurden, konnten Selbstkorrekturen, die andere sprachliche Bereiche betreffen, im Durchschnitt weniger als ein Mal pro Transkript identifiziert werden. Offensichtlich korrigieren sich die Schüler vorwiegend auf der Ebene der Bedeutung. Ein weiterer Grund für die geringen Häufigkeiten nichtlexikalische Bereiche betreffend kann aber auch darin gesehen werden, dass sich Schwierigkeiten im grammatikalischen Bereich möglicherweise nicht als solche in den Selbstkorrekturen beobachten lassen, weil die Kinder nicht nur das entsprechende grammatikalische Phänomen korrigieren, sondern ganze Teile der Äußerung umformulieren, so dass an der Oberfläche die lexikalischsemantische Veränderung im Vordergrund zu stehen scheint und deshalb entsprechend kodiert wurde (z.B. „Dann klebt der das Segel [//] an den Stock“).

Evaluierung: Prüfung der Gütekriterien | 271

Items zur Kodierung zielsprachlicher Merkmale Alle erfassten zielsprachlichen lexikalischen Merkmale weisen im Vergleich zu den Abweichungen und Selbstkorrekturen deutlich höhere Häufigkeiten auf (vgl. Tab. 42). Dies ist nicht überraschend, weil den berücksichtigten lexikalischen Mitteln zentrale kommunikative Funktionen zukommen, ohne die die Aufgabenstellung (Wiedergabe der Filminhalte) kaum erfüllt werden kann. Einige der grammatikalischen Strukturen, die als typische Merkmale schulsprachlicher Kommunikation gelten, konnten dagegen nur selten kodiert werden. Dies betrifft Konjunktiv- und Konjunktiversatzformen, die Konstituentennegation mit kein sowie Passivstrukturen. Im Falle der Passivstrukturen können die geringen Häufigkeiten darauf zurückgeführt werden, dass das Passiv (auch von Kindern mit Deutsch als Muttersprache) relativ spät, z.T. erst während der Primarschulzeit, erworben wird (vgl. Kap. 3.4.2.2). Für die im Rahmen dieser Arbeit zu Beginn des dritten Schuljahres untersuchten DaZ-Schüler ist daher anzunehmen, dass sie sich das Passiv noch nicht (vollständig) angeeignet haben. Auch Strategien zur Vermeidung unsicher beherrschter Strukturen können hier eine Rolle spielen, zumal sich die Filminhalte auch vollständig im Aktiv wiedergeben lassen, was für die Verwendung eines eher alltagssprachlichen Registers typisch ist. Dennoch ist das Passiv, wie die Zusammenfassung der Clips in Kap. 6.3.2.2 zeigt, ein sehr hilfreiches Mittel zur Versprachlichung der Filminhalte. Gerade bei den Clips Wasserflasche und Magnetschiffe, bei denen die Akteure selbst nicht sichtbar sind, stellt das Vorgangspassiv durch die Möglichkeit, das Patiens zum Subjekt des Satzes zu machen, eine grammatikalische Lösung dafür dar, den Handelnden (= das Agens) nicht benennen zu müssen. Es ist daher durchaus erwartbar, dass Erwerbsfortschritte bzw. eine gezielte Förderung im Bereich schulsprachlicher Kompetenz zu einem Anstieg von Passivstrukturen führen. Anders verhält es sich bei den Konjunktiv I/II-Formen (M=,23; SD=,736) und den Konjunktiversatzformen (M=,1103; SD=,33577), die auch in der Beschreibung der Filminhalte in Kap. 6.3.2.2 kein einziges Mal vorkommen. So lässt sich selbst die Aufgabenstellung nach der ersten Hälfte des Clips Zivilcourage („Wie könnte der Film weitergehen?“) in kommunikativ angemessener Weise ohne die Verwendung von Konjunktivformen beantworten, indem der hypothetische Aspekt entweder durch lexikalische Mittel ausgedrückt wird (z. B. „Ich glaube, dass der dem Jungen hilft“, „Vielleicht hat er eine gute Idee“ usw.) oder aufgrund des gemeinsamen Kontextwissens als gegeben vorausgesetzt und gar nicht erst versprachlicht wird. Da die Antwort auf die einzige Frage, die tatsächlich die Verwendung des Konjunktivs erfordert („Jetzt stell dir mal vor, du würdest sehen, wie ein Kind geärgert wird. Wie würdest du dich verhalten?) aus

272 | Entwicklung eines empirischen Verfahrens zur Evaluation von Fördereffekten ökonomischen Gründen nicht transkribiert und kodiert wurde, müssen für die in der Auswertung berücksichtigen Schüleräußerungen die Konjunktiv(ersatz)formen als irrelevant eingestuft werden. Die entsprechenden Variablen werden deshalb verworfen. Konsequenzen Da davon auszugehen ist, dass sehr selten vorkommende Variablen nur schlecht zwischen den untersuchten Schülern differenzieren, werden solche Variablen nach Möglichkeit zu sinnvollen übergeordneten Kategorien zusammengefasst. Dies kann jedoch nur dann erfolgen, wenn der wissenschaftliche Kenntnisstand für eine solche Kategorienbildung ausreicht und mit den Ergebnissen der Häufigkeitsanalyse vereinbar ist. So wäre es zwar theoretisch denkbar, die Variablen zur Kodierung von Selbstkorrekturen nach dem Kriterium Ergebnis zielsprachlich vs. nicht zielsprachlich zusammenfassen; alternativ könnte man die Selbstkorrekturen aber auch nach sprachlichen Bereichen zusammenfassen (z.B. Selbstkorrekturen im lexikalischen vs. grammatikalischen Bereich). Da bislang keine gesicherten Erkenntnisse der Spracherwerbsforschung zur Klassifizierung von Selbstkorrekturen vorliegen, werden hier zunächst keine übergeordneten Variablen gebildet. Im Gegensatz dazu lassen sich die z.T. sehr differenzierten Variablen zur Nominalflexion zu inhaltlich begründeten Kategorien zusammenfassen (VAR001 + Var002 etc.). Im Gegensatz zu den Variablen zur Kodierung fehlender Akkusativmarkierungen, die insgesamt sehr geringe Häufigkeiten aufweisen, und deshalb in einer kombinierten Variablen zusammengefasst werden können, zeigen die Häufigkeiten fehlender Dativmarkierungen durchaus interessante Unterschiede gerade in Bezug auf das jeweilige Regens, die bei einer Zusammenfassung aller Genus- und Kasusvariablen verloren gingen. Tab. 41 zeigt, welche Variablen aufgrund dieser Überlegungen zusammengefasst werden:

Evaluierung: Prüfung der Gütekriterien | 273

Tab. 41. Ursprüngliche und kombinierte Variablen zur Kodierung abweichender Markierungen der Nominalflexion Ursprüngliche Variablen

Mittelwert Standard-

Kombinierte Variable

abweichung Genusfehler am Determinierer, Nominativ-

,3241

,73487

kontext Genusfehler am Possessivpronomen, Nomi-

Genusfehler in Nomina0,0000

0,00000

1,6207

1,31798

tivkontext

nativkontext Genusfehler am Determinierer, Akkusativkontext Genusfehler am Possessivpronomen, Akkusa-

Genusfehler in Akkusa,0621

,31668

Genusfehler am Determinierer, Dativkontext

,4000

,75829

Genusfehler am Possessivpronomen, Dativ-

,0069

,08305

,1310

,39538

,0069

,08305

,0069

,08305

0,0000

0,00000

,1517

,43029

,0207

,14284

,0690

,28026

0,0000

0,00000

,9379

1,02212

0,0000

0,00000

tivkontext

tivkontext

kontext fehlende Akkusativmarkierung am Determi-

Genusfehler in Dativkontext

nierer, Regens Verb fehlende Akkusativmarkierung am Possessivpronomen, Regens Verb fehlende Akkusativmarkierung am Determinierer, Regens Präposition fehlende Akkusativmarkierung am Posses-

fehlende Akkusativmarkierungen

sivpronomen, Regens Präposition fehlende Akkusativmarkierung am Determinierer, Regens Wechselpräposition fehlende Akkusativmarkierung am Possessivpronomen, Regens Wechselpräposition fehlende Dativmarkierung am Determinierer, Regens Verb fehlende Dativmarkierung am Possessivpronomen, Regens Verb fehlende Dativmarkierung am Determinierer, fehlende Dativmarkierung am Possessivpronomen, Regens Verb, evtl. n/m-Verschleifung

fehlende Dativmarkierungen, Regens Verb

Regens Verb, evtl. n/m-Verschleifung

274 | Entwicklung eines empirischen Verfahrens zur Evaluation von Fördereffekten Ursprüngliche Variablen

Mittelwert Standard-

Kombinierte Variable

abweichung fehlende Dativmarkierung am Determinierer,

,4207

,76982

,0414

,23202

Regens Präposition fehlende Dativmarkierung am Possessivpronomen, Regens Präposition fehlende Dativmarkierung am Determinierer,

fehlende Dativmarkie1,1103

1,31823 rungen, Regens Präposition

Regens Präposition, evtl. n/m-Verschleifung fehlende Dativmarkierung am Possessivpro-

,0276

,16435

,1241

,38878

,0069

,08305

,2069

,48443

nomen, Regens Präposition, evtl. n/mVerschleifung fehlende Dativmarkierung am Determinierer, Regens Wechselpräposition fehlende Dativmarkierung am Possessivpronomen, Regens Wechselpräposition fehlende Dativmarkierung am Determinierer, Regens Wechselpräposition, evtl. n/m-

selpräposition

Verschleifung 0,0000

0,00000

fehlende Adjektivflexion

,1448

,37229

fehlerhafte Adjektivflexion, schwache Flexion

,1724

,51834

fehlerhafte Adjektivflexion, gemischte Flexion

,3310

,62422

fehlende Dativmarkierung am Possessivpro-

fehlende Dativmarkierungen, Regens Wech-

nomen, Regens Wechselpräposition, evtl. n/m-Verschleifung fehlerhafte oder fehlende Adjektivflexion

Alle anderen Variablen bleiben vorerst in der ursprünglichen Form erhalten. Denn auch wenn diese Variablen für sich gesehen keinen großen Beitrag zur Varianzaufklärung leisten, können sie für die spätere summative Berechnung der Testwerte bedeutsam sein (vgl. Kap. 6.6.3.6). So kann z.B. die Gesamtzahl aller Fehler Auskunft über das Ausmaß formalsprachlicher Defizite geben, auch wenn einzelne Fehlertypen nur selten vorkommen. Außerdem ist es denkbar, dass gerade einige der Fehlervariablen beim Einsatz des Verfahrens mit anderen Versuchspersonen (z.B. jüngeren bzw. schwächeren Schülern) deutlich häufiger auftreten. Auch bei bestimmten zielsprachlichen Strukturen wie dem Vorgangspassiv ist wahrscheinlich, dass ältere bzw. fortgeschrittenere Lerner diese Form deutlich häufiger verwenden. Deshalb raten u.a. Schmidt-Atzert & Amelang (2012: 145) dazu, bei der Itemselektion darauf zu achten, dass die angestrebte Repräsentativität nicht wieder verloren

Evaluierung: Prüfung der Gütekriterien | 275

geht, indem Items mit hoher bzw. niedriger Itemschwierigkeit (im Rahmen des vorliegenden Verfahrens = Häufigkeit) voreilig verworfen werden. 6.6.3.2 Prüfung der Objektivität Durchführungsobjektivität Die Objektivität der Durchführung bezieht sich auf die Datenerhebung (Elizitierung) und -aufbereitung (Transkription). Wie in Kap. 6.6.1 und 6.6.2 beschrieben, ergab die qualitative Analyse von 20 zufällig ausgewählten Sprachproben (Aufnahme und Transkription), dass das standardisierte Vorgehen bei der Datenerhebung und Transkription entsprechend dem Instruktionsmaterial umgesetzt wurde. Außerdem wurden die Transkribenten und Kodierer dazu aufgefordert, Unregelmäßigkeiten, die ihnen während der Transkription oder Kodierung hinsichtlich der Datenerhebung auffielen, sofort zu markieren und der Projektleitung zu melden. Bis auf wenige Einzelfälle hielten sich die Testleiter nach Aussage der Transkribenten und Kodierer an das standardisierte Vorgehen. Auswertungsobjektivität Je größer der Interpretationsspielraum bei der Auswertung ist, desto wichtiger ist der empirische Nachweis der Auswertungsobjektivität. Zu diesem Zweck werden üblicherweise für mehrere von mindestens zwei Ratern ausgewertete Testresultate die Übereinstimmung und/oder Interrater-Reliabilität berechnet (Schmidt-Atzert & Amelang 2012: 134–136; Bortz & Döring 2010: 274–277). Im Rahmen der vorliegenden Arbeit wurden deshalb 30 Transkripte von je drei unabhängigen Ratern kodiert, um später ihre Ergebnisse vergleichen zu können. Bei der Wahl des geeigneten Zuverlässigkeitsmaßes zur Beurteilung der Auswertungsobjektivität weisen Wirtz & Caspar (2002: 33) auf die Wichtigkeit der Unterscheidung von prozentualer Übereinstimmung und InterraterReliabilität hin und argumentieren, dass hier vor allem das Skalenniveau entscheidend ist: Bei echt nominalskalierten Kategoriensystemen wiegen alle Nichtübereinstimmungen gleich schwer. Die Urteile zweier Rater sind nur dann als zuverlässig zu bezeichnen, wenn beide zumeist gleich urteilen. [...] Diese Information wird durch Maße der Übereinstimmung quantifiziert [...] Bei intervallskalierten Ratingskalen ist diese Forderung nach exakter Übereinstimmung der Werte meist nicht notwendig und auch nicht sinnvoll. (Wirtz & Caspar 2002: 33)

276 | Entwicklung eines empirischen Verfahrens zur Evaluation von Fördereffekten Bei dem vorliegenden Verfahren stellen alle Items Summenwerte dar (z.B. Summe eines bestimmten Fehlertyps), so dass es sich um intervallskalierte Daten handelt. Weiterhin machen gerade die unter 3.3.2 beschriebenen Schwierigkeiten im Zusammenhang mit der Fehleranalyse eine exakte Übereinstimmung der Kodierungen fast unmöglich (vgl. auch Grimm, Gutenberg & Götze 2006: 27). Die Berechnung der prozentualen Übereinstimmung z.B. durch Cohens kappa ist daher ein ungeeignetes Maß, weil hier lediglich der prozentuale Anteil der Fälle ermittelt wird, in denen die Rater das exakt gleiche Urteil abgeben (Wirtz & Caspar 2002: 47). Wird die Objektivität der Auswertung bzw. der Rater dagegen über die Interrater-Reliabilität berechnet, ist entscheidend, dass dieselbe Testperson von den Ratern möglichst ähnliche Werte erhält. Dabei ist einerseits der Grad der Ähnlichkeit der Urteile ausschlaggebend, andererseits müssen sich aber auch die Mittelwerte der eingeschätzten Personen unterscheiden, denn „Reliabilitätsmaße sind Maße für die zuverlässige Identifizierbarkeit von Unterschieden zwischen zu beurteilenden Personen“, und wo z.B. aufgrund geringer Merkmalsvarianz keine Unterschiede auszumachen sind, „kann keine Varianz aufgeklärt werden“ (Wirtz & Caspar 2002: 39). Da für die vorliegenden Daten nicht von exakter Übereinstimmung der Kodierergebnisse auszugehen ist, stellt die Berechnung der Interrater-Reliabilität das geeignetere Maß zur Prüfung der Auswertungsobjektivität dar. Als angemessene Methode für intervallskalierte Ratingwerte empfehlen Wirtz & Caspar (2002: 157–158) die Berechnung der Intraklassenkorrelation (ICC), die im Gegensatz zur Produkt-Moment-Korrelation (Pearson-Korrelation) auch Mittelwertsunterschiede berücksichtigt. In der klassischen Testtheorie geht es bei der Berechnung der Reliabilität um Varianzaufklärung. In diesem Verständnis ist die ICC „ein Maß dafür, welcher Anteil der Varianz durch die Beurteilungen eines Raters […] aufgeklärt werden kann“ (Wirtz & Caspar 2002: 160). Es geht also nicht um die Reliabilität des Testinstruments bzw. der Teilskalen, sondern um die Reliabilität der Rater-Urteile. Wenn die Unterschiede der Testergebnisse durch Unterschiede bei der Merkmalsausprägung zustande kommen, nicht aber durch subjektive Urteile der Rater, gilt das Kodierverfahren als objektiv. Die konkrete Berechnung der ICC beruht daher auf einem varianzanalytischen Vorgehen. Da keine systematischen Unterschiede der Ratings z.B. aufgrund von Persönlichkeitsmerkmalen der Kodierer erwartbar sind, genügt als Grundlage eine einfaktorielle Varianzanalyse (vgl. Wirtz & Caspar 2002: 168–169). Weiterhin muss nach Wirtz & Caspar (2002: 172–173) entschieden werden, ob die Einflussgröße Rater als festgelegt oder zufällig angesehen werden soll. Bei einer Zufallsstichprobe von Ratern aus einer zuvor festgelegten Gruppe hat der gewonnene Reliabilitätskoeffizient Gültigkeit für die gesamte Gruppe. An-

Evaluierung: Prüfung der Gütekriterien | 277

dernfalls haben die berechneten Werte nur für die ausgewählten Rater Gültigkeit. Die studentischen Rater, die im Rahmen des vorliegenden Verfahrens eingesetzt wurden, wurden aufgrund ihrer besonders guten linguistischen Kenntnisse gezielt ausgewählt. ICCunjust lässt sich daher nicht grundsätzlich auf alle Studierenden des Faches Deutsch übertragen. Für die verbleibenden Variablen des vorliegenden Verfahrens wird deshalb der Intraklassenkorrelationskoeffizient (ICCunjust, einfakt) berechnet. Nur Parameter D bleibt in der Analyse unberücksichtigt, da es sich um einen computergenerierten und somit per se objektiven Wert handelt. Auch der Wert für die Gesamtwortzahl wird automatisch berechnet. Da hier jedoch Ratereinflüsse durch die Kodierung von Wiederholungen und Selbstkorrekturen möglich sind 102, wird dieser Wert mit berücksichtigt. Tab. 42 zeigt den ICC für alle verbleibenden Variablen: 10F

Tab. 42. Mittelwert, Standardabweichung und Interklassenkorrelation für alle Einzelvariablen Variable

Mittelwert SD

ICC

Genusfehler in Nominativkontexten

,3241

,73487

,971

Genusfehler in Akkusativkontexten

1,6828

1,37792

,944

Genusfehler in Dativkontexten

,4069

,78613

,884

fehlende Akkusativmarkierung

,3172

,62030

,843

fehlende Dativmarkierungen, Regens Verb

1,0069

1,01034

,856

fehlende Dativmarkierungen, Regens Präposition

1,6000

1,69722

,941

fehlende Dativmarkierungen, Regens Wechselpräposition

,3379

,64787

,740

fehlerhafte oder fehlende Adjektivflexion

,6483

,95402

,755

Genus- oder Kasusfehler am Begleiter

,1379

,40174

,849

fehlerhafte Markierung der Komparation am Adjektiv

,0069

,08305

*

fehlerhafte oder eindeutig fehlende Pluralmarkierungen an Substantiven fehlerhafte oder eindeutig fehlende Dativmarkierungen an Substantiven fehlerhafte S-V-Kongruenz

,1724

,39695

,912

,1241

,42300

,536

,5379

1,02754

,684

|| 102 Von den Transkribenten bzw. Kodierern eingeklammertes Sprachmaterial (Wiederholungen und Selbstkorrekturen) wird von der Analyse ausgeschlossen, so dass sich Unterschiede der Kodierungen auf die Gesamtwortzahl auswirken: Wenn Kodierer 1 mehr Sprachmaterial eingeklammert hat als Kodierer 2, fällt die Gesamtwortzahl bei dem von Kodierer 1 kodierten Transkript geringer aus als bei dem von Kodierer 2 kodierten Transkript.

278 | Entwicklung eines empirischen Verfahrens zur Evaluation von Fördereffekten Variable

Mittelwert SD

ICC

fehlerhafte Partizip-II-Formen

,4000

,66039

,779

fehlerhafte Flexion unregelmäßiger (starker) Verben

,3379

,62606

,501

Verwechslung Hilfsverben haben-sein

,4414

,71566

,853

unvollständige Prädikate (Verbklammer)

1,9310

1,59276

,620

fehlende Prädikate

,8207

1,01837

,513

nicht-zielsprachliche V1-Strukturen

1,5655

2,29072

,925

geforderte, aber nicht realisierte Inversion

1,1241

2,02719

,967

fehlende Determinierer

2,2138

2,10550

,853

fehlende Präpositionen

,6759

1,01299

,554

Selbstkorrekturen auf lexikalisch-semantischer Ebene, Ergebnis zielsprachlich

2,5655

2,37993

,773

Selbstkorrekturen auf lexikalisch-semantischer Ebene, Ergebnis nicht zielsprachlich

,1586

,43582

,322

Selbstkorrekturen Ergänzung Determinierer, Ergebnis zielsprachlich Selbstkorrekturen Ergänzung Präposition, Ergebnis zielsprachlich Selbstkorrekturen Ergänzung Präposition, Ergebnis nicht zielsprachlich Selbstkorrekturen der Nominalflexion, Ergebnis zielsprachlich Selbstkorrekturen der Nominalflexion, Ergebnis nicht zielsprachlich Selbstkorrekturen der Verbalflexion, Ergebnis zielsprachlich

,0276

,16435

,226

,0552

,22911

,322

,0138

,11704

*

,4414

,77169

,633

,1448

,39050

,735

,1448

,40790

,517

Selbstkorrekturen der Verbalflexion, Ergebnis nicht zielsprachlich Selbstkorrekturen Hilfsverb/Modalverb, Ergebnis zielsprachlich Selbstkorrekturen Hilfsverb/Modalverb, Ergebnis nicht zielsprachlich Selbstkorrekturen der Wortstellung, Ergebnis zielsprachlich

,0897

,30996

,493

,3103

,66162

,556

,0276

,16435

,500

,1793

,43571

,438

Selbstkorrekturen der Wortstellung, Ergebnis nicht zielsprachlich sonstige Selbstkorrekturen, Ergebnis zielsprachlich

,0345

,21775

*

,0483

,21509

,375

sonstige Selbstkorrekturen, Ergebnis nicht zielsprachlich

,0414

,35111

*

semantisch falsche Substantive

2,7655

1,98611

,357

Näherungsbegriffe (Substantive)

3,6828

2,06055

,674

semantisch falsche Verben

1,5862

1,51651

,351

Evaluierung: Prüfung der Gütekriterien | 279 Variable

Mittelwert SD

ICC

Näherungsbegriffe (Verben)

2,3586

2,14306

,157

semantisch falsche Konnektoren

,7241

1,00335

,458

semantisch falsche Präpositionen

1,0621

1,04230

,449

semantisch falsch Wechselpräpositionen

,4207

,61991

,303

Umschreibung (Paraphrase)

,8690

1,04917

,826

Passepartout-Substantive (Substantivjoker)

1,1793

1,36763

,984

Satzverbindungen und Satzgefüge

5,3931

3,89675

,930

Präpositionalphrasen

7,4483

3,71358

,962

Präpositionalphrasen (Wechselpräpositionen)

4,8276

3,54210

,894

Attribute (possessiv)

1,8414

1,77042

,993

Konstituentennegation ("kein")

,6483

,96847

1,00

Vorgangspassive

,0552

,22911

,890

Attribute (adjektivisch)

7,4621

4,06547

,954

Strukturen mit Modalverb

2,2483

2,34085

,990

Präpositionen (types)

4,2138

2,21794

,913

Wechselpräpositionen (types)

2,9586

1,89984

,889

Konnektoren (types)

3,5655

2,27246

,863

Verben ohne Präfix (types)

23,8000

5,92148

,962

Verben mit Präfix (types)

14,2138

5,21375

,976

Modalverben (types)

1,5379

1,41432

,985

Adjektive (types)

7,6483

3,53658

,944

Gesamtzahl Vollverben ohne Präfix

36,9724

12,64579

,976

Gesamtzahl Vollverben mit Präfix

17,2345

6,36725

,985

Gesamtwortzahl

378,0828

117,31827

,997

*ICC konnte wegen zu geringer Häufigkeit nicht berechnet werden

Wie bereits aufgrund der Ergebnisse der Häufigkeitsanalyse zu erwarten war, konnte die Intraklassenkorrelation für einige sehr selten vorkommende Variablen nicht berechnet werden. Für die anderen Variablen kann laut Wirtz & Caspar (2002: 160) als „sehr vage Richtlinie“ ein Wert von 0.7 als Indiz für eine gute Reliabilität gelten. In diesem Zusammenhang betonen sie jedoch, dass „die Ausprägung der Koeffizienten immer in Abhängigkeit vom zu messenden Merkmal und der untersuchten Stichprobe beurteilt werden muss“ (Wirtz & Caspar 2002: 160).

280 | Entwicklung eines empirischen Verfahrens zur Evaluation von Fördereffekten Für einen Großteil der Variablen kann mit Werten >0.7 eine gute Reliabilität nachgewiesen werden. Angesichts der Komplexität des Untersuchungsgegenstandes und der besonderen Herausforderung einer Fehleranalyse anhand freier Sprachproben sowie der teilweise durch niedrige Häufigkeiten bedingten geringen Varianz einiger Variablen können jedoch auch Werte >0.6 als zufriedenstellend betrachtet werden. Für viele Variablen kann mit Werten zwischen 0.8–1.0 sogar eine sehr gute bzw. hervorragende Interrater-Reliabilität nachgewiesen werden. Für besonders niedrige Intraklassenkorrelationen können im Rahmen des vorliegenden Verfahrens unterschiedliche Ursachen angenommen werden: 1.

2.

3.

Unscharfe Definition einiger Variablen. Wie bereits in Kap. 6.5.2.4 ausgeführt, ist auf der Grundlage des derzeitigen Forschungsstandes eine objektive Beurteilung der semantischen Angemessenheit von Wörtern problematisch. Deshalb zeigt sich bei allen Variablen, die die Kodierung semantisch abweichender Wörter oder Selbstkorrekturen mit lexikalisch-semantisch falschem Ergebnis betreffen, erwartungsgemäß eine niedrige Intraklassenkorrelation. Unscharfe Differenzierungen im Kodierschema. Einige Variablen, die zur weiteren Ausdifferenzierung von Fehlertypen dienen sollten, lassen sich nicht eindeutig voneinander abgrenzen. So sollte bei semantisch abweichenden Substantiven und Verben eine Differenzierung in falsche Wörter und Näherungsbegriffe vorgenommen werden. Trotz der Beispielzuordnungen (vgl. Anhang 8.3.3, Tab. A-5 und Tab. A-6) sind diese beiden Kategorien offensichtlich nicht eindeutig voneinander zu trennen, so dass die Zuordnung zur einen bzw. anderen Kategorie interpretativ ist. ‚Black-Box-Problem‘. Wie in Kap. 3.3.2 bereits erwähnt, besteht ein besonderes Problem der Fehleranalyse in der zielsprachlichen Rekonstruktion der abweichenden Äußerung. Häufig bestehen mehrere Möglichkeiten, ohne dass der Kodierer sich dieser weiteren Möglichkeiten bewusst ist, was zu abweichenden Kodierungen führt. So sind bei der Äußerung „Das Kind macht das Segel den Zahnstocher dran“ zumindest zwei Rekonstruktionen denkbar: A) „Das Kind macht das Segel an den Zahnstocher dran.“ (= fehlende Präposition) oder B) „Das Kinder macht [//] den Zahnstocher dran.“ (= Selbstkorrektur des Wortes Segel). Eine ähnliche Situation liegt vermutlich bei den Variablen Selbstkorrekturen auf lexikalisch-semantischer Ebene und Selbstkorrekturen Hilfsverb/Modalverb vor. So ist z.B. in der Äußerung „Dann [//] hat der den gesehen“ nicht eindeutig zu ent-

Evaluierung: Prüfung der Gütekriterien | 281

scheiden, ob der Schüler das Hilfsverb korrigieren wollte oder zunächst eine inhaltlich andere Aussage oder zumindest ein anderes Vollverb im Kopf hatte (z.B. „Dann ist der weggegangen“). Offensichtlich können auch die Instruktionsmaterialien und Beispiele diese Schwierigkeit nicht ausreichend lösen. Auch bei den Variablen fehlende Präpositionen und fehlende Prädikate ist wahrscheinlich, dass unterschiedliche Rekonstruktionen der Schüleräußerungen für abweichende Kodierungen verantwortlich sind. 4. Zu geringe Varianz in der Stichprobe. Wirtz & Caspar (2002: 161) weisen darauf hin, dass eine niedrige ICC auch auf eine besonders homogene Stichprobe zurückzuführen sein kann, die sich hinsichtlich des untersuchten Merkmals kaum unterscheidet. Viele der Variablen mit einer niedrigen Interrater-Reliabilität weisen zugleich sehr geringe Häufigkeiten auf, so dass hier vermutlich auch die geringe Merkmalsvarianz für die niedrigen Werte verantwortlich ist. Konsequenzen Die Variablen, bei denen vermutlich unscharfe Differenzierungen im Kodierschema für die niedrige Intraklassenkorrelation verantwortlich sind, werden in einer übergeordneten Variable zusammengefasst (vgl. Tab. 43). Die ICCKoeffizienten für diese kombinierten Variablen werden in der folgenden Tabelle wiedergegeben. Alle nicht weiter kombinierbaren Variablen mit einem ICC .4) auf Faktor 1 aufweisen (vgl. Tab. 47). Parameter D kann vor allem aus Gründen der Skalierbarkeit nicht in die Skala aufgenommen werden. Denn da für die spätere Berechnung des Testwerts dieser Skala alle Item-Werte addiert und durch die Gesamtwortzahl des Transkripts geteilt werden sollen (vgl. Kap. 6.6.3.6), kann ein Quotient wie Parameter D (vgl. Kap. 6.5.2.5) nicht in die Skala integriert werden. Andernfalls würden natürliche Zahlen (= Häufigkeiten der andere Variablen) mit einem Quotienten addiert und die Summe erneut durch die Gesamtwortzahl dividiert, was das Ergebnis verzerren würde.

296 | Entwicklung eines empirischen Verfahrens zur Evaluation von Fördereffekten Auch aus theoretischer Sicht ist die Integration dieses Items in die Skala problematisch, weil hier alle Wörter berücksichtigt werden, also z.B. auch Füllwörter und Partikeln, die eher Merkmale nähesprachlicher Kommunikation sind. Außerdem werden bei der automatischen Berechnung dieses Wertes unterschiedliche Wortformen wie sehen, seh, sieht, gesehen etc. als unterschiedliche Lexeme gewertet. Dadurch eignet sich Parameter D zwar als relativ allgemeiner Indikator für Wortschatzvielfalt, die natürlich auch ein Merkmal elaborierter Sprachverwendung ist. Verschiedene Autoren weisen jedoch darauf hin, dass sich der Gesamtwortschatz für diagnostische Zwecke weniger als Indikator eignet als wortartenspezifische Teilwortschatze (Landua, Maier-Lohmann & Reich 2008: 177; Milton 2009: 140). Im Rahmen der Reliabilitätsanalysen wurde dennoch der Versuch unternommen, Parameter D mit in die Skala zu integrieren. Dabei zeigte sich erwartungsgemäß, dass dies zu einer deutlichen Verschlechterung der internen Konsistenz (Cronbachs Alpha) führte. Deshalb soll die lexikalische Diversität in dieser Skala nur durch Wortarten erfasst werden, die als Indikator für schulsprachliche bzw. fortgeschrittene Sprachkompetenz identifiziert wurden. Parameter D kann jedoch bei der späteren Kriteriumsvalidierung als Außenkriterium hilfreich sein (vgl. Kap. 6.6.3.7). Die Variablen Umschreibungen und fehlende Dativmarkierungen, Regens Verb, werden aus theoretischen Gründen nicht in die Skala Elaborierte Sprachverwendung integriert. So handelt es sich bei der Variable fehlende Dativmarkierung, Regens Verb um ein eindeutig negativ gepoltes Item, das inhaltlich deutlich besser zur Faktor 3 passt, was auch durch das Ladungsmuster in der Mustermatrix bestätigt wird (vgl. Tab. 46). Auch die Variable Umschreibungen ist insofern negativ gepolt, als die Kinder nur dann paraphrasieren, wenn ihnen das passende Lexem nicht bekannt ist. Einige stichprobenartige qualitative Analysen ergaben zudem, dass die Umschreibungen häufig viele sprachliche Abweichungen enthielten und deshalb nicht als Merkmal elaborierter Sprachverwendung interpretiert werden sollten (z.B. „Und da ham sie so so wie eine Bratwurst“ oder „Ja und dann ham die ein das da für die Zähne gelegt also so ein kleines äh Stock. Wenn man des mit den Zähnen braucht.“). Da Passivstrukturen immer wieder als typische Merkmale von Schulsprache hervorgehoben werden (vgl. Kap. 2.2), wird auch die Variable Vorgangspassive in die Skala aufgenommen, obwohl sich nur niedrige Ladungen auf Faktor 1 zeigen. Das uneindeutige Ladungsmuster der Variablen wird v.a. auf die geringe Häufigkeit zurückgeführt. Hier ist jedoch sehr wahrscheinlich, dass Kompetenzzuwächse der Schüler zu einer vermehrten Verwendung dieser Strukturen führen. Auch beim Einsatz des Verfahrens mit einer Stichprobe weiter fortge-

Evaluierung: Prüfung der Gütekriterien | 297

schrittener Lerner ist damit zu rechnen, dass deutlich mehr Passivstrukturen produziert werden. Die Skala Elaborierte Sprachverwendung enthält damit insgesamt 14 Items, die theoretisch basierte Indikatoren einer fortgeschrittenen, schulsprachlichen Sprachverwendung erfassen. Diese zeichnet sich auf lexikalischer Ebene durch den Gebrauch eines vielfältigen verbalen, adjektivischen und funktionalen Wortschatzes aus. Zur Erfassung dieser Bereiche werden die Types der produzierten Verben mit und ohne Präfix, der Modalverben, der Adjektive, der Präpositionen sowie typischer Konnektoren (v.a. Subjunktionen) erfasst. Charakteristisch für eine elaborierte Sprachverwendung im Sinne der Schulsprache ist weiterhin die Verwendung präzisierender Sprachmittel wie attributive Strukturen und Präpositionalphrasen. Deshalb werden neben den genannten lexikalischen Mitteln auch die Zahl der produzierten adjektivischen und possessivischen Attribute sowie der Präpositionalphrasen erfasst. Auf struktureller Ebene bewirken diese Sprachmittel einen erhöhten Komplexitätsgrad, durch den die inhaltlichen Bezüge in verdichteter und sprachlich integrierter Form ausgedrückt werden. Dies geschieht auf syntaktischer Ebene außerdem durch Satzverbindungen und -gefüge, deren Anzahl aus diesem Grund ebenfalls erfasst wird. Auch Passivstrukturen gelten als typisches Merkmal von Schulsprache bzw. einer fortgeschrittenen Sprachkompetenz und werden deshalb ebenfalls in der vorliegenden Skala berücksichtigt. Skala Lexikalisch-semantische Unsicherheiten In diese Skala werden alle Items integriert, die sich plausibel als lexikalischsemantische Unsicherheiten interpretieren lassen und Ladungen >.4 auf Faktor 2 in der Strukturmatrix aufweisen. Außerdem wird die Variable Selbstkorrekturen auf lexikalisch-semantischer Ebene in diese Skala integriert, weil auch Selbstkorrekturen in diesem Bereich ein Zeichen für Unsicherheiten sind und eine Ladung von .3 in der Strukturmatrix (vgl. Tab. 47) eine solche Interpretation stützt. Die sieben Items dieser Skala betreffen einerseits semantisch abweichend produzierte Lexeme (Substantive und Verben), andererseits Auslassungen, die zumindest auch auf lexikalisch-semantische Unsicherheiten zurückzuführen sind. So deutet das Auslassen von Determinierern und Präpositionen auf Defizite im Bereich des funktionalen Wortschatzes hin, der seinerseits ein Zeichen fortgeschrittener, schulsprachlicher Sprachverwendung darstellt (vgl. Skala Elaborierte Sprachverwendung). Auch die Anzahl unvollständig produzierter Prädikate, bei denen entweder der finite, funktionale oder der infinite, lexikalisch bedeutsamere Teil fehlt, lässt sich neben möglichen Schwierigkeiten bei

298 | Entwicklung eines empirischen Verfahrens zur Evaluation von Fördereffekten der syntaktischen Prozessierung vor allem auf lexikalische Lücken zurückführen. Für letztere Interpretation sprechen auch die relativ hohen Ladungen auf Faktor 2 (vgl. Tab. 47). Ergänzend zu diesen eindeutig abweichend produzierten Merkmalen umfasst die Skala auch zwei strategische Mittel, die lexikalisch-semantische Unsicherheiten verraten. Gemeint ist die Zahl von Umschreibungen und Selbstkorrekturen auf dieser Ebene. Auch wenn das Ergebnis solcher Korrekturen und Umschreibungen durchaus zielsprachlich sein kann, sind diese Mittel nur notwendig, wenn aufgrund lexikalisch-semantischer Unsicherheiten der passende Begriff nicht verfügbar ist. Bei der Interpretation der Ergebnisse ist dennoch zu berücksichtigen, dass die vorliegende Skala nicht rein defizitär zu beurteilen ist, weil sowohl Umschreibungen und Selbstkorrekturen als auch die Verwendung von (semantisch immernoch abweichenden) Näherungsbegriffen positiv zu bewertende Strategien zur Kompensation von lexikalischen Lücken darstellen. Skala Fehlerschwerpunkte der Nominalflexion Bis auf das Item Präpositionalphrasen das aus inhaltlichen Gründen bereits der Skala Elaborierte Sprachverwendung zugeordnet wurde, werden in diese Skala alle Items integriert, die hohe Ladungen (>.4) auf Faktor 3 (vgl. Tab. 47) aufweisen. Zusätzlich wird auch die Variable fehlerhafte oder fehlende Adjektivflexion mit in die Skala aufgenommen, da die Ladung mit .369 auf Faktor 3 im Vergleich zu den deutlich niedrigeren Ladungen auf Faktor 1 und 2 immer noch relativ hoch ausfällt. Die sechs Items dieser Skala betreffen damit Abweichungen bei der Markierung der Nominalflexion, die wiederholt als typische Stolpersteine bzw. Fehlerschwerpunkte auch fortgeschrittener DaZ-Lerner hervorgehoben werden (vgl. Kap. 3.4.2.3). Charakteristisch sind vor allem abweichende bzw. fehlende Markierungen in Dativkontexten, die hier entsprechend der möglichen Regens (Verb, Präposition und Wechselpräposition) durch drei Variablen erfasst werden. Fehlerschwerpunkte im Bereich der Genusmarkierungen betreffen vor allem Dativ- und Akkusativkontexte, deren Anzahl ebenfalls berücksichtigt wird. Erfasst werden weiterhin Abweichungen bei der Markierung der Adjektivflexion, die ebenfalls zu den typischen Fehlerschwerpunkten im Bereich der Nominalflexion zählen (vgl. Kap. 3.4.2.3). Skala Formalsprachliche Abweichungen (Grammatik) In diese Skala werden alle Items integriert, die formalsprachliche Abweichungen im grammatikalischen Bereich betreffen, also auch die Items der Skala Fehlerschwerpunkte der Nominalflexion und die Items fehlende Determinierer,

Evaluierung: Prüfung der Gütekriterien | 299

fehlende Präpositionen und unvollständige Prädikate (Verbklammer) aus der Skala Lexikalisch-semantische Unsicherheiten, da letztere neben lexikalischer Lücken auch auf Schwierigkeiten im Bereich der syntaktischen Vollständigkeit hindeuten. Es handelt sich somit um eine übergeordnete Skala, durch die unabhängig von ihrer Häufigkeit oder linguistischen Ebene alle kodierten Grammatikfehler erfasst werden. Dabei handelt es sich in den meisten Fällen um sprachliche Strukturen, die als typische Stolpersteine des DaZ-Erwerbs gelten. Berücksichtigt werden sowohl syntaktische als auch morphologische Fehler. Im Bereich der Syntax werden sowohl Abweichungen bezüglich der Wortstellung (nicht realisierte Subjekt-Verb-Inversionen und V1-Stellung in Aussagesätzen) als auch der Vollständigkeit (fehlendes oder unvollständiges Prädikat, fehlende Präpositionen und Determinierer) erfasst. Auf morphologischer Ebene werden Abweichungen im Bereich der Nominal- und Verbalflexion erfasst 104. Zu beachten ist, dass sich die Fehlerschwerpunkte je nach sprachlichem Bereich deutlich unterscheiden und nicht unbedingt miteinander korrelieren müssen, weshalb sich auch kein entsprechender Faktor abbilden ließ. Dennoch ist eine solche Skala zur Erfassung von Fördereffekten sinnvoll, da durch die meisten Fördermaßnahmen eine Reduzierung grammatikalischer Fehler erzielt werden soll. Tab. 49 fasst noch einmal alle Variablen und die Zuordnung zu den Faktoren bzw. Skalen zusammen. 103F

|| 104 Für eine detaillierte Auflistung aller in diese Skala integrierten Merkmale vgl. Tab. 49 oder Tab. 53.

300 | Entwicklung eines empirischen Verfahrens zur Evaluation von Fördereffekten

Tab. 49. Zuordnung der Variablen zu den Skalen (Übersicht) Elaborierte Sprachverwendung (Faktor 1)

Lexikalischsemantisch Unsicherheiten (Faktor 2)

Fehlerschwerpunkte Nominalflexion (Faktor 3)

Ladung*

Ladung*

Ladung*

Faktor 1

Faktor 2

Faktor 3

Satzverbindungen und Satzgefüge



.696

Präpositionalphrasen



.489

Präpositionalphrasen (Wechselpräpositionen) Attribute (possessiv)



.728



.421

Vorgangspassive



.251

Attribute (adjektivisch)



.564

Strukturen mit Modalverb



.509

Präpositionen (types)



.446

Wechselpräpositionen (types)



.687

Konnektoren (types)



.737

Verben ohne Präfix (types)



.657

Verben mit Präfix (types)



.626

Modalverben (types)



.491

Adjektive (types)



.580

Genusfehler in Nominativkontexten

Formalsprachliche Abweich



Genusfehler in Akkusativkontexten



.549



Genusfehler in Dativkontexten



.687



fehlende Dativmarkierungen, Regens Verb fehlende Dativmarkierungen, Regens Präposition fehlende Dativmarkierungen, Regens Wechselpräposition fehlerhafte oder fehlende Adjektivflexion fehlende Akkusativmarkierung



.457





.731





.517



v

.369

√ √

Genus- oder Kasusfehler am Begleiter



fehlerhafte oder eindeutig fehlende Pluralmarkierungen an Substantiven fehlerhafte oder eindeutig fehlende Dativmarkierungen an Substantiven

√ √

Evaluierung: Prüfung der Gütekriterien | 301 Elaborierte Sprachverwendung (Faktor 1)

fehlerhafte S-V-Kongruenz

Lexikalischsemantisch Unsicherheiten (Faktor 2)

Fehlerschwerpunkte Nominalflexion (Faktor 3)

Ladung*

Ladung*

Ladung*

Faktor 1

Faktor 2

Faktor 3

Formalsprachliche Abweich



fehlerhafte Partizip-II-Formen



fehlerhafte Flexion unregelmäßiger (starker) Verben Verwechslung Hilfsverben haben-sein



fehlende Prädikate



nicht-zielsprachliche V1-Strukturen



geforderte, aber nicht realisierte Inversion fehlende Determinierer

√ √

.582

fehlende Präpositionen



.559



unvollständige Prädikate (Verbklammer) Selbstkorrekturen auf lexikalischsemantischer Ebene semantisch abweichende Substantive



.409





.307



.400

semantisch abweichende Verben



.493

Umschreibung (Paraphrase)



.349





Parameter D (Wortschatzdiversität)

Keine Zuordnung: Inhaltliche Gründe und Problem der Skalierbarkeit Selbstkorrekturen der Nominalflexion Keine Zuordnung: Ladungsmuster in Muster- und Strukturmatrix nicht eindeutig Passepartout-Substantive (Substan- Keine Zuordnung: Ladungsmuster in Muster- und Struktivjoker) turmatrix nicht eindeutig Konstituentennegation ("kein") Keine Zuordnung: Niedriger MSA-Koeffizient, d.h. empirischer Zusammenhang mit anderen Variablen nicht gegeben. fehlerhafte Markierung der Kompara- Keine Zuordnung: Niedriger MSA-Koeffizient und exttion am Adjektiv rem niedrige Häufigkeit (M = 0,01, SD = 0,08). Grund: Elizitierungsverfahren bietet keinen kommunikativen Rahmen für diesen Fehlertyp. * Die Ladungen beziehen sich auf die Strukturmatrix in Tab. 47

6.6.3.5 Prüfung der Reliabilität Zur Prüfung der Reliabilität von Skalen werden meist vier Methoden unterschieden: Retest-Reliabilität, Paralleltest-Reliabilität, Split-Half-Reliabilität und

302 | Entwicklung eines empirischen Verfahrens zur Evaluation von Fördereffekten Prüfung der internen Konsistenz. Die ersten beiden Verfahren kommen im Rahmen der vorliegenden Arbeit nicht in Frage, weil die ökonomischen Rahmenbedingungen keine zweite Datenerhebung und -auswertung zulassen. Auch die Split-Half-Reliabilität ist ungeeignet, weil sich das Verfahren nicht in zwei gleichwertige Testhälften unterteilen lässt. Aus diesen Gründen stellen Analysen zur Ermittlung der internen Konsistenz die einzige Möglichkeit zur Prüfung der Reliabilität der Skalen dar. Eine der bewährtesten Methoden, bei der der Test ist so viele Teile zerlegt wird, wie er Items hat, um dann die mittlere Korrelation der einzelnen Items zueinander zu berechnen, ist die Ermittlung des Konsistenzkoeffizienten Cronbachs Alpha. Da die Interkorrelation der Items von ihrer Homo- bzw. Heterogenität abhängt, fällt Cronbachs Alpha umso höher aus, je homogener die Items bzw. die zu erfassenden Merkmale sind (vgl. z.B. Schermelleh-Engel & Werner 2012: 130–131). Wenn ein mehrdimensionales Merkmal gemessen werden soll und der Test bzw. die Subskala daher heterogene Items umfasst, die unterschiedliche Aspekte des Merkmals erfassen, „wird die tatsachliche Reliabilität mit Konsistenzanalysen in der Regel unterschätzt, d. h. es werden niedrigere Werte zu erwarten sein“ (Schermelleh-Engel & Werner 2012: 137). Im Falle eines heterogenen Merkmals muss ein niedriger AlphaWert also kein Hinweis auf eine unzureichende Reliabilität sein: Aussagen über die anzustrebende Höhe der Reliabilität eines Testverfahrens lassen sich somit allenfalls in Bezug auf eine bestimmte Anwendungssituation und eine bestimmte Methode der Reliabilitätsschätzung machen, jedoch nicht beliebig verallgemeinern (Schermelleh-Engel & Werner 2012: 137).

Außerdem wird die Höhe von Cronbachs Alpha durch die Anzahl der Items einer Skala beeinflusst. Fügt man einer Skala Items hinzu, hat dies zur Folge, dass auch „dann, wenn die zusätzlichen Items inhaltlich nur ‚randständig‘ zur Skala passen“ Cronbachs-α höher ausfällt (Bühner 2011: 167). Umgekehrt kann für Skalen mit weniger als sechs bzw. vier Items allein aufgrund der geringen Itemzahl kein hoher α-Koeffizient erwartet werden. Während „für die psychologische Grundlagenforschung [...] meist relativ eng abgrenzbare Merkmale von Interesse [sind], die mit eher homogenen, deutlich interkorrelierten Items erfasst werden können“, gibt es im Kontext angewandter Linguistik ebenso wie in der angewandten Psychologie „breiter abgegrenzte Merkmale, die zwar inhaltlich klar definiert sind, die sich aber nur mit inhaltlich heterogenen, d.h. gering interkorrelierten Items erfassen lassen“ (Schermelleh-Engel & Werner 2012: 132–133). Auch für die Skalen des vorliegenden Verfahrens handelt es sich größtenteils um heterogene Merkmale, die durch heterogene Variablen erfasst werden. Da zumindest zwei der Skalen aus

Evaluierung: Prüfung der Gütekriterien | 303

relativ wenig Items bestehen, ist in diesen Fällen mit vergleichsweise niedrigen Alpha-Werten zu rechnen. Auch die Trennschärfe der Items sollte untersucht werden. Diese wird in Lienert & Raatz (1998: 30) als die Validität einer Aufgabe bzw. eines Items beschrieben. So, wie im Rahmen der Validitätsprüfung eines Tests nachgewiesen werden muss, dass er auch das misst, was er messen soll, muss für die einzelnen Items überprüft werden, ob sie das zu messende Konstrukt (bzw. Merkmal) repräsentieren, wobei vorauszusetzen ist, dass der Test als Ganzes valide ist (Lienert & Raatz 1998: 30). Um die Trennschärfe bzw. den Trennschärfekoeffizienten zu ermitteln, wird üblicherweise die Korrelation des Items mit dem Gesamttestwert berechnet. Ist die Korrelation hoch, repräsentiert das Item das Gesamtergebnis. Denn dann haben Personen mit starker Merkmalsausprägung das Item häufiger im Sinne der Erwartung beantwortet als Probanden mit niedriger Merkmalsauprägung. Das Item trennt also gut bzw. scharf zwischen Personen hoher vs. niedriger Merkmalsausprägung (Bortz & Döring 2010: 219). Wie bei der internen Konsistenz ist jedoch auch die Trennschärfe abhängig von der Heterogenität des Merkmals bzw. der Items. Es ist deshalb darauf zu achten, dass durch den Versuch, die interne Konsistenz des Verfahrens zu maximieren, indem wenig trennscharfe Items verworfen werden, nicht die Inhaltsvalidität eingeschränkt wird. Denn gerade bei heterogenen Skalen kann die Korrelation eines Items mit dem Testwert gering ausfallen, obwohl es wichtige Informationen liefern kann (Schmidt-Atzert & Amelang 2012: 145). Reliabilität der Skala Elaborierte Sprachverwendung Die Skala Elaborierte Sprachverwendung weist mit α =.83 eine sehr hohe Zuverlässigkeit auf. Wie erwartet fällt die Trennschärfe der Variablen Vorgangspassive niedrig aus (vgl. Tab. 50). Ein Ausschluss dieser Variablen aus der Skala würde jedoch aus den genannten Gründen die Validität einschränken.

304 | Entwicklung eines empirischen Verfahrens zur Evaluation von Fördereffekten

Tab. 50. Skala Elaborierte Sprachverwendung Skala Elaborierte Sprachverwendung Mittelwert

Satzverbindungen und Satzgefüge Attribute (adjektivisch) Attribute (possessiv) Präpositionalphrasen Präpositionalphrasen (Wechselpräpositionen) Strukturen mit Modalverb Vorgangspassive Präpositionen (types) Wechselpräpositionen (types) Konnektoren (types) Verben ohne Präfix (types) Verben mit Präfix (types) Modalverben (types) Adjektive (types)

5,3931 7,4621 1,8414 7,4483 4,8276 2,2483 ,0552 4,2138 2,9586 3,5655 23,8000 14,2138 1,5379 7,6483

Trennschärfe (Korrigierte ItemSkala-Korrelation) ,585 ,488 ,391 ,423 ,544 ,469 ,225 ,461 ,530 ,663 ,616 ,532 ,444 ,549

Reliabilität der Skala Lexikalisch-semantische Unsicherheiten Mit insgesamt nur sieben äußerst heterogen einzustufenden Items zur Erfassung eines vielschichtigen Merkmals fällt die interne Konsistenz dieser Skala mit Cronbachs α =.59 erwartungsgemäß niedrig aus, kann aus den genannten Gründen jedoch noch als ausreichend beurteilt werden. Ein weiterer Grund für die niedrige Reliabilität ist in der geringen Intraklassenkorrelation einiger Items zu sehen, die v.a. auf das Fehlen eines objektiven Vergleichsmaßstabs zur Beurteilung semantischer Angemessenheit zurückgeführt wurde (vgl. Kap. 6.6.3.2). Die niedrige Interrater-Reliabilität war auch der Grund dafür, dass viele Items zur Erfassung semantischer Defizite entweder kombiniert oder verworfen werden mussten, so dass nur noch wenige Items zur Erfassung des Merkmals Lexikalisch-semantische Unsicherheiten zur Verfügung stehen. Angesichts der Komplexität des zu erfassenden Merkmals ist eine Zahl von sieben Items tendenziell als zu gering einzustufen. Hier ist weitere Grundlagenforschung zur Beurteilung semantischer Fähigkeiten in spontansprachlichen Daten notwendig.

Evaluierung: Prüfung der Gütekriterien | 305

Tab. 51. Skala Lexikalisch-semantische Unsicherheiten Skala Lexikalisch-semantische Unsicherheiten Mittelwert

Selbstkorrekturen auf lexikalischsemantischer Ebene fehlende Determinierer fehlende Präpositionen unvollständige Prädikate (Verbklammer) semantisch abweichende Substantive semantisch abweichende Verben Umschreibung (Paraphrase)

3,0621

Trennschärfe (Korrigierte ItemSkala-Korrelation) ,315

2,2138 ,6759 1,9310 6,4483 3,9448 ,8690

,316 ,324 ,248 ,392 ,436 ,223

Reliabilität der Skala Fehlerschwerpunkte der Nominalflexion Auch die Nominalflexion stellt aufgrund der gleichzeitigen Markierung von Numerus, Genus und Kasus und dessen Abhängigkeit von lexikalischsemantischen Einheiten (Regens) ein heterogenes Merkmal dar, das in dieser Skala durch entsprechend unterschiedliche Variablen repräsentiert wird. Aus diesen Gründen ist Cronbachs Alpha bei einer Zahl von nur sechs Items mit .63 als befriedigend zu bewerten. Ähnlich wie bei der Skala Lexikalisch-semantische Unsicherheiten wäre auch hier eine größere Anzahl an Items wünschenswert. Möglicherweise ließen sich durch längere Sprachproben einige der Variablen erhalten, die im Rahmen des vorliegenden Verfahrens aufgrund geringer Häufigkeiten verworfen oder kombiniert werden mussten. Tab. 52. Skala Fehlerschwerpunkte der Nominalflexion Skala Fehlerschwerpunkte der Nominalflexion Mittelwert

Genusfehler in Akkusativkontexten Genusfehler in Dativkontexten fehlende Dativmarkierung, Regens Verb fehlende Dativmarkierung, Regens Präposition fehlende Dativmarkierung, Regens Wechselpräposition fehlerhafte oder fehlende Adjektivflexion

1,6828 ,4069 1,0069 1,6000 ,3379

Trennschärfe (Korrigierte ItemSkala-Korrelation) ,356 ,529 ,342 ,446 ,374

,6483

,301

306 | Entwicklung eines empirischen Verfahrens zur Evaluation von Fördereffekten Reliabilität der Skala Formalsprachliche Abweichungen (Grammatik) Angesichts der besonderen Heterogenität der berücksichtigten sprachlichen Bereiche und der Annahme, dass viele der Items gerade in der freien Spontansprache nicht miteinander korrelieren (müssen), was auch durch die niedrigen Trennschärfen vieler Items bestätigt wird (vgl. Tab. 53), ist Cronbachs Alpha mit .56 noch ausreichend hoch. Tab. 53. Skala Formalsprachliche Abweichungen (Grammatik) Skala Formalsprachliche Abweichungen (Grammatik) Mittelwert

Genusfehler in Nominativkontexten Genusfehler in Dativkontexten Genusfehler in Akkusativkontexten fehlende Akkusativmarkierung fehlende Dativmarkierung, Regens Verb fehlende Dativmarkierung, Regens Präposition fehlende Dativmarkierung, Regens Wechselpräposition Genus- oder Kasusfehler am Begleiter fehlerhafte oder fehlende Pluralmarkierungen am Substantiv fehlerhafte oder fehlende Dativmarkierungen am Substantiv fehlerhafte oder fehlende Adjektivflexion fehlende Determinierer fehlende Präpositionen fehlerhafte S-V-Kongruenz fehlerhafte Partizip-II-Formen fehlerhafte Flexion unregelmäßiger (starker) Verben Verwechslung Hilfsverben haben-sein unvollständige Prädikate (Verbklammer) fehlende Prädikate nicht-zielsprachliche V1-Strukturen geforderte, aber nicht realisierte Inversion

,3241 ,4069 1,6828 ,3172 1,0069 1,6000

Trennschärfe (Korrigierte Item-SkalaKorrelation) ,178 ,428 ,338 ,146 ,181 ,251

,3379

,226

,1379 ,1724

-,076 ,294

,1241

,147

,6483 2,2138 ,6759 ,5379 ,4000 ,3379

,239 ,324 ,385 ,135 ,289 ,054

,4414 1,9310 ,8207 1,5655 1,1241

,100 ,239 ,199 ,100 ,066

Aus testtheoretischer Sicht müssten Items mit negativen Trennschärfen wie hier Genus- oder Kasusfehler am Begleiter aus der Skala eliminiert werden. Dieses Item fiel bereits aufgrund seines niedrigen MSA-Koeffizienten auf (vgl. Kap.

Evaluierung: Prüfung der Gütekriterien | 307

6.6.3.3). Offensichtlich liegen hier keine relevanten Korrelationen mit den anderen Fehlervariablen vor. Da die Variable jedoch eindeutig formalsprachliche Abweichungen im grammatikalischen Bereich erfasst, wird sie nicht aus der Skala eliminiert. In der folgenden Übersicht werden die Skalen noch einmal zusammengefasst und hinsichtlich ihrer tendenziellen Polung spezifiziert. Dabei bedeutet eine positive Polung, dass ein hoher Wert einer hohen Sprachkompetenz entspricht. Bei den tendenziell negativ gepolten Skalen deutet ein hoher Wert dagegen auf Erwerbsschwierigkeiten hin. Tab. 54. Skalen-Übersicht Skala

Polung

Cronbachs Alpha

Elaborierte Sprachverwendung (14 Items)

positiv

.83

Lexikalisch-semantische Unsicherheiten (7 Items)

tendenziell

.59

negativ Fehlerschwerpunkte der Nominalflexion (6 Items)

tendenziell

.63

negativ Formalsprachliche Abweichungen (Grammatik) (21 Items)

tendenziell

.56

negativ

6.6.3.6 Berechnung der Testwerte Da alle in den Skalen enthaltenen Variablen vom Umfang, d.h. der Gesamtwortzahl der Sprachprobe abhängen, ergeben sich die Testwerte der negativ gepolten Skalen zunächst aus dem Quotienten Summe der VariablenWerte/Gesamtwortzahl, was einem klassischen Fehlerquotienten entspricht. Dieses Vorgehen wäre grundsätzlich auch bei der positiv gepolten Skala Elaborierte Sprachverwendung denkbar. Der Testwert dieser Skala lässt sich jedoch mit Blick auf das zu erfassende Merkmal optimieren, wenn man nicht durch die Gesamtwortzahl, sondern durch die Gesamtzahl der Vollverben teilt. Hintergrund dieser Überlegung ist die Frage, wie stark der verbale Wortschatz, d.h. die Zahl der produzierten Verben, ins Gewicht fallen sollte. Verglichen mit den anderen Items dieser Skala kommen Verben deutlich häufiger vor, weil jeder Satz in Form des Prädikats typischerweise ein Vollverb enthält. Insofern sagt die Zahl der Verben nicht nur etwas über den verbalen Wortschatz aus, sondern auch etwas über die Zahl der produzierten Sätze. Problematisch ist dabei, dass die Zahl der Verben gemessen an der Gesamtwortzahl bei der Verwendung vieler kurzer (oder sogar abgebrochener) Sätze höher ausfällt (= Verbalstil), als wenn ein Schüler einen Nominalstil mit weniger, dafür aber inhaltlich verdichteten, längeren Sätzen verwendet (z.B. „Der

308 | Entwicklung eines empirischen Verfahrens zur Evaluation von Fördereffekten schneidet. Dann klebt der das ans Papier.“ vs. „Er klebt das ausgeschnittene Papier an den Zahnstocher.“). Schul- bzw. Distanzsprache zeichnet sich jedoch typischerweise durch einen verdichteten Nominalstil und dadurch vergleichsweise weniger Verben aus (Albert & Marx 2010; Jeuk 2010). Zwar bezieht sich die Variable nur auf die Verbtypes, doch auch diese Zahl wächst mit steigender Äußerungszahl. Kinder mit sprachlichen Defiziten verwenden vermutlich eher kurze Sätze, so dass die Zahl der produzierten Verben im Verhältnis zur Gesamtwortzahl steigen dürfte, was aus den genannten Gründen ein Indikator für einen alltagssprachlichen Verbalstil sein kann. Um ausschließlich die Diversität des verbalen Wortschatzes zu erfassen, bietet es sich an, die Summe der Itemwerte nicht durch die Gesamtwortzahl, sondern durch die Gesamtzahl der Vollverben zu dividieren. Auf diese Weise berechnet man indirekt die Type-Token-Relation der Verben, so dass ein Verbalstil mit vielen kurzen (oder sogar abgebrochenen) Äußerungen nicht zu einer Verbesserung des Testwerts führen kann. Da die Gesamtzahl aller Vollverben sehr hoch mit der Gesamtwortzahl korreliert (.91**), können auch die anderen wortschatzbasierten und syntaktischen Items dieser Skala problemlos an der Gesamtzahl aller Vollverben relativiert werden. Für die anderen Skalen eignet sich dagegen die Relativierung an der Gesamtwortzahl besser, weil hier viele morphologische und lexikalische Aspekte eine Rolle spielen, die weniger von der Zahl der Verben (bzw. Sätze) als von der Gesamtwortzahl beeinflusst werden. Weiterhin müssen bei der Berechnung und Interpretation der so berechneten Testwerte die in Kap. 6.6.3.3 diskutierten Interkorrelationen der Faktoren bzw. der darauf basierenden Skalen berücksichtigt werden. Dabei ist jedoch zu beachten, dass zwischen dem positiv gepolten Testwert der Skala Elaborierte Sprachverwendung und den (tendenziell) negativ gepolten Testwerten der anderen Skalen kein eindeutig linearer Zusammenhang besteht (vgl. Abb. 41-Abb. 43) 105. 104F

|| 105 Die im Gegensatz zu den Skalen-Testwerten lineare Korrelation der Hauptfaktoren aus der explorativen Faktorenanalyse (vgl. Kap. 6.6.3.3 , Tab. 48) lässt sich damit erklären, dass hier ein rein rechnerisch ermitteltes Modell zugrunde liegt, während bei der Skalenkonstruktion auch inhaltliche Überlegungen eine Rolle spielten. So erfolgte die Zuordnung der Variablen zu den Skalen teilweise auch aufgrund hoher Nebenladungen (vgl. Kap. 6.6.3.4 ).

Evaluierung: Prüfung der Gütekriterien | 309

r = ‐.025

Abb. 41. Scatterplot Testwerte Elaborierte Sprachverwendung und Formalsprachliche Abweichungen (Grammatik)

r = .202*

Abb. 42. Scatterplot Testwerte Elaborierte Sprachverwendung und Fehlerschwerpunkte der Nominalflexion

310 | Entwicklung eines empirischen Verfahrens zur Evaluation von Fördereffekten

r = ‐.161

Abb. 43. Scatterplot Testwerte Elaborierte Sprachverwendung und Lexikalisch-semantische Unsicherheiten

Dieses Ergebnis überrascht zunächst vielleicht insofern, als ein hoher Testwert bei der positiv gepolten Skala Elaborierte Sprachverwendung für eine fortgeschrittene Sprachkompetenz spricht, und man von solchen Schülern erwarten würde, dass sie aufgrund ihrer guten Sprachkenntnisse auch weniger Fehler produzieren. Wie an anderer Stelle schon angedeutet, führt jedoch der Versuch einer möglichst genauen und differenzierten Versprachlichung der Filminhalte (= hoher Testwert für Elaborierte Sprachverwendung) zu einer potentiellen Erhöhung des Risikos, auch abweichende Strukturen zu produzieren (= hohe Testwerte bei den negativ gepolten Skalen). Diese Annahme wird durch die schwach positive Korrelation der Testwerte Elaborierte Sprachverwendung und Fehlerschwerpunkte der Nominalflexion bestätigt (vgl. Abb. 42). Dieser Zusammenhang besteht allerdings nur bei Kindern, die trotz sprachlicher Defizite versuchen, die Filminhalte möglichst differenziert wiederzugeben und dafür auch unsicher beherrschte Sprachmittel verwenden – ein Verhalten, das durch viele Förderprogramme bewusst unterstützt wird (Lütke 2010b: 48), obwohl es zu einem Anstieg an Fehlern führen kann. Kinder mit einer fortgeschrittenen Sprachkompetenz werden dagegen auch bei einer elaborierten Sprachverwendung keine oder nur wenige Fehler machen. Wieder andere Kinder vermeiden unsicher

Evaluierung: Prüfung der Gütekriterien | 311

beherrschte sprachliche Mittel, so dass sie weniger Fehler produzieren, sich dafür aber auch nicht sehr elaboriert ausdrücken. Die Zusammenhänge der Testwerte können also individuell unterschiedlich ausfallen, weshalb sich auch keine lineare Korrelation nachweisen lässt. Mit Blick auf eine möglichst eindeutige Interpretation der Ergebnisse sollte jedoch ein hoher Testwert der Skala Elaborierte Sprachverwendung ein Indikator für eine fortgeschrittene Sprachkompetenz sein, ein hoher Testwert der anderen Skalen dagegen für Erwerbsschwierigkeiten bzw. Defizite sprechen. Umgekehrt sollte sich ein niedriger Testwert bei diesen tendenziell negativ gepolten Skalen als Zeichen einer fortgeschrittenen Kompetenz interpretieren lassen und daher negativ mit dem Testwert der Skala Elaborierte Sprachverwendung korrelieren. Eine solche Interpretation ist aufgrund der bisherigen Ergebnisse jedoch nicht möglich (vgl. Scatterplots und Korrelationskoeffizienten in Abb. 41-Abb. 43). Die obigen Überlegungen zeigen, dass die Häufigkeit abweichender Strukturen bzw. die Testwerte der negativ gepolten Skalen für sich gesehen nur eine geringe Aussagekraft haben, weil inhaltliche Ungenauigkeit und die wiederholte Verwendung einfacher, sicher beherrschter Strukturen formalsprachlichen Defizite verschleiern können 106. Aus Gründen der Validität sollte deshalb das Ausmaß der eingesetzten elaborierten, d.h. riskanteren Sprachmittel bei der Berechnung der negativ gepolten Testwerte mit berücksichtigt werden. Für den Testwert der Skala Elaborierte Sprachverwendung ergibt sich eine solche Problematik dagegen nicht, weil die Fehlerhäufigkeit keinen Einfluss auf diesen Testwert ausübt. Um die Aussagekraft der negativ gepolten Testwerte zu erhöhen, werden diese deshalb durch den Testwert Elaborierte Sprachverwendung geteilt, wodurch die Häufigkeit abweichender Strukturen am Ausmaß der verwendeten elaborierten Strukturen relativiert wird. 105F

Tab. 55. Formeln zur Berechnung der Skalen-Testwerte Berechnung des Test- Berechnung der Testwerte der Skalen Lexikalisch-semantische Unsiwerts der Skala Elabo- cherheiten, Fehlerschwerpunkte der Nominalflexion und Formalrierte Sprachverwen- sprachliche Abweichungen (Grammatik): dung: Summe der Itemwerte_ Summe der Itemwerte Summe der Vollverben Gesamtwortzahl

:

Testwert Elaborierte Sprachverwendung

|| 106 Solche Strategien sind im Übrigen auch ein Grund dafür, dass Lehrer die sprachlichen Defizite ihrer Schüler oft erst viel zu spät bemerken (vgl. Kap. 2.1 , Stichwort „verdeckte Sprachschwierigkeiten“, Knapp 1999).

312 | Entwicklung eines empirischen Verfahrens zur Evaluation von Fördereffekten Die Korrelationen der relativierten Testwerte mit dem Testwert der Skala Elaborierte Sprachverwendung zeigen ein theoriekonformes Ergebnis. Damit sind die relativierten Testwerte der negativ gepolten Skalen gegenüber den ursprünglichen Testwerten zu vorzuziehen (vgl. Tab. 56). Tab. 56. Korrelation der Skalen-Testwerte Elaborierte Sprachverwendung -,161 -,536**

Lexikalisch-semantische Unsicherheiten, Quotient Gesamtwortzahl Lexikalisch-semantische Unsicherheiten, Quotient Testwert Elaborierte Sprachverwendung Fehlerschwerpunkte Nominalflexion, Quotient Gesamtwortzahl ,202* Fehlerschwerpunkte Nominalflexion, Quotient Testwert Elaborierte -,064 Sprachverwendung Formalsprachliche Abweichungen (Grammatik), Quotient Gesamtwortzahl -,025 Formalsprachliche Abweichungen (Grammatik), Quotient Testwert Elaborierte Sprachverwendung

-,375**

In der Skalen-Übersicht in Tab. 57 werden die wesentlichen statistischen Kennwerte sowie die Intraklassenkorrelation (ICC) der so berechneten SkalenTestwerte zusammengefasst: Tab. 57. Skalenübersicht mit statistischen Kennwerten der Testwerte Skala

Testwert

Anzahl Cronbachs Minimum Maximum Mittelwert SD ICC der Alpha Items 14 ,83 1,04 2,42 1,6303 ,28176 ,938

Elaborierte Sprachverwendung Formalsprachliche Abwei- 21 chungen (Grammatik) Fehlerschwerpunkte 6 Nominalflexion Lexikalisch-semantische 7 Unsicherheiten

,56

,01

,09

,0289

,01494 ,882

,63

0,00

,03

,0096

,00659 ,922

,59

,01

,09

,0328

,01369 ,759

Die Interrater-Reliabilität ist damit für die Testwerte der Skalen Elaborierte Sprachverwendung und Fehlerschwerpunkte der Nominalflexion hervorragend und für die Skala Formalsprachliche Abweichungen (Grammatik) sehr gut. Aufgrund der Schwierigkeit objektiver Beurteilung semantischer Eigenschaften fällt

Evaluierung: Prüfung der Gütekriterien | 313

die Intraklassenkorrelation der Skala Lexikalisch-semantische Unsicherheiten erwartungsgemäß niedriger aus. Ein Wert von.759 ist jedoch immer noch als gut zu beurteilen. Abschließend soll geprüft werden, ob sich die Variable Gesamtwortzahl, die bisher nur als Relativierungsmaß für die summierten Itemwerte verwendet wurde, als Indikator für die erfassten Dimensionen schulsprachlicher Kompetenz eignet. Denn aus fachlicher Sicht besteht hier Uneinigkeit. So beobachten einige Autoren einen Zusammenhang zwischen Textlänge und sprachlichen Fähigkeiten, wobei sprachlich kompetentere Kinder tendenziell längere Texte mit einer geringeren Fehlerzahl zu produzieren scheinen als weniger kompetente Kinder (vgl. Kap. 3.4.1.1). Andere Autoren wie z.B. Möller (2009) sehen in der Textlänge jedoch nur „ein[en] bedingt geeignete[n] Indikator für Unterschiede und Fortschritte in einer L2“. Das Ergebnis der Korrelationsanalyse in Tab. 58 zeigt, dass bis auf einen schwachen Zusammenhang zwischen der Variablen Gesamtwortzahl und dem Testwert der Skala Formalsprachliche Abweichungen (Grammatik) keine signifikanten Korrelationen bestehen. Die Variable Gesamtwortzahl eignet sich im Rahmen des vorliegenden Verfahrens also nicht als Indikator 107. 106F

Tab. 58. Korrelation aller Testwerte mit der Variablen Gesamtwortzahl Gesamtwortzahl Elaborierte Sprachverwendung Formalsprachliche Abweichungen (Grammatik) Fehlerschwerpunkte der Nominalflexion Lexikalisch-semantische Unsicherheiten

-,032 -,169* -,156 -,145

6.6.3.7 Prüfung der Validität Inhaltsvalidität In Zusammenhang mit dem zu entwickelnden Verfahren bedeutet inhaltliche Validität vor allem, dass A) der kommunikative Rahmen des Elizitierungsverfahren typische Merkmale schulsprachlicher Kommunikationssituationen aufweist, B) die Auswertungskategorien theoretisch fundiert sind || 107 Auch eine Korrelation der Gesamtwortzahl mit den im Rahmen der Kriteriumsvalidierung eingesetzten externen Kriterien (vgl. Kap. 6.6.3.7 ) ergab bis auf eine Korrelation von r =.232** mit dem WWT-Test und eine Korrelation von r =.181* mit Parameter D keine signifikanten Zusammenhänge. Der Umfang mündlicher Sprachproben scheint also in einem geringen Maße mit Wortschatzkenntnissen in Verbindung zu stehen, für grammatikalische Fähigkeiten jedoch keine Bedeutung zu haben.

314 | Entwicklung eines empirischen Verfahrens zur Evaluation von Fördereffekten und C) die ermittelten Subskalen relevanten theoretischen Konstrukten entsprechen. A) und B) wird durch die theoretischen Ausführungen im ersten Teil der Arbeit und die detaillierte Dokumentation des Elizitierungs-, Transkriptionsund Kodierverfahrens Rechnung getragen. Weiterhin lassen sich die ermittelten Subskalen (C) im Sinne schulsprachlich relevanter Fähigkeiten bzw. Schwierigkeiten inhaltlich plausibel interpretieren. Augenscheinvalidität Da das im Rahmen dieser Arbeit entwickelte Instrument vor allem für Forschungszwecke konzipiert ist, muss für den Laien nicht unbedingt nachvollziehbar sein, was mit dem Verfahren gemessen wird. Dennoch ist davon auszugehen, dass auch für Wissenschaftler ohne dezidierten linguistischen Hintergrund nachvollziehbar ist, dass durch das Verfahren ausgewählte Merkmale schulsprachlicher Kompetenz gemessen werden. In Bezug auf die Unverfälschbarkeit der Ergebnisse kann es sogar wünschenswert sein, dass die Testpersonen nicht direkt erkennen, was gemessen werden soll. Im Rahmen der vorliegenden Zielsetzung ist es zwar durchaus wünschenswert, dass die Kinder aktiv versuchen, im Sinne schulsprachlich genauer Sprachproduktion ihr Bestes zu geben. Deshalb wird ihnen suggeriert, dass es darum geht, zu sehen, wie genau sie die Filminhalte nacherzählen können. Es wird ihnen jedoch bewusst verschwiegen, dass es auch um ihre grammatikalischen und lexikalischen Fähigkeiten geht. Denn dies würde nicht nur den Druck erhöhen, sondern vor allem dazu führen, dass die Kinder schwierige bzw. unsicher beherrschte sprachliche Mittel vermeiden, indem sie zum Beispiel komplizierte Inhalte nicht oder nur unvollständig wiedergeben (vgl. z.B. Kleppin 2008: 34–35; Landua, Maier-Lohmann & Reich 2008: 196). So fällt z.B. Lütke (2008: 165) in ihrer Analyse mündlicher Erzählungen von Grundschülern mit Deutsch als Zweitsprache auf, dass „sprachlich komplexe Handlungsverläufe zugunsten einfacherer Darstellungen verändert werden“ (vgl. auch Lütke 2010b: 39). Es ist also keineswegs so, wie man zunächst naiv annehmen könnte, daß ein Lerner in jeder Situation sein 'Bestes gibt', das heißt, daß er immer auch von den erworbenen grammatischen Kenntnissen der Zweitsprache vollen Gebrauch macht. Er kann vielmehr, sofern dadurch seine Kommunikationsinteressen nicht behindert werden, sein grammatisches Wissen nur zum Teil aktivieren. Dabei hängt es von externen Faktoren ab, sowie von der jeweiligen Orientierung des Lerners, ob damit ein Gewinn an Expressivität angestrebt wird, ob Normverstöße in Kauf genommen werden, oder nicht, und so fort. (Clahsen, Meisel & Pienemann 1983: 93–94)

In Bezug auf die Erfassung formalsprachlicher Genauigkeit ist im Rahmen des vorliegenden Verfahrens deshalb bewusst keine Augenscheinvalidität gegeben.

Evaluierung: Prüfung der Gütekriterien | 315

Strukturelle bzw. faktorielle Validität Die Skalen Elaborierte Sprachverwendung, Fehlerschwerpunkte der Nominalflexion und Lexikalisch-semantische Unsicherheiten basieren auf den Hauptfaktoren der in Kap. 6.6.3.3 durchgeführten explorativen Faktorenanalyse, so dass strukturelle bzw. faktorielle Validität gegeben ist. Die Skala Formalsprachliche Abweichungen (Grammatik) ließ sich aufgrund der Heterogenität des zugrundeliegenden Merkmals und der zugehörigen Items nicht als Hauptfaktor abbilden (vgl. Kap. 6.6.3.4). Die Konstruktion der Skala erfolgte deshalb primär auf der Grundlage theoretischer Überlegungen. Zum Nachweis der strukturellen Validität dieser Skala werden die Testwerte der Hauptskalen Lexikalisch-semantische Unsicherheiten, Formalsprachliche Abweichungen (Grammatik) und Elaborierte Sprachverwendung in einer explorativen Faktorenanalyse untersucht 108. Da alle Testwerte Facetten des übergeordneten Merkmals produktiver, medial mündlicher schulsprachliche Kompetenz erfassen sollen, ist zu erwarten, dass alle Testwerte auf demselben Faktor hoch laden. Dabei sollte sich die Korrelationsrichtung (positive vs. negative Korrelation) bei dem positiv gepolten Testwert und den negativ gepolten Testwerten unterscheiden. Das Ergebnis der Hauptkompontenanalyse ist eine 1Faktorenlösung, die diesen Erwartungen voll entspricht (vgl. Tab. 59): 107F

Tab. 59. Faktorenanalyse mit den Testwerten der 3 Hauptskalen Faktor Elaborierte Sprachverwendung Lexikalisch-semantische Unsicherheiten Formalsprachliche Abweichungen (Grammatikfehler) ohne Items aus Skala Lexikalisch-semantische Unsicherheiten

1 -,801 ,843 ,672

Kriteriumsvalidität Zum Nachweis der Kriteriumsvalidität sollen die Testwerte einiger der in BeFo eingesetzten Tests als Außenkriterien verwendet werden, um konvergente bzw. || 108 Der Testwert der Skala Fehlerschwerpunkte der Nominalflexion wird nicht berücksichtigt, da die dazugehörigen Variablen auch in der Skala Formalsprachliche Abweichungen (Grammatik) enthalten sind. Weiterhin wird für die Skala Formalsprachliche Abweichungen (Grammatik) ein Testwert verwendet, der OHNE die Items fehlende Determinierer, fehlende Präpositionen und fehlende Prädikatsteile berechnet wurde, da diese Variablen auch in der Skala Lexikalischsemantische Unsicherheiten enthalten sind (vgl. Kap. 6.6.3.4 , Tab. 51) und doppelt verwendete Items das Ergebnis verzerren könnten.

316 | Entwicklung eines empirischen Verfahrens zur Evaluation von Fördereffekten divergente Validität nachzuweisen (vgl. Kap. 6.1.3). Zwar gibt es bislang kein Verfahren, das das- bzw. dieselbe/n Merkmal/e erfasst (vgl. Kap. 5.2), doch wurden in BeFo weitere Instrumente eingesetzt, die sowohl sprachliche als auch nicht-sprachliche Bereiche erfassen und daher als Außenkriterien verwendet werden können: – – – – –

BeFo-Grammatiktest (Gesamtergebnis) BeFo-Grammatiktest (Subskala Kasus) ELFE (Leseverstehen, Gesamtergebnis), Lenhard (2006) WWT (Wortschatz, Gesamtergebnis), Glück (2011) DEMAT (Mathematisches Verständnis, Gesamtergebnis), Gölitz (2004)

Außerdem: – Parameter D (Wortschatzdiversität) (vgl. Kap. 6.5.2.5) Sollten sich signifikante Zusammenhänge zwischen den Ergebnissen der sprachlichen Tests und den Testwerten des vorliegenden Verfahrens nachweisen lassen, liegt Übereinstimmungsvalidität vor (vgl. Kap. 6.1.3). Dabei sollten die Korrelationen mit den Ergebnissen der sprachlichen Tests nicht hoch ausfallen (schwach konvergent). Denn auch wenn grundsätzlich Zusammenhänge zwischen Wortschatz- und Grammatikentwicklung angenommen werden (vgl. Kap. 3.4.1.1), kann nicht automatisch von einem sprachlichen Teilbereich oder Register auf einen anderen Teilbereich bzw. ein anderes Register geschlossen werden (Gogolin 2010: 1312). Das vorliegende Verfahren erfasst einen speziellen Teilbereich sprachlicher Kompetenz, der in dieser Form nicht Gegenstand der anderen eingesetzten Tests ist. Vor allem die unterschiedlichen Realisierungsformen (frei + mündlich vs. geschlossen + schriftlich) sowie Unterschiede in Bezug auf produktive und rezeptive Fähigkeiten sollten sich in den Ergebnissen dadurch zeigen, dass die Korrelationen nur schwach ausfallen. In Bezug auf den BeFo-Grammatiktest ist darauf hinzuweisen, dass die Validierung dieses Verfahrens noch nicht abgeschlossen ist, so dass es sich nur bedingt als Außenkriterium eignet. Weiterhin fällt auf, dass die Testwerte dieses Verfahrens hoch mit den Ergebnissen des Wortschatz- und des Lesetests korrelieren (vgl. Tab. 60), was auf das schriftliche Format dieser Verfahren zurückzuführen sein dürfte. In Bezug auf die Skala Formalsprachliche Abweichungen (Grammatik) ist daher trotz der Orientierung beider Verfahren auf grammatikalische Fähigkeiten mit eher niedrigen Korrelationen zu rechnen.

Evaluierung: Prüfung der Gütekriterien | 317 Tab. 60. Korrelation der BeFo-Grammatiktestwerte mit ELFE, DEMAT und WWT

BeFoGrammatiktest, gesamt BeFoGrammatiktest, Kasus

BeFoGrammatiktest, gesamt

BeFoGrammatiktest, Kasus

ELFE (Leseverstehen)

1

,806**

,654**

DEMAT WWT (Wort(Mathematischatz) sches Verständnis) ,413** ,628**

,806**

1

,542**

,366**

,538**

Da bis auf den DEMAT-Test alle Verfahren auf die Erfassung von Sprachkompetenz – wenn auch auf unterschiedliche Dimensionen von Sprachkompetenz – ausgerichtet sind, sollten sich trotz dieser Einschränkungen signifikante Zusammenhänge nachweisen lassen. Außerdem sollten sich die Erwartungen hinsichtlich der Polung der Korrelationen (positiv vs. negativ) bestätigen lassen. In den folgenden Übersichten werden für alle Testwerte des vorliegenden Verfahrens die Erwartungen hinsichtlich konvergenter bzw. divergenter Validität und Polung der Korrelationen mit den Außenkriterien zusammengefasst. Tab. 61. Erwartete Korrelationen für den Testwert der Skala Elaborierte Sprachverwendung Elaborierte Sprachverwendung Erwartungen hinsichtlich konvergenter bzw. divergenter Validität BeFo-Grammatiktest (Gesamtergebnis) konvergent BeFo-Grammatiktest (Subskala Kasus) konvergent ELFE (Leseverstehen, Gesamtergebnis) konvergent WWT (Wortschatz, Gesamtergebnis) konvergent Parameter D (Wortschatzdiversität) konvergent DEMAT (Mathematisches Verständnis) divergent Testwert

erwartete Polung der Korrelationen

positiv positiv positiv positiv positiv -

318 | Entwicklung eines empirischen Verfahrens zur Evaluation von Fördereffekten

Tab. 62. Erwartete Korrelationen für den Testwert der Skala Lexikalisch-semantische Unsicherheiten Lexikalisch-semantische Unsicherheiten Erwartungen hinsichtlich konvergenter bzw. divergenter Validität BeFo-Grammatiktest (Gesamtergebnis) konvergent* BeFo-Grammatiktest (Subskala Kasus) konvergent* ELFE (Leseverstehen, Gesamtergebnis) konvergent WWT (Wortschatz, Gesamtergebnis) konvergent Parameter D (Wortschatzdiversität) divergent** DEMAT (Mathematisches Verständnis) divergent Testwert

erwartete Polung der Korrelationen

negativ negativ negativ negativ -

* Die Erwartung konvergenter Validität ergibt sich hier aus zwei Gründen. Erstens scheinen auch die BeFoGrammatiktest-Skalen lexikalische Fähigkeiten zu erfassen (vgl. Tab. 60), und zweitens enthält die Skala Lexikalisch-semantische Unsicherheiten Items, die auch grammatikalische Fähigkeiten betreffen (fehlende Determinierer, fehlende Präpositionen und fehlende Prädikatsteile). ** Die Erwartung divergenter Validität ergibt sich aus der Annahme, dass sich der Zusammenhang dieser Testwerte in Abhängigkeit von Kompetenzstand und Einsatz von Vermeidungsstrategien unterscheiden dürfte. So ist anzunehmen, dass bei fortgeschrittenen Lernern eine ausgeprägte Wortschatzvielfalt (Parameter D) negativ mit der Zahl lexikalisch-semantischer Abweichungen bzw. dem Testwert Lexikalischsemantische Unsicherheiten korreliert. Bei Schülern mit lexikalisch-semantischen Defiziten ist jedoch erwartbar, dass der Versuch, die Filminhalte durch viele, möglichst genaue (Fach-)begriffe differenziert wiederzugeben, dazu führt, dass vermehrt abweichende Lexeme produziert werden (= positive Korrelation). Diese Zusammenhänge werden durch die Relativierung des Testwerts am Testwert der Skala Elaborierte Sprachverwendung zwar verringert (vgl. Kap. 6.6.3.6), dürften aber in abgeschwächter Form weiterhin vorhanden sein. Da also kein einfacher linearer Zusammenhang zwischen diesen beiden Testwerten anzunehmen ist, wird divergente Validität angenommen.

Tab. 63. Erwartete Korrelationen für die Testwerte Formalsprachliche Abweichungen (Grammatik) und Fehlerschwerpunkte Nominalflexion Formalsprachliche Abweichungen (Grammatik) und Fehlerschwerpunkte der Nominalflexion Testwert Erwartungen hinsicht- erwartete Polung lich konvergenter der Korrelationen bzw. divergenter Validität BeFo-Grammatiktest (Gesamtergebnis) konvergent negativ BeFo-Grammatiktest (Subskala Kasus) konvergent negativ ELFE (Leseverstehen, Gesamtergebnis) konvergent* negativ WWT (Wortschatz, Gesamtergebnis) konvergent* negativ Parameter D (Wortschatzdiversität) divergent DEMAT (Mathematisches Verständnis) divergent -

Evaluierung: Prüfung der Gütekriterien | 319 * Die Erwartung konvergenter Validität ergibt sich aus der Annahme, dass die in den Skalen enthaltenen Items teilweise gleichzeitig grammatikalische und lexikalische Aspekte erfassen (z.B. fehlende Determinierer und fehlende Präpositionen, vgl. Kap. 6.6.3.4). Weiterhin ist anzunehmen, dass gute grammatikalische Kompetenzen sich positiv auf das Leseverstehen auswirken. Aufgrund der sehr unterschiedlichen Prozesse von Produktion und Rezeption, über deren Zusammenhang zudem wenig bekannt ist, ist jedoch mit keinen hohen Korrelationen zu rechnen.

In Tab. 64 werden die ermittelten Korrelationen nach Pearson zusammengefasst. Dabei sind die Korrelationen, die den Erwartungen in Tab. 61-Tab. 63 entsprechen, grau unterlegt. Die Korrelationen auf weißem Hintergrund widersprechen den Erwartungen. Tab. 64. Korrelation der Testwerte des vorliegenden Verfahrens mit Außenkriterien BeFoBeFoELFE-Test Grammatik- Grammatik- (Lesetest, gesamt test, Kasus verständnis) ,283** ,267** ,219**

DEMATTest (Mathe)

WWT-Test (Wortschatz)

,136

,327**

Parameter D (Wortschatzdiversität) ,331**

-,283**

-,194*

-,148

-,289**

-,066

-,182*

-,156

-,138

-,174*

-,050

-,188*

-,180*

-,070

-,305**

-,146

Elaborierte Sprachverwendung Formalsprachliche -,271** Abweichungen (Grammatik) Fehlerschwer-,136 punkte der Nominalflexion Lexikalisch-,229** semantische Unsicherheiten

Wie erwartet lassen sich signifikante Zusammenhänge nachweisen, die auch hinsichtlich der Polung in fast allen Fällen den Erwartungen entsprechen (= grauer Hintergrund). Weiterhin bestätigt sich bezogen auf den Test zum mathematischen Verständnis (DEMAT) die Erwartung divergenter Validität. Die Höhe der Korrelationen fällt erwartungsgemäß niedrig aus. Die Korrelation des Testwerts Formalsprachliche Abweichungen (Grammatik) mit dem WWTTestwert ist vermutlich vor allem auf die Items fehlende Determinierer, fehlende Präposition und fehlende Prädikatsteile zurückzuführen, die neben grammatikalischen auch lexikalische Aspekte erfassen. Grundsätzlich bestätigt sich dadurch die Annahme, dass grammatikalische und lexikalische Kompetenzen miteinander in Zusammenhang stehen.

320 | Entwicklung eines empirischen Verfahrens zur Evaluation von Fördereffekten Entgegen der Erwartungen ließen sich keine signifikanten Korrelationen zwischen den Testwerten der Skala Fehlerschwerpunkte der Nominalflexion, dem Gesamtergebnis des BeFo-Grammatiktests und dem Lesetest (ELFE) nachweisen. Auch die Korrelation mit dem Testwert der Kasus-Skala aus dem BeFoGrammatiktest fällt niedriger aus als erwartet. Hier ist anzunehmen, dass sich die Unterschiede zwischen schriftlicher und mündlicher Sprachproduktion stärker auswirken als erwartet. Weiterhin ist zu vermuten, dass die unterschiedlichen Erhebungsmethoden einen starken Einfluss ausüben. So können die Schüler die Fehlerzahl in den freien Sprachproben durch Vermeidung problematischer Strukturen stark beeinflussen, während die Items des BeFo-Tests vorgegeben sind. Die mündlichen Produktionsbedingungen üben zudem einen starken Einfluss auf die Markierungen der Nominalflexion aus, da hier viele Verschleifungen toleriert werden, die in der Schriftsprache als Normverstoß gelten. In Bezug auf den Lesetest (ELFE) wurden nur schwache Korrelationen erwartet. Offensichtlich üben die Unterschiede hinsichtlich der Sprachverarbeitungsprozesse (Rezeption von Schriftsprache vs. Produktion mündlicher Sprache) einen stärkeren Einfluss aus als angenommen. Damit entspricht das Muster der Korrelationen insgesamt den Erwartungen. Auch kann bezogen auf den Mathematiktest divergente Validität bestätigt werden. 6.6.3.8 Prüfung der Nebengütekriterien In Bezug auf Kodierung und Auswertung sind vor allem die Nebengütekriterien Normierung, Vergleichbarkeit, Ökonomie, Nützlichkeit, Fairness und NichtVerfälschbarkeit bedeutsam (vgl. Kap. 6.1.3). Wie bereits im Zusammenhang mit der Prüfung der Interpretationsobjektivität dargestellt, wurde das vorliegende Verfahren bisher nicht normiert (vgl. Kap. 6.6.3.2). Für Vergleiche innerhalb der Stichprobe, wie sie zum Zwecke der Evaluation von Fördereffekten durchgeführt werden, sind normierte Referenzwerte einer Eichstichprobe jedoch auch nicht erforderlich. In Bezug auf das Kriterium der Vergleichbarkeit liegen aufgrund des aufwändigen Elizitierungs- und Auswertungsverfahrens weder parallele Testformen vor (vgl. Kap. 6.6.3.5) noch existieren andere Verfahren, die dasselbe Merkmal erfassen würden (vgl. Kap. 5.2). Im Rahmen der Kriteriumsvalidierung konnte jedoch konvergente Validität mit einigen anderen Sprachtests nachgewiesen werden. Das Kriterium der Vergleichbarkeit ist somit nur eingeschränkt erfüllt. Schwierig zu beurteilen ist das Kriterium der Ökonomie. Mit insgesamt 45– 70 min/Transkript ist die Kodierung als relativ aufwändig einzustufen (vgl. Kap. 6.5.2, Abb. 30). Hinzu kommen weitere 15 min/Transkript für die Auszählung

Evaluierung: Prüfung der Gütekriterien | 321

und Eingabe der Daten (vgl. Kap. 6.5.2.5). Zu beachten ist jedoch, dass sich prozedurale Fähigkeiten (Sprachkönnen) gerade in Bezug auf mündliche Sprachfähigkeiten nur anhand einer freier Sprachproben erfassen lassen. Diese auszuwerten ist grundsätzlich aufwändiger als die Auswertung geschlossener Testformate. Aufgrund des lückenhaften Forschungsstandes musste außerdem ein teilweise induktiv-exploratives Vorgehen eingesetzt werden, bei dem im Vorfeld nicht gesagt werden konnte, ob sich alle berücksichtigten Merkmale eignen würden. Die Ergebnisse der Häufigkeitsanalyse und Güteprüfung zeigen, dass sich viele Kategorien zusammenfassen lassen und einige Variablen verworfen werden mussten, weil sie sich nicht objektiv kodieren ließen. Eine entsprechende Überarbeitung könnte zu einer Vereinfachung des Kodierverfahrens führen, die auch den zeitlichen Aufwand verringern würde. Insgesamt ist der Aufwand jedoch angesichts der großen Zahl der erfassten Phänomene angemessen, weil auf diese Weise eine größere Validität und Nützlichkeit erreicht werden. Der mehrschrittige Kodiervorgang stellt zudem eine optimale Nutzung kognitiver Ressourcen auf Seiten der Kodierer dar und ermöglicht teilweise das parallele Kodieren desselben Transkripts unter unterschiedlichen Perspektiven und durch verschiedene Rater. Die Nützlichkeit des Verfahrens ergibt sich aus der Notwendigkeit, Effekte von Sprachfördermaßnahmen empirisch zu evaluieren und den diversen Desiderate in diesem Bereich (vgl. Kap. 1 und Kap. 5.2). Weiterhin wird durch das standardisierte Kodier- und Auswertungsverfahren keine Gruppe systematisch benachteiligt (Fairness). In diesem Zusammenhang ist die Wichtigkeit der Relativierung der negativ gepolten Testwerte am positiv gepolten Testwert der Skala Elaborierte Sprachverwendung hervorzuheben, da andernfalls risikobereite ‚Vielsprecher‘, die trotz sprachlicher Defizite versuchen, die Aufgabenstellung möglichst gut zu erfüllen, gegenüber vorsichtigen Schülern, die riskante Strukturen vermeiden, benachteiligt würden (vgl. Kap. 6.6.3.6). Dies ist auch in Bezug auf das Nebengütekriterium der Nicht-Verfälschbarkeit bedeutsam. Denn auch wenn es in der Spontansprache möglich ist, das Testergebnis der negativ gepolten Skalen positiv zu beeinflussen, indem unsicher beherrschte Strukturen und damit Fehler vermieden werden, so führt dies gleichzeitig zu einem niedrigerem Testwert der Skala Elaborierte Sprachverwendung. Bei der Beurteilung der Fördereffekte sind deshalb immer sowohl die negativ gepolten Testwerte als auch der positiv gepolte Testwert zu berücksichtigen.

322 | Diskussion

7 Diskussion 7.1 Zusammenfassung Ausgangspunkt der vorliegenden Arbeit war die Feststellung, dass methodisch fundierte Evaluationen von didaktischen Maßnahmen und Programmen zur Sprachförderung im Bereich Deutsch als Zweitsprache ein großes Desiderat darstellen und für viele sprachliche Bereiche keine geeigneten Instrumente zur Erfassung von Lernerfolgen vorliegen. Besonders virulent ist dieser Bedarf für Förderkontexte im Schulalter. In den letzten Jahren wird die Wichtigkeit durchgängiger Sprachbildung über die gesamte Schullaufbahn hinweg betont. Schul- bzw. bildungssprachliche Fähigkeiten werden dabei als Schlüsselkompetenzen hervorgehoben und die Bildungsmisserfolge von Schülern mit Deutsch als Zweitsprache vor allem auf Defizite in diesem Bereich zurückgeführt. Auch wenn es sich bei Schulsprache um ein konzeptionell schriftliches Register handelt, beschränkt sich ihre Verwendung nicht auf den schriftlichen Bereich, sondern ist auch in der gesprochenen Sprache der Schule bedeutsam und stellt insbesondere für Schüler mit Deutsch als Zweitsprache eine besondere Herausforderung dar. Aktuelle Fördermaßnahmen für Kinder und Jugendliche im Schulalter wie z.B. das BeFoProjekt verfolgen daher das ausdrückliche Ziel, die schulsprachlichen Fähigkeiten der Förderschüler zu verbessern. Eine Analyse der existierenden Sprachstandsdiagnoseverfahren für den Primarbereich ergab, dass sich keines der Instrumente für die Evaluierung von DaZ-Fördereffekten im Bereich produktiver, medial mündlicher schulsprachlicher Kompetenz bzw. der für diese Kompetenz als grundlegend erachteten grammatikalischen und lexikalisch-semantischen Fähigkeiten eignet (vgl. Kap. 5.2). So sind viele der Instrumente weder ausreichend linguistisch fundiert noch erfüllen sie die notwendigen psychometrischen Voraussetzungen. Die wenigen vorliegenden validierten Verfahren für den Primarbereich arbeiten fast ausschließlich mit geschlossenen Testaufgaben, durch die sich prozedurale Sprachfähigkeiten, d.h. automatisiertes Sprachkönnen, nicht erfassen lässt. Eine wesentliche Problematik bei der Anwendung sprachstandsdiagnostischer Verfahren im Zusammenhang mit der Evaluation von Fördereffekten besteht jedoch vor allem in einer grundsätzlich anderen Zielsetzung. So geht es bei der Sprachstandsdiagnose primär um die Ermittlung individueller Sprachent-

Zusammenfassung | 323

wicklungsstände und -verläufe, während Förderevaluationen überindividuelle Lerneffekte erfassen sollen, die sich auf die Förderintervention zurückführen lassen. Um möglichst belastbare Ergebnisse zu erzielen, sind letztere auf standardisierte, quantifizierende Verfahren angewiesen. Im Gegensatz dazu bedingt die Ausrichtung auf individuelle Sprachentwicklungsprozesse der meisten sprachstandsdiagnostischen Verfahren und der Spracherwerbsforschung insgesamt eher individualisierte qualitative Herangehensweisen. Die Entwicklung geeigneter Instrumente zur Erfassung von Fördereffekten speziell im Bereich prozeduraler Sprachfähigkeiten (freie Sprachproduktion) stellt aus den genannten Gründen ein dringendes Desiderat dar. Ziel der vorliegenden Arbeit war es daher, ein Instrument zu entwickeln, das Fördereffekte in Bezug auf die gesprochene Schulsprache fortgeschrittener DaZ-Lerner im Primarschulalter (mind. 3–4 Kontaktjahre mit der deutschen Sprache) abbildet, wobei vor allem Kompetenzzuwächse im Bereich des prozeduralen Sprachwissens bzw. -könnens erfasst werden sollten. Der Fokus liegt dabei auf lexikalischen und morpho-syntaktischen Phänomenen, da die linguistische Grundlangenforschung in diesen Bereichen am weitesten fortgeschritten ist und zudem die meisten Sprachfördermaßnahmen Kompetenzzuwächse im Bereich des Wortschatzes und der Grammatik anstreben. Darüber hinaus stellen die Beherrschung der Kerngrammatik und grundlegende lexikalisch-semantisch Fähigkeiten wesentliche Voraussetzungen für schulsprachliche Kommunikation dar. Es sei hier erneut betont, dass sich schulsprachliche Kompetenz natürlich nicht auf diese Bereiche beschränkt, sondern auch spezifische narrative bzw. diskursive und pragmatische Fähigkeiten umfasst. Zu diesen Bereichen liegen mit Bezug zur Schul- bzw. Bildungssprache bislang jedoch keine umfassenden empirischen Forschungsarbeiten vor. Zur Entwicklung des geplanten Evaluationsinstruments wurden deduktive und induktive Herangehensweisen integriert. Bei der Aufarbeitung des Forschungsstandes hinsichtlich Konzeptualisierung und Merkmalsbeschreibung gesprochener Schulsprache zeigte sich, dass bislang weder eine umfassende theoretische Modellierung noch eine empirisch ausreichend fundierte Beschreibung der charakteristischen sprachlichen Merkmale dieses Registers vorliegen. Auch in Bezug auf den Erwerb des Deutschen als Zweitsprache fortgeschrittener Lerner wurden in vielen Bereichen Desiderate festgestellt. Bei der Auswahl der zu berücksichtigenden sprachlichen Merkmale wurden deshalb deduktive und induktive Herangehensweisen kombiniert. Aufgrund des lückenhaften Forschungsstandes war im Vorfeld keine eindeutige Aussage über die Zugehörigkeit der kodierten Merkmale zu übergeordneten Dimensionen (schul-)sprachlicher Kompetenz möglich. Mithilfe einer explorativen Faktorenanalyse konnten jedoch auf rechnerischem Wege drei

324 | Diskussion Hauptkomponenten identifiziert werden, die sich auch inhaltlich interpretieren ließen. Die auf dieser Grundlage konstruierten Skalen erfassen folgende Merkmale: 1. 2. 3.

Elaborierte Sprachverwendung Lexikalisch-semantische Unsicherheiten Fehlerschwerpunkte der Nominalflexion

Darüber hinaus wurde eine theoretisch begründete Skala Formalsprachliche Abweichungen (Grammatik) gebildet, die alle Grammatik-Fehlervariablen integriert. Für alle Skalen konnte eine ausreichende Reliabilität (.56-.83) nachgewiesen werden. Weiterhin wurden die für die Skalen berechneten Testwerte erfolgreich hinsichtlich Objektivität und Validität geprüft. Damit ist es gelungen, erstmals ein Verfahren zu entwickeln, das wesentliche Teilbereiche produktiver, medial mündlicher schulsprachlicher Kompetenz von Primarschülern mit Deutsch als Zweitsprache bzw. entsprechende Defizite verlässlich erfasst. Um Effekte von Sprachfördermaßnahmen zu untersuchen, muss das Verfahren mit den zu untersuchenden Schülern einmal vor und einmal nach der Förderintervention durchgeführt werden. Mögliche Fördereffekte können dann mittels Verfahren zur Prüfung von signifikanten Gruppenunterschieden (z.B. tTest, ANOVA etc.) nachgewiesen werden. Im Folgenden sollen zunächst die theoretischen Grundlagen zusammenfassend diskutiert werden, bevor das methodische Vorgehen zur Entwicklung und Evaluierung des vorliegenden Instruments sowie die entsprechenden Ergebnisse reflektiert werden.

7.2 Diskussion der theoretischen Grundlagen Insgesamt existieren nur wenige theoretische und empirische Arbeiten zur Beschreibung und Charakterisierung der sprachlichen Merkmale von Schulsprache, geschweige denn der Besonderheiten gesprochener Schulsprache. Eine umfassende Konzeptualisierung dieses Registers steht also noch aus. Einigkeit herrscht jedoch dahingehend, dass es sich um ein formelles, konzeptionell schriftliches bzw. distanzsprachliches Register handelt. Eine Besonderheit gesprochener Schulsprache ergibt sich dabei aus der medial mündlichen Realisierungsform eines konzeptionell schriftlichen Registers. Aufbauend auf diesen Überlegungen wurde der Versuch unternommen, das Register gesprochene Schulsprache basierend auf aktuellen Nähe-Distanz-

Diskussion der theoretischen Grundlagen | 325

Modellierungen der Gesprochene-Spache-Forschung und unter Berücksichtigung der Zielgruppe DaZ-Lerner im Primarschulalter konzeptionell zu beschreiben (vgl. Kap. 2.3.5). Das auf Koch & Oesterreicher (1985) aufbauende Modell von Ágel & Hennig (2006a) stellt die bislang differenzierteste Modellierung von Nähe- bzw. Distanzsprache dar. Dabei bietet vor allem die Unterscheidung verschiedener übergeordneter Parameter einen hilfreichen Erklärungsrahmen für nähe- und distanzsprachlicher Merkmale. Da es den Autoren jedoch primär um prototypische Nähe- bzw. Distanzsprache geht, sind die konkret genannten sprachlichen Mittel nur bedingt hilfreich, wenn es um die Merkmale gesprochene Schulsprache von DaZ-Primarschülern geht. Denn zum einen orientieren sich Ágel & Hennig (2006a) an der Sprache kompetenter Erwachsener mit Deutsch als Erstsprache, zum anderen handelt es sich bei gesprochener Schulsprache durch ihre mediale Mündlichkeit und zugleich konzeptionelle Schriftlichkeit weder um prototypische Nähe- noch um prototypische Distanzsprache. In diesem Zusammenhang ist der medial-extensionale Ansatz von Fiehler et al. (2004) passender, bei dem zunächst die mediale Realisierungsform zur Unterscheidung von Mündlichkeit und Schriftlichkeit herangezogen und weiterhin darauf hingewiesen wird, dass es die gesprochene Sprache nicht gibt, „sondern immer nur gesprochene Sprache im Kontext bestimmter kommunikativer Praktiken“ (Fiehler et al. 2004: 22). Auch gesprochene Schulsprache in der Primarstufe ist als eine bestimmte kommunikative Praktik zu verstehen, die sich in Abhängigkeit von der konkreten Kommunikationssituation (z.B. Diskussion im Plenum, Präsentation, Erzählung/Bericht, Beschreibung etc.) z.T. deutlich hinsichtlich ihrer sprachlichen Merkmale unterschieden kann. In Kap. 2.3.5 wurde der Versuch einer Konzeptualisierung gesprochener Schulsprache von Primarschülern unternommen, bei der die verschiedenen Ebenen und Parameter des Nähe-Distanz-Modells von Ágel & Hennig (2006a) den theoretischen Rahmen für die Beschreibung der Spezifika der kommunikativen Praktik gesprochene Schulsprache darstellten. Als ursächlich für die besonderen Herausforderungen im Zusammenhang mit schul- bzw. distanzsprachlicher Kommunikation konnten bezogen auf die Ebenen II-IV (vgl. Kap. 2.3.2) bestimmte außersprachliche Kommunikationsbedingungen und Diskursmerkmale identifiziert werden, die eine monologische, dekontextualiserte, d.h. symbolische Sprachverwendung erfordern, welche den besonderen Anforderungen der Institution Schule entsprechen muss. Zu letzteren zählen insbesondere eine eingeschränkte Themenwahl (Themenfixierung) und die Verwendung der Standarsprache. Bezogen auf die fünf Parameter des Nähe-Distanz-Modells von Ágel & Hennig (2006a) sind für gesprochene Schulsprache in der Primarstufe sowohl

326 | Diskussion nähe- als auch distanzsprachliche Merkmale erwartbar. So ist durch den monologischen Charakter prototypischer schulsprachlicher Kommunikationssituationen (z.B. in Form von Berichten, Nacherzählungen oder Präsentationen) die Verteilung der Rollen Sprecher und Zuhörer stabil (Rollenparameter). Für die Diskursgestaltung bedeutet dies vor allem, dass die Äußerungen vom Sprecher allein produziert werden müssen und gemeinsame Konstruktionen wie „Warum geht Herr Müller weg? – Weil er sauer ist“ nicht möglich sind. Auch muss der thematische Kontext durch den Sprecher allein hergestellt werden und kann nicht durch Produzent und Rezipient gemeinsam aufgebaut und abgeglichen werden. Auf sprachlicher Ebene erfordert dies die Verwendung elaborierter lexikalischer und grammatikalischer Mittel. Auch in Hinblick auf den Situationsparamter sind durch die Situationsentbindung schulsprachlicher Kommunikationssituationen distanzsprachliche Merkmale erwartbar, wobei diese natürlich in Abhängigkeit vom Ausmaß der tatsächlichen Dekontextualisierung variieren. Ist kein gemeinsamer situativer Kontext gegeben, müssen deiktische Begriffe durch Ausdrücke des Symbolfelds ersetzt und alle Inhalte und Bezüge symbolisch, d.h. verbal ausgedrückt werden. Die inhaltliche Genauigkeit und Verständlichkeit von Äußerungen ist dabei weitgehend von ihrer grammatikalischen Integrativität und Elaboriertheit abhängig. Bezogen auf die Parameter des Codes und des Mediums sind neben distanzsprachlichen auch nähesprachliche Merkmale anzunehmen. So können nonverbale Mittel wie z.B. Gesten, die ein typisches Merkmale nähesprachlicher Kommunikation sind, in typischen schulsprachlichen Kommunikationssituationen nur teilweise unterstützend eingesetzt werden. Andererseits spielen Prosodie, Gestik und Mimik im Sinne der Multimodalität natürlich auch in bildungssprachlichen Kommunikationssituationen eine wichtige Rolle. Phonologische Besonderheiten wie Assimilationen (z.B. Mädschen), Elisionen (z.B. nich, sie warn, wir ham, siehste, Ich seh ein Jung etc.) und Enklisen bzw. Klitisierungen (aufm, fürs etc.) können auf die medial mündliche Realisierungsform und die entsprechenden artikulatorischen Bedingungen zurückgeführt werden und sind daher auch in der gesprochenen Schulsprache erwartbar. Eindeutig nähesprachliche Merkmale im Kontext gesprochener Schulsprache sind jedoch hinsichtlich des Zeitparameters zu erwarten, da aufgrund der medial mündlichen Realisierungsform Planung und Produktion der Äußerungen zeitgleich (online) ablaufen müssen. Aufgrund der eingeschränkten kognitiven Kapazitäten ist daher z.B. mit aggregativen Strukturen an den Satzrändern zu rechnen ist (traditionell: Linksversetzung, Herausstellung, Expansion). Auch Abbrüche (Anakoluthe), Apokoinukonstruktionen, Kontaminationen, Satzverschränkungen und die Verwendung

Diskussion der theoretischen Grundlagen | 327

von Allroundsubjunktionen (für Beispiele vgl. Kap. 2.3.5) werden auf die beschränkten Planungskapazitäten zurückgeführt. Weitere Merkmale, die auf die Zeitlichkeit mündlicher Produktionen zurückgeführt werden, betreffen Reparaturverfahren mit Korrektursignalen, Wiederholungen und Neuansätzen. Weiterhin werden einfache, weniger komplexe Einheiten bevorzugt und Zeitgewinnungsverfahren wie Heckenausrücke (z.B. so was wie, Dings) und Verzögerungssignale (z.B. äh, hm) eingesetzt. Insgesamt scheint die Zeitgebundenheit vor allem Einfluss auf die syntaktische Prozessierung zu haben. Welche syntaktischen Einheiten für die gesprochene Sprache grundlegend sind, wird deshalb kontrovers diskutiert. Weitgehende Einigkeit besteht jedoch darin, dass die Kategorie Satz in der gesprochenen Sprache eine deutlich geringere Rolle spielt als in der Schriftsprache. Auch für die Beschreibung und Analyse gesprochener Schulsprache ist die Einheitenfrage daher nicht eindeutig zu beantworten. Da die Gleichzeitigkeit von Planung und Produktion gerade für junge Sprecher im Primarschulalter eine enorme kognitive Beanspruchung darstellt, ist jedoch in jedem Fall mit Einheiten zu rechnen, die den Wohlgeformtheitsbedingungen des geschriebenen Satzes nicht entsprechen, ohne dass dies als Normverstoß empfunden würde. Bei Strukturen, die von der schriftsprachlichen Norm abweichen, ist grundsätzlich zu klären, ob sie im Kontext gesprochener Schulsprache ebenfalls als Normverstoß empfunden werden. In diesem Zusammenhang wurde in Kap. 2.3.3 diskutiert, ob für gesprochene und geschriebene Sprache das gleiche zugrundeliegende Regelsystem angenommen werden kann, oder ob von unterschiedlichen Sprachsystemen auszugehen ist. Basierend auf Coserius‘ Differenzierung von Rede, Norm und System unterscheidet Hennig (2006) zwischen systembedingten (regelhaften) und performanzbedingten (erklärbaren) Phänomenen gesprochener Sprache, wobei sie nur für die erstgenannten ein anderes zugrundeliegendes Teilsystem annimmt (Grammatik des System bzw. der Norm für die gesprochene Sprache). Für weite Teile der Grammatik und bei Fiehler (2008b) auch der Lexik werden dagegen gemeinsame Regelmengen postuliert. Da es sich bei gesprochener Schulsprache um ein konzeptionell schriftliches Register handelt, kann davon ausgegangen werden, dass die Regeln der Schriftsprache hier weitgehend Gültigkeit besitzen. Nur die sprachlichen Phänomene, die aufgrund der Zeitlichkeit mündlicher Sprachproduktion von der schriftsprachlichen Norm abweichen, sind ebenso wie die beschriebenen artikulationsbedingten phonologischen Besonderheiten als performanzbedingte Abweichungen erwartbar und zumindest teilweise im Coseriu‘schen Sinne als normal einzustufen. Die in der Gesprochene-Sprache-Forschung entwickelten Modellierungen von Mündlichkeit und Schriftlichkeit stellen vor allem in Bezug auf die

328 | Diskussion außersprachlichen Kommunikationsbedingungen und übergeordneten Diskursverfahren einen nützlichen theoretischer Rahmen zur Charakterisierung gesprochener Schulsprache dar. Die Beschreibung konkreter sprachlicher Mittel von Distanzsprache erfolgt bei Ágel & Hennig (2006a) dagegen nur exemplarisch und unvollständig. Auch fehlen empirische Nachweise zur tatsächlichen Relevanz der von Ágel & Hennig (2006a) genannten distanzsprachlichen Merkmale. Diese Desiderate sind u.a. darauf zurückzuführen, dass sich das Interesse der Gesprochenen-Sprache-Forschung auf die spezifischen Merkmale prototypischer Nähesprache konzentriert. Ergänzend zu diesen theoretischen Ansätzen wurden die empirischen Arbeiten bzw. Forschungsüberblicke von Gogolin & Roth (2007), Hövelbrinks (2013), Vollmer & Thürmann (2010), Schleppegrell (2001) und Snow & Uccelli (2009) zur Identifizierung konkreter sprachlicher Merkmale von Schul- bzw. Bildungssprache diskutiert und hinsichtlich ihrer Ergebnisse verglichen. Übereinstimmend werden darin Merkmale morpho-syntaktischer Komplexität sowie lexikalischer Dichte, Spezifik und Vielfalt und bestimmte grammatikalische Mittel wie Konjunktiv- und Passivstrukturen ermittelt (für die vollständige Liste vgl. Kap. 2.3.5, Tab. 10). Auch wenn damit nur ein kleiner Teil schulsprachlicher Merkmale beschrieben ist und weitere empirische Arbeiten zur Untersuchung der Charakteristika von Schul- bzw. Bildungssprache erforderlich sind, scheinen sich die genannten Phänomene immer wieder in schulsprachlichen Produktionen beobachten zu lassen, so dass sie sich als Indikatoren schulsprachlicher Kompetenz anbieten. Eine wesentliche Voraussetzung schulsprachlicher Kommunikation ist die Beherrschung der Kerngrammatik entsprechend der deutschen Standardsprache, da diese die Grundlage einer elaborierten, symbolischen Diskursgestaltung im Sinne distanzsprachlicher Sprachproduktion darstellt. In Bezug auf Primarschüler mit Deutsch als Zweitsprache konnte in diversen Untersuchungen gezeigt werden, dass diese Voraussetzung in vielen Fällen nicht gegeben ist (vgl. Kap. 2.4.1 und 3.4). Fortschritte im Bereich schulsprachlicher Kompetenz bedeuten zumindest bei schwachen Lernern also zunächst Fortschritte hinsichtlich ihrer ziel- bzw. standardsprachlichen Fähigkeiten. In Bezug auf die Frage, was (gesprochene) Standardsprache und in diesem Zusammenhang auch Sprachnormen sind, existieren verschiedene Definitionen, wobei die meisten Ansätze Standardsprache mit Schriftsprache assoziieren. Mündlichkeit zeichnet sich im Gegensatz zur Schriftsprache durch Anpassungsfähigkeit und Vielfalt aus, wodurch sie kaum normierbar ist (Fiehler 2006: 1185–1186). Sprach-Kodizes wie die Duden-Grammatik, die den Anspruch erheben, die gültigen Sprachnormen festzuhalten, orientieren sich

Diskussion des neu entwickelten Evaluationsinstruments | 329

daher traditionellerweise an der Schriftsprache, wobei in die Duden-Grammatik seit 2005 auch ein Zusatzkapitel zur gesprochenen Sprache aufgenommen ist, das regelhafte Phänomene konzeptioneller Mündlichkeit behandelt. Geht es um die zielsprachlich orientierte Analyse gesprochener Schulsprache, stellt die Duden-Grammatik trotz ihrer primär schriftsprachlichen Orientierung den geeignesten Vergleichsmaßstab dar, da eine umfassende Grammatik der gesprochenen Sprache bisher nicht entwickelt wurde und sich aufgrund des konzeptionell schriftlichen Charakters gesprochener Schulsprache auch nicht als Vergleichsnorm eignen würde. Dennoch ist entsprechend der obigen Überlegungen zu den zeitlichen und artikulatorischen Bedingungen gesprochener Schulsprache mit Abweichungen vom schriftsprachlichen Standard zu rechnen, die aufgrund der mündlichen Produktionsform nicht als Normverstoß zu beurteilen sind. Im Gegensatz zur Grammatik existiert für die Bereiche Lexik und Semantik kein kodifizierter Standard. Hier kann lediglich das muttersprachliche Sprachgefühl als Maßstab dienen, was eine grundlegende Problematik für die objektive Analyse schulsprachlicher Daten darstellt. In welchen lexikalisch-semantischen und morpho-syntaktischen Bereichen bei Primarschülern mit Deutsch als Zweitsprache noch Schwierigkeiten zur erwarten sind bzw. welche Phänomene sich als Indikatoren für Erwerbsfortschritte eignen, wurde in dem Forschungsüberblick in Kap. 3.4 zusammengefasst (vgl. Tab. 15). Die empirische Forschungsgrundlage dieser Indikatoren bzw. Stolpersteine fortgeschrittener DaZ-Lerner ist jedoch als relativ dünn einzustufen, da viele Arbeiten auf sehr kleinen Stichproben oder Einzelfällen basieren und zum Großteil qualitativer Ausrichtung sind. Größer angelegte Longitudinalstudien anhand möglichst repräsentativer Stichproben stellen daher ein dringendes Desiderat der Deutsch-als-Zweitsprache-Forschung dar.

7.3 Diskussion des neu entwickelten Evaluationsinstruments 7.3.1 Diskussion des Elizitierungs- und Transkriptionsverfahrens Entsprechend der Zielsetzung, Erwerbs- bzw. Lernfortschritte im Bereich produktiver, medial mündlicher schulsprachliche Kompetenz zu erfassen, wurde ein Verfahren zur Elizitierung spontaner, schulsprachlicher Sprachproben entwickelt, pilotiert und zur Erhebung von Sprachdaten von 150 Drittklässlern mit Förderbedarf in Deutsch als Zweitsprache aus dem BeFo-Projekt (vgl. Rösch & Stanat 2011) eingesetzt.

330 | Diskussion Als maßgebliche Kommunikationsbedingungen für prototypische schulsprachliche Produktionen im Primarschulbereich wurden Situationsentbindung (bedingt v.a. durch Themenfixierung, Fremdheit der Kommunikationspartner und Institutionalität) sowie Rollenstabilität bzw. Monologizität und eingeschränkte Einsatzmöglichkeiten nonverbaler Mittel identifiziert (vgl. Kap. 6.3.1). Entsprechend dieser Kriterien wurde ein Verfahren entwickelt, bei dem den Schülern nacheinander drei tonlose Videoclips zu unterschiedlichen schulrelevanten Themen (Zivilcourage, Wasser-Experiment, Basteln von Magnetschiffen) präsentiert werden. Aufgabe der Schüler ist es, die Inhalte dieser Clips möglichst genau nachzuerzählen. Dabei sollen sie sich vorstellen, dass sie die Filme Zuhause gesehen hätten und nun ihrer bzw. einer fremden Klasse möglichst genau erzählen sollen, was sie gesehen hätten. Dabei sollen sie davon ausgehen, dass die Klasse die Filme nicht kennt. Auch die Testleiter als direkte, relativ fremde Gesprächspartner geben vor, die Filminhalte nicht zu kennen. Das Verfahren erwies sich als gut umsetzbar und führte zu monologischen Redebeiträgen der Schüler mit durchschnittlich 378 Wörtern (SD 117). Sowohl inhaltlich als auch sprachlich zeigten die späteren Analysen, dass sich die Sprachproben z.T. deutlich voneinander unterschieden. In Abhängigkeit von den sprachlichen Kompetenzen führten die schulsprachlichen Kommunikationsbedingungen also nicht immer dazu, dass die Kinder sich tatsächlich schulsprachlich ausdrückten. Aufgrund der für die Zielgruppe durchaus umfangreichen monologischen Sprachproduktionen kann jedoch davon ausgegangen werden, dass die Kinder die Aufgabenstellung prinzipiell verstanden und versucht haben, den gegebenen kommunikativen Bedingungen mit den ihnen zur Verfügung stehenden Mitteln gerecht zu werden. Ähnlich wie in der Studie von Temple, Wu & Snow (1991) schienen die Kinder aufgrund der dekontextualisierten Aufgabenstellung zu erkennen, dass insgesamt mehr Informationen versprachlicht werden müssen, was bei den schwächeren Lernern aufgrund der fehlenden sprachlichen Fähigkeiten jedoch nur zu längeren, jedoch nicht unbedingt zu elaborierteren Redebeiträgen führte. Einschränkend muss jedoch gesagt werden, dass diese Zusammenhänge nicht systematisch überprüft wurden. Für die Transkription der auf Video aufgezeichneten Sprachproben wird die Transkriptionssoftware CLAN mit dem entsprechenden CHAT-Format verwendet. Dabei sind grundlegende Transkriptionskonventionen zu befolgen, die so einfach wie möglich und so detailliert wir nötig gehalten sind (vgl. Kap. 6.4). Im Vordergrund steht entsprechend der Zielsetzung der vorliegenden Arbeit eine einheitliche Verschriftlichung lexikalischer und morpho-syntaktischer Merkmale, auf deren Grundlage eine standardsprachlich orientierte Kodierung durchgeführt werden kann.

Diskussion des neu entwickelten Evaluationsinstruments | 331

Da eine systematische Berücksichtigung prosodischer Merkmale den Zeitaufwand für die Transkription einer Sprachprobe deutlich erhöhen würde, wird bis auf die Markierung von Pausen weitgehend darauf verzichtet. Bei den meisten der zu kodierenden Merkmale stellt dies kein Problem dar. Bei der Identifizierung von Selbstkorrekturen können prosodische Informationen jedoch bedeutsam sein. Deshalb werden Wiederholungen und Selbstkorrekturen bereits im Rahmen der Transkription markiert und während der späteren Kodierung weiter analysiert und entsprechend kodiert. Auch bei der Beurteilung syntaktischer Strukturen können prosodische Merkmale relevant sein. Da die Frage nach den syntaktischen Einheiten der gesprochenen Sprache jedoch bislang nicht abschließend geklärt werden konnte und die syntaktische Gliederung in besonderem Maße durch die Zeitlichkeit mündlicher Sprachproduktion beeinflusst wird, werden nur solche Strukturen berücksichtigt, die sich auch weitgehend unabhängig von prosodischen Merkmalen analysieren lassen. Dies bedeutet natürlich nicht, dass nicht auch prosodische und syntaktische Phänomene der gesprochenen Schulsprache durch vertiefende, möglicherweise eher qualitative Untersuchungen, gezielt erforscht werden sollten. Im Rahmen der vorliegenden Arbeit war dies angesichts der lückenhaften Forschungslage und zeitlicher Beschränkungen jedoch nicht möglich. Mit durchschnittlich 90 min pro Transkription stellt die Verschriftlichung der Sprachproben den zeitlich aufwändigsten Baustein des Verfahrens dar. Im Vergleich zu anderen Forschungskontexten (v.a. Konversationsanalysen), in denen für die Transkription einer Aufnahme das 30- bis 60-fache der Dauer der Aufzeichnung gerechnet wird, ist der zeitliche Aufwand der vorliegenden Verfahrens jedoch als ökonomisch einzustufen. 7.3.2 Diskussion des Kodierverfahrens Die Auswahl der Variablen bzw. Kategorien, anhand derer die Transkripte kodiert werden, basiert auf den zuvor identifizierten Indikatoren schulsprachlicher Sprachverwendung und den Indikatoren und Stolpersteinen des DaZErwerbs fortgeschrittener Lerner. Diese wurden hinsichtlich ihrer Relevanz für die medial mündliche Kommunikationssituation des Elizitierungsverfahrens überprüft und ggfs. modifiziert bzw. verworfen. Aufgrund der lückenhaften Forschungslage wurden ergänzend zu diesem deduktiven Vorgehen die Sprachproben aus der Pilotierung des Elizitierungsverfahrens explorativ hinsichtlich weiterer auffälliger Merkmale untersucht. Darüber hinaus wurden die möglichen Indikatoren durch das Kriterium der Operationalisierbarkeit ‚gefil-

332 | Diskussion tert‘, so dass nur eindeutig identifizierbare und klassifizierbare Merkmale in dem Verfahren berücksichtigt werden (vgl. Kap. 6.5.1). Dieses aufgrund der Standardisierung notwendige Vorgehen bedeutet eine Reduzierung linguistischer Kategorien nicht nur in Bezug auf ihre Anzahl, sondern auf bezüglich ihrer Differenziertheit. So gibt es lernersprachliche Phänomene, für die bislang keine klar abgrenzbaren linguistischen Kategorien existieren, da es sich z.T. um individuelle Übergangsformen handelt, die keiner der traditionellen linguistischen Ebenen zugeordnet werden können und sich nur durch qualitative, langfristig angelegte Einzelfalluntersuchungen erforschen lassen. Als Ergebnis dieses teils deduktiven, teils induktiven Vorgehens wurden insgesamt 83 sprachliche Phänomene bzw. Variablen ausgewählt (vgl. Kap. 6.5.1.3, Tab. 24), wobei entsprechend zweier klassischer Analysemethoden der Spracherwerbsforschung zur Ermittlung von Erwerbsfortschritten sowohl zielsprachliche als auch abweichende Strukturen berücksichtigt werden (vgl. Emergenz-Kriterium, Kap. 3.3.1 und klassische Fehleranalyse, Kap. 3.3.2). Zu den besonderen Schwierigkeiten im Zusammenhang mit der klassischen Fehleranalyse zählt die Wahl eines geeigneten Vergleichsmaßstabs. Da für die Zielgruppe des vorliegenden Verfahrens angenommen werden kann, dass sich die Lerner in vielen sprachlichen Bereichen bereits in den letzten Aneignungsphasen befinden und es zudem um die Erfassung von Kompetenzzuwächsen eines konzeptionell schriftlichen Registers geht, scheint eine Orientierung an der Standardsprache angemessen. Dies ergibt sich auch aus der Annahme, dass weiten Teilen gesprochener Schulsprache dieselben grammatikalischen und lexikalischen Regelmengen zugrundeliegen wie der Schriftsprache, weshalb im Sinne Hennigs (2006) von einer Gemeinsamen Grammatik des Systems bzw. der Norm auszugehen ist (vgl. Kap. 2.3.3). Auch die Tatsache, dass im Kontext von Sprachfördermaßnahmen formale Korrektheit häufig ein ausdrückliches Ziel darstellt, spricht für einen Vergleich mit der standardsprachlichen Norm. Darüber hinaus erfordert das im Rahmen von Evaluationsstudien notwendige standardisierte Vorgehen eine kriteriale Norm bzw. ein tertium comparationis, dessen Kategorien eindeutig und klar voneinander abgrenzbar sind. Ein solches Kategorieninventar liegt in Form kodifizierter Grammatiken wie der DudenGrammatik derzeit nur für die Standardsprache vor. Doch auch wenn aus diesen Gründen ein Vergleich abweichender Produktionen mit den Normen der Zielsprache sinnvoll ist, darf dies nicht darüber hinwegtäuschen, dass dadurch bestimmte Feinheiten des Spracherwerbs gerade bei schwachen Lernern nicht erfasst werden können, auch wenn wie im Rahmen des vorliegenden Kodierverfahrens möglichst differenzierte Fehlerkategorien entwickelt wurden.

Diskussion des neu entwickelten Evaluationsinstruments | 333

Weiterhin ist bei der Beurteilung von Abweichungen anhand standardsprachlicher Normen zu beachten, dass einige lautlich bedingte Unterschiede zur Schriftsprache (z.B. Abschleifungen an den Flexionsendungen wie in „Ich seh ein Jung“) in der gesprochenen Sprache nicht als Normverstoß zu werten sind. Da es für die Lautung gesprochener Sprache keine kodifizierte Norm gibt, kann in diesem Bereich nur das kollektive muttersprachliche Sprachgefühl als Maßstab dienen, was nur bedingt objektivierbar ist. Wichtig sind in diesem Zusammenhang deshalb möglichst eindeutige Instruktionshinweise. Auch für den gesamten Bereich der Semantik existiert keine kodifizierte Norm. Hier ist das muttersprachliche Sprachgefühl als Vergleichskriterium besonders problematisch, da die Beurteilung der Akzeptabilität eines Begriffes je nach sozio-kulturellem Hintergrund und individueller Einschätzung des kommunikativen Kontextes stark variieren kann. Die zweite Schwierigkeit der klassischen Fehleranalyse bezieht sich auf die Rekonstruktion der intendierten bzw. zielsprachlichen Äußerungen. Wie die Ausführungen in Kap. 3.3.2 gezeigt haben, ist dies in vielen Fällen ein relativ spekulativer Akt, weil man immer nur vermuten kann, was der Lerner gesagt hätte, wenn ihm die nötigen Sprachmittel zur Verfügung gestanden hätten (Black-Box-Problem). Gerade bei sehr bruchstückhaften Äußerungen können zudem verschiedene Rekonstruktionsmöglichkeiten bestehen, bei deren Vergleich mit der Ursprungsäußerung unterschiedliche Fehlertypen resultieren. Im Rahmen eines standardisierten Kodierverfahrens können deshalb nur eindeutig rekonstruierbare Äußerungen berücksichtigt werden, wodurch eine gewisse Zahl an abweichenden Strukturen nicht erfasst wird. Weiterhin lässt es sich kaum verhindern, dass nicht auch einige nicht eindeutig rekonstruierbare Äußerungen kodiert werden, weil den Kodierern die Ambiguität möglicher Rekonstruktionen nicht immer auffällt. Diese Einflüsse können die Objektivität der fehleranalytisch gewonnen Ergebnisse einschränken. Trotz dieser Schwierigkeiten besteht jedoch Einigkeit, dass abweichende Strukturen bzw. Fehler wichtige Informationen über Erwerbsprozesse und fortschritte liefern können und formaler Korrektheit im schulischen Kontext eine große Bedeutung zukommt. Methodisch stellt das Kodierverfahren eine Form der quantitativen Inhaltsanalyse dar. Um trotz der großen Zahl der zu erfassenden Merkmale, deren Kodierung zudem spezifische linguistische Kenntnisse erfordert, eine zuverlässige Auswertung zu ermöglichen, wurde ein vierschrittiges Kodierverfahren entwickelt, bei dem jedes Transkript von mehreren studentischen Ratern in vier Schritten kodiert wird. Dieses Vorgehen entlastet nicht nur die kognitiven Kapazitäten der Kodierer, sondern ermöglicht teilweise auch eine parallele Kodie-

334 | Diskussion rung desselben Transkripts durch zwei Rater, was eine große Zeitersparnis darstellt. Voraussetzung für eine objektive Kodierung ist jedoch eine intensive Schulung sowie detaillierte Instruktionsmaterialien (vgl. Anhang 8.3). Durch die Markierung der identifizierten Merkmale innerhalb der Transkripte ist nicht nur gewährleistet, dass jederzeit überprüfbar ist, welche Strukturen erfasst wurden, sondern es wird auch eine hilfreiche Grundlage für vertiefende qualitative Analysen geschaffen, die sich bei Bedarf anschließen lassen. Bezogen auf einen Großteil der erfassten lexikalischen Mittel liegen nach der Kodierung zudem vollständige Listen mit dem erfassten Wortmaterial vor, die für weiterführende semantische Analysen genutzt werden können. Ein weiterer Vorteil bezogen auf die Kodierung der Merkmale innerhalb der Transkripte besteht darin, dass sich die Häufigkeiten dieser Variablen automatisch auszählen und in eine Statistik-Software exportieren lassen, was gegenüber eine manuellen Auszählung einen enorme Zeitersparnis darstellt. Die Kodierung eines Transkripts benötigt in Abhängigkeit von der jeweiligen Sprachprobe insgesamt 45–70 min, was als relativ aufwändig einzustufen ist. Dies ist vor allem auf die große Zahl und Differenziertheit der berücksichtigten Merkmale zurückzuführen. Wie die Ergebnisse der Häufigkeitsanalyse zeigten, kamen viele der Merkmale jedoch nur sehr selten in den Sprachproben vor, so dass bei einer Überarbeitung des Verfahrens viele der sehr spezifischen Kategorien in übergeordnete Variablen zusammengefasst werden könnten, was das Verfahren vereinfachen würde. Auch Kategorien, die sich inhaltlich nur schwer voneinander abgrenzen lassen und daher zu unterschiedlichen Kodierentscheidungen führen, könnten zu übergeordneten Kategorien kombiniert werden (vgl. Kap. 6.6.3.2). Von geringen Häufigkeiten waren vorwiegend fehlerhafte sowie einige der als typisch schulsprachlich eingestuften grammatikalischen Strukturen (Konjunktive und Passive) betroffen. Als ursächlich wurden hierfür neben einer zu großen Spezifizierung der Variablen vor allem Vermeidungsstrategien angenommen. So ist es in der freien Sprachproduktion möglich, schwierige, unsicher beherrschte Mittel zu vermeiden, indem man sich auf einfache, weniger elaborierte Strukturen beschränkt und/oder thematisch komplexe inhaltliche Details weglässt. Hinzu kommt, dass aufgrund des hohen Aufwands, der mit der Erhebung und Auswertung freier mündlicher Sprachproben verbunden ist, nur je eine Sprachprobe pro Schüler vor und nach der Förderintervention erhoben und ausgewertet wird. Auch wird die inhaltliche Vollständigkeit nicht überprüft. Es ist deshalb nicht auszuschließen, dass riskant empfundenen Strukturen erfolgreich vermieden werden, was zu einer geringeren Fehlerhäufigkeit in den entsprechenden Bereichen führt, meist aber auch mit einer geringeren Elaboriertheit verbunden ist.

Diskussion des neu entwickelten Evaluationsinstruments | 335

7.3.3 Diskussion der Evaluationsergebnisse (Güteprüfung) Zur Objektivität der Variablen Um die Objektivität des Verfahrens prüfen zu können, waren 30 Transkripte von je drei unabhängigen Ratern kodiert worden. Als Maß für die Auswertungsobjektivität des Kodierverfahrens wurde die Intraklassenkorrelation berechnet. Diese fiel u.a. aufgrund geringer Häufigkeiten und damit verbundenen geringen Varianzen bei einigen Variablen zu niedrig (