Sprachdiagnostik Deutsch als Zweitsprache: Ein Handbuch 9783110418712, 9783110419788

This volume presents current research and fundamental insights concerning a broadly applicable and important theme in ed

483 70 2MB

German Pages 643 [644] Year 2019

Recommend Papers

Sprachdiagnostik Deutsch als Zweitsprache: Ein Handbuch 9783110418712, 9783110419788

This volume presents current research and fundamental insights concerning a broadly applicable and important theme in ed

147 25 16MB Read more

Schreiben in der Zweitsprache Deutsch: Ein Handbuch 9783110354577, 9783110354225

Many students use written German as a second or third language. Some students have age-appropriate writing competency in

147 46 8MB Read more

Schreiben in der Zweitsprache Deutsch: Ein Handbuch 9783110354577, 9783110354225

Many students use written German as a second or third language. Some students have age-appropriate writing competency in

181 39 3MB Read more

Schritte neu Grammatik: Deutsch als Zweitsprache: Deutsch als Fremd- und Zweitsprache [1 ed.] 3190110816, 9783190110810

Niveau A1 bis B1 - die ideale Ergänzung zu Schritte plus Neu und Schritte international Neu - auch lehrwerksunabhängig e

886 100 73MB Read more

Deutsch als Fremd- und Zweitsprache: 2. Halbband 9783110240252, 9783110205084

The handbook Deutsch als Fremd- und Zweitsprache summarizes existing knowledge on acquisition and teaching of the German

182 69 3MB Read more

Deutsch als Fremd- und Zweitsprache: 1. Halbband 9783110240245, 9783110205077

The handbook Deutsch als Fremd- und Zweitsprache summarizes existing knowledge on acquisition and teaching of the German

196 103 7MB Read more

Der-Die-DaZ – Forschungsbefunde zu Sprachgebrauch und Spracherwerb von Deutsch als Zweitsprache 9783110582819, 9783110572940, 9783110710571

Die Festschrift eröffnet einen Blick in das Themenspektrum des interdisziplinären Forschungsbereichs Deutsch als Zweitsp

161 56 10MB Read more

Gesprochene Schulsprache in der Primarstufe: Ein empirisches Verfahren zur Evaluation von Fördereffekten im Bereich Deutsch als Zweitsprache 9783110403015, 9783110402957

Current programs to help primary school students learn German as a second language have the overarching aim of strengthe

157 39 13MB Read more

Gesprochene Schulsprache in der Primarstufe: Ein empirisches Verfahren zur Evaluation von Fördereffekten im Bereich Deutsch als Zweitsprache 9783110403015, 9783110402957

Current programs to help primary school students learn German as a second language have the overarching aim of strengthe

139 80 4MB Read more

Prüfung Express – Deutsch-Test für Zuwanderer A2, B1: Deutsch als Zweitsprache / Übungsbuch mit Audios online 3195016516, 9783195016513

Niveau B1 bis B1 Ein kompaktes und übersichtliches Prüfungsvorbereitungsmaterial für Lernende, die sich schnell auf die

1,941 126 23MB Read more

Sprachdiagnostik Deutsch als Zweitsprache: Ein Handbuch
9783110418712, 9783110419788

Author / Uploaded
Stefan Jeuk (editor)
Julia Settinieri (editor)

0 0 0
Like this paper and download? You can publish your own PDF file online for free in a few minutes! Sign Up

File loading please wait...

Citation preview

Sprachdiagnostik Deutsch als Zweitsprache

DaZ-Handbücher

Deutsch als Zweitsprache, Mehrsprachigkeit und Migration

Herausgegeben von Bernt Ahrenholz Christine Dimroth Beate Lütke Martina Rost-Roth

Band 2

Sprachdiagnostik Deutsch als Zweitsprache Ein Handbuch

Herausgegeben von Stefan Jeuk und Julia Settinieri

ISBN 978-3-11-041978-8 e-ISBN (PDF) 978-3-11-041871-2 e-ISBN (EPUB) 978-3-11-041884-2 Library of Congress Control Number: 2018956985 Bibliografische Information der Deutschen Nationalbibliothek Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über http://dnb.dnb.de abrufbar. © 2019 Walter de Gruyter GmbH, Berlin/Boston Bildnachweis: Aerial3 / iStock / Getty Images Plus Satz: Meta Systems Publishing & Printservices GmbH, Wustermark Druck und Bindung: CPI books GmbH, Leck www.degruyter.com

Einleitung Sprachdiagnose, Sprachstandserhebung, Sprachstandsüberprüfung, Sprachstandsbeobachtung oder auch Kompetenzmessung sind nur einige Begriffe, die seit einiger Zeit bei der Konzeptualisierung sprachbildender Maßnahmen für sowohl einsprachig mit Deutsch als Erstsprache als auch mehrsprachig mit Deutsch als Erst- oder Zweitsprache aufwachsende Kinder, Jugendliche und Erwachsene an Bedeutung gewonnen haben. Verbunden werden diese Begriffe häufig mit dem Konzept einer individuellen Diagnose und Förderung bzw. eines auf die je individuellen Bedürfnisse und Möglichkeiten ausgerichteten Unterrichts. Diagnoseinstrumente werden jedoch auch bei der Evaluation sprachbildender Maßnahmen, bei der Untersuchung des Sprachstands von Kindern und Jugendlichen einer bestimmten Altersgruppe zur Ermittlung eines Ressourcenbedarfs, bei Abschlussprüfungen von Sprachkursen oder im Rahmen von Bildungsstudien eingesetzt. Das hier vorgelegte Handbuch präsentiert aktuelle Forschungsarbeiten und Grundlagenwissen zu diesem breit gefächerten und bildungspolitisch bedeutsamen Thema. Die Diagnose der Sprachaneignung in der Zweitsprache Deutsch wird dabei unter mehreren Blickwinkeln bearbeitet. Das Buch ist in insgesamt vier Abschnitte gegliedert: Der erste Abschnitt enthält konzeptionelle Beiträge zu Grundlagen der Sprachdiagnostik. Mit Blick auf aktuelle Entwicklungen werden zentrale Begriffe und Zugriffsweisen geklärt sowie notwendige Abgrenzungen vorgenommen. Des Weiteren werden Grundverfahren der Sprachdiagnose erläutert und der diagnostische Prozess wird in seiner Gesamtheit in den Blick genommen. Der zweite Abschnitt fokussiert auf verschiedene Altersgruppen und Bildungsetappen. Lag in der Vergangenheit ein deutlicher Schwerpunkt sprachstandsdiagnostischer Verfahren im vorschulischen Bereich, so sind in jüngerer Zeit zunehmend auch Verfahren für ältere Lerner*innen entstanden. Diese werden in ganz unterschiedlichen Bereichen eingesetzt und sind teilweise von hoher lebensplanerischer Relevanz für die Getesteten, wenn man bspw. an Hochschulzugangsprüfungen oder Zuwanderungsregelungen denkt. Der dritte Abschnitt ist verschiedenen Verfahren auf unterschiedlichen linguistischen Ebenen einerseits und in Bezug auf Teilfertigkeiten andererseits gewidmet, und der vierte Abschnitt schließlich greift ausgewählte diagnostische Verfahrensfamilien heraus, die auf dem derzeitigen Stand der wissenschaftlichen Diskussion besonders prominent erscheinen, um diese detaillierter und in ihrer Eigensystematik darzustellen. Überschneidungen zwischen einzelnen Kapiteln sind möglich und im Rahmen eines Nachschlagewerks durchaus üblich, um alle Artikel auch einzeln lesbar zu halten. Nichtsdestotrotz empfehlen wir, zunächst den ersten Abschnitt des Bandes zur Einführung in die Thematik zu lesen, um auf dieser Grundlage auch selektiv möglichst gewinnbringend weiterlesen zu können. https://doi.org/10.1515/9783110418712-202

VI

Einleitung

Die Autorinnen und Autoren dieses Bandes sind erfahrene Forscherinnen und Forscher, die aus ganz unterschiedlichen Fachrichtungen, wie bspw. der Deutschdidaktik, der Germanistik, dem Deutschen als Zweit- und Fremdsprache, der Zweitspracherwerbsforschung oder auch der Psychologie, auf den Forschungsgegenstand blicken. Dadurch versammelt sich in diesem Band eine umfangreiche Expertise, die gleichzeitig auch eine gewisse Bandbreite von Perspektiven auf den Forschungsgegenstand repräsentiert. Wir danken zunächst den Reihenherausgebern für ihr Vertrauen und die Möglichkeit, den vorliegenden Band zu publizieren. Und wir danken allen Autorinnen und Autoren sehr herzlich für ihr großes Engagement bei der Arbeit an diesem Band. Ein ganz besonderer Dank gilt Dagmar Freitag, ohne deren unermüdliche und akribische Arbeit der Band nicht zustande gekommen wäre. Nicht zuletzt danken wir auch Julie Miess und Stefan Diezmann vom Verlag De Gruyter für ihre kontinuierliche Unterstützung des Arbeitsprozesses.

Inhalt Einleitung

V

I Grundlagen Julia Settinieri und Stefan Jeuk 1 Einführung in die Sprachdiagnostik Christine Dimroth 2 Lernersprachen

3

21

Iris Kleinbub 3 Kompetenzmodellierung

47

Solveig Chilla 4 Spracherwerbsverzögerung – Spracherwerbsstörung Nazan Gültekin-Karakoç 5 Sprachdiagnostische Grundverfahren Stefan Jeuk und Julia Settinieri 6 Der sprachdiagnostische Prozess

71

97

117

II Sprachdiagnostik und Bildungsverlauf Yvonne Decker-Ernst 7 Sprachdiagnostik im Elementarbereich

139

Stefan Jeuk und Beate Lütke 8 Sprachdiagnostik im Primar- und Sekundarbereich Alexandra Eberhardt 9 Sprachdiagnostik für den Beruf

197

Raphaela Porsch und Heike Wendt 10 High-Stakes-Tests im Kontext von Migration

221

163

VIII

Inhalt

III Teilkompetenzdiagnostik Grit Mehlhorn 11 Phonetik

245

Tabea Becker 12 Orthographie

277

Elke G. Montanari 13 Diagnostik von Wortwissen Angela Grimm und Anja Müller 14 Syntax und Morphologie Vivien Heller 15 Pragmatik

299

327

353

Sylwia Adamczak-Krysztofowicz und Christiane Limbach 16 Hören 387 Julia Webersik 17 Sprechen

413

Zeynep Kalkavan-Aydin und Katja Winter 18 Lesen 441 Joachim Schäfer 19 Schreiben

471

Sarah L. Fornol und Britta Hövelbrinks 20 Bildungssprache 497

IV Ausgewählte diagnostische Verfahrensgruppen Jennifer Paetsch 21 Psychometrische Testverfahren Wilhelm Grießhaber 22 Profilanalysen

547

525

Inhalt

Marion Döll 23 Sprachdiagnose durch Beobachtung Rüdiger Grotjahn 585 24 C-Tests Julia Ricart Brede 25 Sprachenportfolios

611

Sprachdiagnostische Verfahren Sachregister

624

621

569

IX

I Grundlagen

Julia Settinieri und Stefan Jeuk

1 Einführung in die Sprachdiagnostik 1 2 3 4 5 6 7

Einleitung Förder- vs. Zuweisungsdiagnostik Grundlagen der Lernersprachenanalyse Überblick über sprachdiagnostische Verfahrensformen Grundprobleme der Sprachdiagnostik Anforderungen an sprachdiagnostische Verfahren aus wissenschaftlicher Sicht Neuere Entwicklungstendenzen

1 Einleitung Diagnostik und Förderung sind für das Lehren und Lernen von Sprachen in gesteuerten Kontexten von zentraler Bedeutung. Spätestens seit der Jahrtausendwende und begründet durch die Kompetenzorientierung ist dieses Thema auch in den Bildungsplänen verankert. Eine einschlägige Sprachdiagnose, also die Analyse vorhandener sprachlicher Kompetenzen auf Basis ausgewählter mündlicher oder schriftlicher Performanzdaten, stellt dabei gleichsam die Voraussetzung für eine möglichst passgenaue anschließende Förderung dar. Das Fachlexikon Deutsch als Fremd- und Zweitsprache versteht unter Sprachstandsdiagnose bzw. Sprachstandsmessung „jegliche[n] Versuch der Erfassung des Sprachstands eines Lernenden mit Hilfe eines Verfahrens, das im Hinblick auf diese Zielsetzung entwickelt worden ist“ (Maak 2010: 309). Das Wort Diagnostik bzw. Diagnose stellt eine Entlehnung von frz. diagnose dar, das wiederum auf gr. diágignṓskein ‚genau, durch und durch erkennen, unterscheiden, beurteilen‘ zurückzuführen ist (Pfeifer 1993: 221; Kluge 2011: 196). Neben dem Begriff Sprachdiagnostik werden – häufig synonym – auch Sprachstandsdiagnostik, Sprachdiagnose, Sprachstandsdiagnose, Sprachstandsmessung, Sprachstandserhebung oder auch Sprachstandsbeobachtung verwendet. Sie alle beziehen sich gleichermaßen auf eine evidenzbasierte Einschätzung der Sprachkompetenz von Lernerinnen und Lernern. Da einige der genannten Fachtermini sich im engeren Sinne allerdings eher auf zuweisungsdiagnostische Instrumente beziehen (insbesondere, wenn {stand}, {mess} oder {erheb} Bestandteile des Kompositums sind), verwenden wir im Folgenden den u. E. weiter fassenden Begriff der Sprachdiagnostik, der förderdiagnostische Verfahren mit einschließt (vgl. genauer Abschnitt 2 in diesem Beitrag zur Unterscheidung zwischen Zuweisungs- vs. Förderdiagnostik). Lengyel (2012: 8) verweist außerdem darauf, dass dieser Begriff „breiter angelegt ist sowie den gesamten Prozess und alle Tätigkeiten fokussiert, mit dem Daten zum Sprachstand […] sowie weiterführende Informationen gesammelt, erhoben, analysiert, bewertet, in Beziehung gesetzt und interpretiert werden“. Abzugrenzen ist die https://doi.org/10.1515/9783110418712-001

4

Julia Settinieri und Stefan Jeuk

Sprachdiagnostik im Deutschen als Zweitsprache auch vom Fachdiskurs um das Testen und Prüfen im Kontext des Deutschen als Fremdsprache (vgl. z. B. Rossa 2016 für eine Einführung), der sehr stark auf die an bestimmten Bildungsstandards orientierte Sprachaneignung im Fremdsprachenunterricht ausgerichtet ist. Mehrsprachigkeit oder auch Bildungsbenachteiligung spielen in diesem Diskurs bspw. eine eher untergeordnete Rolle, auch wenn es nichtsdestotrotz natürlich breite Überschneidungsbereiche gibt.1 Um terminologische Klarheit zu gewährleisten, sei auch kurz angemerkt, was wir im Rahmen dieses Handbuchs unter den Begriffen Erst-, Zweit- und Fremdsprache verstehen. Wir verwenden die Fachtermini L1/Erstsprache und L2/Zweitsprache sowie Zweit- vs. Fremdsprache, sofern die Abgrenzung inhaltlich notwendig erscheint. Wie allgemein üblich, bezeichnen wir eine Sprache dabei als L1, wenn sie von Geburt an erworben wurde, während eine L2 zu einem späteren Zeitpunkt im Leben (nach dem 3. Lebensjahr) und in aller Regel dann auch außerhalb des familiären Umfelds erworben wird. Fremdsprachenlernen findet wiederum prototypisch gesteuert, d. h. in einem Unterrichtskontext, sowie außerhalb des Zielsprachenlandes statt, wohingegen eine Zweitsprache grundsätzlich im Alltagsleben innerhalb eines Landes, in dem diese Sprache auch als Verkehrssprache genutzt wird, in natürlicher Kommunikation, also ungesteuert, erworben wird. Letzteres schließt möglichen zusätzlichen Unterricht in der Zweitsprache selbstverständlich nicht aus (vgl. z. B. Ahrenholz 2014; Jeuk 2018: 17).

2 Förder- vs. Zuweisungsdiagnostik In Abhängigkeit von ihrer Zielsetzung lassen sich grundsätzlich zwei Ausrichtungen von Sprachdiagnostik voneinander unterscheiden: die Förder- und die Selektionsbzw. Zuweisungsdiagnostik. Während formative Förderdiagnostik darauf zielt, den prozesshaften Spracherwerb einzelner Lernender möglichst genau zu beschreiben, um sie ausgehend von Zonen der nächsten Entwicklung (Vygotskij 2002: 326–336)2 optimal fördern zu können, legt die summativ angelegte Zuweisungsdiagnostik nor-

1 Entsprechend bietet bspw. auch das Handbuch Fremdsprachenunterricht drei getrennte Artikel zu Testen und Prüfen (Rossa 2016), Sprachdiagnostik für Migrantinnen und Migranten (Döll 2016) sowie Sprachprüfungen für Migrantinnen und Migranten (Kniffka 2016). 2 Für Vygotskij (2002) war die „Zone der nächsten Entwicklung“ das, was ein Kind bei einem konkreten Test bzw. einer Aufgabe mit Hilfestellung erreichen kann (vgl. auch Grotjahn & Kleppin 2017: 280–285 zu Implikationen für ein angemessenes Feedback). Er ging davon aus, dass das, was das Kind mit Hilfestellung erreichen kann, der Bereich ist, den das Kind als nächstes auch ohne Hilfestellung wird leisten können. Somit ist die Zone der nächsten Entwicklung an klare Aufgaben und Testformate gebunden. Im pädagogischen Diskurs hat sich etabliert, diesen Terminus auch mit Blick auf das einzusetzen, was ein Kind ganz allgemein (und auch unspezifisch) als nächstes erreichen bzw. lernen kann.

Einführung in die Sprachdiagnostik

5

mative Maßstäbe an Gruppen an und ermittelt, welche Lerner*innen zu einem bestimmten Zeitpunkt jeweils Förderbedarf haben und welche nicht. Während Zuweisungsdiagnostik also der externen Differenzierung dient und in der Regel wenig konkrete Ansätze zur Förderung bietet, trägt Förderdiagnostik zur Binnendifferenzierung von Gruppen und zur Erstellung individueller Förderpläne bei. Entsprechend spricht man im Zusammenhang mit Förderdiagnostik vs. Zuweisungsdiagnostik auch von pädagogischen vs. politischen Zielsetzungen unterschiedlicher Verfahren, wobei Förderdiagnostik in der alltäglichen pädagogischen Arbeit angesiedelt ist, Zuweisungsdiagnostik hingegen in aller Regel politisch von außen implementiert wird, um Fördergelder für Sprachfördermaßnahmen zuzuteilen bzw. einzelne Lerner*innen für diese Fördermaßnahmen auszuwählen (vgl. auch Fried 2005: 21–24; Reich 2005: 90; Kallmeyer 2007: 43–44 zur Differenzierung der beiden grundlegenden Verfahrensgruppen). Auch die Zuweisung von Lernenden zu Niveaustufen im Rahmen von Einstufungstests kann man unter dieser Zielsetzung subsummieren. Ferner werden sprachdiagnostische Verfahren im Rahmen der Evaluation sprachbildender Maßnahmen eingesetzt, indem die Effekte der Maßnahme über den Vergleich eines Prä- und Posttests eingeschätzt werden (evaluative Zielsetzung, vgl. Lengyel 2012: 10–11). Dies kann im unterrichtlichen Kontext in Form von Lernfortschrittsdiagnosen, aber auch in unterschiedlichen Forschungskontexten der Fall sein. Weiter kann Sprachdiagnostik an individuellen, kriterialen oder sozialen Normen ausgerichtet sein (vgl. z. B. Lengyel 2012: 12–13). Während die individuelle Bezugsnorm intrapersonell Fortschritte einzelner Lerner*innen in den Blick nimmt, zielen soziale Bezugsnormen auf interpersonelle Vergleiche. In diesem Fall wird ein Verfahren an einer Normstichprobe geeicht, um spätere Einzelfallmessungen in die so entstehende Werteverteilung einordnen zu können. Eine Person, die das Verfahren durchlaufen hat, kann bspw. besser abschneiden als 72 % der Referenzstichprobe. Kriterienorientierte Normen schließlich erlauben Aussagen darüber, ob bestimmte, im Vorfeld theoretisch definierte Kompetenzen vorhanden sind oder nicht. Diese sind in der Regel in Form von Can-do-Formulierungen festgehalten, wie z. B. im Falle des Gemeinsamen Europäischen Referenzrahmens für Sprachen (GER). Jemand, der ein Sprachniveau C1 zertifiziert bekommt, kann bspw. „ein breites Spektrum anspruchsvoller, längerer Texte verstehen und auch implizite Bedeutungen erfassen“ (http://www.europaeischer-referenzrahmen.de/). Normorientierte Verfahren ordnen einzelne Sprecher*innen also im Vergleich zu sich selbst oder anderen ein, während kriterienorientierte Verfahren davon vollständig unabhängig sind und stattdessen danach fragen, ob jemand imstande ist, etwas Bestimmtes zu tun. Häufig basieren kriterienorientierte Sprachdiagnosen auf modellierten Sprachentwicklungsverläufen (vgl. Tracy 2007; Grießhaber 2010). Weitere terminologische Unterscheidungen, die im Kontext der Sprachdiagnostik frequent genutzt werden, sind insbesondere die in formelle vs. informelle, standardisierte vs. nicht-standardisierte oder auch normierte vs. nicht-normierte Verfah-

6

Julia Settinieri und Stefan Jeuk

ren. Eine einfache Gleichsetzung mit politischer Zuweisungs- vs. pädagogischer Förderdiagnostik würde hier allerdings zu kurz greifen. Die Dichotomie normiert vs. nicht-normiert ist definitorisch klar zu greifen, da sie sich im Endeffekt schlicht auf das Vorliegen bzw. Nicht-Vorliegen einer publizierten Tabelle mit Normwerten bezieht. Standardisiert sind Verfahren dann, wenn Sprachdatenerhebung, -aufbereitung und -auswertung so genau festgeschrieben sind, dass jede*r Verfahrensdurchführende möglichst gleich vorgehen und somit auch zu maximal ähnlichen Ergebnissen kommen würde (Gütekriterium der Objektivität). So ist bei Tests bspw. in der Regel vorgegeben, wie häufig ein bestimmter Stimulus vom Testabnehmer dargeboten werden muss, ob ein Kind ein Pseudowort bspw. ein- oder zweimal vorgesprochen bekommen soll, bevor es es imitiert. Dabei ist die Standardisierung eine skalare Größe, die in Bezug auf einzelne Verfahren schwächer oder stärker ausgeprägt sein kann. Außerdem kann ein Verfahren durchaus standardisiert, aber nicht normiert sein, wohingegen eine Normierung grundsätzlich eine Standardisierung voraussetzt. Weniger klar umrissen hingegen erscheint die Differenzierung zwischen formellen und informellen Verfahren, obgleich sie in der Fachliteratur vielfach Verwendung findet. Dabei wird insbesondere der Begriff informell genutzt und in der Regel entweder standardisierten Verfahren oder enger Tests dichotom gegenübergestellt. Manchmal bezieht er sich auch auf Alltagsdiagnostik im Unterrichtskontext, z. B. auf Rückmeldungen auf Hausaufgaben oder anderen Arbeitsergebnisse. Während informelle Förderdiagnostik in Erst-, Zweit- und Fremdsprache vermutlich existiert, seit es Sprachunterricht gibt, handelt es sich bei der standardisierten Zuweisungsdiagnostik um eine neuere Entwicklungstendenz. In den 1970er und 1980er Jahren spielte die Testung von Kindern vor allem in der Sonderpädagogik eine Rolle; im Kontext einer Intelligenzdiagnostik wurde bspw. entschieden, ob und an welcher Art von Sonderschule ein Kind eingeschult werden sollte. Sprachdiagnostik spielte insbesondere für die Zuweisung an eine Schule für Sprachbehinderte eine Rolle. Ebenfalls in den 1970ern entwickelte sich in der Sonderpädagogik die Kritik an der Zuweisungsdiagnostik (Kobi 1977), und es wurde die Förderdiagnostik als Alternative entwickelt (zur Kritik vgl. Schlee 2008). Die normorientierte Diagnostik hat nun mit PISA und verwandten Studien in den letzten ein bis zwei Jahrzehnten erneut einen enormen Aufschwung erlebt (Reich 2005; Roth & Dirim 2007: 649– 651; Roth 2008: 22). Insbesondere im Elementarbereich sind in allen Bundesländern flächendeckend Diagnostikverfahren für das Deutsche als Erst- und Zweitsprache entwickelt und eingesetzt worden, die bereits bei Vierjährigen ansetzen, um möglichen Förderbedarf aufzudecken und schnellstmöglich entsprechend reagieren zu können (vgl. Jeuk 2009).

Einführung in die Sprachdiagnostik

7

3 Grundlagen der Lernersprachenanalyse Wann immer Lehrende anfallende mündliche oder schriftliche Äußerungen ihrer Lernenden mit Blick auf deren Zielsprachenadäquatheit analysieren, spielen nicht nur Abweichungen von unterstellten, normgerechten Formen (also „Fehler“ im klassischen Sinne) eine Rolle, sondern zum einen gerät spätestens seit Selinker (1972) auch in den Blick, was die/der Lerner*in bereits kann bzw. welche Teile des Systems sie/er bereits durchdrungen hat und nutzt und an welchen Stellen sie/er möglicherweise eigene lernersprachliche Hypothesen gebildet hat. Diagnostisch relevant ist auch die Frage nach möglichen Ursachen für von der Zielsprache abweichende Formbildungen, die von temporärer Müdigkeit über Übergeneralisierungen bis hin zu lernstrategischen Entscheidungen reichen können. Grundsätzlich sind Selinker (1972) zufolge Einflüsse der L1, der L2 und andere Einflüsse (z. B. Strategien) beobachtbar. Jeuk (2017: 104–106) legt den Text eines Sechstklässlers mit L1 Türkisch zur sprachdiagnostischen Analyse vor. Der Text beginnt wie folgt (unterstellte intendierte Version in Klammern): Kurt denkte an das Belohnung was er mit dem Gelt machen würde. Kurts Eletern konnten ja ihm ein Spesialfarrad kaufen können. Hannes und Maria soben Kurt nach Minigolfpatz sie haten mit denn anderen nicht verabretet. (Kurt dachte an die Belohnung und was er mit dem Geld machen würde. Kurts Eltern könnten ihm ja ein Spezialfahrrad kaufen. Hannes und Maria schoben Kurt auf den Minigolfplatz, sie hatten sich mit den anderen nicht verabredet.)

Bereits an diesem sehr kurzen Ausschnitt lassen sich sprachdiagnostisch viele relevante Beobachtungen anstellen. Zum einen wird deutlich, was der Lerner bereits alles kann: So bildet er Nebensätze mit Verbletztstellung (was er mit dem Gelt machen würde), darüber hinaus mit würde-Form anstelle des Konjunktivs II. Auch der Wortschatz scheint sehr gut ausgebaut zu sein, wobei zu prüfen wäre, inwiefern es sich zumindest teilweise auch um Übernahmen aus dem nachzuerzählenden Originaltext handeln könnte. Obgleich der Text geschrieben ist, lassen sich einige Hörinterferenzen als mögliche Fehlerursachen ausmachen, z. B. in Bezug auf den Sprossvokal in Eletern, die nicht-realisierte Affrikate in Spesialfarrad oder auch die Unterscheidung zwischen stimmhaften und stimmlosen Plosiven in verabretet. Hier sind auch L1-Einflüsse denkbar; so gibt es in der Aussprache des Türkischen bspw. kein /ts/. Ein weiteres Beispiel für einen möglichen L1-Einfluss wäre auf orthographischer Ebene der Ersatz von durch in soben, wobei das /ʃ/ im Türkischen genau genommen geschrieben wird. Andererseits handelt es sich hier um einen Fehler, der auch auf L2-Einfluss zurückzuführen sein könnte, denn viele Lerner folgen in der Orthographie der Annahme, dass ein Phonem auch mit genau

8

Julia Settinieri und Stefan Jeuk

einem Graphem verschriftet werden sollte (vgl. bspw. analog die Schreibung von Spiel). So kann ein solcher Fehler auch im einsprachig deutschen Schriftspracherwerb beobachtet werden. Die Beobachtung und Analyse eines Fehlers führt demnach nicht immer zu eindeutigen Ursachenzuschreibungen, sondern vielmehr zu näher zu prüfenden Hypothesen. Ein deutlicher L2-Einfluss wird hingegen in der Übergeneralisierung der regelmäßigen Imperfektform in denkte sichtbar, die Ansätze einer Umstrukturierung des Lernersystems erkennen lässt. Auch könnte man „andere Einflüsse“ ausmachen, z. B. in der kreativen Form konnten kaufen können, die eine besondere Betonung der zum Ausdruck gebrachten Möglichkeit darzustellen scheint. Weiter erscheinen Unsicherheiten in der Markierung der Quantität und Qualität der Vokale, die phonologische oder orthographische Ursachen haben könnten (Spesialfarrad, haten, denn). Auch Auslautverhärtung (Gelt, aber: Spesialfarrad), Genus (das Belohnung), Reflexiva (sie haten verabretet) und Präpositionen (nach Minigolfpatz) rücken in das diagnostische Blickfeld. Selbstverständlich müssen diese ersten diagnostischen Hypothesen am weiteren Textverlauf (der hier nicht abgedruckt ist) sowie an weiteren mündlichen und schriftlichen Äußerungen des Lerners abgeglichen, erweitert, verfeinert und ggf. auch revidiert werden. Auch lässt sich das Grundproblem der Sprachdiagnostik, dass aus beobachtbaren Performanzdaten auf zugrunde liegende, jedoch nicht unmittelbar beobachtbare Sprachkompetenz geschlossen wird, nicht lösen. Nichtsdestotrotz wird deutlich, wie viele Informationen über das lernersprachliche System selbst in sehr kurzen Äußerungen bereits enthalten sein können. Mit Blick auf die sprachlichen Formen sind dabei immer besonders diejenigen linguistischen Bereiche interessant, in denen Variation zu beobachten ist. Nutzt ein Lerner in einem Text bspw. viele regelmäßige Imperfektformen normgerecht, ebenso einige frequente unregelmäßige und überträgt er zusätzlich die regelmäßige Bildung irrtümlich auf einige weitere unregelmäßige Verben (Übergeneralisierung), so lässt sich schlussfolgern, dass der Lerner diesen Erwerbsbereich gerade restrukturiert und den hierfür typischen U-kurven-förmigen Verlauf (Gass & Selinker 1994: 213–216; Bredel 2005: 85–87) zeigt: Werden viele komplexe Formen anfangs nur als Chunks, also als gesamthaft auswendig gelernte Formen, verwendet, zeichnet sich die eigentliche Erwerbsphase durch Analyse und Resynthese aus, wobei zunächst auf der sprachlichen Oberfläche mehr Fehler gemacht werden, z. B. weil Grundregeln auch auf Ausnahmebereiche übertragen werden, bevor schließlich in der dritten Phase wiederum normgerechte, nun regelgeleitete Formen beobachtet werden können. Diese Variationsbereiche sind also zum einen förderdiagnostisch wichtig, weil sie optimale Anknüpfungspunkte für die Förderdiagnostik darstellen. Für viele Erwerbsbereiche (z. B. Satzmodelle, Verbalmorphologie, Kasusmorphologie) konnten zudem Erwerbssequenzen (vgl. genauer Dimroth in diesem Band zu Lernersprache sowie Grießhaber in diesem Band zu Profilanalysen) ermittelt werden. „Aktivität“ in einem Erwerbsbereich stellt folglich quasi ein Fenster in das Gehirn des Lerners dar, durch das sich aktuell stattfindender Erwerb beobachten lässt (vgl. auch Lengyel 2012: 21).

Einführung in die Sprachdiagnostik

9

4 Überblick über sprachdiagnostische Verfahrensformen Sowohl die Förder- als auch die Zuweisungsdiagnostik haben bislang zahlreiche unterschiedliche Wege eingeschlagen, um ihre jeweiligen diagnostischen Ziele zu erreichen. Grundsätzlich lassen sich die methodischen Herangehensweisen grob in Schätzverfahren, Beobachtungsverfahren, Profilanalysen, Screenings und Tests unterteilen (vgl. genauer Gültekin-Karakoç in diesem Band). Das Spektrum reicht dabei von maximal offenen, methodisch kaum kontrollierten Verfahren hin zu standardisierten, gleichzeitig aber auch sehr künstlichen und selektiven Settings. Während in der Förderdiagnostik Beobachtung (vgl. Döll in diesem Band) und vor allem Profilanalyse (vgl. Grießhaber in diesem Band) im engeren bzw. Lernersprachenanalyse (vgl. Dimroth sowie Jeuk & Settinieri in diesem Band) im weiteren Sinne eine große Rolle spielen, haben sich in zuweisungsdiagnostischen Zusammenhängen vor allem Grobscreening bzw. Test (vgl. Porsch & Wendt, Paetsch sowie Grotjahn in diesem Band) durchgesetzt, wobei bei jüngeren Lernern bzw. in Kontexten, in denen die Gruppenzuordnung keinen größeren Eingriff in das Leben der Lernenden darstellt, sondern es tatsächlich einfach um die Zuordnung in Fördergruppen geht, auch Beobachtungsverfahren und Profilanalysen eingesetzt werden. Auch die Sprachdiagnostik befindet sich damit, wie alle Datenerhebungsverfahren, im unauflösbaren Konflikt zwischen dem Wunsch nach möglichst natürlichen Sprachdaten, der dem nach kontrollierten, vergleichbaren Daten gegenübersteht (vgl. Riemer & Settinieri 2010: 765–768). Diskutiert wird diese Opposition im Kontext der Sprachdiagnostik vor allem am Beispiel der Vor- und Nachteile des Beobachtens vs. Testens (vgl. auch Apeltauer 2004; Fried 2004: 7–10; Ulich & Mayr 2004: 12–13; Ehlich 2007: 43–44; Fried & Briedigkeit 2007: 10; Reich 2007: 154–164; Kurzwernhart 2009: 39– 43; Settinieri 2012). Gleichzeitig lässt sich bereits an dieser Stelle aus der Darstellung ableiten, dass in den seltensten Fällen ein einziges Diagnoseinstrument ausreichend Einsicht in den Sprachstand von Lerner*innen zu geben vermag. Vielmehr ist in aller Regel der Einsatz mehrerer, einander perspektivisch ergänzender Verfahren zielführender (vgl. genauer Jeuk & Settinieri in diesem Band zum diagnostischen Prozess). Selbstverständlich kann ein Instrument ohnehin nicht alle Facetten sprachlicher Kompetenz erfassen. Differenziert werden kann hier (vgl. Abschnitt III in diesem Band) entlang der vier Fertigkeiten (Hören, Sprechen, Lesen, Schreiben), der linguistischen Teilbereiche (z. B. Phonetik/Phonologie, Orthographie, Lexik, Morphologie, Syntax und Textgrammatik, Pragmatik; vgl. Ehlich 2005), entlang unterschiedlicher Register (z. B. Allgemeinsprache, Bildungssprache, Fachsprache) sowie spezifischer Textsorten (z. B. Erzählen, Briefverfassen, Argumentieren). Außerdem sind die verschiedenen Instrumente jeweils spezifisch auf bestimmte Zielgruppen zugeschnitten. Diese sind häufig nach Bildungsetappen (Elementarbereich, Primarbereich, Sekundarstufe I und II, Studium und Beruf; vgl. Abschnitt II in diesem

10

Julia Settinieri und Stefan Jeuk

Band) oder auch nach Altersgruppen (in Jahren) definiert, sowie nach sprachlichem Hintergrund (z. B. Deutsch als Erst- vs. Zweitsprache, teilweise auch nach verschiedenen nicht-deutschen Erstsprachen, wie z. B. bei HAVAS 5).

5 Grundprobleme der Sprachdiagnostik Ein Grundproblem der Sprachdiagnostik besteht darin, dass, wie bereits im letzten Absatz angeklungen, der Spracherwerb in Abhängigkeit von zahlreichen Faktoren, wie bspw. dem Erwerbsalter, individuell sehr unterschiedlich verlaufen kann. Da das Zusammenspiel aus biologischen, kognitiven und sozio-affektiven Faktoren höchst komplex ist (vgl. auch Jeuk & Settinieri in diesem Band), ist es kaum möglich, Standardverläufe zu modellieren. Diese stellen in zuweisungsdiagnostischen Verfahren jedoch die notwendige Grundlage für eine Normierung dar. Werden vom Verfahren Vergleichsgruppennormen geliefert, so können diese nur herangezogen werden, wenn die getesteten Lerner*innen ebenfalls zur dem Verfahren zugrunde liegenden Normgruppe zugeordnet werden können. Andernfalls wäre der Vergleich unangemessen und testtheoretisch auch unfair. Besteht eine Normstichprobe bspw. ausschließlich aus Kindern, die monolingual mit der L1 Deutsch aufwachsen, wäre es unzulässig, ihren Erwerbsverlauf auf mehrsprachig aufwachsende Kinder zu übertragen. Ideal für die Diagnose mehrsprachiger Lerner*innen ist es außerdem, bei der Normierung nicht nur das Alter, sondern auch die Kontaktdauer mit der getesteten Sprache bei der Normierung zu berücksichtigen (wie es bspw. LiSe-DaZ [vgl. z. B. Wenzel, Schulz & Tracy 2009] tut), da es natürlich einen Unterschied macht, ob ein vierjähriges Kind bereits seit drei Jahren oder erst seit drei Monaten Kontakt mit der L2 Deutsch hat. Bei einigen Verfahren stellt sich außerdem im Zuge der Normierung heraus, dass getrennte Normen für Mädchen und Jungen anzulegen sind (z. B. Sismik, vgl. z. B. Ulich & Mayr 2004). Bei vielen Verfahren erweist sich die Trennung an dieser Stelle aber als nicht notwendig, worauf es in den Verfahrenserläuterungen dann nichtsdestotrotz einen Hinweis geben sollte. Trotz vielfältiger Bemühungen bei der Normierung lassen sich dennoch nie alle potentiell relevanten Gruppen in je eigenen Skalen abbilden. Betrachtet man allein das Beispiel nach L1 vs. L2 getrennter Normskalen, so könnte man unmittelbar die Frage anschließen, wo Lernende einzuordnen wären, die einen doppelten Erstspracherwerb durchlaufen, die drei- oder viersprachig aufwachsen, deren Sprachkompetenzen unterschiedlich balanciert sind usw. Hier wird es immer nur möglich sein, annähernd passgenaue Unterscheidungen zu treffen. Lengyel (2012: 13) folgert daher: Die Frage nach der geeigneten Bezugsgruppe für soziale Vergleiche ist derzeit noch ungelöst, nicht zuletzt aufgrund der großen Forschungslücken zur mehrsprachigen Sozialisation speziell unter den Bedingungen der Migration. Diese „Unsicherheit“ gilt es in der Praxis auszuhalten und zu reflektieren.

Einführung in die Sprachdiagnostik

11

Döll (2016: 426) kommt angesichts der Problematik zu dem Schluss, bei der Beurteilung zweitsprachlicher Kompetenzen gänzlich auf soziale Bezugsnormen zu verzichten und ausschließlich individuelle oder kriteriale Normen anzulegen. Liegt eine Normstichprobe vor, so stellt sich im Rahmen zuweisungsdiagnostischer Überlegungen weiter die Frage, ab wann ein Kind denn Förderbedarf hat, wo sich also die Grenze zwischen einer normal verlaufenden, „unbedenklichen“ Sprachentwicklung und einem alarmierenden Verlauf befindet, d. h., bei wie viel Punkten eines Tests bspw. der sog. Cut-off-Wert liegen sollte. In einigen Tests, insbesondere bei Screenings, werden so genannte Schwellenwerte angegeben; werden diese nicht erreicht, wird eine Förderung empfohlen. Die Schwellenwerte können bspw. auf Grundlage der statistischen Werteverteilung festgelegt werden (z. B. eine Standardabweichung unter dem Mittelwert). In der Praxis werden diese Werte jedoch häufig auch arbiträr festgelegt, etwa mit Blick auf vorhandene Fördertöpfe. Denn grundsätzlich kann natürlich jede*r in ihrer/seiner Sprachkompetenz mit Gewinn weiter gefördert werden, egal auf welchem Niveau sie/er sich bereits bewegt. Als problematisch angesehen würde dabei aber wohl ein Verlauf, der dazu führen würde, dass ein Mensch im Laufe seiner Entwicklung aufgrund eines sprachlichen Hemmnisses hinter seinen sonstigen persönlichen Möglichkeiten zurückbliebe. Da Sprache das Medium allen Lernens ist, Sprach- und Fachlernen also untrennbar miteinander verknüpft sind (vgl. z. B. Schmölzer-Eibinger et al. 2013: 11), sollte die Sprachkompetenz soweit ausgebaut werden, dass sie alle anderen Lernmöglichkeiten offenhält. Dies erscheint sowohl aus humanistischer Sicht für jeden einzelnen wichtig, als auch aus bildungs- bzw. wirtschaftspolitischer Sicht für eine Gesellschaft. Im Falle von High-Stakes-Tests (vgl. Porsch & Wendt in diesem Band) ist darüber hinaus zu bedenken, dass testbasierte politische Ja-Nein-Entscheidungen teilweise massive Einschnitte im Leben von getesteten Personen darstellen, die es erfordern, die zugrunde liegenden Verfahren sehr genau in den Blick zu nehmen. Bildet ein sprachdiagnostisches Verfahren die Entscheidungsgrundlage für die Aufnahme eines Studiums oder das Bleiberecht in einem Land, muss die Frage, inwiefern der Test überhaupt in der Lage ist, hier eine angemessene Prognose zu stellen, umso kritischer gestellt werden. So konstatiert auch Döll (2016: 427; vgl. auch die Kritik bei Kniffka 2016: 431) in diesem Zusammenhang: „Die mit der Gleichsetzung von Integration und Deutschkompetenz bzw. schulischer Leistungsfähigkeit und Deutschkompetenz einhergehende Überhöhung sprachdiagnostischer Ergebnisse ist ethisch sehr bedenklich […].“ Für die Sprachdiagnostik bedeutet dies, dass bspw. in der Sprache Vierjähriger bestimmte Merkmale ausgemacht werden müssen, die als verlässliche Anzeichen eines späteren problematischen Entwicklungsverlaufs gelten können. Diese Indikatoren müssten erstens in der Gruppe der Vierjährigen eine relativ starke Variation zeigen, um zwischen den Kindern differenzieren zu können. Und zweitens müssten sie hoch mit späteren Bildungsindikatoren, wie z. B. den Übergangsempfehlungen von der Grundschule in weiterführende Schulen, korrelieren, damit von einer ausrei-

12

Julia Settinieri und Stefan Jeuk

chenden prognostischen Validität (vgl. genauer Gültekin-Karakoç in diesem Band) der einzelnen Indikatoren ausgegangen werden könnte. Drittens wäre mit Blick auf eine möglicherweise anschließende Förderung zu klären, ob eine Förderarbeit an genau diesem sprachlichen Merkmal auch tatsächlich zu einer messbaren Verbesserung der Übergangsergebnisse führen würde. Dies wäre für jeden in Frage kommenden Indikator, für jede in Frage kommende Gruppe (bspw. differenziert nach Alter, Sprache/n, Geschlecht, Kontaktdauer mit dem Deutschen usw.) zu klären. Über alle möglichen Verläufe hinweg Gruppen zu bilden, die ausreichend homogen sind, um eine faire Normierung zu gewährleisten, erscheint daher alles andere als trivial. Für den Bereich der Sprachdiagnostik des Deutschen als Zweitsprache wird außerdem immer wieder angeführt, dass auch der Sprachstand in der Erstsprache der Kinder berücksichtigt werden sollte, u. a. um mögliche Spracherwerbsstörungen, die sich bereits in der Erstsprache manifestieren, schneller aufdecken zu können (z. B. Schroeder & Stölting 2005; Kallmeyer 2007: 46). Dies ist jedoch in der Praxis nur schwer umzusetzen und daher auch nur sehr selten der Fall (Lisker 2010: 24). So müsste u. a. beachtet werden, dass sich Sprachen in der Migration verändern und dass z. B. bei einem Kind mit Türkisch als L1, das in Deutschland lebt, nicht automatisch dieselben Maßstäbe angelegt werden können wie bei einem Kind mit Türkisch als L1, das in der Türkei lebt. Darüber hinaus müsste die/der Diagnostiker*in die jeweiligen Sprachen der Kinder auch selbst beherrschen, um den Sprachstand kompetent einschätzen zu können. Angesichts dieser Herausforderungen besteht nach wie vor großer Bedarf bzgl. der Entwicklung sprachdiagnostischer Verfahren, die zwischen einer Sprachentwicklung, die aufgrund von Sprachkontaktbedingungen lediglich verzögert verläuft, und einem Verlauf, für den psychische oder physische Entwicklungsstörungen ursächlich sind, d. h. zwischen Erwerbsverzögerung vs. Erwerbsstörung und in Konsequenz zwischen pädagogischem Sprachförder- vs. klinischem Sprachtherapiebedarf (vgl. Chilla in diesem Band), unterscheiden können. Deutlich wird also bereits an dieser Stelle, dass die Diagnostik ein komplexes und methodisch äußerst anspruchsvolles Tätigkeits- und Forschungsfeld darstellt.

6 Anforderungen an sprachdiagnostische Verfahren aus wissenschaftlicher Sicht In den letzten Jahren sind zahlreiche Forschungsinitiativen sowie auch Expertisen, u. a. im Auftrag des Bundesministeriums für Bildung und Forschung (BMBF), entstanden, die sprachdiagnostische Verfahren entwickeln und erproben bzw. synoptisch zusammenstellen und vergleichend kritisch diskutieren. Im Rahmen des BundLänder-Projekts Förderung von Kindern und Jugendlichen mit Migrationshintergrund (FörMig, 2004–2009), an dem sich insgesamt zehn Bundesländer beteiligt haben,

Einführung in die Sprachdiagnostik

13

sind insbesondere profilanalytische Verfahren (vgl. Grießhaber in diesem Band) für den Übergang zwischen unterschiedlichen Bildungsetappen (vom Elementarbereich bis hin zur beruflichen Bildung) entwickelt worden. Auch das mittlerweile weit verbreitete Konzept der Durchgängigen Sprachbildung (vgl. z. B. Gogolin & Lange 2010) ist durch das Projekt sehr befördert worden. Die interdisziplinär aufgestellte Forschungsinitiative Sprachdiagnostik und Sprachförderung (FiSS, 2009–2012 und 2012–2016) umfasste bis zu 25 Forschungsprojekte zur Aneignung, Diagnose und Förderung der Sprachkompetenzen von Kindern und Jugendlichen. Zusammengefasst sind wesentliche Ergebnisse u. a. in zwei Sammelbänden (Redder & Weinert (Hrsg.) 2013; Redder, Naumann & Tracy (Hrsg.) 2015). Das Forschungs- und Entwicklungsprogramm Bildung durch Sprache und Schrift (BiSS) schließlich zielt auf die Evaluation und Weiterentwicklung von bereits in den unterschiedlichen Bundesländern durchgeführten Maßnahmen in den Bereichen Sprachdiagnose, Sprachförderung und hier insbesondere Leseförderung für Kinder und Jugendliche. Insgesamt über 600 Bildungsträger arbeiten dabei in 102 Verbünden zusammen. Für den Bereich der Sprachdiagnostik besonders interessant ist eine teilweise öffentlich zugängliche Online-Datenbank, die zahlreiche diagnostische Verfahren ausführlich vorstellt und hinsichtlich ihrer wissenschaftlichen Güte bewertet (http://www.biss-sprachbildung.de/biss.html?seite=27). Was den Punkt der Expertisen betrifft, so zeugen diese von einer intensiven Auseinandersetzung mit Qualitätsanforderungen an zuweisungsdiagnostische Verfahren im Anschluss an die im Zuge der Post-PISA-Schwemme in den unterschiedlichen Bundesländern ad hoc aus dem Boden gestampften Verfahren. Zu nennen sind hier bspw. Fried (2004), Ehlich (2005), Ehlich et al. (2007), Kallmeyer (2007), Dietz & Lisker (2008), Kurzwernhart (2009), Lisker (2010, 2013), Redder et al. (2010), Lengyel (2012), Mercator-Institut (Hrsg.) (2013) oder auch Neugebauer & Becker-Mrotzek (2013). Zusammenfassend lassen sich in Anlehnung an die genannten Expertisen die folgenden Kriterien zur Beschreibung und Bewertung standardisierter sprachdiagnostischer Verfahren anlegen: Linguistische und zweitsprachenerwerbstheoretische Kriterien − theoretische Fundierung, − Berücksichtigung der Basisqualifikationen (Ehlich 2005), − Berücksichtigung produktiver vs. rezeptiver Fertigkeiten, − Berücksichtigung mündlicher vs. schriftlicher Fertigkeiten, − Berücksichtigung spontansprachlicher, quasi-natürlicher Äußerungen, − Berücksichtigung von Variation als Indikator einer Erwerbsaktivität. Diagnostische Kriterien − Verfahrensart (Test, Screening, Profilanalyse, Beobachtung, Schätzverfahren), − Zielgruppe (einsprachige, mehrsprachige Lerner*innen; Lerner*innen mit Spracherwerbsstörungen; Alter und Kontaktdauer der Lernenden),

14 − − − −

Julia Settinieri und Stefan Jeuk

Einbezug relevanter sprachbiographischer Hintergrundinformationen, Gütekriterien (s. a. weiter unten in diesem Abschnitt), förderdiagnostische Einsetzbarkeit, wiederholte Einsetzbarkeit.

Kriterien der Mehrsprachigkeitsforschung − Einbezug aller Sprachen der Lernenden bei der Datenerhebung und bei der Normierung, − Differenzierung zwischen Spracherwerbsverzögerung und -störung unter Einbezug der Sprachkompetenz in der L1, − Berücksichtigung mehrsprachiger Sprachgebrauchsformen. Pädagogische Kriterien − Offenlegung von Zielen und Entstehungshintergründen des Verfahrens, − ethische Kriterien (z. B. Vermeidung von Frustration, Form der Rückmeldung, diagnostische Konsequenzen usw.), − zeitliche Anforderungen, − Qualifikation der diagnostizierenden Fachkräfte. Insbesondere für jüngere Lerner*innen verweisen Wenzel, Schulz & Tracy (2009: 49) mit Blick auf die Validität außerdem darauf, dass für die in der Regel mündlichen Verfahren auch eine Orientierung an mündlichen (und nicht etwa an schriftsprachlichen) Sprachnormen zentral sei, sowie auf die erforderliche Trennung von Sprach- und Weltwissen. Einerseits dürften in einer Testsituation geäußerte kindliche Formulierungen wie z. B. Weiß ich., die Erwachsene in derselben Sprechsituation in identischer Form äußern würden, nicht etwa als fehlerhafte Objektelision, sondern vielmehr als gesprochensprachlich absolut normgerechte Äußerung interpretiert werden. Und zum anderen sollten Tests möglichst frei von kulturspezifischen Kommunikationssituationen sein, um zu vermeiden, dass mehrsprachige Kinder nicht an ihren tatsächlichen sprachlichen Fähigkeiten, sondern vielmehr an ihrem kulturellen Weltwissen gemessen würden (Wenzel, Schulz & Tracy 2009: 49– 50). Aus dieser Forderung nach Unabhängigkeit von unterschiedlichen Erwerbsgelegenheiten leitet sich auch die Empfehlung ab, nur regelgeleitete Grammatikkompetenz und nicht etwa unregelmäßige Formen oder gar Wortschatz abzutesten. Eine solche Beschränkung auf „regelbasierte grammatische Kernbereiche“ (Schulz, Tracy & Wenzel 2008: 12) erscheint darüber hinaus auch angesichts der begrenzten Zeit, die für einen Test in Anspruch genommen werden kann, sinnvoll. Für Fragen der individuellen Förderung könnten hingegen die Fähigkeiten einer Person gerade in den unregelmäßigen Formen durchaus wichtig sein. Angesichts des Umfangs des obigen Kriterienkatalogs kann es sicherlich nicht das eine sprachdiagnostische Verfahren geben, sondern alle Verfahren sind grundsätzlich als ausschnittartig, perspektivisch und fehlerbehaftet anzusehen. Entspre-

Einführung in die Sprachdiagnostik

15

chend umsichtig und reflektiert sollten sie eingesetzt werden, was eine kritische Prüfung der Verfahrensgüte und der damit verbundenen Einsatzmöglichkeiten sowie Einschränkungen ihrer Reichweite betrifft. Zuweisungsdiagnostische Verfahren unterliegen dabei den klassischen Gütekriterien Objektivität, Reliabilität und Validität sowie den einschlägigen Nebengütekriterien Normierung, Vergleichbarkeit, Ökonomie und Nützlichkeit (Lienert & Raatz 1998: 7; Bühner 2006: 33, 43; Settinieri 2012; vgl. genauer auch die Beiträge von Gültekin-Karakaoç; Porsch & Wendt; Paetsch; Grotjahn in diesem Band). Darüber hinaus ist eine transparente Darstellung des Verfahrens (inkl. seiner Konstruktion und Pilotierung sowie Normierung) eminent wichtig, um seine Güte überhaupt beurteilen zu können. Für förderdiagnostische Verfahren liegt hingegen kein fester Katalog von Gütekriterien vor. Es kann davon ausgegangen werden, dass die Gütekriterien qualitativer Forschung (vgl. z. B. Steinke 2008; Schmelter 2014) grundsätzlich übertragbar sein sollten (analog zur Anwendung der quantitativen Kriterien auf die Zuweisungsdiagnostik; vgl. auch Lengyel 2012: 21). So erheben qualitative Herangehensweisen grundsätzlich den Anspruch, „das Handeln der Personen im untersuchten Feld zu verstehen und aus ihrer Perspektive, d. h. aus einer Innenperspektive, beschreibend möglichst vollständig zu erfassen, um so Zusammenhänge, Muster, Typen usw. entdecken und in begrenztem Maße erklären zu können“ (Schmelter 2014: 41). Analog zielen förderdiagnostische Ansätze darauf, das System der Lernersprache von Lernenden in seinem komplexen Zusammenspiel aus L1-, L2- und davon unabhängigen Einflüssen zu rekonstruieren. Die Verfahren gehen dabei datengeleitet vor und untersuchen offen (d. h. ohne vorherige Festlegung weniger, ausgewählter Indikatoren) möglichst natürliche (oder zumindest quasi-natürliche) Lerneräußerungen. Die Wahl der Diagnoseinstrumente muss dabei natürlich begründet erfolgen (Indikation), weist aber eine große Flexibilität auf und kann bzw. sollte im Diagnoseprozess immer wieder angepasst werden. Üblicherweise werden mehrere, einander ergänzende mündliche und/oder schriftliche Lerneräußerungen zur Diagnose herangezogen (Triangulation), deren Limitation (z. B. bzgl. Umfang, Textsorte usw.) reflektiert werden sollte. Schließlich sollte die Gesamtinterpretation sowohl kohärent als auch für die weitere Förderplanung relevant sein, was weitere Gütekriterien qualitativer Sozialforschung aufgreift. Abschließend stellen Transparenz und intersubjektive Nachvollziehbarkeit auch im förderdiagnostischen Zusammenhang wichtige Grundanforderungen an das sprachdiagnostische Vorgehen dar. Dabei zeigen die o. g. Expertisen, dass die aktuell vorhandenen Verfahren die an sie gestellten Anforderungen in ganz unterschiedlichem Maße erfüllen. Auch ist zu konstatieren, dass die Auswahl sprachdiagnostischer Verfahren im Primar- und Elementarbereich mittlerweile recht groß ausfällt, dann aber mit ansteigenden Bildungsstufen deutlich abnimmt. Für die Sekundarstufe II und den berufsbildenden Bereich finden sich schließlich nur noch sehr wenige spezifisch einschlägige Verfahren (vgl. Abschnitt III in diesem Band). Wie bei vielen didaktischen Entwicklungen (vgl. z. B. die aktuelle Entwicklung von Konzepten zur Durchgängigen Sprachbil-

16

Julia Settinieri und Stefan Jeuk

dung) besteht jedoch auch hier die Hoffnung, dass sich die Verfahren vom Elementar- bis hin zum Erwachsenenbereich sukzessive aufbauen werden.

7 Neuere Entwicklungstendenzen Schließlich ist in jüngerer Zeit zu beobachten, dass die starke Tendenz zur Entwicklung normierter Verfahren und zur Kompetenzorientierung in der Sprachdiagnostik bereits wieder im Abklingen befindlich zu sein scheint und das Pendel im Zuge der aktuelleren Inklusionspolitik wieder in Richtung informellerer, am Individuum ausgerichteter Förderdiagnostik auszuschlagen scheint. Mit der Grundidee von Inklusion, wie sie bspw. von der deutschen UNESCO-Kommission festgehalten wird, erscheint eine Zuweisungsdiagnostik auf den ersten Blick denn auch kaum vereinbar. Inklusive Bildung bedeutet, dass allen Menschen – unabhängig von Geschlecht, Behinderung, ethnischer Zugehörigkeit, besonderen Lernbedürfnissen, sozialen oder ökonomischen Voraussetzungen – die gleichen Möglichkeiten offen stehen, an qualitativ hochwertiger Bildung teilzuhaben und ihre Potenziale zu entwickeln. (Deutsche UNESCO-Kommission 2012: 10)

Wenn „alle“ Zugang zu „allen“ Bildungsmöglichkeiten haben sollten, scheinen Selektionsmaßnahmen kaum noch zeitgemäß zu sein. Darüber hinaus wird Mehrsprachigkeit in inklusiven Diskussionszusammenhängen in gewisser Weise auf eine Heterogenitätsdimension unter vielen möglichen anderen reduziert, und auch das im Schulzusammenhang aktuell sehr dominante Konzept der Durchgängigen Sprachbildung betont explizit, sich an alle Schüler*innen zu richten und nicht etwa ausschließlich an mehrsprachige. Gleichzeitig dürfen die spezifischen Lernvoraussetzungen, -bedarfe und -potentiale mehrsprachig aufwachsender Lerner*innen nicht aus dem Blick verloren werden, um optimal angepasste Lernumgebungen schaffen zu können. Und auch das letzte Wort zwischen Inklusions- und Sonderpädagogen ist noch nicht gesprochen. Problematisch kann es in diesem Zusammenhang sein, wenn Diagnostik für die Zwecke der Zuweisung personeller Ressourcen vor den Karren gespannt wird (Etikettierungs-Ressourcen-Dilemma) und gleichzeitig Zuschreibungen vornimmt (vgl. Riemer 2017; Jeuk erscheint). Auch weitere, im Kontext der Sprachdiagnostik entstehende ethische Fragen sollten in Zukunft noch stärker in den Forschungsfokus gestellt werden. In Abschnitt 5 ist bereits die Segregations-Problematik von High-Stakes-Tests im Kontext von Migration angesprochen worden. Es stellen sich aber auch alltäglichere Fragen wie bspw. Ist es zu rechtfertigen, dass KiTa-Kinder in Tränen ausbrechen, weil sie Angst vor einem Sprachtest haben? oder Verbessert es wirklich die Sprachfördermaßnahme, wenn neu zugewanderte Schüler*innen im Rahmen eines Erstgesprächs nach den Berufen ihrer Eltern gefragt werden? Sicherlich ließen sich hier noch zahlreiche weitere Fragen aufwerfen, die zeigen, dass der Bereich der Sprachdiagnostik ein

Einführung in die Sprachdiagnostik

17

besonders sensibles Praxisfeld darstellt. Insofern bleibt abzuwarten, wie sich das Lehr- und Forschungsgebiet in den kommenden Jahrzehnten weiterentwickeln und ausdifferenzieren wird. Als sicher gelten kann nur, dass die Diagnostik als Grundlage didaktischer Entscheidungen weiterhin eine zentrale Grundlage jeden Sprachunterrichts darstellen wird und dass sowohl Förder- als auch Zuweisungsdiagnostik einen je spezifischen Beitrag leisten können.

Literaturangaben Ahrenholz, Bernt (2014): Erstsprache – Zweitsprache – Fremdsprache. In Bernt Ahrenholz & Ingelore Oomen-Welke (Hrsg.), Deutsch als Zweitsprache, 3–16. Baltmannsweiler: Schneider. Apeltauer, Ernst (2004): Beobachten oder Testen? Möglichkeiten zur Erfassung des Sprachentwicklungsstandes von Vorschulkindern mit Migrationshintergrund. Flensburg: Rux. Bredel, Ursula (2005): Sprachstandsmessung – Eine verlassene Landschaft. In Bundesministerium für Bildung und Forschung (Hrsg.), Anforderungen an Verfahren der regelmäßigen Sprachstandsfeststellung als Grundlage für die frühe und individuelle Förderung von Kindern mit und ohne Migrationshintergrund, 77–119. Bonn: BMBF. Bühner, Markus (2006): Einführung in die Test- und Fragebogenkonstruktion. 2., aktual. Aufl. München: Pearson. Deutsche UNESCO-Kommission e.V. (Hrsg.) (2012): Bildungsregionen auf dem Weg. Inklusive Bildung in Aachen, Wiesbaden, Hamburg und Oberspreewald-Lausitz. Hamburg: Kandinsky Production House. https://www.unesco.de/sites/default/files/2018-05/Bildungsregionen_ auf_dem_Weg_2012-1_0.pdf (20. 06. 2018). Dietz, Sandra & Andrea Lisker (2008): Sprachstandsfeststellung und Sprachförderung im Kindergarten. Deutsches Jugendinstitut e.V. http://www.dji.de/fileadmin/user_upload/bibs/ Sprachstandsfeststellung_Dietz_Lisker.pdf (20. 06. 2018). Döll, Marion (2016): Sprachdiagnostik für Migrantinnen und Migranten. In Eva Burwitz-Melzer, Grit Mehlhorn, Claudia Riemer, Karl-Richard Bausch & Hans-Jürgen Krumm (Hrsg.), Handbuch Fremdsprachenunterricht, 423–428, 6., völlig überarb. und erw. Aufl. Tübingen: Francke. Ehlich, Konrad (2005): Eine Expertise zu „Anforderungen an Verfahren der regelmäßigen Sprachstandsfeststellung als Grundlage für die frühe und individuelle Sprachförderung von Kindern mit und ohne Migrationshintergrund“. In Ingrid Gogolin, Urusla Neumann & HansJoachim Roth (Hrsg.), Sprachdiagnostik bei Kindern und Jugendlichen mit Migrationshintergrund. Dokumentation einer Fachtagung am 14. Juli 2004 in Hamburg, 33– 50. Münster: Waxmann. Ehlich, Konrad (2007): Sprachaneignung und deren Feststellung bei Kindern mit und ohne Migrationshintergrund. Was man weiß, was man braucht, was man erwarten kann. In Konrad Ehlich (Hrsg.), Anforderungen an Verfahren der regelmäßigen Sprachstandsfeststellung als Grundlage für die frühe und individuelle Förderung von Kindern mit und ohne Migrationshintergrund, 11–75. Bonn u. a.: BMBF. Ehlich, Konrad, in Zusammenarbeit mit Ursula Bredel, Birgitta Garme, Anna Komor, Hans-Jürgen Krumm, Tim McNamara, Hans H. Reich, Guido Schnieders, Jan D. ten Thije, Huub van den Bergh (2007): Anforderungen an Verfahren der regelmäßigen Sprachstandsfeststellung als Grundlage für die frühe und individuelle Förderung von Kindern mit und ohne Migrationshintergrund. Bildungsforschung 11. BMBF. https://www.bmbf.de/pub/ Bildungsforschung_Band_11.pdf (20. 06. 2018).

18

Julia Settinieri und Stefan Jeuk

Fried, Lilian (2004): Expertise zu Sprachstandserhebungen für Kindergartenkinder und Schulanfänger. Eine kritische Betrachtung. Deutsches Jugendinstitut München. https:// www.dji.de/fileadmin/user_upload/bibs/271_2232_ExpertiseFried.pdf, (20. 06. 2018). Fried, Lilian (2005): Spracherfassungsverfahren für Kindergartenkinder und Schulanfänger. In Ingrid, Gogolin, Ursula Neumann & Hans-Joachim Roth (Hrsg.), Sprachdiagnostik bei Kindern und Jugendlichen mit Migrationshintergrund, 19–32. Münster: Waxmann. Fried, Lilian & Eva Briedigkeit (2007): Delfin 4. Hintergründe und Einblicke zum neuen System der Sprachstandsfeststellung und -förderung. KOMPAKT Spezial 5, 10–12. Gass, Susan M. & Larry Selinker (1994): Second language acquisition. An introductory course. 2. Aufl. Mahwah, NJ: Erlbaum. Gogolin, Ingrid & Imke Lange (2010): Durchgängige Sprachbildung. Eine Handreichung. Münster: Waxmann. Grießhaber, Wilhelm (2010): Spracherwerbsprozesse in Erst-und Zweitsprache. Duisburg: Universitätsverlag Rhein-Ruhr. Grotjahn, Rüdiger & Karin Kleppin (2017): Feedback zu schriftlichen Lernerproduktionen. In Bettina Akukwe, Rüdiger Grotjahn & Stefan Schipolowski (Hrsg.), Schreibkompetenzen in der Fremdsprache. Aufgabengestaltung, kriterienorientierte Bewertung und Feedback, 255–291. Tübingen: Narr. Jeuk, Stefan (2009): Probleme der Sprachstandserhebung bei mehrsprachigen Kindern. Zeitschrift für Soziologie der Erziehung und Sozialisation 29, 141–156. Jeuk, Stefan (2018): Deutsch als Zweitsprache in der Schule. Grundlagen – Diagnose – Förderung. 4., aktual. Aufl. Stuttgart: Kohlhammer. Jeuk, Stefan (erscheint): Sprachstandsdiagnostik als Exklusion? In Christiane Hochstadt, & Ralph Olsen (Hrsg.), Deutschunterricht und Inklusion. Überblick und Kritik. Weinheim: Beltz. Kallmeyer, Kirsten (2007): Vorschulische Maßnahmen zur Sprachstandserhebung in den deutschen Bundesländern. Eine wissenschaftliche Synopse ausgewählter praxisrelevanter Verfahren. Aachen: Shaker. Kluge, Friedrich (2011): Etymologisches Wörterbuch der deutschen Sprache. 25., durchges. Aufl. Berlin; Boston: De Gruyter. Kniffka, Gabriele (2016): Sprachprüfungen für Migrantinnen und Migranten. In Eva Burwitz-Melzer, Grit Mehlhorn, Claudia Riemer, Karl-Richard Bausch & Hans-Jürgen Krumm (Hrsg.), Handbuch Fremdsprachenunterricht, 428–433. 6., völlig überarb. und erw. Aufl. Tübingen: Francke. Kurzwernhart, Petra Johanna (2009): Sprachstandserhebungsverfahren im Überblick unter Berücksichtigung von linguistischen Grundlagen, Mehrsprachigkeitsdiagnostik, Basisqualifikationen, Gütekriterien und Verfahrensarten. http://othes.univie.ac.at/6699/1/ 2009-08-10_0203973.pdf (20. 06. 2018). Lengyel, Drorit (2012): Sprachstandsfeststellung bei mehrsprachigen Kindern im Elementarbereich. Deutsches Jugendinstitut e.V. http://www.weiterbildungsinitiative.de/ uploads/media/Expertise_29_Lengyel_Sprachstandsfeststellung.pdf (20. 06. 2018). Lienert, Gustav A. & Ulrich Raatz (1998): Testaufbau und Testanalyse. 6. Aufl. Weinheim: Beltz. Lisker, Andrea (2010): Sprachstandsfeststellung und Sprachförderung im Kindergarten sowie beim Übergang in die Schule. Expertise im Auftrag des Deutschen Jugendinstituts. https:// www.dji.de/fileadmin/user_upload/bibs/Expertise_Sprachstandserhebung_Lisker_2010.pdf (20. 06. 2018). Lisker, Andrea (2013): Sprachstandsfeststellung und Sprachförderung im Kindergarten sowie beim Übergang in die Schule. Deutsches Jugendinstitut e.V. http://www.dji.de/fileadmin/user_ upload/bibs2014/Expertise_Sprachstandserhebung_Lisker_2013.pdf (20. 06. 2018). Maak, Diana (2010): Sprachstandsdiagnose/Sprachstandsmessung. In Barkowski, Hans &Krumm, Hans-Jürgen (Hrsg.), Fachlexikon Deutsch als Fremd- und Zweitsprache, 309–310. Tübingen: Francke.

Einführung in die Sprachdiagnostik

19

Mercator-Institut für Sprachförderung und Deutsch als Zweitsprache (Hrsg.) (2013): Qualitätsmerkmale für Sprachstandsverfahren im Elementarbereich. Ein Bewertungsrahmen für fundierte Sprachdiagnostik in der Kita. Köln. https://www.stiftung-mercator.de/media/ downloads/3_Publikationen/Becker-Mrotzek_et_al_Qualitaetsmerkmale_ Sprachstandsverfahren_Kita.pdf (20. 06. 2018). Neugebauer, Uwe & Michael Becker-Mrotzek (2013): Die Qualität von Sprachstandsverfahren im Elementarbereich. Eine Analyse und Bewertung. Köln: Mercator-Institut für Sprachförderung und Deutsch als Zweitsprache. http://www.mercator-institut-sprachfoerderung.de/fileadmin/ user_upload/MercatorInstitut_Qualitaet_Sprachstandsverfahren_Web_03.pdf (20. 06. 2018). Pfeifer, Wolfgang (1993): Etymologisches Wörterbuch des Deutschen. A–L. 2., durchges., erg. Aufl. Berlin: Akademie Verlag. Redder, Angelika, Johannes Naumann & Rosemarie Tracy (Hrsg.) (2015): Forschungsinitiative Sprachdiagnostik und Sprachförderung (FiSS) – Ergebnisse. Münster u. a.: Waxmann. Redder, Angelika, Knut Schwippert, Marcus Hasselhorn, Sabine Forschner, Detlef Fickermann & Konrad Ehlich (2010): ZUSE-Diskussionspapier Nummer 1. Grundzüge eines nationalen Forschungsprogramms zur Sprachdiagnostik und Sprachförderung. http://epub.sub.unihamburg.de/epub/volltexte/2011/9870/pdf/ZUSE_Diskussion001.pdf (20. 06. 2018). Redder, Angelika & Sabine Weinert (Hrsg.) (2013): Sprachförderung und Sprachdiagnostik – interdisziplinäre Perspektiven. Münster: Waxmann. Reich, Hans H. (2005): Auch die „Verfahren zur Sprachstandsanalyse bei Kindern und Jugendlichen mit Migrationshintergrund“ haben ihre Geschichte. In Ingrid Gogolin, Ursula Neumann & Hans-Joachim Roth (Hrsg.), Sprachdiagnostik bei Kindern und Jugendlichen mit Migrationshintergrund, 87–95. Münster: Waxmann. Reich, Hans H. (2007): Forschungsstand und Desideratenaufweis zu Migrationslinguistik und Migrationspädagogik für die Zwecke des „Anforderungsrahmens“. In Konrad Ehlich (Hrsg.), Anforderungen an Verfahren der regelmäßigen Sprachstandsfeststellung als Grundlage für die frühe und individuelle Förderung von Kindern mit und ohne Migrationshintergrund, 121– 169. Bonn u. a.: BMBF. Riemer, Claudia (2017): „DaZ und Inklusion – Gemeinsamkeiten und Unterschiede. Ein fachpolitischer Positionierungsversuch aus der Perspektive des Fachs DaF/DaZ“. In Michael Becker-Mrotzek, Peter Rosenberg, Christoph Schroeder & Annika Witte (Hrsg.), Deutsch als Zweitsprache in der Lehrerbildung, 171–186. Münster; New York: Waxmann. Riemer, Claudia & Julia Settinieri (2010): Empirische Forschungsmethoden in der Zweit- und Fremdsprachenerwerbsforschung. In Hans-Jürgen Krumm, Christian Fandrych, Britta Hufeisen & Claudia Riemer (Hrsg.), Deutsch als Fremd- und Zweitsprache, 764–781. Berlin: de Gruyter. Rossa, Henning (2016): Testen und Prüfen. In Eva Burwitz-Melzer, Grit Mehlhorn, Claudia Riemer, Karl-Richard Bausch & Hans-Jürgen Krumm (Hrsg.), Handbuch Fremdsprachenunterricht, 399–403. 6., völlig überarb. und erw. Aufl. Tübingen: Francke. Roth, Hans-Joachim (2008): Verfahren zur Sprachstandsfeststellung – ein kritischer Überblick. In Christiane Bainski & Marianne Krüger-Potratz (Hrsg.), Handbuch Sprachförderung, 22–41. Essen: Neue Deutsche Schule. Roth, Hans-Joachim & İnci Dirim (2007): Diagnostik der Sprachleistungen zweisprachig aufwachsender Kinder. In Hermann Schöler & Alfons Welling (Hrsg.), Sonderpädagogik der Sprache, 648–665. Göttingen u. a.: Hogrefe. Schlee, Jörg (2008): 30 Jahre Förderdiagnostik – eine kritische Bilanz. Zeitschrift für Heilpädagogik 4, 122–131. Schmelter, Lars (2014): Gütekriterien. In Julia Settinieri, Sevilen Demirkaya, Alexis Feldmeier, Nazan Gültekin-Karakoç & Claudia Riemer (Hrsg.), Einführung in empirische Forschungsmethoden für Deutsch als Fremd- und Zweitsprache, 33–46. Paderborn: UTB.

20

Julia Settinieri und Stefan Jeuk

Schmölzer-Eibinger, Sabine, Magdalena Dorner, Elisabeth Langer & Maria-Rita Helten-Pacher (2013): Sprachförderung im Fachunterricht in heterogenen Klassen. Stuttgart: Klett. Schroeder, Christoph & Wilfried Stölting (2005): Mehrsprachig orientierte Sprachstandsfeststellungen für Kinder mit Migrationshintergrund. In Ingrid Gogolin, Ursula Neumann & Hans-Joachim Roth (Hrsg.), Sprachdiagnostik bei Kindern und Jugendlichen mit Migrationshintergrund, 59–74. Münster: Waxmann. Schulz, Petra, Rosemarie Tracy & Ramona Wenzel (2008): Linguistische Sprachstandserhebung – Deutsch als Zweitsprache (LiSe-DaZ): Theoretische Grundlagen und erste Ergebnisse. In Bernt Ahrenholz (Hrsg.), Zweitspracherwerb: Diagnosen, Verläufe, Voraussetzungen, 9–33. Freiburg i.B.: Fillibach. Selinker, Larry (1972): Interlanguage. International Review of Applied Linguistics in Language Teaching 10, 219–231. Settinieri, Julia (2012): Zur Messgüte sprachstandsdiagnostischer Verfahren im Vorschulalter. Erste Ergebnisse der Korrelationsstudie Sismik/Seldak – Delfin 4. In Bernt Ahrenholz & Werner Knapp (Hrsg.), Sprachstand erheben – Spracherwerb erforschen. Beiträge aus dem 6. Workshop „Kinder mit Migrationshintergrund“, 2010, 35–52. Freiburg im Breisgau: Fillibach. Steinke, Ines (2008): Gütekriterien qualitativer Forschung. In Uwe Flick, Ernst von Kardoff & Ines Steinke (Hrsg.): Qualitative Forschung. Ein Handbuch, 319–331. 6., durchges. und aktual. Aufl. Reinbek bei Hamburg: Rowohlt. Tracy, Rosemarie (2007): Wie Kinder Sprachen lernen. Tübingen: Francke. Ulich, Michaela & Toni Mayr (2004): Sprachentwicklung von Migrantenkindern im Kindergarten – der Beobachtungsbogen SISMIK. In Argyro Panagiotopoulou & Ursula Carle (Hrsg.), Sprachentwicklung und Schriftspracherwerb. Beobachtungs- und Fördermöglichkeiten in Familie, Kindergarten und Grundschule, 12–22. Baltmannsweiler: Schneider. Vygotskij, Lew S. (2002): Denken und Sprechen. Weinheim: Beltz. Wenzel, Ramona, Petra Schulz & Rosemarie Tracy (2009): Herausforderungen und Potenzial der Sprachstandsdiagnostik – Überlegungen am Beispiel von LiSe-DaZ. In Drorit Lengyel, Hans H. Reich, Hans-Joachim Roth & Marion Döll (Hrsg.), Von der Sprachdiagnose zur Sprachförderung, 45–70. Münster u. a.: Waxmann.

Christine Dimroth

2 Lernersprachen 1 2 3 4 5 6

Einleitung: Der Begriff Lernersprachen Voraussetzung für die Sprachdiagnostik: Überindividuelle Gemeinsamkeiten im Erwerbsverlauf Einflussfaktoren auf die Entwicklung von Lernersprachen beim Zweitspracherwerb Die Entwicklung von Lernersprachen Sprachstandsdiagnose: Die Verbstellung als Kriterium für Erwerbsphasen Fazit und Ausblick

1 Einleitung: Der Begriff Lernersprachen Sprachdiagnostik ist nur dann sinnvoll, wenn man annimmt, dass der Spracherwerb ein gerichteter Prozess ist, der eine ausreichende überindividuelle Systematik aufweist, um Lernende an irgendeiner Stelle „verorten“ zu können und ggfs. Abweichungen von einem Normalverlauf zu bestimmen (Rothweiler 2016). Dabei muss die Entwicklung in verschiedenen sprachlichen Teilgebieten (z. B. Aussprache, Wortschatz, Grammatik, Diskurs) nicht unbedingt als zusammenhängend aufgefasst werden, d. h., die spezifische „Verortung“ eines Lernenden in einer bestimmten Entwicklungsphase, etwa im Bereich des Wortschatzes, sagt noch nicht unbedingt etwas über die Entwicklung desselben Individuums im Bereich der Grammatik aus. Die meisten Ansätze gehen aber durchaus davon aus, dass besonders die Entwicklung von Lexikon und Grammatik nicht völlig losgelöst voneinander stattfindet. Dies gilt prinzipiell sowohl für den einsprachigen als auch für den mehrsprachigen Erwerbsverlauf, für den gesteuerten genauso wie für den ungesteuerten Spracherwerb. Allerdings ist das Konzept eines gerichteten Prozesses in mancher Hinsicht eine Idealisierung, denn die Eigendynamik des Spracherwerbs wird von einer Reihe von Faktoren, wie etwa Eigenschaften individueller Lernender oder individueller Lernsituationen, beeinflusst und ein hohes Maß an Variation liegt in der Natur des sich entwickelnden Sprachwissens. Nicht zuletzt spielt auch die Kreativität individueller Lernender dabei eine Rolle. Wenn also im Folgenden von der Systematik des Spracherwerbs die Rede ist, muss dies immer mitgedacht werden. Wir kommen im zweiten Abschnitt dieses Beitrags noch auf diese Fragen zurück, auf die verschiedene theoretische Ansätze zum Teil recht unterschiedliche Antworten geben. Besondere Herausforderungen stellen sich der Sprachdiagnostik bei mehrsprachigen SprecherInnen. Zum einen sind die oben genannten Faktorenkonstellationen hier komplexer und variabler als beim monolingualen Spracherwerb, zum anderen stellt sich die Frage nach einem geeigneten Vergleichsmaßstab, an dem die Entwicklung gemessen werden kann. Während beim monolingualen Spracherwerb ein relativ klarer Zusammenhang zwischen ungestörter Sprachentwicklung und Lebensalhttps://doi.org/10.1515/9783110418712-002

22

Christine Dimroth

ter auszumachen ist, können die zeitliche Verteilung und die Art des Zugangs zu den beteiligten Sprachen beim mehrsprachigen Erwerb stark divergieren. Dazu kommt die Frage, inwieweit es überhaupt zielführend und aufschlussreich ist, mehrsprachige mit einsprachigen SprecherInnen zu vergleichen, da Untersuchungen zum Sprachgebrauch eine teilweise komplementäre Nutzung und einen davon abhängigen unterschiedlichen Ausbau der beteiligten Sprachen aufzeigen. Psycholinguistische Studien zum bilingualen Lexikon (Kroll & Tokowicz 2005) sowie Untersuchungen zu Sprachmischungen (Muysken 2000) zeigen außerdem, dass das sprachliche Wissen zu den unterschiedlichen Sprachen, über das mehrsprachige Lernende und SprachnutzerInnen verfügen, nicht vollständig voneinander getrennt ist, sondern dass vielmehr von einer gegenseitigen Beeinflussung auszugehen ist. Die Sprachentwicklung monolingualer SprecherInnen ist daher als Maßstab für bilinguale SprecherInnen nur bedingt geeignet (Grosjean 1989). Der Begriff Lernersprache wird gebraucht, um anzuzeigen, dass die Sprachkompetenz von Lernenden oft Eigenschaften hat, die weder der Ausgangssprache noch der Zielsprache entsprechen. Mit Sprachkompetenz sind dabei die in Entwicklung befindlichen Wissenssysteme gemeint, die dem Sprachgebrauch (Produktion und Perzeption) der Lernenden zugrunde liegen. Die Bezeichnung Interlanguage lenkte die Aufmerksamkeit schon früh (Selinker 1969: 1972) auf die Besonderheiten solcher eigenständiger Systeme, wobei die Bezeichnung eine Art Übergangsstadium zwischen Ausgangs- und Zielsprache suggeriert. Die Kompetenz von L2-SprecherInnen unterscheidet sich jedoch in den meisten Fällen dauerhaft von der von MuttersprachlerInnen (z. B. durch einen Akzent). Selinker verweist auf eine angenommene Quote von 5 % AusnahmelernerInnen, die ein muttersprachliches Niveau erreichen, und geht davon aus, dass die Entwicklung bei allen anderen vorher zum Stillstand kommt (fossilization) oder von temporären Rückschritten (backsliding) geprägt ist. Der Begriff Lernersprache soll sowohl der Dynamik als auch der Möglichkeit der Stabilisierung auf einem nicht-muttersprachlichen Niveau gerecht werden. Dabei legt der Begriff eine Sichtweise nahe, die zum Ziel hat, die sprachliche Kompetenz von Lernenden – besonders so, wie sie sich in der Sprachproduktion zeigt – in ihrer Eigengesetzlichkeit zu erfassen. Gemeint ist der Versuch, die Eigenschaften von Lernersprachen zu untersuchen, ohne dabei ihre Abweichungen von der Zielsprache in den Vordergrund zu stellen, da eine „Ziel-Abweichungs-Perspektive“ (Klein & Dimroth 2003) den Blick auf Struktur, Funktion und Dynamik entstehender Wissenssysteme leicht verstellen kann. Die Bezeichnung Lernersprache transportiert stattdessen eine Perspektive auf den Untersuchungsgegenstand, die diesen mit anderen Sprachen auf eine Stufe stellt. Diese Eigenständigkeit wird auch durch die alternative Bezeichnung Lernervarietät hervorgehoben, die jedoch zudem einen Hinweis auf die Überdachung durch eine Zielsprache (etwa: Lernervarietät des Deutschen) enthält. Beide Bezeichnungen suggerieren, dass das Sprachwissen von Lernenden trotz aller Varianz so viel Systematik aufweist, dass es die Bezeichnung Sprache/Varietät

Lernersprachen

23

verdient, und werden somit in Abgrenzung zu Willkür oder Chaos verwendet. Besonders im generativen Paradigma kommt dem Begriff Sprache darüber hinaus noch eine andere Bedeutung zu. Das Gegenstück wäre hier ein Kommunikationssystem, das durchaus systematisch sein kann, jedoch bestimmte Eigenschaften nicht erfüllt, die der generativen Theorie zufolge als konstitutiv für menschliche Sprachen gelten. Besonders das Fehlen hierarchischer syntaktischer Strukturen führt dieser Auffassung zufolge zu einer Einordnung als Nicht-Sprache oder Protosprache (Bickerton 1998). Mit Blick auf den Spracherwerb nahmen Vertreter der generativen Theorie an (Johnson & Newport 1989; Long 1990; Meisel 2009), dass L2 Lernende, die das (Klein-)Kindesalter und somit eine „Kritische Periode“ für den Spracherwerb bei Erwerbsbeginn bereits hinter sich gelassen haben, dazu verurteilt sind, in einem solchen nicht voll sprachäquivalenten Kommunikationssystem zu verharren. Das angeborene domänenspezifische Vorwissen, das zum Aufbau einer „echten“ Sprache vonnöten ist, steht älteren Lernenden nicht mehr zur Verfügung. Während junge Kinder also auf Vorwissen über „zulässige“ Grammatiken (Universalgrammatik, UG) zurückgreifen können, das ihnen dabei hilft, eine zulässige Grammatik „auszuwählen“, die mit der Umgebungssprache kompatibel ist, müssen sich ältere Lernende mit allgemeinen kognitiven Ressourcen behelfen, mit denen eine „echte“ Sprache nicht erreichbar ist. Ältere Lernende können zwar noch sprachliche Routinen erwerben, mit deren Hilfe kommunikative Aufgaben bewältigt werden können; eine vollwertige Grammatik, die auch die kognitiven Aufgaben einer Sprache erfüllt, kann jedoch nicht mehr entwickelt werden. Dieser Auffassung zufolge sind qualitative Unterschiede zwischen dem L2-Wissen älterer Lernender und dem Sprachwissen von MuttersprachlerInnen oder sehr jungen L2-Lernenden unausweichlich und die Errungenschaften älterer Lernender verdienen – selbst wenn sie fortgeschritten sind – die Bezeichnung natürliche Sprache streng genommen nicht (z. B. BleyVroman 1989: 62). Modernere Ansätze formulieren dies anders – insbesondere hat sich die Aufmerksamkeit von der Natur des Sprachwissens hin zu den Eigenschaften der Sprachverarbeitung verschoben. Die Ansicht, dass qualitative Unterschiede zwischen frühen L2-Lernenden/MuttersprachlerInnen und späten L2-Lernenden bestehen, ist dabei durchaus noch aktuell (Clahsen & Felser 2006). Konkurrierende Auffassungen (z. B. Hopp 2010) gehen davon aus, dass es sich um quantitative Unterschiede (beispielsweise bei der Verarbeitungsgeschwindigkeit) handelt, die gegebenenfalls auch überwunden werden können. Birdsong (2006) stellt bei einer Zusammenfassung von Untersuchungsergebnissen fest, dass bisher keine grammatischen Bereiche identifiziert werden konnten, die nicht zumindest von einigen späten L2-Lernenden auf muttersprachlichem Niveau beherrscht wurden. Zugleich ist jedoch umstritten, ob individuelle Lernende dieses Niveau in allen Bereichen erreichen können. Dies ist auch deshalb empirisch schwer festzustellen, weil unklar ist, wie ein „muttersprachliches Niveau“ im Einzelnen zu operationalisieren ist.

24

Christine Dimroth

Funktionale Ansätze (Perdue 1993), und auch solche, die sich unter dem Schlagwort „Gebrauchsbasierter Spracherwerb“ zusammenfassen lassen (Ellis 2008), lehnen die Vorstellung einer Trennung von Sprache und Nicht-Sprache und auch die Annahme angeborenen Sprachwissens ab. Sie gehen stattdessen davon aus, dass der Spracherwerb ein kontinuierlicher Prozess ist, bei dem Lernende auf der Grundlage sprachlicher Interaktion mit SprecherInnen der Umgebungssprache (Input) neue sprachliche Systeme aufbauen. Neben dem Input, der beim Aufbau sprachlichen Wissens eine entscheidende Rolle spielt, nehmen auch diese Ansätze an, dass das Vorwissen der Lernenden, und dabei besonders ihre Erstsprache(n), ein wichtiger Einflussfaktor ist – nur handelt es sich hierbei eben um erlerntes, und nicht um angeborenes sprachliches Vorwissen. Wie man sieht, kann der Begriff Lernersprache also durchaus theoretisch aufgeladen sein. Im Folgenden soll er eine Herangehensweise bezeichnen, die die eigendynamische Entwicklungslogik von Sprachwissen und Sprachgebrauch in den Mittelpunkt stellt, ohne dass damit schon eine Aussage über die Struktur dieser Sprache getroffen wäre. Vielmehr sollen prinzipiell alle Ausprägungen menschlichen Sprachlernens, vom noch rudimentären System bei Anfängern bis zur quasinativen Sprachbeherrschung weit fortgeschrittener L2-NutzerInnen, erfasst werden. Wenn das Augenmerk darauf liegt, dass Lernende im Erwerbsverlauf verschiedene Entwicklungsstadien durchlaufen, die jedoch oft nicht ganz klar voneinander abgrenzbar sind, wird der Begriff oft im Plural verwendet (Lernersprachen). Wichtig ist die Grundidee, dass insbesondere ungesteuert Lernende durch den Kontakt mit der Umgebungssprache bestimmte Muster abstrahieren oder Hypothesen über zugrundeliegende Regelmäßigkeiten aufstellen, die sich dann in ihrem Sprachgebrauch (Verstehen und Produzieren) niederschlagen. Dieser Auffassung zufolge handelt es sich beim L2-Erwerb also um „einen konstruktiven kognitiven Prozess, bei dem nicht ausschließlich Wissen aus der Erstsprache transferiert wird bzw. der nicht allein auf einer unzureichenden Kenntnis zielsprachlicher Regeln basiert“ (Barkowski & Krumm 2010: 142). Verfahren der Sprachstandsdiagnose haben zum Ziel, solche Eigenschaften zu identifizieren, die geeignet sind, Lernersprachen auf einer bestimmten Entwicklungsstufe im Erwerbsverlauf zu verorten. Dies ist, wie oben bereits angedeutet, nur dann sinnvoll, wenn angenommen wird, dass nicht nur einzelne Lernersprachen interne Regelmäßigkeiten aufweisen, sondern dass auch der Übergang zu den jeweils weiter entwickelten oder „fortgeschrittenen“ Varietäten trotz einiger Variation systematisch erfolgt.

Lernersprachen

25

2 Voraussetzung für die Sprachdiagnostik: Überindividuelle Gemeinsamkeiten im Erwerbsverlauf Wird eine Fremdsprache im Unterricht gesteuert vermittelt, so liegt es nahe, dass sich die Lernenden neue sprachliche Elemente, d. h. Wörter oder grammatische Eigenschaften wie z. B. die Personalpronomen oder ein neues Vergangenheitstempus, in der Reihenfolge aneignen, in der sie im Unterricht angeboten werden (Progression). Angenommen wird, dass dies besonders gut gelingt, wenn die entsprechenden Curricula erfahrungsbasiert vom Einfachen zum Komplexen aufgebaut sind und dabei den natürlichen Erwerbssequenzen entsprechen. Ist dies nicht der Fall, bleibt es oft bei kurzfristigen Trainingseffekten (Diehl et al. 2000; Pienemann 1989), die nicht mit der Integration neuen Strukturwissens in die bis dato bestehende Lernervarietät gleichzusetzen sind. Ist die Unterrichtsprogression so gestaltet, dass den Lernenden erst spät Gegenevidenz für die auf einer Stufe vorherrschende Lernergrammatik angeboten wird (z. B. späte Einführung von Sätzen, die von der SVOStellung abweichen; vgl. Winkler 2011), dann kann der Fremdsprachenunterricht dazu beitragen kann, das Verharren der Lernenden in diesen Erwerbsphasen zu verlängern. Beim ungesteuerten Erwerb einer Zweitsprache ist die Aufgabe der Lernenden anders gelagert. Der sprachliche Input ist hier – anders als beispielsweise bei den Lehreinheiten und Texten in einem Sprachlehrbuch – nicht systematisch nach bestimmten Kriterien vorsortiert. Lernende kommen vielmehr in verschiedenen Kommunikationssituationen mit einem sprachlichen Input in Kontakt, aus dem nicht herausgefiltert werden konnte, was zum gegebenen Zeitpunkt noch nicht bekannt ist. Beim ungesteuerten Zweitspracherwerb dient die Umgebungssprache nicht in erster Linie dem Lernen, sondern der Kommunikation. Die für kommunikative Zwecke genutzte Sprache einschließlich der interaktiven Situationen, in denen sie verwendet wird, ist das Material, aus dem Lernende Elemente und Struktureigenschaften extrahieren, ihren Sinn deuten und eine Grammatik entwickeln müssen. In der Realität liegt übrigens oft eine Mischform aus ungesteuertem und gesteuertem Zweitspracherwerb vor, etwa wenn MigrantInnen in der zielsprachlichen Umgebung durch Kontakt mit MuttersprachlerInnen lernen, zugleich aber (beispielsweise in Integrationskursen oder in der Schule) an gesteuerten Sprachlehr- oder fördermaßnahmen teilnehmen. Erwachsene SprecherInnen haben einen ungesteuerten Spracherwerbsprozess beim Erstspracherwerb schon einmal erfolgreich durchlaufen. Longitudinale, vergleichende Untersuchungen zum Erstspracherwerb haben gezeigt, dass Lernende beim schrittweisen Aufbau immer komplexerer Grammatiken recht ähnliche Wege beschreiten. Übereinzelsprachlich betrachtet beschränken sich diese Gemeinsamkeiten teilweise zwar auf trivial anmutende Eigenschaften (etwa, dass die Einwortphase

26

Christine Dimroth

der Mehrwortphase vorangeht). Andere Beobachtungen sind aber weniger vorhersagbar, z. B. werden Inhaltswörter generell vor Funktionswörtern gelernt, obwohl letztere in der Umgebungssprache meist sehr viel häufiger vorkommen. Vergleichende Untersuchungen zum Erwerb einer bestimmten Sprache haben weitere, z. T. sehr spezifische überindividuelle Entwicklungsschritte zu Tage gefördert. In der Folge hat der besser untersuchte Erstspracherwerb immer wieder als Blaupause für die Beschreibung des Zweitspracherwerbs fungiert. Sobald sich die Zweitspracherwerbsforschung als selbständiges Feld etablierte, stand auch hier die Untersuchung von Erwerbsreihenfolgen und Entwicklungsstadien im Mittelpunkt des Forschungsinteresses. In den frühen Phasen wurde insbesondere nach „universellen“ oder „natürlichen“ Lernreihenfolgen gesucht, d. h. solchen, die von der Erstsprache der Lernenden sowie ihrem Alter, ihrer Motivation und der Lernsituation etc. unabhängig Bestand haben. Anders als in späteren Untersuchungen wurde dabei oft eine fast willkürlich anmutende Menge an hauptsächlich morphologischen Eigenschaften miteinander verglichen (im Englischen als Zielsprache u. a. Plural, present progressive, 3 Person Singular; vgl. Dulay & Burt 1974). Statt die Phasen zu untersuchen, die Lernende auf dem Weg zu einer zielsprachlichen Beherrschung der ausgewählten Phänomene durchlaufen, wurde in erster Linie die Reihenfolge festgehalten, in der diese Phänomene mit einer bestimmten Konstanz (meist in 90 % der obligatorischen Kontexte) zielsprachlich realisiert wurden. Trotz eines gewissen Erfolgs dieser sogenannten Morpheme Studies, die zumindest für das Englische weitreichende Übereinstimmungen zwischen Erstund Zweitspracherwerb belegten (vgl. die Identitätshypothese; Dulay & Burt 1974), blieb der eigentliche Erklärungswert der Befunde umstritten. Die Annahme überindividueller Entwicklungsstadien prägte auch die großen longitudinalen Zweitspracherwerbsstudien mit erwachsenen Lernenden in den 1980er und 1990er Jahren. Eine Vorreiterrolle in Bezug auf das Deutsche hatten das Heidelberger Projekt Pidgindeutsch (Dittmar & Klein 1975), die ZISA-Studie1 (Clahsen, Meisel & Pienemann 1983), das ESF-Projekt Second Language Acquisition by Adult Immigrants (Perdue 1993) und das Projekt Modalität von Lernervarietäten im Längsschnitt (Skiba 1989). Diese Untersuchungen unterschieden sich von den Morpheme Studies in zweierlei Hinsicht: Statt unzusammenhängender Einzelphänomene wurden Eigenschaften von Lernersprachen in bestimmten kohärenten Bereichen untersucht, die entweder formal (z. B. Verbstellung im Nebensatz) oder funktional (z. B. Ausdruck der Temporalität) abgrenzbar sind. Außerdem wurde nicht auf die Reihenfolge des Erreichens einer zielsprachlichen Beherrschung fokussiert, sondern auf die davor liegenden Entwicklungsverläufe.

1 Die Ergebnisse der ZISA-Studie haben sich direkt in dem Diagnoseverfahren Profilanalyse (Grießhaber 2010; 2013) niedergeschlagen (vgl. dazu Abschnitt 5 in diesem Beitrag sowie Grießhaber in diesem Band).

Lernersprachen

27

Der Schwerpunkt der Arbeiten lag auf morphosyntaktischen Phänomenen. Hier konnte der diesbezüglich gut untersuchte Erstspracherwerb als Vergleichsgröße herangezogen werden, die es zugleich ermöglichte, die Vorhersagen der vorherrschenden universalgrammatischen Erwerbstheorie zu überprüfen. Der Vergleich syntaktischer Entwicklungsstufen bei Lernenden in verschiedenen Lebensaltern hat sich bei der Abgrenzung von Lernertypen als sehr fruchtbar erwiesen. Neben dem Alter bei Erwerbsbeginn (z. B. Dimroth 2008; Tracy & Thoma 2009)2 hat sich gezeigt, dass auch die Erstsprache der Lernenden (Haberzettl 2005) einen Einfluss auf die Syntaxentwicklung hat. Auch theoretische Ansätze, die Beschränkungen der Sprachverarbeitungskapazität als bestimmende Kraft des Spracherwerbs in den Blick nehmen (z. B. Processability Theory; Pienemann 1998 oder Processing Determinism; O’Grady 2015), untersuchen hauptsächlich Lernreihenfolgen aus dem Bereich der Morphosyntax. Sie fokussieren jedoch weder das Erreichen zielsprachlicher Kompetenz, noch die Entwicklungsverläufe, sondern eher die Reihenfolge des ersten Auftretens bzw. erfolgreichen Verstehens bestimmter Strukturen. Die gefundenen Reihenfolgen werden mit einem Zuwachs an zunehmend komplexen Verarbeitungsmechanismen erklärt. Der funktionale Lernervarietäten-Ansatz (z. B. Perdue 1993) unterscheidet sich insofern von den genannten Herangehensweisen, als dass die Struktur aufeinander aufbauender Lernervarietäten in bestimmten funktional definierten Bereichen (z. B. Raumreferenz; Becker & Carroll 1997; oder Zeitreferenz; Dietrich, Klein & Noyau 1995) untersucht wird. Dabei werden nicht nur grammatische, sondern auch lexikalische oder diskursive Ausdrucksmittel berücksichtigt und die sich entfaltenden Ausdruckssysteme werden auf jeder Entwicklungsstufe als Sprachen mit Eigengesetzlichkeiten und nicht als defizitäre Version der Zielsprache untersucht. Neben kleinschrittigen Beschreibungen von Entwicklungsverläufen in bestimmten Teilbereichen wurden allgemein charakterisierbare Organisationsstufen unterschieden, deren Dreh- und Angelpunkt die sogenannte Basisvarietät darstellt. In dem zielsprachenunabhängigen Dreischritt von „Nominaler Äußerungsorganisation“ zu „Verbaler Äußerungsorganisation“ (= Basisvarietät) und schließlich „Finiter Äußerungsorganisation“ (Klein & Perdue 1992) kommt ihr als flexionsloser Varietät mit semantischpragmatisch determinierter Wortstellung insofern eine besondere Stellung zu, als sie für einen nicht unerheblichen Teil der untersuchten erwachsenen Lernenden zugleich die Endvarietät darstellte. Bei dieser Einteilung in nur drei Ausprägungen von Lernervarietäten sind zwar viele Details ausgeblendet, es werden jedoch zielsprachenunabhängige Charakteristika für Spracherwerbsstufen herausgearbeitet, die zumindest für den ungesteuerten Zweitspracherwerb Erwachsener unabhängig von Ausgangs- und Zielsprache typisch sind.

2 So haben die sogenannten Meilensteine der Syntaxentwicklung (Tracy 2002) beispielsweise Eingang in das Diagnoseverfahren LiSe-DaZ (Schulz & Tracy 2011; vgl. Decker-Ernst in diesem Band) gefunden.

28

Christine Dimroth

Die bisher dargestellten Ansätze unterscheiden sich in erster Linie darin, a) welches Vorwissen sie den Lernenden zuschreiben (am deutlichsten sichtbar bei der Diskussion um einen Zugang zu universalgrammatischem Wissen bei L2-Lernenden verschiedenen Alters), und b) wie sie die Rolle der Lernenden konzipieren. Die oben beschriebene Heuristik des Hypothesen-Testens ist dabei eine Vorstellung, die den Lernenden eine vergleichsweise aktive Rolle zuschreibt. Sie geht davon aus, dass Lernende versuchen, ihre Beobachtungen der Umgebungssprache intuitiv zu verallgemeinern, was sich u. a. daran zeigt, dass sie einmal erkannte Regelmäßigkeiten (im Deutschen z. B. die Flexion schwacher Verben) auf Ausnahmen (starke Verben) übergeneralisieren. Moderne gebrauchsbasierte Ansätze (Lieven & Tomasello 2008) halten solche (Über-)Generalisierungen eher für ein Randphänomen und fokussieren stattdessen darauf, dass Lernende in vielen Fällen bestimmte Inputeigenschaften sehr genau imitieren. Dabei werden häufig auftretende und besonders auffällige (saliente) Eigenschaften des Inputs besonders gut verarbeitet und beeinflussen den Spracherwerb (Ellis 2002). Seltene oder wenig saliente Eigenschaften (z. B. unbetonte kurze Wörter oder Affixe) werden bei der Sprachverarbeitung hingegen schlechter wahrgenommen. Während der Einfluss von Frequenz und Salienz generell nicht bezweifelt wird, liegt eine Schwierigkeit darin, dass die beiden Eigenschaften oft gegenläufig sind. So sind z. B. die meisten Funktionswörter und Suffixe im Deutschen hochfrequent, aber nicht sehr salient, während viele Inhaltswörter salienter, aber weniger frequent sind. So lässt sich erfolgreicher oder nicht-erfolgreicher Erwerb oft entweder mit der Frequenz oder der Salienz von Formen im Input erklären, bzw. es ist unklar, welche Vorhersagen letztlich gemacht werden können. Die besprochenen Ansätze vereint, dass sie den Spracherwerb als einen gerichteten Prozess auffassen, dem in formal oder funktional abgrenzbaren Bereichen eine gewisse Entwicklungslogik zugrunde liegt. Im Gegensatz dazu stellt eine andere Gruppe neuerer Arbeiten das Konzept einer zielgerichteten und trotz aller Variation systematischen Entwicklung grundsätzlich in Frage. An seine Stelle tritt der Begriff der Emergenz, mit dem das selbstregulierte Entstehen von Strukturen eines Systems aus dem Zusammenspiel seiner Komponenten bezeichnet wird. Die relevanten Komponenten sind dabei allerdings nicht nur sprachlicher Natur, vielmehr interagiert das sich fortlaufend neu organisierende kognitive System ständig mit seiner Umwelt. Dabei beeinflussen sich alle bekannten außersprachlichen Einflussgrößen (Alter, Motivation, Menge und Art des Inputs etc.) sowie auch zufällige und individuelle Faktoren gegenseitig und wirken auf den Spracherwerb ein. Der Dynamic Systems Theory zufolge ist der Zweitspracherwerb ein nicht-linearer, multidimensionaler Prozess, in dem Variation und Variabilität nicht etwa Randphänomene, sondern die zentrale Triebkraft der Entwicklung darstellen (de Bot, Lowie & Verspoor 2007). Die AutorInnen schlagen vor, die Metapher einer Messlatte für die Sprachentwicklung durch die eines Brokkoli zu ersetzen, dessen multidimensionales und stark verzweigendes Wachstum nicht vorhersagbar ist, obwohl er eben auch keine vollkommen willkürliche Gestalt hat.

Lernersprachen

29

Dass individuelle Unterschiede und die Variation innerhalb von Lernersprachen bei der Suche nach systematischen Gemeinsamkeiten und verallgemeinerbaren Entwicklungsstadien in der Vergangenheit nicht immer genügend berücksichtigt worden sind, ist durchaus plausibel. Für die Sprachstandsdiagnose ist jedoch wenig gewonnen, wenn unter dem Gewicht komplexester Interaktionen zwischen allen möglichen Facetten einer vielschichtigen Gemengelage keinerlei Verortungen und Vorhersagen mehr möglich sind, und es gibt gute Gründe anzunehmen, dass dies auch für die Zweitspracherwerbsforschung im Allgemeinen gilt: [I]t is this broad picture that holds for the large majority of learners of a given L2, that forms the baby that we do not want to see thrown out with the bathwater when studying L2 development. Scientific inquiry is concerned with abstracting away from details, trying to discern general patterns across individuals, and using appropriate statistical techniques to guard researchers against the danger of claiming evidence for general trends that cannot be reliably supported. (Hulstijn 2015: 228)

Mit Blick auf die Sprachstandsdiagnose muss es also darum gehen, Verortungen und Vorhersagen sinnvoll auf solche Bereiche zu begrenzen, in denen robuste Evidenz für Entwicklungsstufen vorliegt, bestimmte Einflussfaktoren zu isolieren und ihren Beitrag einzuschätzen (s. folgender Abschnitt), und die Ergebnisse nicht zu verabsolutieren, sondern im Gegenteil, mit entsprechender Vorsicht zu interpretieren.

3 Einflussfaktoren auf die Entwicklung von Lernersprachen beim Zweitspracherwerb Die folgende Systematisierung grundlegender Einflussfaktoren orientiert sich im Wesentlichen an den von Klein (2000) vorgeschlagenen „Grundgrößen des Spracherwerbs“, findet sich so oder ähnlich aber auch in anderen Übersichtsdarstellungen. Grob trennen lassen sich zunächst einmal Eigenschaften der Sprachlernsituation von Eigenschaften der Lernenden – obwohl, wie wir sehen werden, auch diese Ebenen nicht völlig unabhängig voneinander sind.

3.1 Eigenschaften der Sprachlernsituation Zur Sprachlernsituation gehören Umgebungsfaktoren, die den Zugang des Lernenden zur Zielsprache beeinflussen. So besteht beispielsweise beim gesteuerten Spracherwerb einer Fremdsprache Zugang zu Metainformationen (grammatische Strukturen, Wortbedeutungen etc.) über die zu lernende Sprache, die beim ungesteuerten Zweitspracherwerb nicht verfügbar sind. Typischerweise unterscheiden sich diese beiden Erwerbstypen auch durch vermehrten Zugang zu schriftlichem

30

Christine Dimroth

Input vs. hauptsächlich mündlicher Interaktion. Beim DaZ-Erwerb liegt in der Regel eine Mischform aus gesteuertem und ungesteuertem Erwerb vor. Neben der Art des sprachlichen Inputs und der Form, in der er den Lernenden typischerweise begegnet, spielt natürlich auch die Menge des Sprachkontakts eine wichtige Rolle. Anders als beim Erstspracherwerb, wo das Alter der Lernenden als Vergleichsmaßstab herangezogen werden kann, wird beim Zweitspracherwerb neben dem Alter des Erstkontaktes (age of onset) meist die Kontaktzeit (length of exposure) in Jahren oder Monaten, beim gesteuerten Erwerb auch in Unterrichtsstunden, zum Vergleich herangezogen. Dabei gilt es jeweils zu berücksichtigen, dass in einem Sprachkontaktmonat oder -jahr bei mehrsprachigen Lernenden naturgemäß weniger Nutzungszeit auf jede einzelne Sprache entfällt als bei einsprachigen Lernenden. Außerdem kann die Verteilung zwischen den beteiligten Sprachen sich mit der Zeit verändern, weil beispielsweise der Anteil an innerfamiliärer Kommunikation in einem bestimmten Lebensalter zugunsten der Kommunikation mit Freunden und Bekannten abnimmt. Um solche Schwankungen zu erfassen, arbeitet Unsworth (2013) mit dem Begriff der kumulativen Kontaktzeit (cumulative length of exposure), der darauf abzielt, die dynamische Verteilung der Sprachen im Alltag der Lernenden (Kontaktpersonen, Institutionen etc.) pro Zeiteinheit zu dokumentieren und aufzuaddieren. Der Frage, zu welchem Grad die Struktur von Lernersprachen Eigenschaften des umgebungssprachlichen Inputs widerspiegelt, kommt insbesondere in gebrauchsbasierten Spracherwerbstheorien eine entscheidende Stellung zu. Longitudinale Korpora – zunächst in erster Linie mit dem Ziel erhoben, die Entwicklung von Lernersprachen zu dokumentieren, wurden verstärkt zur Analyse der miterfassten Inputsprache herangezogen. Der Versuch, einen möglichst genauen Einblick in den umgebungssprachlichen Input zu erlangen, der Sprachlernenden zur Verfügung steht, hat in der Erstspracherwerbsforschung in der Folge zur Erstellung sogenannter dense corpora (Lieven & Behrens 2011) geführt, die einen möglichst repräsentativen Ausschnitt aus Input und Sprachproduktion zu erfassen suchen. In der Zweitspracherwerbsforschung versucht man darüber hinaus, mit quasi-experimentellen Verfahren den sprachlichen Input, zu dem Lernende Zugang haben, in seiner Gesamtheit zu dokumentieren. So lässt sich beispielsweise im Projekt VILLA3 der Zweitspracherwerb von AnfängerInnen über die ersten vierzehn Stunden zu jedem Zeitpunkt mit dem kontrollierten und komplett aufgezeichneten Input abgleichen (Dimroth et al. 2013). Art, Menge und strukturelle Eigenschaften des zugänglichen Sprachangebots sind nicht die einzigen Faktoren, die die Sprachlernsituation beeinflussen. Entscheidend ist sicher auch, ob die zu lernende Sprache in einem geschützten Raum quasi spielerisch genutzt werden kann oder ob das Lernen unter großem Druck

3 Varieties of Initial Learners in Language Acquisition, gefördert von ANR, DFG und NWO (Open Research Area, 2011–2015).

Lernersprachen

31

stattfindet, beispielsweise weil die Lebensumstände der Lernenden stark von ihrem kommunikativen Erfolg abhängen. Wie an den besprochenen Parametern Sprachangebot und Erfolgsdruck schon deutlich wird, variieren Sprachlernsituationen – jedenfalls beim ungesteuerten Erwerb in zielsprachlicher Umgebung – in prototypischer Weise mit dem Lebensalter. Während Kinder beim DaZ-Erwerb oft allein durch den Besuch von Bildungsinstitutionen Zugang zu einem vergleichsweise reichen Sprachangebot haben, das sie in einer Umgebung nutzen können, die in erster Linie auf das Lernen ausgerichtet ist, finden Erwachsene oft weniger günstige Bedingungen vor und müssen zugleich früh in der Zweitsprache „funktionieren“.

3.2 Eigenschaften der Lernenden Zu den relevanten Eigenschaften der Lernenden gehören in erster Linie kognitive und sozio-affektive Voraussetzungen, die den Spracherwerb und damit die Herausbildung von Lernersprachen in besonderem Maße beeinflussen. Verschiedene kognitive Faktoren bedingen, wie Lernende die Zweitsprache beim Verstehen und Produzieren verarbeiten können. Direkt altersabhängig sind allgemeine kognitive Ressourcen wie etwa das Arbeitsgedächtnis und die sogenannten exekutiven Funktionen, mit denen Lernende an die Spracherwerbsaufgabe herangehen. Diese Größen unterliegen bis ins junge Erwachsenenalter einer reifebedingten dynamischen Entwicklung, wobei durchaus umstritten ist, ob und bis zu welchem Grad ein Zuwachs dieser Ressourcen einer größeren Sensibilität für die Verarbeitung sprachlicher Stimuli entspricht (vgl. z. B. die less is more Hypothese von Newport 1990), bzw. ob nicht gerade das notgedrungen kleinschrittige und zunächst stark imitative Vorgehen junger Kinder (Lieven & Tomasello 2008) eine sehr erfolgversprechende Spracherwerbsstrategie darstellt. Zu den kognitiven Voraussetzungen gehört in gewisser Weise auch das Vorwissen der Lernenden (Klein 2000). Sowohl das verfügbare Weltwissen, als auch das sprachliche Vorwissen in der zu lernenden Sprache und in anderen Sprachen haben einen direkten Einfluss auf das, was gelernt werden muss und gelernt werden kann. Die Struktur der Erwerbsaufgabe wird auf verschiedenen Ebenen von dem bereits verfügbaren Wissen der Lernenden beeinflusst. So müssen beim Spracherwerb im Kleinkindalter parallel zum und vermittelt durch den Spracherwerb beispielsweise basale Raum- und Zeit-Konzepte oder Grundlagen des Informations- oder Diskursmanagements erworben werden, die älteren Lernenden bereits zur Verfügung stehen. Auch einzelsprachliche Form-Funktions-Zuordnungen können einen direkten Einfluss auf Verarbeitung und Erwerb weiterer Sprachen haben, wobei früher erworbenes Sprachwissen gegen den Einfluss neuen Wissens nicht unbedingt immun ist (interlingualer Einfluss). Oft wird allerdings in erster Linie nach dem Einfluss der Erstsprache(n) auf die zu lernende Sprache gefragt. So beeinflussen beispielsweise typologische Eigenschaften der Erstsprache die Kategorien, nach denen Lernende in der Zweitsprache suchen, und die Stellen, an denen sie dies tun (z. B.

32

Christine Dimroth

Haberzettl 2005). Dabei kann die partielle Übertragung verfügbaren Sprachwissens auf eine neue Sprache (Transfer) positive oder negative Auswirkungen haben. Wie robust ein solcher Transfer ist, hängt unter anderem davon ab, wie ähnlich Ausgangs- und Zielstrukturen sind (kleine Unterschiede in Form oder Funktion sind schwerer zu entdecken als große) und wie viel Erfahrung mit einer anderen Sprache der Lernende bereits mitbringt. Je mehr und je länger eine bestimmte Sprache genutzt wird, desto stärker sind die für diese Sprache optimierten Sprachverarbeitungsroutinen eingeschliffen (L1 entrenchment) und desto schwieriger ist es, sie beim Erwerb einer neuen Sprache entsprechend anzupassen. Infolgedessen – aber vielleicht auch infolge einer weniger ausgeprägten Sprachbewusstheit – kommt es beim Zweitspracherwerb im frühen Kindesalter (vgl. Tracy & Thoma 2009) kaum zu Interferenzen der Erstsprache. Für die Sprachstandsdiagnose besonders relevant ist sprachliches Vorwissen in der zu lernenden Sprache selbst, insofern es sehr direkt mitbestimmt, welche sprachlichen Eigenschaften auf einem bestimmten Entwicklungsniveau wahrgenommen, analysiert und in das bestehende System eingebaut werden können. Die im vorausgehenden Abschnitt beschriebenen überindividuellen Erwerbsreihenfolgen gehen ja darauf zurück, dass bestimmte Entwicklungsschritte nur auf der Basis des bereits vorhandenen Sprachwissens erfolgen können. So kann es beispielsweise erst dann zu einer produktiven Übergeneralisierung bestimmter Flexionsformen kommen, wenn das Stadium des imitativen Reproduzierens holistisch gelernter Formen überwunden ist und abstrakte Regelmäßigkeiten erkannt wurden. Ist das dafür notwendige Vorwissen (etwa in Form einer kritischen Masse an lexikalischen Einheiten) noch nicht vorhanden, so kann auch der Abstraktionsschritt nicht stattfinden. Neben den kognitiven Voraussetzungen (sprachunabhängige kognitive Ressourcen und Vorwissen) haben auch sozio-affektive Voraussetzungen auf Seiten der Lernenden einen zentralen Einfluss auf den Spracherwerb und die Entwicklung von Lernersprachen. Besonders gut erforscht sind die Rolle der Motivation (Gardner 1985) und die Rolle von Einstellungen zur Zielsprache und ihren SprecherInnen (Dörnyei 2009). Während viele Arbeiten davon ausgehen, dass Motivation hauptsächlich beim Fremdsprachenerwerb eine Rolle spielt, untersuchen andere den sogenannten „Antrieb“ (Klein 2000) auch im ungesteuerten Erwerb und schlagen eine altersabhängige Deutung vor. Die Idee ist, dass eine altersabhängige Bereitschaft oder sogar Notwendigkeit zur sozialen Integration den Spracherwerbserfolg von Kindern im Gegensatz zu Erwachsenen letztlich mindestens ebenso sehr bestimmt wie etwa Unterschiede in den kognitiven Voraussetzungen (Pagonis 2009). Der Altersfaktor im Spracherwerb (Singleton & Ryan 2004) hat also sowohl mit zentralen Eigenschaften der Lernenden selbst zu tun, die sich mit dem Lebensalter verändern, als auch mit Ausprägungen der Lernsituation, die für das Sprachenlernen in bestimmten Lebensabschnitten typisch sind. Grotjahn (2003) diskutiert deshalb, ob sich der Altersfaktor, bezogen auf die kognitive Entwicklung der Lernenden, nicht letztlich als eine Pseudo-Variable erweisen könnte, hinter der sich Faktoren verbergen, die in erster Linie mit der Lernsituation zu tun haben.

Lernersprachen

33

4 Die Entwicklung von Lernersprachen Wenn die Entwicklung von Lernersprachen beschrieben werden soll, müssen mindestens die folgenden drei Dimensionen unterschieden werden (Klein 2000): der Endstand, die Geschwindigkeit sowie der Verlauf des Spracherwerbs. Der Endstand des Spracherwerbs (ultimate attainment), d. h. das Niveau, auf dem sich eine Lernersprache stabilisiert, hat besonders für empirische Untersuchungen zum Altersfaktor eine Rolle gespielt. Aber auch unabhängig davon wurde untersucht, ob Lernende eine zweite Sprache jemals auf muttersprachlichem oder quasi-muttersprachlichem Niveau (native-like oder near native proficiency) beherrschen können. Reifungshypothesen wie die Hypothese von der Kritischen Periode sagen voraus, dass dies nur Kindern möglich ist; die empirische Evidenz ist jedoch umstritten (vgl. z. B. Birdsong 2006 und Hyltenstam & Abrahamsson 2003). Problematisch ist bei Untersuchungen zum Endstand generell, dass ein Konzept wie native-like proficiency auf einem Vergleich zwischen sehr weit fortgeschrittenen L2Lernenden und MuttersprachlerInnen derselben Sprache beruht. Dies ist zum einen schwierig, weil ja auch die MuttersprachlerInnen einer Sprache keine homogene Gruppe darstellen, und zum anderen, weil weit fortgeschrittene und letztlich einfach mehrsprachige SprecherInnen nicht über zwei (oder mehr) hermetisch voneinander abgeschlossene Sprachsysteme verfügen, sondern als multikompetente SprecherInnen auf ein vernetztes sprachliches Wissen zurückgreifen können (s. Literaturverweise in der Einleitung), das sie je nach Bedarf in der einen oder der anderen Sprache weiterentwickeln. Für die Sprachstandsdiagnose ist der Endstand weniger relevant als der Spracherwerbsverlauf und die Geschwindigkeit. Die Geschwindigkeit der Sprachentwicklung lässt sich sinnvollerweise nur in Relation zu Qualität und Quantität des Inputs bestimmen (s. dazu Abschnitt 3.1 in diesem Beitrag). Um die Geschwindigkeit bei der Sprachstandsdiagnose von Kindern realistisch einschätzen zu können, ist es wichtig, L2-lernende Kinder nicht mit ihren AltersgenossInnen, sondern mit solchen Kindern in Relation zu setzen, deren Kontaktzeit zur Zielsprache vergleichbar ist (vgl. etwa das Verfahren in LiSe-DaZ; Schulz & Tracy 2011). Um die Geschwindigkeit des Erwerbsprozesses interpretieren zu können, ist aber zunächst einmal eine Verortung der Lernenden auf einer gedachten Skala des Erwerbsverlaufs vonnöten. Der kontinuierliche Verlauf wird dabei meist in Erwerbsphasen oder -stufen untergliedert. Erst wenn man weiß, in welcher Abfolge sprachlichen Strukturen in bestimmten Teilbereichen erworben werden, kann man feststellen, ob individuelle Lernende als weiter fortgeschritten gelten können als andere. Erst dann ist es auch sinnvoll, die Erwerbsgeschwindigkeit als Vergleichsmaßstab heranzuziehen.4 Instrumente

4 Dabei stellt sich manchmal heraus, dass der Zweitspracherwerb nicht immer langsamer verläuft als der Erstspracherwerb (vgl. z. B. Dimroth & Haberzettl 2012 zum Erwerb der Verbflexion).

34

Christine Dimroth

der Sprachstandsdiagnose geben typischerweise zunächst einmal Auskunft über die Verortung individueller Lernender im Verlauf (etwa: erreichte Spracherwerbsstufe). Einige (z. B. LiSe-DaZ, s. o.) erlauben darüber es hinaus, die Erwerbsgeschwindigkeit im Vergleich mit anderen Lernenden zu bestimmen. Für das Deutsche als Zweitsprache sind für verschiedene Bereiche der Grammatik Erwerbssequenzen vorgeschlagen worden. Am besten untersucht ist der Erwerb der Verbstellung, der auch Eingang in prominente Sprachstandsdiagnoseverfahren gefunden hat (vgl. dazu Abschnitt 5). Neben der Syntax ist auch die schrittweise Entfaltung morphologischer Markierungen im Bereich der Verb- und Nominalflexion untersucht worden. Ausgewählte Befunde zu Erwerbssequenzen beim Erwerb von Subjekt-Verb-Kongruenz, Genus und Kasus sollen hier kurz zusammengefasst werden. Die meisten von ihnen basieren auf longitudinalen Korpora. Was als Evidenz für den Erwerb einer bestimmten Markierung angesehen wird, variiert allerdings von Fall zu Fall etwas. Köpcke (1987) hat basierend auf longitudinalen Produktionsdaten von erwachsenen Arbeitsmigranten eine Erwerbssequenz für die Subjekt-Verb-Kongruenz herausgearbeitet. Diese wurde von anderen Untersuchungen zum Erst- und Zweitspracherwerb (z. B. Clahsen 1988; Chilla 2008; Dimroth & Haberzettl 2012) weitgehend bestätigt und scheint deshalb nicht auf den ursprünglich untersuchten Erwerbstyp beschränkt zu sein. Köpcke (1987) schlägt eine Einteilung in die folgenden vier Erwerbsphasen vor: I Suffixe -ø, -e, -(e)n treten in freier Variation auf II Suffix -t markiert systematisch die 3. Pers. Sg. III Suffix -st markiert systematisch die 2. Pers. Sg. IV Übergeneralisierung von -ø, -e, -(e)n geht zurück; vollständiger Erwerb des Kongruenzsystems Die Lernenden verwenden dabei zu Beginn des Erwerbs frequente und ambige Suffixe. Besonders bei -(e)n kann nicht zwischen Infinitiv und finiten Formen unterschieden werden. Auch die Form -t, die im nächsten Schritt das Formenrepertoires erweitert, tritt nicht nur in der 3. Person Singular, sondern auch an Partizipien auf, sodass erst der Erwerb der 2. Person Singular einen Wendepunkt hin zu einer eindeutigen Form-Funktionszuweisung darstellt. Durch die hohe Erwerbsgeschwindigkeit insbesondere bei kindlichen L2-Lernenden (Dimroth & Haberzettl 2012) sind die einzelnen Phasen, die sich ja sowieso überlappen, allerdings unter Umständen nur schwer voneinander abzugrenzen. Im Bereich der Nominalflexion scheint sich global betrachtet die Erwerbsreihenfolge Numerus vor Kasus vor Genus abzuzeichnen. Wegener (1995) erklärt dies mit dem abnehmenden Bedeutungsgehalt der drei Kategorien und schließt: „Die beobachtete Reihenfolge beim Erwerb der deutschen Nominalflexion […] ist geeignet, zwischen beiden Positionen (funktionalistisch vs. formal) eine vermittelnde Haltung einzunehmen: Die Kinder lernen nicht nur bedeutungsvolle Strukturen und funktio-

Lernersprachen

35

nale Elemente, aber sie lernen diese wesentlich leichter als die afunktionalen.“ (Wegener 1995: 22–23). Im Folgenden soll ein knapper Überblick über die Erwerbsreihenfolgen für Kasus und Genus gegeben werden (zum Plural siehe Wegener 2008 und Köpcke & Wecker 2015). Da sich beide Phänomene im Deutschen in erster Linie an den Artikelformen manifestieren, werden sie von Lernenden in einer gemeinsamen Perspektive bearbeitet. Wegener (1995) und Kaltenbacher & Klages (2012), die Kinder im Vor- und Grundschulalter untersucht haben, gehen von einer schrittweisen Entfaltung des Systems aus. Eine Zusammensicht der Befunde legt eine Einteilung in die folgenden Phasen nahe: I Fehlen jeglicher Markierung; Auslassung von Artikeln II Erwerb der Determination (Unterscheidung zwischen unbestimmtem und bestimmtem Artikel). Noch keine Kasus- und Genusmarkierung. Flexionsformen zunächst in freier Variation, dann oft Reduktion der Formenvielfalt (beispielsweise Beschränkung auf die Opposition zwischen ein und die) III Zweigliedriges Kasus-System: Herausbildung einer Opposition zwischen Nominativ und Akkusativ ohne Unterscheidung von Genus (beispielsweise der/die im Nominativ und den im Akkusativ) IV Zweigliedriges Genus-System: Differenzierung zwischen Maskulinum und Femininum, zunächst nur im Nominativ, später auch im Akkusativ V Dreigliedriges Kasus-System (Nominativ, Akkusativ, Dativ) VI Ausbau der Genusmarkierungen (Unterscheidung des Neutrums zunächst im Nominativ) Kaltenbacher & Klages (2012) weisen allerdings darauf hin, dass bei der Abfolge der Schritte III–VI durchaus Variation zu beobachten ist. Ob die Kinder Genus früher bearbeiten als Kasus, scheint u. a. von den in der Erstsprache unterschiedenen Kategorien beeinflusst zu sein. Außerdem können auch innerhalb einer Kategorie noch detailliertere Erwerbssequenzen ausgemacht werden. So zeigt beispielsweise Binanzer (2015), die den Genuserwerb bei Kindern im Grundschulalter untersucht, dass die Lernenden genusanzeigende Formen zunächst nicht nach grammatischen, sondern nach konzeptuellen Kriterien, nämlich zur Markierung von Sexus (s. auch Wegener 1995) und zur Unterscheidung von Belebtheit und Unbelebtheit verwenden. Die Studie zeichnet außerdem kleinschrittig die Entwicklung von sexusbasierten zu genusbasierten Formverwendungen nach und unterscheidet dabei zwischen Markierungen der Genuskongruenz innerhalb (Artikel) und außerhalb der Nominalgruppe (Pronomen). Eine Schlüsselrolle im Erwerbsverlauf kommt laut Binanzer (2015) der nominalgruppeninternen Genusmarkierung bei unbelebten Nomen zu. Die Untersuchung von Erwerbssequenzen wird dadurch erschwert, dass es besonders bei der Sprachproduktion keine einheitlichen Kriterien für die Belastbarkeit der empirischen Evidenz gibt. So ist es gar nicht trivial zu entscheiden, ab welchem Zeitpunkt bestimmte Formen tatsächlich stabil als zielsprachlich flektiert bezeichnet werden können. Zum einen werden Suffixe in der gesprochenen Alltagssprache

36

Christine Dimroth

oft nicht sehr explizit realisiert, zum anderen ist durch die Entwicklungsdynamik und die vielen Einflussfaktoren bei Lernersprachen generell mit viel Variation zu rechnen. Dazu kommt, dass die Lernenden je nach Kommunikationssituation unterschiedlich viele kognitive Ressourcen auf die formale Richtigkeit ihrer Äußerungen verwenden können. Am schwierigsten ist es wahrscheinlich, die Produktivität des sprachlichen Wissens einzuschätzen, d. h. festzustellen, wann Lernende bestimmte Formen, oder auch ganze Äußerungen, selbst gebildet und nicht als ganzheitlich gespeicherte Versatzstücke (sog. Chunks) aus dem Input übernommen haben. Neuere Untersuchungen (z. B. Binanzer 2015; Köpcke & Wecker 2015) setzen deshalb vermehrt auf Experimente mit Kunstwörtern. Da sich die Verbstellungsregularitäten in der Sprachproduktion von Lernenden einfacher ermitteln lassen als etwa Eigenschaften der Flexion oder gar der Umfang des Lexikons, ist es nicht verwunderlich, dass prominente Sprachstandserhebungsverfahren wie das Diagnoseverfahren LiSe-DaZ (Schulz & Tracy 2011) und die Profilanalyse (Grießhaber 2010; 2013; vgl. auch Grießhaber in diesem Band) sich darauf stützen. Wie robust dieses Kriterium ist, und ob auch hier mehr als ein Verlaufspfad angesetzt werden muss, wird in Abschnitt 5 in diesem Beitrag besprochen.

5 Sprachstandsdiagnose: Die Verbstellung als Kriterium für Erwerbsphasen Als sogenannte Verbzweitsprache hat das Deutsche relativ komplexe Verbstellungsregeln, an denen sich bestimmte Stadien der syntaktischen Entwicklung im Prinzip gut ablesen lassen. Dabei müssen die Lernenden erkennen, dass für die Stellung des finiten Verbs verschiedene Positionen in Frage kommen (Verberst, Verbzweit, Verbletzt), mit deren Hilfe ausgedrückt wird, um welchen Satztyp (interrogativer, imperativer oder deklarativer Hauptsatz oder Nebensatz) es sich handelt. Darüber hinaus spielt die Stellung von nicht-finiten Verben oder Verbteilen eine Rolle. In den besonders gut untersuchten deklarativen Hauptsätzen bilden finite und nichtfinite Verben die sogenannte Satzklammer und teilen den Satz dadurch in „Felder“ ein. Dem finiten Verb in der linken Satzklammer geht dabei das Vorfeld voran, das im Regelfall von nur einer Konstituente besetzt ist (daher die Bezeichnung „Verbzweitsprache“). Nach dem finiten Verb folgt das Mittelfeld, das von potentiell vorhandenen nicht-finiten Verben in der rechten Satzklammer begrenzt wird. Genau genommen ist das Deutsche also keine Verbzweitsprache, sondern eher eine „Finitheitszweitsprache“, denn nur die finiten Verben befinden sich in deklarativen Hauptsätzen in der zweiten Position. Oft wird sie von Hilfsverben eingenommen (Gestern hat Paula ihre Schlüssel verloren.), die man als semantisch leere Träger von Finitheitsmerkmalen auffassen kann, während die für die Bedeutung und die weiteren obligatorischen Bestandteile des Satzes relevanten lexikalischen Verben in der

Lernersprachen

37

rechten Satzklammer zu finden sind. Enthält ein Satz nur ein Verb, muss dies zugleich die Verbbedeutung und die Finitheitsmerkmale ausdrücken – es wird dann entsprechend flektiert und in die Finitheitsposition (linke Satzklammer) gestellt (Paula verliert öfter ihre Schlüssel.). Der Erwerb der Verbstellung hat die Aufmerksamkeit von Spracherwerbsforschern auf sich gezogen, weil man hier beobachtet hat, dass sowohl L1- als auch L2-Lernende zu Beginn des Erwerbs eine Entwicklungsphase durchlaufen, in der ihre Äußerungen anstelle finiter Verben nicht-finite Verbformen, d. h. Infinitive und Partizipien, aber auch unflektierte Stammformen enthalten (mein Vater nicht schlafen). Außerdem stehen diese Verben oft nicht in der für finite Verben vorgesehenen Position. Bis zum Erreichen der Zielsprache ist hier ein Entwicklungsweg mit vielen Zwischenschritten dokumentiert worden. Auf diese Befunde stützt sich sowohl das Diagnoseverfahren LiSe-DaZ (Schulz & Tracy 2011) als auch die Profilanalyse (Grießhaber 2010; 2013). Ein Vergleich der Instrumente zeigt jedoch, dass hierbei nicht von derselben Entwicklungslogik ausgegangen wird, sodass bestimmte Strukturen unterschiedlichen Erwerbsstufen zugeordnet werden. Bei beiden Verfahren basiert die Zuordnung auf natürlichsprachlichem Material. Im Falle von LiSe-DaZ wird dies mit Hilfe einer Bildergeschichte mündlich elizitiert, im Falle der Profilanalyse können mündliche oder schriftliche Sprachproduktionen aus verschiedenen Zusammenhängen verwendet werden. Beide Verfahren unterscheiden im Kernbereich vier Erwerbsstufen5 und geben den Untersuchenden entsprechende Analyseraster mit Beispielen an die Hand, für deren Darstellung sie das Feldermodell (siehe unten) verwenden. Die Analyseraster können daher gut miteinander verglichen werden. Die Stufen sind jeweils mit I–IV nummeriert (bei der Profilanalyse geht diesen noch eine Stufe 0 „Bruchstücke“ voraus). Aus einem Vergleich der Tabellen 1 und 2 wird leicht ersichtlich, dass die Verfahren in vielen Fällen zu einer unterschiedlichen Zuordnung kommen. Zunächst fällt auf, dass bei der Profilanalyse zwischen „Bruchstück“ und „Finitum“ keine Zwischenstufen unterschieden werden. Lerneräußerungen, die laut LiSe-DaZ wichtige Erwerbsschritte erkennen lassen, nämlich die Besetzung der rechten Klammer in Stufe I und der Aufbau eines Mittelfelds in Stufe II, müssten in der Profilanalyse als Belege für „Bruchstücke“ gerechnet werden. Dafür werden bei LiSe-DaZ für Inversion und Separation keine weiteren Stufen angesetzt. Nur bei Stufe IV (Verbletztstellung im Nebensatz bei Besetzung der linken Klammerposition mit einer Subjunktion) stimmen beide Modelle überein. Kann man nun sagen, dass sich die Profilanalyse einfach nicht sehr für die Anfänge des Verbstellungserwerbs interessiert, sodass alles, was vor dem Erwerb

5 Nach dem Erreichen der Verbletztstellung im Nebensatz unterscheidet die Profilanalyse noch zwei weitere Stufen (die Insertion von Nebensätzen und die Integration von Partizipialattributen), die jedoch in erster Linie für die Schriftsprache relevant sind.

38

Christine Dimroth

Tab. 1: Entwicklungsstufen und ausgewählte Beispieläußerungen aus dem Begleitheft zur Durchführung und Auswertung von LiSe-DaZ (Schulz & Tracy 2011: 48). Entwicklungsstufe (ESS)

Vorfeld

Linke Klammer

Mittelfeld

ESS-I

raus umgeschmissen

ESS-II

ESS-III

ESS-IV

Rechte Klammer

Brot kleiner

essen gemacht

die dann

winkt mag

auch der da

raus

…,

wenn

man den Mülleimer

umkippt

Tab. 2: Grundlegende Wortstellungsmuster und ausgewählte Beispieläußerungen zur Erläuterung der Profilanalyse (Grießhaber 2013: 2). Stellungsmuster

Vorfeld

Linke Klammer

Mittelfeld

0 Bruchstücke

Danke!

I Finitum

Maria

geht

ins Kino.

II Separation

Maria Maria

kommt ist

um 8 Uhr ins Theater

an. gegangen.

III Inversion

Danach Wen

geht will Kommst

Maria nach Hause. Maria du morgen?

treffen?

…,

dass

sie ins Theater

geht.

IV Verbendstellung

Rechte Klammer

finiter Hauptverben geschieht, ausgeblendet wird? Und ist es andererseits so, dass LiSe-DaZ vor dem Auftreten finiter Verben sehr feinmaschig unterscheidet, jedoch bei den weiter fortgeschrittenen Stufen keine Ausdifferenzierungen vornimmt und Beispielsätze mit analytischen Verbformen (hat … probiert) und Inversion (jetzt geh ich …) mit anderen finiten Sätzen in einen Topf wirft? In diesem Falle wäre dem Problem leicht abzuhelfen, indem man die beiden Stufenmodelle einfach in der Mitte (etwa beim einfachen finiten Hauptsatz) zusammenlegt, um ein angemessen differenziertes Bild des Verbstellungserwerbs zu erhalten. Zweifel kommen jedoch auf, wenn man feststellt, dass Standardsätze mit finitem Hauptverb (Paul trinkt Limonade.) nach der Profilanalyse die allererste Stufe nach den Bruchstücken darstellen, während sie nach LiSe-DaZ der letzten Stufe vor den Nebensätzen zugeordnet werden, auf der dann zugleich auch Inversion und Hilfsverbstrukturen (Separation) verfügbar sind: Diese Unterschiede gehen nicht auf das Ausblenden bestimmter Erwerbsphasen zurück. Vielmehr liegt den beiden

Lernersprachen

39

Verfahren eine unterschiedliche Entwicklungslogik zugrunde, die verschiedenen Lernerpopulationen abgeschaut wurde. Die Profilanalyse basiert auf den Ergebnissen des longitudinalen Spracherwerbsprojekts ZISA (Zweitsprachenerwerb italienischer und spanischer Arbeiter; vgl. Clahsen, Meisel & Pienemann 1983). In dem Projekt wurde festgestellt, dass erwachsene Lernende mit romanischen Erstsprachen zunächst von der Grundwortstellung SVO (die leute arbeiten hier) ausgehen, d. h. nur über eine dem Subjekt folgende Position für Verben verfügen. Auf einer darauffolgenden Erwerbsstufe wird diese Grundreihenfolge zunächst um vorangestellte adverbiale Ausdrücke erweitert (in italia viel interessiert die familie), bevor es dann in einem nächsten Schritt zur Trennung finiter und infiniter Verben kommt (vgl. Profilanalyse: Separation) und somit eine weitere Position für Verben am Äußerungsende etabliert wird (die deutsche leute haben mir hier gebracht). Erst danach erfolgt dann der Erwerb einer echten Verbzweitposition für finite Verben (Profilanalyse: Inversion), was sich in Äußerungen mit Subjekt-Verb Stellung zeigt (jetzt kann sie mir eine frage machen). Die Verbendstellung in Nebensätzen schließt den Erwerb der Verbstellung ab (wann die siebzig prozent ausländer rausgehen, die edelstahl is aus). Die Profilanalyse geht also auf Erwerbssequenzen zurück, die bei erwachsenen Lernenden beobachtet wurden, deren Erstsprache eine SVO-Stellung aufweist. Für diese Lernenden ist die Produktion finiter Hauptsätze (Paul trinkt Limonade) also kein sehr großer Erwerbsschritt, weshalb ihn die Profilanalyse ganz am Anfang einordnet (Stufe I). Nach diesem Einstieg müssen die Lernenden aber noch viel über das Deutsche herausfinden. Sie müssen insbesondere die Eigenschaften erkennen, die eine Verbzweit- von einer SVO-Sprache unterscheiden, z. B. dass die Verben sich in Stufe I in einer Position befinden, die im Deutschen keine genuine Position für Verben, sondern vielmehr eine für den Ausdruck von Finitheit ist. Lexikalische Verben können auch in der rechten Klammer auftreten, und dies zu erkennen ist ein weiterer Erwerbsschritt (Stufe II der Profilanalyse). Damit ist die Verbzweit-Eigenschaft des Deutschen jedoch immer noch nicht voll entwickelt, denn die Lernenden müssen auch noch herausfinden, dass im Deutschen – anders als in SVO-Sprachen – vor dem finiten Verb (d. h. im Vorfeld) nur Platz für eine Konstituente ist. Ist diese Konstituente nicht das Subjekt, kommt es zur Inversion (Stufe III der Profilanalyse). Dieser Weg zur zielsprachlichen Verbstellung erlaubt es zwar, relativ früh oberflächlich korrekte Äußerungen zu bilden (SVO ist ja eine zulässige Wortstellung im Deutschen), zugleich erschwert die Annahme, Deutsch sei eine SVO-Sprache, jedoch das Entdecken der rechten Verbklammer und der Verbzweitgrammatik. Haberzettl (2005) hat diesen Weg deshalb einen „Holzweg“ genannt. Demgegenüber stützt sich LiSe-DaZ auf einen „Königsweg“ (Haberzettl 2005) zur deutschen Verbstellung, der im Erstspracherwerb des Deutschen und auch im frühen Zweitspracherwerb beobachtet wurde. Junge Kinder bauen die Satzstruktur des Deutschen „von rechts nach links“ auf, deshalb sind die Partikeln oder auch nicht finite Verben in der rechten Verbklammer ein signifikanter Schritt in die richti-

40

Christine Dimroth

ge Richtung (Stufe I nach LiSe-DaZ). Anschließend wird das Mittelfeld besetzt (Stufe II). Sobald finite Verben in der linken Klammerposition erscheinen, entsteht auch ein Vorfeld, in dem sowohl das Subjekt (vorher im Mittelfeld) als auch andere Konstituenten untergebracht werden können. Ein eigener Erwerbsschritt (Inversion) ist dafür nicht nötig. Das gilt auch für die Besetzung der rechten Satzklammer: Dort standen nicht-finite Verben ja schon in Schritt I und II – ein Erwerbsschritt „Separation“ entfällt deshalb. Hinter dieser Einteilung verbirgt sich ein Syntaxmodell, demzufolge nicht finite lexikalische Verben beim Entstehen finiter Sätze aus ihrer Grundposition am Satzende entfernt und in die linke Klammerposition hineinbewegt werden müssen. Lernende, denen ein solches Prinzip als Leitlinie zur Verfügung steht, erwerben den Zusammenhang zwischen Finitheit und Verbstellung also sozusagen automatisch. In der generativen Spracherwerbstheorie wird davon ausgegangen, dass dies nur bei kindlichen Lernenden der Fall ist, während ältere Lernende sich die Zusammenhänge schrittweise durch Inputanalyse erschließen müssen (z. B. Meisel 2009). Ob sich Kinder und Erwachsene hier wirklich grundsätzlich unterscheiden, ist allerdings genauso umstritten (Verhagen & Schimke 2009) wie die genaue Position einer Altersgrenze. Bei der Anwendung der beiden Diagnoseinstrumente gibt es jedenfalls einen Überlappungsbereich, denn zumindest für das frühe Grundschulalter werden beide empfohlen: LiSe-DaZ ist für Kinder im Alter von 3;00–7;11 Jahren konzipiert (Schulz & Tracy 2011), die Profilanalyse ist laut Grießhaber (2013) für den Schuleingangsbereich gleichfalls geeignet. Darüber hinaus sind beim Erwerb der Verbstellung auch L1-bedingte Unterschiede gefunden worden. In einer Längsschnittstudie vergleicht Haberzettl (2005) den Verlauf bei vier Grundschulkindern mit Russisch und Türkisch als Erstsprache. Die Erwerbssequenzen zeigen, dass die russischen Lernenden, ähnlich wie die in der ZISA-Studie untersuchten Erwachsenen, von einer SVOWortstellung ausgehen, während die türkischen Lernenden – basierend auf der Grundwortstellung ihrer Erstsprache – zunächst eine OV-Wortstellung für das Deutsche vermuten und dann den Weg gehen, der den Entwicklungsstufen von LiSe-DaZ zugrunde liegt.6 Des Weiteren zeigen longitudinale Erwerbsstudien, dass es beim Erwerb der Verbstellung neben Alter und Erstsprache auch auf den Verbtyp ankommt. Jordens (2012) untersucht sowohl den Erstspracherwerb als auch den Zweitspracherwerb des Niederländischen, wo die zielsprachlichen Zusammenhänge dem Deutschen so ähnlich sind, dass sein Modell auch auf das Deutsche anwendbar ist (vgl. Bittner & Bartz, im Erscheinen). In dem Modell wird bei L1-Lernenden und erwachsenen L2-Lernenden der Übergang von einem lexikalischen in ein funktionales Stadium angesetzt. Wichtig ist

6 Interessanterweise werden durch die oben beschriebenen komplexen Verbstellungsregeln des Deutschen zunächst beide Gruppen in ihren Vorannahmen bestärkt, da sich eben an beiden Oberflächenpositionen deutscher Sätze Verben befinden können.

Lernersprachen

41

nun, dass Vorgangs- und Zustandsverben (state predicates) bei beiden Lernergruppen schon im lexikalischen Stadium in finiter Form und Position auftreten, während dies für Handlungsverben (action predicates) erst im funktionalen Stadium gilt. Daraus folgt, dass schon früh Äußerungen mit finiten state predicates zu erwarten sind (teller fällt runter, mama kommt nicht, der Hund will das). Solche Äußerungen müssten in den beiden Diagnosetabellen als Finitum (Profilanalyse Stufe I) bzw. ESS-III (LiZe-DaZ) eingeordnet werden, obwohl sie Jordens (2012) zufolge keinen Aufschluss über die Entwicklung der Verbstellung erlauben, da state predicates fast nur in finiter Position vorkommen. Nur action predicates (mama isst eis) machen tatsächlich eine Entwicklung von nicht-finit zu finit durch und eignen sich deshalb als Indikator. Es gibt eine Reihe von Belegen für die Beobachtung, dass finite Handlungsverben von verschiedenen Lernerpopulationen erst nach dem Erwerb von Hilfsverben produktiv verwendet werden (Becker 2005; Dimroth 2008; Jordens 2012; Parodi 2000; Schimke 2009; Schimke & Dimroth 2017), sodass auch Auxiliarverben als Scheidelinie für die Sprachstandsdiagnose in Frage kämen.7 Selbst in einem Bereich wie der Verbstellung, für den schon gut funktionierende Diagnoseinstrumente vorliegen, gibt es also bei der Auswahl der Analyseverfahren und der Interpretation der Ergebnisse einige Probleme zu bedenken. Letztlich kommt es darauf an, welche Evidenz für eine bestimmte Verbposition man unter welchen Bedingungen für ausschlaggebend und belastbar hält.

6 Fazit und Ausblick Wie der vorangegangene Abschnitt gezeigt hat, ist die Zuordnung von Lernenden zu Erwerbsstufen selbst in einem gut untersuchten Teilbereich wie der Verbstellung oft komplexer, als es Sprachstandsdiagnoseverfahren bei oberflächlicher Betrachtung nahelegen. Das liegt zum einen an verschiedenen theoretischen Grundannahmen und zum anderen an unterschiedlichen Einschätzungen über die relevante empirische Evidenz und die Methoden zu ihrer Gewinnung. Man kann sich leicht vorstellen, wie viel schwieriger die Entwicklung zuverlässiger Diagnoseverfahren in Bereichen ist, die bisher noch nicht so ausgiebig erforscht wurden. Obwohl selbst der Begriff Lernersprache theoretisch nicht „unschuldig“ ist, wie eingangs gezeigt wurde, hat sich die Grundidee, dass sich entwickelnde Sprachwissen von Lernenden in seiner Eigengesetzlichkeit zu erforschen, anstatt es nur als defizitäre Variante der Zielsprache aufzufassen, als fruchtbar erwiesen. Besonders Veränderungen im Erwerbsverlauf sind klarer erkennbar, wenn ähnlich wie beim

7 Manche Lernenden bauen sogar Dummy-Hilfsverben (vgl. die Beiträge in Blom, van de Craats & Verhagen 2013) als Platzhalter für die Finitheitsposition in ihre Äußerungen ein (das kind is auto spiele). Die Grundstruktur einer „Finitheitszweitsprache“ (s. o.) wird so besonders transparent.

42

Christine Dimroth

Sprachwandel versucht wird, formale und funktionale Eigenschaften des gesamten Ausdruckssystems zu erfassen, anstatt isolierte Eigenschaften mit der Zielsprache abzugleichen. Hier unterscheidet sich der Lernersprachenansatz deutlich von der früheren Fehleranalyse (vgl. Ahrenholz 2014). Neben der Suche nach überindividuellen Gemeinsamkeiten, die für die Sprachstandsdiagnose besonders relevant sind, wird sich die Forschung in Zukunft verstärkt individuellen Unterschieden zuwenden müssen, was angesichts der Vielzahl bereits bekannter Faktoren, die den Zweitspracherwerb beeinflussen, sicher keine triviale Aufgabe ist. Eine weitere Herausforderung liegt darin, den dynamischen soziolinguistischen Status zu erforschen, den nicht-muttersprachliche Varietäten innerhalb des Variationsspektrums innehaben, die einem Individuum oder einer Gesellschaft als Ausdrucksformen zur Verfügung stehen. Die Bezeichnung Lernersprache suggeriert ja einen vorübergehenden Zustand (eben während der Phase des Lernens), obwohl wir wissen, dass besonders erwachsene L2-Lernende sehr stabile Varietäten herausbilden können, die sich mehr oder weniger deutlich von der Zielsprache unterscheiden. Um die Erwartbarkeit und Normalität dieser Situation zu unterstreichen, schlägt etwa Cook (2002) vor, die Bezeichnung L2 learner durch L2 user zu ersetzen.

Literatur Ahrenholz, Bernt (2014): Lernersprachenanalyse. In Julia Settinieri, Sevilen Demirkaya, Alexis Feldmeier, Nazan Gültekin-Karakoç, Stephanie Immich & Claudia Riemer (Hrsg.), Einführung in empirische Forschungsmethoden für Deutsch als Fremd- und Zweitsprache. 167–181. Paderborn: Schöning. Barkowski, Hans & Hans-Jürgen Krumm (Hrsg.) (2010): Fachlexikon Deutsch als Fremd- und Zweitsprache. Tübingen: Francke. Becker, Angelika (2005): The semantic knowledge base for the acquisition of negation and the acquisition of finiteness. In Henriette Hendriks (Hrsg.), The Structure of Learner Varieties, 263–314. Berlin: Mouton de Gruyter. Becker, Angelika & Mary Carroll (1997): The Acquisition of Spatial Relations in a Second Language. Amsterdam: John Benjamins. Bickerton, Derek (1998): Catastrophic evolution: The case for a single step from protolanguage to full human language. In James R. Hurford, Michael Studdert-Kennedy & Chris Knight (Hrsg.), Approaches to the evolution of language: social and cognitive bases, 341–358. Cambridge: Cambridge University Press. Binanzer, Anja (2015): Von Sexus zu Genus? Semantische Strategien im Erwerb von Genuskongruenz in der Zweitsprache Deutsch. In Klaus-Michael Köpcke & Arne Ziegler (Hrsg.), Deutsche Grammatik in Kontakt. Deutsch als Zweitsprache in Schule und Unterricht, 263–294. Berlin, Boston: De Gruyter. Birdsong, David (2006): Age and Second Language Acquisition and Processing: A Selective Overview. Language Learning 56 (Issue Supplement s1), 9–49. Bittner, Dagmar & Damaris Bartz (im Erscheinen): Finiteness in early but-clauses in German L1-acquisition. First Language. Bley-Vroman, Robert (1989): What is the logical problem of foreign language learning? In Susan Gass & Jacquelyn Schachter (Hrsg.), Linguistic Perspectives on Second Language Acquisition, 41–68. New York: CUP.

Lernersprachen

43

Blom, Elma, Ineke van de Craats & Josje Verhagen (Hrsg.) (2013): Dummy Auxiliaries in First and Second Language Acquisition. Berlin: Mouton De Gruyter. Bot, Kees de, Wander Lowie & Marjolijn Verspoor (2007): A dynamic systems theory approach to second language acquisition. Bilingualism: Language and Cognition 10 (1), 7–21. Chilla, Solveig (2008): Erstsprache, Zweitsprache, Spezifische Sprachentwicklungsstörung? Eine Untersuchung des Erwerbs der deutschen Hauptsatzstruktur durch sukzessiv-bilinguale Kinder mit türkischer Erstsprache. Hamburg: Dr. Kovac. Clahsen, Harald (1988): Normale und gestörte Kindersprache. Linguistische Untersuchungen zum Erwerb von Syntax und Morphologie. Amsterdam u. a.: John Benjamins. Clahsen, Harald, Jürgen Meisel & Manfred Pienemann (1983): Deutsch als Zweitsprache. Der Spracherwerb ausländischer Arbeiter. Tübingen: Narr. Clahsen, Harald & Claudia Felser (2006): How native-like is non-native language processing? Trends in Cognitive Sciences 10 (12), 564–570. Cook, Vivian (Hrsg.) (2002): Portraits of the L2 user. Clevedon u. a.: Multilingual Matters. Diehl, Erika, Helen Christen, Sandra Leuenberger, Isabelle Pelvat & Thérèse Studer (2000): Grammatikunterricht, alles für der Katz? Untersuchungen zum Zweitsprachenerwerb Deutsch. Tübingen: Niemeyer. Wolfgang Klein & Colette Noyau (1995): The Acquisition of Temporality in a Second Language. Amsterdam: John Benjamins. Dimroth, Christine (2008): Age effects on the process of L2 acquisition? Evidence from the acquisition of negation and finiteness L2 German. Language Learning 58 (1), 117–150. Dimroth, Christine & Stefanie Haberzettl (2012): The Older the Better, or More is More: Language Acquisition in Childhood. In Marzena Watorek, Sandra Benazzo & Maya Hickmann (Hrsg.), Comparative Perspectives to Language Acquisition: A tribute to Clive Perdue, 324–350. Bristol u. a.: Multilingual Matters. Dimroth, Christine, Rebekah Rast, Marianne Starren & Marzena Watorek (2013): Methods for studying the learning of a new language under controlled input conditions: The VILLA project. Eurosla Yearbook (13), 109–138. Dittmar, Norbert & Wolfgang Klein (1975): Untersuchungen zum Pidgin-Deutsch spanischer und italienischer Arbeiter in der Bundesrepublik: Ein Arbeitsbericht. Jahrbuch Deutsch als Fremdsprache 1, 170–194. Dörnyei, Zoltán (2009): The psychology of second language acquisition. Oxford: Oxford University Press. Dulay, Heidi C. & Marina K. Burt (1974): Natural sequences in child second language acquisition. Language Learning 24 (1), 37–53. Ellis, Nick (2002): Frequency effects in language processing: A review with implications for theories of implicit and explicit language acquisition. Studies in Second Language Acquisition 24 (2), 143–188. Ellis, Nick C. (2008): Usage-based and Form-focused Language Acquisition: The Associative Learning of Constructions, Learned-Attention, and the Limited L2 Endstate. In Peter Robinson & Nick Ellis (Hrsg.), Handbook of Cognitive Linguistics and Second Language Acquisition, 372–405. New York u. a.: Routledge. Gardner, Robert C. (1985): Social psychology and second language learning: The role of attitudes and motivation. London: Arnold. Grießhaber, Wilhelm (2010): Spracherwerbsprozesse in Erst- und Zweitsprache. Eine Einführung. Duisburg: Universitätsverlag Rhein-Ruhr. Grießhaber, Wilhelm (2013): Die Profilanalyse für Deutsch als Diagnoseinstrument zur Sprachförderung. Universität Duisburg-Essen. https://www.uni-due.de/imperia/md/content/ prodaz/griesshaber_profilanalyse_deutsch.pdf (30. 09. 2017). Grosjean, François (1989): Neurolinguists, beware! The bilingual is not two monolinguals in one person. Brain and Language 36 (1), 3–15.

44

Christine Dimroth

Grotjahn, Rüdiger (2003): Der Faktor „Alter“ beim Fremdsprachenlernen. Mythen, Fakten, didaktisch-methodische Implikationen. Deutsch als Fremdsprache 1, 32–41. Haberzettl, Stefanie (2005): Der Erwerb der Verbstellungsregeln in der Zweitsprache Deutsch durch Kinder mit russischer und türkischer Muttersprache. Tübingen: Niemeyer. Hendriks, Henriëtte (2005): Structuring space in discourse. A comparison of Chinese, French, German and English L1 and French, German and English L2 acquisition. In Henriëtte Hendriks (Hrsg.), The structure of learner varieties, 111–156. Berlin u. a.: Mouton de Gruyter. Hopp, Holger (2010): Ultimate attainment in L2 inflection: Performance similarities between nonnative and native speakers. Lingua 120 (4), 901–931. Hulstijn, Jan (2015): How Different Can Perspectives on L2 Development be? Language Learning, 65 (1), 210–232. Hyltenstam, Kenneth & Niclas Abrahamsson (2003): Maturational Constraints in SLA. In Catherine J. Doughty & Michael H. Long (Hrsg.), The Handbook of Second Language Acquisition, 539– 588. Malden u. a.: Blackwell. Johnson, Jacqueline S. & Elissa L Newport (1989): Critical period effects in second language learning: The influence of maturational state on the acquisition of English as a second language. Cognitive Psychology 21 (1), 60–99. Jordens, Peter (2012): Language acquisition and the functional category system. Berlin: De Gruyter Mouton. Kaltenbacher, Erika & Hannah Klages (2012): Sprachprofil und Sprachförderung bei Vorschulkindern mit Migrationshintergrund. In Bernt Ahrenzolz (Hrsg.), Kinder mit Migrationshintergrund − Spracherwerb und Fördermöglichkeiten, 80–91. Freiburg im Breisgau: Filibach. Klein, Wolfgang & Clive Perdue (1992): Utterance Structure. Developing Grammars again. Amsterdam: Benjamins. Klein, Wolfgang (2000): Prozesse des Zweitspracherwerbs. In Hannelore Grimm (Hrsg.), Enzyklopädie der Psychologie: Band 3. Göttingen u. a.: Hogrefe, 538–570. Klein, Wolfgang & Christine Dimroth (2003): Der ungesteuerte Spracherwerb Erwachsener. In Utz Maas & Ulrich Mehlem (Hrsg.), Qualitätsanforderungen für die Sprachförderung im Rahmen der Integration von Zuwanderern, 127–161. Osnabrück: Institut für Migrationsforschung und Interkulturelle Studien (IMIS). Köpcke, Klaus-Michael (1987): Der Erwerb morphologischer Ausdrucksmittel durch L2-Lerner am Beispiel der Personalflexion. Zeitschrift für Sprachwissenschaft 6 (2), 186–205. Köpcke, Klaus-Michael & Verena Wecker (2015): Deutsche Pluralbildung im DaZ-Erwerb. Didaktische Überlegungen zum Umgang mit Abweichungen von der Norm. In Klaus-Michael Köpcke & Arne Ziegler (Hrsg.), Deutsche Grammatik in Kontakt. Deutsch als Zweitsprache in Schule und Unterricht, 295–312. Berlin, Boston: De Gruyter. Kroll, Judith F. & Natasha Tokowicz (2005): Models of bilingual representation and processing: Looking back and to the future. In Judith F. Kroll & Annette M. B. de Groot (Hrsg.), Handbook of bilingualism: Psycholinguistic approaches, 531–553. New York: Oxford University Press. Lieven, Elena & Michael Tomasello (2008): Children’s first language acquisition from a usagebased perspective. In Peter Robinson & Nick Ellis (Hrsg.), Handbook of cognitive linguistics and second language acquisition, 168–196. New York: Routledge. Lieven, Elena & Heike Behrens (2011): Dense Sampling. In Erika Hoff (Hrsg.), Research Methods in Child Language: A Practical Guide, 226–239. Oxford: Wiley-Blackwell. Long, Michael H. (1990): Maturational constraints on language development. Studies in Second Language Acquisition 12 (3), 251–285. Meisel, Jürgen (2009): Second language acquisition in early childhood. Zeitschrift für Sprachwissenschaft 28 (1), 5–34. Muysken, Pieter (2000): Bilingual Speech: A Typology of Code-Mixing. Cambridge: CUP.

Lernersprachen

45

Newport, Elissa L. (1990): Maturational Constraints on language learning. Cognitive Science 14 (1), 11–28. O’Grady, William (2015): Processing determinism. Language Learning 65 (1), 6–32. Pagonis, Giulio (2009): Kritische Periode oder altersspezifischer Antrieb. Was erklärt den Altersfaktor im Zweitspracherwerb? Eine empirische Fallstudie zum ungesteuerten Zweitspracherwerb des Deutschen durch russische Lernerinnen unterschiedlichen Alters. Frankfurt a. M.: Peter Lang. Parodi, Teresa (2000): Finiteness and verb placement in second language acquisition. Second Language Research, 16 (4), 355–381. Perdue, Clive (Hrsg.) (1993): Adult Language Acquisition: cross-linguistic perspectives. Volume 1: Field methods. Volume 2: The Results. Cambridge: Cambridge University Press. Pienemann, Manfred (1989): Is Language Teachable? Psycholinguistic Experiments and Hypotheses. Applied Linguistics 10 (1), 52–79. Pienemann, Manfred (1998): Language Processing and Second Language Development: Processability Theory. Amsterdam: John Benjamins. Rothweiler, Monika (2016). Spezifische Sprachentwicklungsstörung und früher kindlicher Zweitspracherwerb: Grammatische Defizite und Konsequenzen für die Diagnostik. In Diana Gebele & Alexandra L. Zepter (Hrsg.), Inklusion: Sprachdidaktische Perspektiven. Theorie, Empirie, Praxis, 187–224. Duisburg: Gilles & Francke Verlag. Schimke, Sarah (2009): The acquisition of finiteness by Turkish learners of German and Turkish learners of French: Investigating knowledge of forms and functions in production and comprehension. Nijmegen: Radboud Universiteit Dissertation. Schimke, Sarah & Christine Dimroth (2017): The influence of finiteness and lightness on verb placement in L2 German: comparing child and adult learners. Second Language Research. Schulz, Petra & Rosemarie Tracy (2011): Linguistische Sprachstandserhebung – Deutsch als Zweitsprache (LiSe-DaZ). Göttingen u. a.: Hogrefe. Selinker, Larry (1969): Language Transfer. General Linguistics 9, 67–92. Selinker, Larry (1972): Interlanguage. International Review of Applied Linguistics in Language Teaching (IRAL) 10 (3), 209–231. Singleton, David M. & Lisa Ryan (2004): Language Acquisition: The Age Factor. 2. Aufl. Clevedon: Multilingual Matters. Skiba, Romuald (1989): Funktionale Beschreibung von Lernervarietäten: Das Berliner Projekt P-MoLL. In Norbert Reiter (Hrsg.), Sprechen und Hören: Akten des 23. Linguistischen Kolloquiums. Tübingen: Niemeyer, 181–191. Tracy, Rosemarie (2002): Deutsch als Erstsprache: Was wissen wir über die wichtigsten Meilensteine des Erwerbs? Mannheim: Forschungs- und Kontaktstelle Mehrsprachigkeit. Tracy, Rosemarie & Dieter Thoma (2009): Convergence on finite V2 clauses in L1, bilingual L1 and early L2 acquisition. In Peter Jordens & Christine Dimroth (Hrsg.), Functional categories in learner language. Berlin & New York: Mouton de Gruyter, 1–43. Unsworth, Sharon (2013): Assessing the role of current and cumulative exposure in simultaneous bilingual acquisition: The case of Dutch gender. Bilingualism: Language and Cognition 16 (1), 86–110. Verhagen, Josje & Sarah Schimke (2009): Differences or fundamental differences? Kommentar zu J. Meisels Artikel „Second language acquisition in early childhood“. Zeitschrift für Sprachwissenschaft 28 (1), 97–106. Wegener, Heide (1995): Das Genus im DaZ-Erwerb. Beobachtungen an Kindern aus Polen, Rußland und der Türkei. In Brigitte Handwerker (Hrsg.), Fremde Sprache Deutsch. Tübingen: Narr, 1–24. Wegener, Heide (2008): *Häsen und *Hünde. Irreguläre Pluralformen beim DaZ-Erwerb. In Bernt Ahrenholz, Ursula Bredel, Wolfgang Klein, Martina Rost-Roth & Romuald Skiba (Hrsg.),

46

Christine Dimroth

Empirische Forschung und Theoriebildung. Beiträge aus Soziolinguistik, GesprocheneSprache- und Zweitspracherwerbsforschung. Festschrift für Norbert Dittmar zum 65. Geburtstag, 343–352. Frankfurt/M. u. a.: Lang. Winkler, Steffi (2011): Progressionsfolgen im DaF-Unterricht. Eine Interventionsstudie zur Vermittlung der deutschen (S)OV-Wortstellung. In Natalia Hahn & Thorsten Roelcke (Hrsg.), Grenzen überwinden mit Deutsch, 193–207. Göttingen: Universitätsverlag.

Iris Kleinbub

3 Kompetenzmodellierung 1 2 3 4 5 6

Einleitung Kompetenzen und ihre Bedingungsfaktoren Fachbildungsstandards – Rekonstruktion eines kritischen (Fach-)Diskurses Kompetenzmessung im Spannungsfeld von Produkt- und Prozessorientierung Standards im Spannungsfeld zwischen fachlicher und sprachlicher Kompetenzmodellierung Fazit

1 Einleitung Im Zuge der Output-Steuerung des Bildungssystems werden die Leistungen der Schülerinnen und Schüler als Maße erfolgreichen Kompetenzerwerbs gemessen. Die zu erwerbenden und in standardisierten Tests nachzuweisenden fachlichen Kompetenzen sind in den Nationalen Bildungsstandards1 festgehalten, die als Basis zunächst noch vorläufiger Kompetenzmodelle zu verstehen sind. Das Erreichen dieser fachlichen Standards gelingt nicht allen Schülerinnen und Schülern in gleichem Maße und hängt zu einem nicht unerheblichen Teil von ihren sprachlichen Kompetenzen ab. Insbesondere Lernende mit Deutsch als Zweitsprache sind bei Lernstandserhebungen häufig auf den unteren Kompetenzniveaus überrepräsentiert. Mit zunehmender Heterogenität der Lernvoraussetzungen u. a. durch Bi- und Multilingualität der Schülerinnen und Schüler stellen sich mehr und mehr Fragen nach der Chancengleichheit im Hinblick auf die Erreichbarkeit fachlicher Bildungsstandards, nach der Aussagekraft und den didaktischen Konsequenzen fachlicher Leistungsmessung für den Zweitspracherwerb sowie nach geeigneten Sprachkompetenzmodellen, die als Basis für Instrumente zur Sprachstandsdiagnose und für Konzepte zur Sprachförderung dienen können.

2 Kompetenzen und ihre Bedingungsfaktoren Der Blick auf das komplexe Gefüge von Lehren und Lernen lässt unterschiedliche Perspektiven zu. Zwei davon lassen sich mit Produktorientierung und Prozessorientierung umschreiben (Helmke 2015). Erstere bezeichnet eine wirkungsorientierte Sichtweise, die Produkte und Erträge des Lehrens und Lernens in den Fokus rückt.

1 In diesem Beitrag wird an verschiedenen Stellen exemplarisch auf die Bildungsstandards Deutsch für den Primarbereich verwiesen. Die Aussagen treffen jedoch in den meisten Fällen auch auf die Bildungsstandards Deutsch für den mittleren Schulabschluss zu. https://doi.org/10.1515/9783110418712-003

48

Iris Kleinbub

Der sog. Output des Bildungssystems umfasst der Klieme-Expertise (Klieme et al. 2003: 12–13) zufolge […] neben der Vergabe von Zertifikaten im Wesentlichen den Aufbau von Kompetenzen, Qualifikationen, Wissensstrukturen, Einstellungen, Überzeugungen, Werthaltungen – also von Persönlichkeitsmerkmalen bei den Schülerinnen und Schülern, mit denen die Basis für ein lebenslanges Lernen zur persönlichen Weiterentwicklung und gesellschaftlichen Beteiligung gelegt ist.

Insbesondere der Kompetenzbegriff wurde in der Folge innerhalb und zwischen den Disziplinen viel diskutiert. Meist wird dem Diskurs in der deutschsprachigen Bildungsforschung der Kompetenzbegriff von Weinert (2001a: 27–28) zu Grunde gelegt, der darunter […] die bei Individuen verfügbaren oder durch sie erlernbaren kognitiven Fähigkeiten und Fertigkeiten, um bestimmte Probleme zu lösen, sowie die damit verbundenen motivationalen, volitionalen und sozialen Bereitschaften und Fähigkeiten um die Problemlösungen in variablen Situationen erfolgreich und verantwortungsvoll nutzen zu können

versteht. Als Erträge schulischen Unterrichts nennt er neben fachlichen (z. B. physikalischer, fremdsprachlicher, musikalischer Art) auch fachübergreifende Kompetenzen (z. B. Problemlösen, Teamfähigkeit) sowie Handlungskompetenzen, „die neben kognitiven auch soziale, motivationale, volitionale und oft moralische Kompetenzen enthalten“ (Weinert 2001a: 28). Er geht davon aus, dass sich Lernerfolg als Kompetenz beschreiben lässt. Im Rahmen der länderübergreifenden Bildungsstandards und der vergleichenden Leistungsmessungen in Schulen rücken insbesondere die fachlichen Kompetenzen in den Vordergrund. Um ihre Struktur konzeptionell zu erfassen und zu präzisieren, werden Kompetenzmodelle entwickelt. Dies ist eine gemeinsame Aufgabe der Deutschdidaktik und der an Bildungsforschung beteiligten Disziplinen, wie Pädagogik und Psychologie. Die Kompetenzen werden mit konkreten Anforderungssituationen in Verbindung gebracht, wo sie bereichs- bzw. domänenspezifisch gefordert bzw. gezeigt werden. Dabei wird davon ausgegangen, dass Kompetenzen kumulativ bzw. progressiv beschreibbar sind (vgl. Peek 2008). Die zweite Perspektive richtet den Fokus auf die Lehr-Lern-Prozesse und auf das Zusammenspiel verschiedener Bedingungen und Faktoren, die sie bestimmen. Wie komplex das Wirkungsgefüge dieser Faktoren ist, die den Lernerfolg beeinflussen, verdeutlicht das Makromodell der Bedingungsfaktoren schulischer Leistungen (Helmke 2015, vgl. Abbildung 1). Es zeigt, dass schulische Leistung und Leistungsunterschiede multipel determiniert sind. Die Dynamik der wechselseitigen Verflechtungen kann in einem Modell nur unzureichend abgebildet werden, daher geht es vielmehr um die Identifikation einflussreicher Bereiche. Manche Faktoren nehmen relativ direkt (proximale Faktoren), andere nur indirekt (distale Faktoren), auf die Leistung Einfluss. Ein proximaler Faktor ist die Persönlichkeit des Kindes; seine individuellen Eingangsvoraus-

Kompetenzmodellierung

49

Abb. 1: Makromodell der Bedingungsfaktoren schulischer Leistungen (Helmke 2015).

setzungen wie kognitive und metakognitive Kompetenzen (z. B. das Vorwissen in einem Fach), motivationale, soziale, konstitutionelle und affektive Merkmale sowie seine Bildungs- und Sprachlernbiografie haben direkten Einfluss auf die Lernleistung. Sprachlich Geäußertes angemessen zu verstehen und ebenso sich sprachlich angemessen zu artikulieren ist unerlässlich im Prozess der Aneignung von Bildung ebenso wie in der Situation, in der der Aneignungserfolg überprüft wird. Bildungswissen wird zu einem erheblichen – empirisch noch nie genau erfassten – Teil sprachlich dargeboten, verarbeitet und geprüft. (Gogolin et al. 2016: 286)

Eher indirekt in Bezug auf Leistung, jedoch mit Einfluss auf die Persönlichkeit des Kindes wirken der Konsum von Medien sowie die Beziehung zu Gleichaltrigen. Von welch großer Bedeutsamkeit die Persönlichkeit der Eltern, die familiäre Lernumwelt und somit auch die Prozessmerkmale des elterlichen Erziehungsverhaltens sind, haben zahlreiche Studien in den vergangenen Jahren belegt. Komplementär hierzu sind schulische Faktoren wie Schulumwelt, Klassenkontext und die dadurch beeinflussten Prozessmerkmale des Unterrichts zu sehen. Weitere zentrale Determinanten, die auf das gesamte Bedingungsgefüge einwirken, sind die soziokulturellen Rahmenbedingungen. In einer zunehmend multikulturellen und multilingualen Gesellschaft gewinnen sie an Bedeutung. Je nach sprachlicher, kultureller, regionaler und schichtspezifischer Herkunft 2 der Schülerinnen und Schüler, die sich in der 2 Die Zugehörigkeit zu einer sozialen Schicht hat keinen eigenständigen Erklärungswert für Schulleistungen bzw. Leistungsunterschiede. Vielmehr sind es Merkmale wie Bildungsnähe, Anregungs-

50

Iris Kleinbub

Klassenzusammensetzung wiederfindet, können (und müssen) Lehr- und Lernprozesse, Kommunikationsmuster und Erziehungsmaßnahmen unterschiedlich gestaltet werden (vgl. Helmke & Weinert 1996; Helmke 2015). Um schulische Leistungen zu verbessern, gilt es, die hier dargestellten Bedingungsfaktoren zu optimieren. Aus dem Modell geht hervor, dass Interventionen bei Einflussfaktoren wie dem familialen und sozialen Umfeld deutlich schwerer sein dürften als dies bei der Variable „Prozessmerkmale des Unterrichts“ der Fall ist. In Anbetracht dessen stellt sich die Frage, wie groß die Bedeutung des Faktors Unterricht für das Zustandekommen schulischer Leistung ist und in welchem Maße eine hohe Unterrichtsqualität Defizite auf der Ebene schulferner Variablen möglicherweise zu kompensieren vermag. Diese Frage ist insbesondere für die sprachlichen Kompetenzen in Deutsch, deren Bedeutung u. a. für den Erwerb fachlicher Kompetenzen unbestritten ist, relevant, da hier davon auszugehen ist, dass familiale Bildungsnähe und sprachliche Herkunft die Lernvoraussetzungen wesentlich beeinflussen. Ein (Deutsch-)Unterricht, der diese individuellen Lernvoraussetzungen der Schülerinnen und Schüler berücksichtigt, hat daher auch die Aufgabe, auf ihre sprachlichen Biografien einzugehen.

3 Fachbildungsstandards – Rekonstruktion eines kritischen (Fach-)Diskurses Unter einem „Standard“ versteht man einen Maßstab, einen Anker, eine Norm, ein Kriterium oder eine vorab festgelegte Leistung. Bildungsstandards sind demzufolge normierte Erwartungen bezogen auf die fachlichen Wirkungen von Schule (Output, Outcome). Sie formulieren, welche Leistungen und Kompetenzen von Schülerinnen und Schülern an bestimmten Gelenkstellen der Schulkarriere erreicht sein sollen (vgl. Klieme et al. 2003). Mit der Einführung von Fachbildungsstandards und der Forderung nach Kompetenzorientierung als Reaktion auf das schlechte Abschneiden deutscher Schülerinnen und Schüler bei den internationalen Vergleichsstudien TIMSS und PISA wurde ein Wandel in der bundesdeutschen Bildungspolitik eingeleitet. „[D]ie Umstellung von der Input- zur Output-Orientierung gleicht einer kopernikanischen Wende in den Grundlagen und Zielsetzungen des deutschen Bildungssystems“, so Frederking (2008a: 5). Die Klieme-Expertise (Klieme et al. 2003: 9–10) stellt diesen Sachverhalt deutlich heraus: Die Bildungsstandards […] legen fest, welche Kompetenzen die Kinder oder Jugendlichen bis zu einer bestimmten Jahrgangsstufe mindestens erworben haben sollen. Die Kompetenzen werden so konkret be-

qualität der Lernumwelt, Lernerfolgsorientierung, Qualität des sprachlichen Vorbildes u. a., deren Ausprägung schichtspezifische Unterschiede aufweist (vgl. Helmke 2015).

Kompetenzmodellierung

51

schrieben, dass sie in Aufgabenstellungen umgesetzt und prinzipiell mit Hilfe von Testverfahren erfasst werden können. Der Darstellung von Kompetenzen, die innerhalb eines Lernbereichs oder Faches aufgebaut werden, ihrer Teildimensionen und Niveaustufen, kommt in diesem Konzept ein entscheidender Platz zu.

Im Jahr 2004 wurden die länderübergreifenden Bildungsstandards im Fach Deutsch für den Primarbereich von der Kultusministerkonferenz veröffentlicht. Sie bilden seit dem Schuljahr 2005/2006 bundesweit die Grundlage für den kompetenzorientierten Unterricht im Fach Deutsch. Die Länder verpflichteten sich, die Standards zu implementieren und insbesondere bei der Lehrplanarbeit, der Schulentwicklung und bei der Lehreraus- und -fortbildung zu berücksichtigen. In landesweiten bzw. länderübergreifenden Lernstandsmessungen wird festgestellt, in welchem Umfang die Standards von den Schülerinnen und Schülern erreicht werden (vgl. KMK 2005a: 3). Die Bildungsstandards Deutsch für die Primarstufe beschreiben die Aufgabe des Deutschunterrichts in der Grundschule, „den Schülerinnen und Schülern eine grundlegende sprachliche Bildung zu vermitteln, damit sie in gegenwärtigen und zukünftigen Lebenssituationen handlungsfähig sind“ (KMK 2005a: 3). Zu diesem Zweck soll der Deutschunterricht „die sprachlichen Fähigkeiten jedes einzelnen Kindes so umfassend wie möglich fördern und zum selbstständigen Lernen hinführen“ (KMK 2005a: 3). Die Bildungsstandards sind als erster Entwurf eines Kompetenzmodells zu verstehen (vgl. Klieme et al. 2003). Sie wurden in kurzer Zeit entwickelt und stellen eine Auflistung von Kenntnissen und Fähigkeiten, von Tätigkeiten und Bereitschaften dar, die bildungspolitisch als zentral erachtet werden. Dabei konzentrieren sie sich auf fachliche Zielsetzungen des Deutschunterrichts (vgl. Abbildung 2). „Aspekte der Förderung der personalen und sozialen Kompetenzen werden hier nicht explizit angesprochen, sind aber gleichwohl unverzichtbarer Bestandteil grundlegender Bildung in der Grundschule“ (KMK 2005a: 6). Somit beziehen sich die Standards auf die vier Kompetenzbereiche „Sprechen und Zuhören“, „Schreiben“, „Lesen – mit Texten und Medien umgehen“, „Sprache und Sprachgebrauch untersuchen“. Jeder dieser Kompetenzbereiche wird durch Teilkompetenzen näher definiert. Ob es sich bei diesen Teilkompetenzen um analytisch trennbare Dimensionen handelt, müssen empirische Studien erst noch klären. Neben allgemeinen Kompetenzen werden Niveaus kognitiver Anforderung, sog. Anforderungsbereiche, definiert. Sie bieten einen Orientierungsrahmen für den Schwierigkeitsgrad und die Komplexität von Aufgabenstellungen. Dabei wird unterschieden zwischen dem Wiedergeben bekannter Informationen und Anwenden grundlegender Verfahren und Routinen (Anforderungsbereich 1), dem Herstellen von Zusammenhängen, wobei die Lernenden vertraute Sachverhalte miteinander verknüpfen, indem sie erworbenes Wissen und bekannte Methoden anwenden (Anforderungsbereich 2), sowie dem Reflektieren und Beurteilen, bei dem neue Problemstellungen bearbeitet werden, die eigenständige Beurteilungen und eigene Lösungsansätze erfordern (Anforderungsbereich 3) (vgl. KMK, 2005a: 21).

52

Iris Kleinbub

Bildungsziele eines Unterrichtsfaches Bildungsstandards: Kernbereiche fachlicher Kompetenzen

Gegenstand von Vergleichsarbeiten: Schriftlich und ökonomisch testbarer Teile der Bildungsstandards

Abb. 2: Bildungsziele – Bildungsstandards – Vergleichsarbeiten (Helmke 2015).

Innerhalb des Faches werden die von der Kultusministerkonferenz vorgelegten Bildungsstandards kontrovers diskutiert (u. a. Spinner 2005; Kammler 2006; Frederking 2008a; Granzer, Böhme & Köller 2008; Bredel 2014). Auch wenn Bremerich-Vos (2014: 9) zu bedenken gibt, dass die Standards aufgrund der „Mehrfachadressierung“ einen Kompromiss darstellen und somit „qua ‚Textsorte‘ in besonderem Maße kritikanfällig“ seien, werden die Problembereiche in den deutschdidaktischen Diskursen mit kritischem Grundton thematisiert. „Ein etwas genauerer Blick in die Bildungsstandards der KMK zeigt, dass es sich bei diesen im Wesentlichen um eine Auflistung einschlägiger Lernziele handelt, wie sie sich in ähnlicher Form in den Lehrplänen der verschiedenen Bundesländer bereits finden“, moniert Kammler (2006: 9). Auch gibt der vorläufige Charakter der Standards und insbesondere der Anforderungsbereiche Anlass zur Kritik. Die Klieme-Expertise beschreibe eher den Soll- als den Ist-Zustand, da die Standards (noch) nicht auf klar konturierten und theoretisch konsistent modellierten Kompetenzen basieren (Frederking 2008a: 6). Sie stellen ein erstes, sehr grobes, empirisch nicht gestütztes Kompetenzmodell dar (Granzer, Böhme & Köller 2008: 12), was in den Erläuterungen der KMK zur Konzeption und Entwicklung der Bildungsstandards ebenfalls betont wird (vgl. KMK 2005b; Klieme et al. 2003: 71). Diese kompetenztheoretische Fundierung der Bildungsstandards stellt zweifelsohne eine Herausforderung der aktuellen Bildungsforschung dar (Klieme et al. 2003: 136). Für eine empirische Überprüfung der Erreichung der Bildungsstandards müssen diese kognitionspsychologisch und fachdidaktisch präzisiert und mithilfe von Testaufgaben operationalisiert werden. „Dabei besteht die Herausforderung, dass Teilkompetenzen an manchen Stellen unpräzise formuliert und inhaltlich überfrachtet sind“, so Granzer, Böhme & Köller (2008: 14). Infolge dessen wird die Notwendigkeit der Präzisierung und empirischen Absicherung der in den Standards angedeuteten Kompetenzmodelle allseits betont. Derzeit werden die verabschiedeten Bildungsstandards in einem mehrjährigen Prozess durch das von der

Kompetenzmodellierung

53

KMK gegründete Institut für Qualitätsentwicklung im Bildungsbereich (IQB) unter Einbeziehung der Fachdidaktiken normiert und evaluiert. Forschungsschwerpunkte liegen in der Optimierung einzelner Standards und der Ausarbeitung adäquater, wissenschaftlich gesicherter, d. h. evidenzbasierter Modelle von Kompetenzniveaus, die „post hoc“ zu entwickeln sind. Ein weiterer Kritikpunkt von Seiten der Deutschdidaktik ist die „Diskrepanz zwischen den aus deutschdidaktischer und lerntheoretischer Sicht zentralen individualisierten bzw. selbstregulierten Lernprozessen und der impliziten Logik der eingeleiteten Standardisierungsprozesse“ (Frederking 2008b: 38). Spinner (2005: 8) befürchtet, die Lernenden werden „im standardisierten Unterrichtsprozess zurechtgestutzt. Entfaltung von Individualität und das Ernstnehmen von Subjektivität werden – z. T. ohne dass man das will und sich dessen bewusst ist – durch die Standardisierungsprozesse zurückgedrängt“. Der „standardisierte Schüler“ (Spinner 2005: 4) ist zwar nicht das Ziel der eingeleiteten Veränderungen, „möglicherweise aber deren ungewolltes Resultat“, so Frederking (2008b: 38). Vertreter der Deutschdidaktik befürchten, dass sich das Augenmerk der Lehrenden und Lernenden zunehmend auf das Erreichen von Standards richte und ein Schrumpfen der Freiräume für individuelle und kreative Lernprozesse als ungewollte Folge der Bildungsstandards drohe. Darüber hinaus könnte sich mit den damit verbundenen Lernstandserhebungen ein „teaching to the test“ und somit die Gefahr einseitiger Fixierung des Unterrichts auf das Testbare einstellen (Kammler 2006: 20; Abraham 2006: 130) (vgl. Abbildung 2). Man fürchtet, dass dies enggeführte Einübungsrituale und die „Verkehrung von selbstständigem Lernen in angeleitetes Training“ (Spinner 2005: 13) zur Folge habe, und der Deutschunterricht somit „zum Feld dressurähnlicher Lehrund Lernformen mutiert und fortan auf bloße Verwertungszusammenhänge ausgerichtet“ sei (Frederking 2008b: 39). Weinert (2001b: 354–355) antwortet auf die Frage, ob „es unter dem Einfluss zahlreicher vergleichender Leistungsmessungen die Gefahr einer bewussten oder unbewussten Privilegierung des Wissens- und Leistungsaspekts auf Kosten anderer, gleichermaßen wichtiger Bildungsziele“ gebe, dass Bildungsziele wie Kompetenzen zum autonomen Handeln, Kompetenzen zu sozialer Partizipation, Lern- und Problemlösekompetenzen, musische, geisteswissenschaftlich-historische, sozialwissenschaftlich-ökonomische, aber auch religiös-wertbezogene Bildungsziele für die Schule gleichermaßen wichtig seien. Ihre empirische Testung steht derzeit jedoch nicht im Vordergrund. Eine breite Diskussion regt auch die Frage an, inwieweit die fachspezifischen Inhalte und Lehr-Lern-Prozesse kompetenztheoretisch und empirisch erfassbar sind. Insbesondere in den geisteswissenschaftlichen Fächern gibt es zentrale pädagogisch-didaktische Zieldimensionen, die sich nur schwer bzw. (noch) nicht vollständig als empirisch zu validierende Kompetenzen beschreiben lassen wie bspw. die Modellierung literarischer und (literar)ästhetischer Kompetenzen. Auch für die Integration von Substandards aus dem Kompetenzbereich „Sprache und Sprachge-

54

Iris Kleinbub

brauch untersuchen“ wie „Gemeinsamkeiten und Unterschiede von Sprachen entdecken“ in ein Kompetenzmodell und für deren Überführung in Aufgaben zur Lernstandserhebung ist derzeit noch kein gangbarer Weg gefunden (KMK 2015: 8). So zeigt Bredel (2014: 6) auf, dass lediglich ein Bruchteil der Standards bei der Stufenmodellierung berücksichtigt wird. Sie moniert insbesondere die „forschungslogisch bedingte(n) Verkürzung auf überwiegend passive Rezeptionsleistungen“ sowie die „Inkompatibilität zwischen Bildungs- und Gegenstandslogik auf der einen und empirischer Forschungslogik auf der anderen Seite“ (Bredel 2014: 8). In Anlehnung an Kämper-van den Boogaart (2005: 27) bringt dies die zentrale Frage auf den Punkt: „Lässt sich normieren, was als […] Bildung gelten soll?“. Abraham merkt skeptisch an: „Das alles spricht nun nicht gegen ein Kompetenzmodell. […] Die meisten Deutschdidaktiker/-innen teilen aber […] die Überzeugung, dass es der Komplexität sprachlich-literarischen Lernens nicht gerecht wird, testbare Einzelkomponenten, weil (vielleicht) (nur) sie wirklich testbar sind, unabhängig voneinander zu beschreiben“ (Abraham 2007: 12). Dementsprechend sind sog. „schwer messbare Kompetenzen“ auch nur sehr eingeschränkt in den von der KMK formulierten Bildungsstandards vertreten. Auf die damit verbundene Gefahr eines auf testbare Teilaspekte des Fachs reduzierten Lehr- und Lernspektrums wurde bereits hingewiesen. Es ist daher die Aufgabe empirischer fachdidaktischer Forschung, auch jene Kompetenzen theoretisch zu modellieren und empirisch zu erheben, die nur schwer zu operationalisieren sind. Zahlreiche wertvolle Annäherungen werden im Fachdiskurs bereits kommentiert. Der Deutschdidaktik und der Unterrichtspraxis wird es zukommen, der aufgezeigten Gefahr einer dem Fach unangemessenen Unterrichtskultur entgegenzusteuern. Sie ist gemeinsam mit der Psychologie und der empirischen Pädagogik gefordert, Kompetenzmodelle zu entwickeln, in denen die Struktur und die konzeptionellen Präzisierungen der Kompetenzen vorgenommen werden. Ein Einbringen in die empirische Unterrichtsforschung kann dafür sorgen, dass die Eigenarten des Faches und die Lernvoraussetzungen der Schülerinnen und Schüler eine angemessene Berücksichtigung finden. Hierzu rufen auch Klieme et al. (2003: 141) dezidiert auf, wenn sie resümieren: „Die fachdidaktische Fundierung der Bildungsstandards, insbesondere der Kompetenzmodelle, ist ein wesentliches Desiderat der weiteren Arbeit.“

4 Kompetenzmessung im Spannungsfeld von Produkt- und Prozessorientierung 4.1 Kompetenzmessung und Kompetenzniveaus Die von der Kultusministerkonferenz verabschiedeten nationalen Bildungsstandards für das Fach Deutsch beschreiben die Lernergebnisse, die in einem kompe-

Kompetenzmodellierung

55

tenzorientierten Fachunterricht erzielt werden sollen. Ob diese Kompetenzen von den Schülerinnen und Schülern erreicht werden, wird seit 2009 regelmäßig bundesweit evaluiert. Heute stellt die vergleichende Leistungsmessung in Schulen, so Weinert (2001a: 27), „eine umstrittene Selbstverständlichkeit“ dar. Aus den Leistungstests resultieren quantitative Messungen auf kontinuierlichen Skalen. Anhand dieser Zahlenwerte können Zusammenhänge der erfassten Kompetenzen mit anderen Variablen (z. B. dem sozioökonomischen Status der Eltern) untersucht werden. Auch ist es möglich, die Kompetenzen verschiedener Gruppen zu vergleichen (z. B. von Lernenden aus verschiedenen Schulen). Neben derartigen quantitativen Zusammenhangsanalysen ist es aber gerade aus fachdidaktischer Perspektive von Interesse, wie sich diese spezifischen Kompetenzen, über die Lernende auf einem bestimmten Niveau verfügen, charakterisieren lassen. Es besteht demnach der Bedarf an einer kriteriumsorientierten Interpretation der quantitativen Leistungswerte (vgl. Rost 2007). Dieses Ziel wird mit der Bildung sog. Kompetenzniveaus erreicht. Da es nicht realisierbar ist, für jeden einzelnen Punkt einer quantitativen Skala eine Beschreibung der jeweiligen Kompetenz vorzunehmen, wird eine Unterteilung der Skala in Abschnitte vorgenommen, welche als Kompetenzniveaus (bzw. -stufen) bezeichnet werden. Der Begriff „Stufe“ rührt von einer Übersetzung des englischen Terminus proficiency level. Er ist in Schulleistungsstudien geläufig (z. B. PISA; PIRLS/IGLU; VerA), kann aber in Erziehungswissenschaft, Psychologie und Fachdidaktik leicht zu Missverständnissen führen. Stufen werden hier oft mit qualitativen Unterschieden – wie z. B. im Piagetschen Modell der kognitiven Entwicklung – assoziiert. Den in Schulleistungsstudien verwendeten „Kompetenzstufen“ liegen in aller Regel jedoch keine echten Stufenmodelle zugrunde, sie dienen lediglich einer Veranschaulichung der erfassten quantitativen Leistungsdimensionen. Bei den Kompetenzstufen handelt es sich demnach weder um lerntheoretische Modelle, welche die Abfolge bestimmter Lernprozesse modellieren, noch um didaktische Modelle, aus denen die Lehrkräfte die Abfolge der Unterrichtsinhalte ableiten könnten. So lässt sich beispielsweise die fachdidaktische Frage, in welcher Reihenfolge Aufgaben im Leseunterricht einzusetzen sind, mit der Bestimmung von Lesekompetenzstufen nicht beantworten. Diese können jedoch dazu beitragen, dass Lehrpersonen Aufgaben konzipieren, mit denen sie die Kompetenzen der Lernenden differenziert erfassen und förderdiagnostisch mit dem Ziel einer fachlichen Förderung nutzen können (vgl. Bos et al. 2007; Helmke & Hosenfeld 2004; Hartig 2007). Angesichts der möglicherweise irreführenden Konnotationen des Stufenbegriffs wird bei manchen Studien (z. B. DESI) der Begriff „Kompetenzniveau“ bevorzugt. Beide Termini werden jedoch synonym verwendet. Für die Niveaus werden kriteriumsorientierte Beschreibungen der Schülerkompetenzen vorgenommen.3 Diese basieren auf den Schwierigkeiten der Aufgaben 3 Die in verschiedenen Studien eingesetzten Methoden zur Definition und inhaltlichen Beschreibung der Niveaus und der Schwellen zwischen den Niveaus unterscheiden sich dahingehend, wie differenziert und mit welchem Abstraktionsgrad die Anforderungen der Testaufgaben systematisiert

56

Iris Kleinbub

eines Tests und deren fachbezogenen Anforderungen. Aufgaben mit ähnlichen Anforderungsprofilen werden gruppiert und von Aufgaben mit anderen Anforderungsprofilen unterschieden. Die so gefundenen Kompetenzstufen lassen sich beschreiben und mit Beispielaufgaben veranschaulichen, welche wiederum bestimmten Positionen auf der Skala der Testwerte zugeordnet werden (vgl. Bos et al. 2007; Hartig 2007). In den bisherigen Large-Scale-Untersuchungen wurden Kompetenzniveaus (bzw. „-stufen“) in der Regel nicht theoretisch begründet, sondern ex post konstruiert, d. h. erst nach Sichtung der testmodellkonformen Aufgaben. Gegenwärtig ist ein solches Verfahren zwar plausibel, mittelund langfristig ist es aber vor allem vom wissenschaftstheoretischen Ansatz her unbefriedigend,

so Bremerich-Vos, Granzer & Köller (2008: 7). Allerdings ist es bereits seit einigen Jahren state of the art, dass Lehrkräfte, Fachdidaktiker und empirische Bildungsforscher in Kooperation die Operationalisierung und Präzisierung der empirisch basierten Kompetenzniveaus vornehmen und somit auch schulpädagogisch formulierte Anforderungen berücksichtigt werden (vgl. Peek 2008). Möglich wird eine derartige Bestimmung von Kompetenzniveaus dadurch, dass die verwendeten Tests im Rahmen der probabilistischen Testtheorie (PTT) bzw. der Item-Response-Theorie (IRT) konstruiert sind. Dies hat den für die Skalierung der Leistungstests entscheidenden Vorteil, dass Aufgabenschwierigkeiten und Schülerleistungen auf einer gemeinsamen Skala abgebildet werden können. Bei einer klassischen Testwertbildung lässt sich zwischen der Kompetenz eines Lernenden (z. B. wie viel Prozent aller Aufgaben er gelöst hat) kein Bezug zur Schwierigkeit einer Aufgabe (z. B. von wie viel Prozent der Schülerinnen und Schüler sie gelöst wurde) herstellen. Die Raschskalierung bildet für beide Größen eine gemeinsame Skala; der Bezug zwischen der Kompetenz der Personen und der Schwierigkeit der Aufgaben wird in Form von Lösungswahrscheinlichkeiten hergestellt (vgl. Hartig 2007). In psychometrischer Hinsicht werden dabei Voraussetzungen gemacht: Ein Kompetenzniveau gilt dann als erreicht, wenn man mit „hinreichender Sicherheit“ davon ausgehen kann, dass das Testergebnis eines Lernenden nicht zufällig zustande gekommen ist. Hinweis hierfür kann die Anzahl der insgesamt gelösten Aufgaben sein. Eine weitere Voraussetzung ist, dass ein Lernender eine definierte Schwelle überschreiten muss, damit ihm die Fähigkeit auf dem entsprechenden Niveau attestiert wird. Diese Schwelle ist arbiträr und wird von den Verantwortlichen der Lernstandserhebung festgesetzt (i. d. R. sind es mindestens 65 Prozent aller Aufgaben des vorgelagerten Kompetenzniveaus) (vgl. Peek 2008: 163). Allerdings betont die KMK die Vorläufigkeit ihrer Entwürfe und fordert zukünftig die „Entwicklung einer anforderungsbezogenen Aufgabenkultur“ (KMK 2005b: 17),

werden und inwieweit Hypothesen über spezifische Aufgabenanforderungen und über mögliche Kompetenzniveaus schon vor der Erhebung empirischer Leistungsdaten formuliert werden (vgl. Hartig 2007).

Kompetenzmodellierung

57

die Validierung der Bildungsstandards und ihre Ergänzung durch Rahmenlehrpläne bzw. „Kerncurricula“ in den einzelnen Bundesländern.

4.2 Kompetenzmessung und ihre didaktischen Konsequenzen Ein wesentlicher Grundgedanke externer Evaluation und speziell standardisierter Leistungsmessung ist der, dass sich die […] „hauseigene Währung“ der Noten und der Schulabschlüsse als Kriterien der Rechenschaftslegung und der Entwicklung des Schulwesens nicht eignen, sondern dass vielmehr die tatsächlich erzielten Lehr- und Lernerfolge untersucht werden müssen, um Auskunft über die Effektivität des Systems und seiner Teilbereiche zu erhalten. (Peek 2001: 327)

Weinert (2001b: 353) ergänzt, dass Wirksamkeitsuntersuchungen für die kontinuierliche Verbesserung von Theorien und Modellen notwendig sind, dass sie aber nur einen reduzierten Erklärungswert besitzen, […] wenn es um die Beantwortung der Frage geht, warum bestimmte Bildungsziele von welchen Schülern und Schulen mehr oder minder gut erreicht wurden, welche Prozesse und Bedingungskonstellationen dafür maßgebend waren, durch welche Veränderungen didaktischer, pädagogischer oder organisatorischer Art bessere Ergebnisse erreicht werden und welche unerwünschten Effekte dabei auftreten könnten.

Nun bringen Schülerinnen und Schüler „sehr unterschiedliche Erfahrungen und Voraussetzungen für das Lernen mit. Die Grundschule und besonders der Deutschunterricht stehen vor der Herausforderung, an den jeweiligen Entwicklungsstand des einzelnen Kindes […] anzuknüpfen“ (KMK 2005a: 6). Sichtet man die Ergebnisse umfassender Leistungstests, muss man zu der Folgerung kommen, dass die Lernwirksamkeit des Unterrichts für Schülerinnen und Schüler mit Deutsch als Zweitsprache nicht gegeben zu sein scheint. Sie sind im Vergleich zu ihren monolingual deutschen Mitschülerinnen und Mitschülern in allen getesteten Kompetenzbereichen häufiger auf den unteren Kompetenzniveaus vertreten. Die Leistungsvergleiche in übergreifenden wissenschaftlichen Berichten und in klassen- bzw. kursbezogenen Rückmeldungen erlauben der Bildungsadministration und den Schulen selbst eine allgemeine Standortbestimmung, eine vergleichende Orientierung an Durchschnittswerten bzw. im radikaleren Sinne an Spitzenwerten („Benchmarking“) und geben damit erste Hinweise auf Handlungsnotwendigkeiten. (Peek 2001: 335).

So kann der Befund, dass Schülerinnen und Schüler mit Deutsch als Zweitsprache in nahezu allen bisher getesteten Domänen auf den unteren Kompetenzniveaus überrepräsentiert sind, als Signal dafür gewertet werden, dass an dieser Stelle eine Analyse des Systems und ggf. seine Optimierung notwendig sind. Instruktions-

58

Iris Kleinbub

sensitivität 4 der Testitems vorausgesetzt, lassen sich die Ergebnisse dahingehend interpretieren, dass geringere sprachliche Kompetenzen im Deutschen dem fachlichen Lernen abträglich sind und es im Unterricht nicht gelingt, die sprachlichen Voraussetzungen für erfolgreiches fachliches Lernen zu schaffen. Von der Nutzung sprachlicher Ressourcen bi- und multilingualer Schülerinnen und Schüler im Unterricht scheint man weit entfernt zu sein. Somit haben die Befunde den Charakter einer Handlungsaufforderung, gehen jedoch auch nicht darüber hinaus. Leistungsbezogene Informationen über Schülerinnen und Schüler können somit [zwar] als Planungs-, Legitimations- und Eingriffswissen genutzt werden. Sie liefern jedoch nur begrenzt Aufschluss über mögliche Ursachenzusammenhänge und erst recht nicht didaktische Konzepte zur Beseitigung erkannter Defizite. Nach diesem Verständnis sind Vergleichsuntersuchungen ein Einstieg in den Prozess der Qualitätsverbesserung sowie ein externer Auslöser für bildungspolitische und für schulinterne Reflexionen,

so Peek (2001: 335). Diese Fokussierung auf die Lernergebnisse, die mit den Bildungsstandards und der Kompetenzmessung vorgenommen wird, wird in der Deutschdidaktik auch kritisch gesehen, da Merkmale der Prozessebene weitgehend ausgeklammert bleiben. Dirim & Döll (2010: 5) monieren an der ökonomischen Perspektive auf Bildungssysteme, bei der die Steigerung und Sicherung von Effizienz, Qualität und Konkurrenzfähigkeit dominieren, dass sie den Blick auf das lernende Subjekt verstelle. In der Tat werden […] spezielle Förderhinweise, z. B. für Kinder mit Migrationshintergrund, […] in den jetzt vorgelegten Bildungsstandards nicht ausgewiesen, da diese Kompetenzen festlegen, über die Schülerinnen und Schüler zu einem bestimmten Zeitpunkt ihrer Schullaufbahn verfügen sollen, sie beschreiben somit nicht den Unterricht, also gleichsam den Weg, auf dem sie erworben werden. Gleichwohl stellen die Bildungsstandards eine Chance zur Auslösung von Förderung dar, z. B. indem Lernstandsfeststellungen zu einem früheren Zeitpunkt als dem Abschlusszeitpunkt durchgeführt werden, um eine gezielte Förderung im Hinblick auf die Erreichung der Standards zu ermöglichen. (KMK 2005b: 18)

Hu (2005) zweifelt daran, dass so die intendierte Förderung mehrsprachiger Schülerinnen und Schüler gelingen könne, da Lehrpersonen orientierungslos zurückblieben und die Gefahr methodischer Beliebigkeit groß sei. Helmke et al. (2008: 24) weisen daher mit Recht darauf hin, dass neben der Produkt- auch die Prozessebene von Bedeutung ist, und Oomen-Welke (2003: 285) resümiert, „die Lösung der […] sichtbar gemachten Probleme muss offensichtlich in der Schule gefunden werden.“ Zusätzlich zu dem Blick auf die Lernerträge der Schülerinnen und Schüler gilt es,

4 Instruktionssensitivität ist ein Gütekriterium, das erfasst, inwieweit Testitems Effekte des Unterrichts (z. B. der Unterrichtsqualität) auf die Leistungen der Schülerinnen und Schüler abbilden können. Sie ist demnach Voraussetzung, um von Leistungsergebnissen der Lernenden auf Unterrichtsmerkmale schließen zu können (vgl. Naumann, Hochweber & Klieme 2016).

Kompetenzmodellierung

59

die Lehr-Lern-Prozesse zu fokussieren. Relevante Faktoren mit Einfluss auf die Schülerleistungen sind u. a. die Professionskompetenz und Expertise der Lehrpersonen sowie die Prozessqualität des Unterrichts (s. Abb. 1). Sobald Leistungsmaßstäbe an Schülerinnen und Schüler angelegt werden, gilt es auch, hinreichende (Lehrund Lern-) Bedingungen zu schaffen, die es ihnen ermöglichen, diese Leistung zu erbringen. Hierzu gehören u. a. die Entwicklung einer Unterrichtskultur, die die Lernvoraussetzungen der Lernenden berücksichtigt, die Professionalisierung der Lehrpersonen, sodass sie diesen Unterricht im Wesentlichen zu gestalten vermögen, und die Schaffung von bildungspolitischen und schulischen Rahmenbedingungen, die ein erfolgreiches Arbeiten mit heterogenen Lerngruppen ermöglichen. Nicht zuletzt ist die Deutschdidaktik ebenso gefragt wie die Didaktiken anderer Fächer, gängige Unterrichtspraxis kritisch zu reflektieren und den Unterricht mit dem Ziel einer durchgängigen Sprachförderung und -bildung weiterzuentwickeln.5 Hierbei wird darauf zu achten sein, dass neben Fördermaßnahmen für spezielle Schülergruppen (wie frühe Vermittlung von Deutschkenntnissen und engmaschige Sprachstandsdiagnostik) insbesondere auch Konzepte für einen gemeinsamen Deutschunterricht und Formen mehrsprachiger Bildung entworfen und implementiert werden (vgl. Lüddecke & Luchtenberg 2003). Die Weiterentwicklung der Lehr-Lern-Prozesse geschieht u. a. durch die Konzeption von Handreichungen, Lehr- und Rahmenplänen, die die produktorientierten Bildungsstandards auf der Prozessebene ergänzen (vgl. Caspari 2005). In den KMK-Erläuterung zu Konzeption und Entwicklung der Bildungsstandards wird dargelegt, in welchem Verhältnis Bildungsstandards und Lehrpläne zueinander stehen (KMK 2005b: 17–18): Bildungsstandards formulieren die zu erreichende Zielebene bis zu einer bestimmten Jahrgangsstufe bzw. bis zu einem bestimmten Abschluss, während Lehrpläne den Weg zur Zielerreichung beschreiben und strukturieren. Bildungsstandards stellen also eine auf das Ergebnis schulichen [sic] Lernens gerichtete Form curricularer Vorgaben dar. Neu im System der Output-Steuerung ist in jedem Fall, dass empirisch untersucht werden soll, inwieweit die Leistungserwartungen tatsächlich eingelöst werden. Auf der Input-Seite kann es weiterhin Lehr- und Rahmenpläne sowie Curricula geben, die Lernziele und Lerninhalte systematisch und in ihrer zeitlichen Abfolge beschreiben und den Lehrkräften Hinweise für das methodisch-didaktische Vorgehen und für Lernerfolgskontrollen geben.

In den einzelnen Bundesländern gibt es mittlerweile zahlreiche Handreichungen, Lehr- und Rahmenpläne zu Deutsch als Zweitsprache bzw. zur Arbeit in Vorbereitungsklassen, die den „Input“ näher definieren und somit die Lehr-Lern-Prozesse fokussieren. Ein Beispiel hierfür ist der verbindliche „Lehrplan Deutsch als Zweitsprache“, der 2001 vom Bayerischen Staatsministerium für Unterricht und Kultus

5 Ein Sequenzmodell der Unterrichtsentwicklung und ihrer Bedingungen findet sich bspw. bei Helmke (2015).

60

Iris Kleinbub

entwickelt und bereits von weiteren Bundesländern übernommen wurde. Er enthält Lernziele und -inhalte sowohl für die Grundschule sowie die Förderschule als auch für die weiterführenden Schularten Hauptschule, Realschule, Wirtschaftsschule, Gymnasium und Berufsschule. Der zyklisch aufgebaute Lehrplan ist in einen Grundund Aufbaukurs gegliedert. Für beide werden je sechs Lernfelder mit jeweils einem zentralen Signalthema und zugeordneten Modulen (Kerninhalte, lexikalische Bereiche, syntaktische Mittel und mögliche Schüleraktivitäten) ausgewiesen. Er ist allerdings nicht für den „regulären“ Deutschunterricht vorgesehen, sondern für den Unterricht im Fach Deutsch als Zweitsprache, das in Übergangs- und Eingliederungsklassen, in zweisprachigen Klassen oder in Intensivkursen organisiert ist. Darüber hinaus ist er auch Grundlage für den Förderunterricht Deutsch und Deutsch als Zweitsprache.6 Dazu, wie gleichermaßen fachliches und sprachliches Lernen im „Regelunterricht“ Deutsch thematisiert werden kann, gibt es von deutschdidaktischer Seite empirische, konzeptionelle und unterrichtspraktische Ansätze unterschiedlicher Tragweite und wissenschaftlicher Fundierung, von denen die meisten im LanguageAwareness-Konzept (vgl. Luchtenberg 2010) verwurzelt sind (z. B. Belke 2003; Oomen-Welke 2006; 2010; Rothstein 2010; 2011; Jeuk 2014; Wildemann & Fornol 2016). Sie gehen von dem Gedanken aus, dass Schülerinnen und Schüler über die reflexive Auseinandersetzung mit eigenen und fremden Sprachen – insbesondere durch den Vergleich ihrer strukturellen Eigenschaften – zu besserem Sprachenlernen, zu Selbstwert, Identifikation und Integration gelangen sollen. Eine fachübergreifende Perspektive bietet u. a. das Konzept des sprachsensiblen Fachunterrichts (z. B. Ahrenholz 2010; Gogolin et al. 2011; 2013; Leisen 2011; Röhner & Hövelbrinks 2012; Schmölzer-Eibinger et al. 2013; Becker-Mrotzek et al. 2013). Die verschiedenen Ansätze zu nutzen, bleibt derzeit jedoch weitgehend der Eigeninitiative der Lehrpersonen überlassen. Weitreichende didaktische Konzepte mit der Tragweite von verbindlichen Lehrplänen, die gleichermaßen fachliches und sprachliches Lernen auf der Prozessebene modellieren, existieren gegenwärtig nicht.

5 Standards im Spannungsfeld zwischen fachlicher und sprachlicher Kompetenzmodellierung Ein Kritikpunkt an den Bildungsstandards bezieht sich auf die mangelnde Orientierung an den Lernvoraussetzungen mehrsprachiger Schülerinnen und Schüler. In

6 Seit 2017 liegt mit dem LehrplanPLUS eine aktualisierte Version des Lehrplans Deutsch als Zweitsprache für Grund- und weiterführende Schulen vor. (Staatsinstitut für Schulqualität und Bildungsforschung München 2017).

Kompetenzmodellierung

61

den Bildungsstandards Deutsch für die Primarstufe (KMK 2005a: 6) ist hierzu Folgendes zu lesen: Für viele Kinder ist die deutsche Sprache nicht die erste und nicht die Familiensprache. Sie verfügen dadurch z. T. über andere sprachliche Erfahrungen und Kompetenzen als einsprachige Kinder. Der Deutschunterricht sollte dies auch für eine interkulturelle Erziehung aller Kinder nutzen. Bei manchen Kindern mit anderer Herkunftssprache müssen durch entsprechende Fördermaßnahmen Grundlagen für schulisches Lernen in der Unterrichtssprache Deutsch erst gesichert werden.

Hier wird auch darauf hingewiesen, dass „die Beherrschung der deutschen Sprache […] für alle Kinder eine wichtige Grundlage für ihren Schulerfolg [ist], denn Sprache ist in allen Fächern Medium des Lernens“ (KMK 2005a: 6). Formulierungen wie diese wecken laut Dirim & Döll (2010) die Erwartung, den Bedürfnissen und Ressourcen mehrsprachiger Schülerinnen und Schüler werde in den Bildungsstandards Rechnung getragen. Daraufhin untersuchten sie, inwiefern andere Sprachen als Deutsch in die Bildungsstandards einbezogen wurden und ob sie als Basis für die Entwicklung sprachstandsdiagnostischer Verfahren für die Erfassung des Sprachstands im Deutschen als Zweitsprache geeignet sind. Sie nehmen dabei exemplarisch Bezug auf die deutschen und österreichischen Bildungsstandards für das Fach Deutsch im Primarbereich. Dirim & Döll (2010) kommen zu dem Ergebnis, dass Mehrsprachigkeit nur im Hinblick auf die Erweiterung des Sprachbewusstseins durch Sprachvergleiche vorkommt. Im Kompetenzbereich „Sprache und Sprachgebrauch untersuchen“ wird beispielsweise angeregt, dass Lernende über ihre Erfahrungen mit anderen Sprachen sprechen (KMK 2005a: 9) und „Gemeinsamkeiten und Unterschiede von Sprachen entdecken“ (KMK 2005a: 13). Dirim & Döll (2010: 9) stellen abschließend fest, dass „die Bildungsstandards für das Fach Deutsch die Anpassung des Deutschunterrichts an die Verhältnisse der migrationsspezifischen Mehrsprachigkeit in beiden Staaten verfehlen“. Des Weiteren monieren sie, dass die Testungen mit standardisierten Leistungstests auf der Basis der Bildungsstandards wenig über den Sprachstand von Schülerinnen und Schülern mit Deutsch als Zweitsprache aussagen. Zwar lassen die erzielten Testergebnisse aus Vergleichsarbeiten zum Zweck des Bildungsmonitorings Aussagen zu über das Abschneiden der Testteilnehmer im Vergleich zu anderen Testteilnehmern; ebenso ist es den Schülerinnen und Schülern möglich, etwas über ihre Stärken und Schwächen in der getesteten Fachdomäne zu erfahren. Zur Individualdiagnostik im Bereich Deutsch als Zweitsprache sind sie jedoch nicht geeignet. Ein Grund hierfür mag sein, dass sie hierfür schlichtweg nicht vorgesehen sind. Mit den Testungen wird das Ziel verfolgt, die fachlichen Kompetenzen in den einzelnen Kompetenzbereichen zu messen, die sprachlichen Kompetenzen in der deutschen Sprache scheinen hiervon ausgenommen zu sein, stellen sie doch die Voraussetzung für den Erwerb und den Abruf fachlicher Leistungen dar. Demzufolge werden auch die Kompetenzen im Fach Deutsch als fachliche Kompetenzen verstanden. Diese Trennung in fachliche und sprachliche Kompetenzen (nicht nur im Fach

62

Iris Kleinbub

Deutsch – so zeigt u. a. der Diskurs zu sprachsensiblem Fachunterricht) und die Beschränkung auf die Testung der ersteren lässt jedoch manche Bedürfnisse der Unterrichtspraxis unbefriedigt. Hier werden Verfahren zur Erfassung sprachlicher Kompetenzen mehrsprachiger Schülerinnen und Schüler benötigt, die individuelle Potentiale und Lernschwierigkeiten der Lernenden so diagnostizieren können, dass auf ihrer Grundlage eine passgenaue Sprachförderung möglich ist (vgl. Jeuk 2015). Hiervon zeugt die Entwicklung zahlreicher Instrumente zur Feststellung des Sprachstandes in Deutsch als Zweitsprache in den letzten Jahren (z. B. Beobachtungsverfahren wie Niveaubeschreibungen DaZ, Profilanalysen wie HAVAS 5) (vgl. Abschnitt IV in diesem Band). Infolge der „Inflation der Verfahren“ (Ehlich 2009: 17), die in Typ, Aufbau und Zielsetzung z. T. deutliche Unterschiede aufweisen, entstand ein reger Diskurs um Qualitätskriterien (vgl. Ehlich 2005) wie die Einhaltung der klassischen Testgütekriterien (Objektivität, Reliabilität, Validität), eine linguistische und spracherwerbstheoretische Basis, die Berücksichtigung von Mehrsprachigkeit und die Praktikabilität der Instrumente in der Unterrichtspraxis (vgl. Dirim & Döll 2010). Reich (2005) gibt in diesem Diskurs zu bedenken, dass jedwede Norm zur Beurteilung sprachlicher Fähigkeiten bi- oder multilingualer Schülerinnen und Schüler kritisch zu sehen sei, da die individuellen Erwerbsbedingungen und Sprachbiographien große Unterschiede aufweisen. So könne das Messen an monolingual orientierten Standards ein defizitorientiertes Bild von Lernenden mit Deutsch als Zweitsprache vermitteln, eigene Standards wiederum könnten eine möglicherweise ebenfalls diskriminierende Sonderbehandlung mit sich bringen und ein Standard, der sich an den durchschnittlichen Leistungen aller orientiert, würde Gleichartigkeit von mono-, bi- und multilingualer Sprachaneignung unterstellen. Standards – sofern man die Testung zum Zwecke des Leistungsvergleichs in den Hintergrund rückt – können jedoch auch im Sinne von Lernzielen und Entwicklungsbereichen verstanden werden, die Zielklarheit für Lehrende und Lernende schaffen und an denen sich Lehr- und Lern-Prozesse ausrichten können. In diesem Sinne sind auch die aus der Sprachstandsdiagnostik bekannten Basisqualifikationen von Ehlich (2005) zu interpretieren, die sich als Sprachkompetenzmodell (im Gegensatz zu den Fachkompetenzmodellen der Bildungsstandards) verstehen. Ehlich zufolge bedeutet die „Aneignung von Sprache, dass ein Kind Sprache als Handlungsmittel umfassend erwirbt und Sprechen so zu einer eigenen, gesellschaftlich hinreichenden Handlungsressource für sich entwickelt“ (Ehlich 2005: 19). Bereits diese Erkenntnis signalisiert, dass „die Befähigung zur sprachlichen Teilnahme an gesellschaftlichen Prozessen […] die Aneignung und Entfaltung einer Reihe von Einzelqualifikationen“ verlangt (Jeuk 2015: 54). Der Sprachkompetenz sind also unterschiedliche Basisqualifikationen untergeordnet. In der deutschsprachigen Literatur stellt das auf Ehlich, Bredel & Reich (2008) zurückgehende Modell des Qualifikationenfächers einen geläufigen, analytischen Orientierungsrahmen zur genaueren Betrachtung der Sprachkompetenz dar. Dieses Modell verdeutlicht die Mehr-

Kompetenzmodellierung

63

dimensionalität von Sprache und schafft dadurch eine Grundlage für differenzierte Sprachstandserhebungen (vgl. Döll 2012). Die Autoren identifizieren in diesem Modell fünf verschiedene Basisqualifikationen, welche sich kongruent zu den sprachwissenschaftlichen Teildisziplinen verhalten: – Phonische Qualifikation (phonetisch-phonologische Qualifikation, Aussprache, Lautdifferenzierung) – Pragmatische Qualifikation I und II (sprachliche Kooperation, Erzählfähigkeit, kommunikativer Aufbau von Phantasiewelten) – Semantische Qualifikation (Wortschatz- und Bedeutungserwerb) – Morphosyntaktische Qualifikation (Wort- und Satzstrukturen) – Literale Qualifikation I und II (Lesen und Schreiben) Für jede Basisqualifikation existiert sowohl eine produktive als auch eine rezeptive Ebene. Ehlich, Bredel & Reich (2008) betonen, dass die systematische „Auffächerung“ der einzelnen Basisqualifikationen rein analytischer Natur sei und die unterschiedlichen Bereiche in der Realität in engem Zusammenhang zueinander stehen. Der Gewinn einer solchen Erwerbsperspektive ist auch für Schülerinnen und Schüler mit Deutsch als Erstsprache nicht zu unterschätzen, denn auch hier gibt es Sprachförderbedarfe, die in einem bildungsfernen sozialen Umfeld begründet liegen und weniger von den Merkmalen der Ein- oder Mehrsprachigkeit bedingt sind. Wild et al. (2016: 54) merken hierzu an, dass sich die diagnostischen und Förderaktivitäten in Kita und Schule […] nach wie vor sehr stark an dem speziellen Förderbedarf von Kindern aus Einwanderungsfamilien [orientieren], an den grammatischen Kompetenzen der Kinder sowie an ihrem Wortschatz und in der Schule an schriftsprachlichen Erwerbsprozessen. Dabei wird oft übersehen, dass auch benachteiligte einsprachig-deutsche Kinder […] einen erheblichen Sprachförderbedarf haben, der sich bereits auf mündliche Sprachpraktiken bezieht und insbes. die Ebene übersatzmäßiger Strukturen (erzählen, erklären, argumentieren) betrifft, die sich im Schulalter noch wesentlich weiterentwickeln. Verzögerungen in diesem Bereich wirken sich nicht nur auf die Textproduktionsfähigkeit aus (Quasthoff, Ohlhus & Stude 2009), sondern auch auf die Partizipation an fachlich anspruchsvolleren Klassengesprächen in der Sek. 1 (Prediger et al. 2015). Hier ist eine Sensibilisierung von Lehr- und Förderpersonen auf diese Spracherwerbsdomäne und die unterrichtlichen Erwerbschancen gefragt.

Bei näherem Hinsehen zeigt sich, dass die in den Nationalen Bildungsstandards Deutsch für die Primarstufe ausgewiesenen Kompetenzbereiche nicht alle der im Qualifikationenfächer ausgewiesenen sprachlichen Qualifikationsbereiche umfassen. Dirim & Döll (2010) kommen zu dem Ergebnis, dass in den Bildungsstandards zwar Aussagen zu phonischen, pragmatischen, diskursiven und literalen Fähigkeiten zu finden sind, semantische und morphosyntaktische Fähigkeiten jedoch nur wenig berücksichtigt werden. Allerdings liegen auch nicht für alle Qualifikationsbereiche empirische Befunde zu Erwerbssequenzen vor, was als Desiderat der (Zweit-)Spracherwerbsforschung benannt werden kann.

64

Iris Kleinbub

Ein Instrument, das anstrebt, den Bedürfnisse der Unterrichtspraxis nach Sprachstandsdiagnostik, Niveaubeschreibung zur Einschätzung sprachlicher Entwicklung und Sprachförderung gerecht zu werden, sind die Niveaubeschreibungen Deutsch als Zweitsprache (Sächsisches Bildungsinstitut (2013).7 Im Rahmen des Bundesmodellprogramms „Förderung von Kindern und Jugendlichen mit Migrationshintergrund – FörMig“ wurde mit den Niveaubeschreibungen Deutsch als Zweitsprache ein Instrument zur prozessbegleitenden pädagogischen Diagnostik entwickelt. Es entstand in Anlehnung an die Bildungsstandards Deutsch der Kultusministerkonferenz. Die Beobachtungsbereiche decken ein Spektrum an sprachlichen Teilqualifikationen ab und ermöglichen das Erstellen individueller Kompetenzprofile. Die Fassung für die Primarstufe beschreibt insgesamt 25 Sprachaneignungsprozesse, die jeweils einem der folgenden Teilbereiche zugeordnet sind: – Weite der sprachlichen Handlungs- und Verstehensfähigkeit – Wortschatz – Aussprache – Lesen – Schreiben – Grammatik Für jeden Aneignungsprozess werden in verbaler Form vier Niveaustufen beschrieben (Sächsisches Bildungsinstitut 2013). Ziel des Einsatzes des empirisch geprüften Beobachtungsinstruments ist es, systematisch und kriteriengeleitet Informationen über den individuellen Sprachbildungsprozess von Schülerinnen und Schülern (nicht nur von jenen mit Deutsch als Zweitsprache) zu erhalten, um daraufhin die sprachliche Entwicklung durch gezielte sprachdidaktische Maßnahmen unterstützen zu können. Die „Niveaubeschreibungen Deutsch als Zweitsprache für die Primarstufe“ sollen […] eine Orientierungshilfe sein, die immer wieder eingesetzt wird, um den gangbarsten Weg zu bestimmen. Sie verstehen sich nicht als punktuelle Feststellung einer Ausgangsposition, sondern als begleitende, formative Diagnose. Dabei haben sie ein klares Ziel: Sie orientieren sich an den „Bildungsstandards im Fach Deutsch für den Primarbereich (Jahrgangsstufe 4)“ und gehen insoweit davon aus, dass alle Schülerinnen und Schüler gleiche und gemeinsame Sprachlernziele verfolgen. Zugleich aber verdeutlichen sie, dass diese Ziele je nach den Voraussetzungen der Lernenden auf unterschiedlichen Wegen erreicht werden. Die Bildungsstandards beschreiben ein mittleres Anforderungsniveau, sodass viele darüber oder darunter liegende Leistungen sich noch im Rahmen des Normalen bewegen. Sie dürfen nicht dazu missbraucht werden, didaktisch Unmögliches zu erwarten oder zu verlangen. Es wird selbstverständlich Schülerinnen und Schüler mit Deutsch als Zweitsprache geben, die am Ende von Klasse 4 nicht alle Standards erreicht haben.

7 Sie liegen derzeit für den Primarbereich, für die Sekundarstufe I und für die Sekundarstufe II vor.

Kompetenzmodellierung

65

Ihren weiterbestehenden Sprachlernbedarf zu decken ist Pflicht der aufnehmenden weiterführenden Schulen. Sich anhand der „Niveaubeschreibungen“ darüber zu verständigen ist eine sinnvolle Form schulartübergreifender Zusammenarbeit. (Sächsisches Bildungsinstitut 2013: 6)

Im außerschulischen Bereich (z. B. Volkshochschule) kommt häufig der Gemeinsame Europäische Referenzrahmen für Sprachen (GeR) zum Einsatz (Europarat 2001). Diese Globalskala beschreibt den Erwerb einer Fremdsprache in den Lernbereichen Hörverstehen, Sprechen, Lesen und Schreiben, die auf 6 Niveaustufen (A1–C2) durch Deskriptoren formuliert werden. Entstanden vor dem Hintergrund, für Studierende ein Instrument zur reflektierten Selbsteinschätzung ihrer fremdsprachlichen Kompetenzen zu schaffen, bezieht er sich auf Fremdsprachenlernen auf akademischem Niveau. Sein Einsatz im schulischen Bereich (z. B. in Vorbereitungs- bzw. Willkommensklassen oder am Übergang Berufsschule/Beruf) wird vielfach kritisch gesehen. So setzt der GeR beispielsweise die Schriftbeherrschung in der L1 voraus, was die Lernsituation nicht-alphabetisierter Sprachenlernender nicht berücksichtigt. Darüber hinaus entsteht der Eindruck, das Können der Lernenden befinde sich in allen Teilbereichen auf gleichem Niveau, was jedoch insbesondere bei Zweitsprachenlernenden zumeist nicht zutrifft. Als europaweites System gemeinsamer Referenzpunkte gedacht, bedient sich der GeR alltagssprachlicher Formulierungen, die inhaltlich allgemeiner gehalten sind als die in Teilkompetenzen ausdifferenzierten schulischen Kompetenzformulierungen. Auch bildet er lediglich einen Teil der schulisch relevanten Kompetenzbereiche ab (z. B. literarisches Lernen oder prozessorientiertes Schreiben werden kaum berücksichtigt). Inwiefern der GeR für das Deutschlernen aller Altersgruppen geeignet ist und welche Relevanz er in fluktuationsanfälligen Vorbereitungs- bzw. Willkommensklassen besitzt, in denen Lernende auf unterschiedlichen deutschsprachlichen Niveaus sind, ist derzeit noch ungeklärt.

6 Fazit Um es Schülerinnen und Schülern zu ermöglichen, ihre Potenziale bestmöglich auszuschöpfen, bedarf es verschiedener Perspektiven auf das komplexe Gefüge von Lehren und Lernen. Hierbei ist zum einen zu unterscheiden nach Lernprodukten und Lernprozessen, zum anderen nach fachlichen Kompetenzen und nach sprachlichen Kompetenzen. Für alle Bereiche gibt es unterschiedliche Instrumente, die zu unterschiedlichen Zwecken eingesetzt werden und deren Stärken demzufolge in unterschiedlichen Bereichen liegen. Mit Blick auf die Lernprodukte ist es von Bedeutung, anzustrebende fachliche Kompetenzen zu benennen, ihre Struktur in Kompetenzmodellen zu erfassen und

66

Iris Kleinbub

regelmäßig zu überprüfen, ob und unter welchen Voraussetzungen es Lernenden mit unterschiedlichen Lernausgangslagen gelingt, die formulierten Standards zu erreichen. Die Ergebnisse dieser fachlichen Lernstandsmessungen sagen etwas über fachliche Stärken und Schwächen der Schülerinnen und Schüler aus, erlauben jedoch keine detaillierte Einschätzung ihres Sprachstandes in der Zweitsprache Deutsch. Hierzu sind Instrumente nötig, die auf Sprachkompetenzmodellen basieren und eine individuelle Diagnose in den relevanten sprachlichen Qualifikationsbereichen ermöglichen, wie bspw. die Niveaustufen Deutsch als Zweitsprache. Wissenschaftlich fundierte Kompetenzmodelle – sowohl fachlicher als auch sprachlicher Natur – stecken derzeit noch in den Anfängen und bedürfen weiterer empirischer Überprüfung. Die Ergebnisse der Lernstandsmessungen erlauben weiterhin Urteile darüber, ob es dem Bildungssystem gelingt, alle Lernenden (insbesondere mit Blick auf ihre Lernausgangslagen) zum Erreichen der gesteckten Ziele zu befähigen. Dieser Fokus auf die Produkte fachlichen Lernens kommt einer Systemdiagnose gleich, ohne jedoch konkrete Maßnahmen zur Systemoptimierung zu implizieren. Hierzu bedarf es einer näheren Betrachtung der Prozessebene. Hier gilt es, den Unterricht im Fach Deutsch und seine Bedingungsfaktoren kritisch zu reflektieren und Optimierungsansätze zu entwickeln und zu evaluieren. Wie ein Unterricht aussehen kann, der den Spracherwerb in der Zweitsprache Deutsch bzw. die Sprachförderung von Schülerinnen und Schülern zum Ziel hat, wird bspw. anhand des Bayerischen Lehrplans Deutsch als Zweitsprache sichtbar (Bayerisches Staatsministerium für Unterricht und Kultur 2001). Darüber hinaus gibt es Ansätze und Konzepte, die sowohl speziell für das Fach Deutsch als auch für den Fachunterricht aufzeigen, wie gleichermaßen fachliches und sprachliches Lernen im „Regelunterricht“ gefördert werden kann. Weitreichende didaktische Konzepte mit der Tragweite von verbindlichen Lehrplänen, die gleichermaßen fachliches und sprachliches Lernen auf der Prozessebene modellieren, existieren gegenwärtig jedoch nicht.

Literatur Abraham, Ulf (2006): Wie standardisierbar ist Methodenkompetenz im Umgang mit Lyrik? Zu Bertolt Brecht ‚Der Steinfischer‘ (9./10. Schuljahr) In Clemens Kammler (Hrsg.), Literarische Kompetenzen – Standards im Literaturunterricht. Modelle für die Primar- und Sekundarstufe, 118–133. Seelze: Klett/Kallmeyer. Abraham, Ulf (2007): Kompetenzmodelle – Überfällige Professionalisierung des Faches oder Familienaufstellung in der Deutschdidaktik. In: Didaktik Deutsch 22, 10–13. Ahrenholz, Bernt (Hrsg.) (2010): Fachunterricht und Deutsch als Zweitsprache. Tübingen: Narr. Bayerisches Staatsministerium für Unterricht und Kultus (Hrsg.) (2001): Lehrplan Deutsch als Zweitsprache. Becker-Mrotzek, Michael, Karin Schramm, Eike Thürmann & Helmut Johannes Vollmer (Hrsg.) (2013): Sprache im Fach. Sprachlichkeit und fachliches Lernen. Münster: Waxmann.

Kompetenzmodellierung

67

Belke, Gerlind (2003): Mehrsprachigkeit im Deutschunterricht: Sprachspiele, Spracherwerb und Sprachvermittlung. Baltmannsweiler: Schneider Hohengehren. Bos, Wilfried, Renate Valtin, Andreas Voss, Sabine Hornberg & Eva-Maria Lankes (2007): Konzepte der Lesekompetenz in IGLU 2006. In Wilfried Bos, Sabine Hornberg, Karl-Heinz Arnold, Gabriele Faust, Lilian Fried, Eva-Maria Lankes, Knut Schwippert & Renate Valtin (Hrsg.), IGLU 2006. Lesekompetenzen von Grundschulkindern in Deutschland im internationalen Vergleich, 81–107. Münster: Waxmann. Bredel, Ursula (2014): Anspruch und Wirklichkeit – Debattenbeitrag zu den Bildungsstandards. Didaktik Deutsch 36, 5–8. Bremerich-Vos, Albert, Dietlinde Granzer & Olaf Köller (2008): Vorwort der Herausgeber. In Albert Bremerich-Vos, Dietlinde Granzer & Olaf Köller (Hrsg.), Lernstandsbestimmung im Fach Deutsch. Gute Aufgaben für den Unterricht, 7–8. Weinheim, Basel: Beltz. Bremerich-Vos, Albert (2014): Revision der Bildungsstandards? – Zurzeit nicht vordringlich. Didaktik Deutsch 36, 9–12. Caspari, Daniela (2005): Von Bildungsstandards zu Lehrplänen. In Karl-Richard Bausch, Eva Burwitz-Melzer, Frank G. Königs & Hans-Jürgen Krumm (Hrsg.), Bildungsstandards für den Fremdsprachenunterricht auf dem Prüfstand: Arbeitspapiere zur 25. Frühjahrskonferenz zur Erforschung des Fremdsprachenunterrichts, 67–77. Tübingen: Narr. Dirim, İnci & Marion Döll (2010): Mehrsprachigkeit und Deutsch als Zweitsprache in den Bildungsstandards für das Fach Deutsch. Didaktik Deutsch 29, 5–14. Döll, Marion (2012): Beobachtung der Aneignung des Deutschen bei mehrsprachigen Kindern und Jugendlichen. Modellierung und empirische Prüfung eines sprachdiagnostischen Beobachtungsverfahrens. Münster: Waxmann. Ehlich, Konrad (2005): Sprachaneignung und deren Feststellung bei Kindern mit und ohne Migrationshintergrund. Was man weiß, was man braucht, was man erwarten kann. In Bundesministerium für Bildung und Forschung (BMBF) (Hrsg.), Anforderungen an Verfahren der regelmäßigen Sprachstandsfeststellung als Grundlage für die frühe und individuelle Förderung von Kindern mit Migrationshintergrund, 11–75. Bonn, Berlin. Ehlich, Konrad, Ursula Bredel & Hans H. Reich (Hrsg.) (2008): Referenzrahmen zur altersspezifischen Sprachaneignung. Bundesministerium für Bildung und Forschung (BMBF). Bonn, Berlin. Ehlich, Konrad (2009): Sprachaneignung – Was man weiß, und was man wissen müsste. In Drorit Lengyel, Hans H. Reich, Hans-Joachim Roth & Marion Döll (Hrsg.), Von der Sprachdiagnose zur Sprachförderung, 15–24. Münster: Waxmann. Europarat (2001): Gemeinsamer europäischer Referenzrahmen für Sprachen: lernen, lehren, beurteilen. Berlin: Langenscheidt. Frederking, Volker (2008a): Schwer messbare Kompetenzen. Herausforderungen für die empirische Fachdidaktik. Vorwort. In Volker Frederking (Hrsg.), Schwer messbare Kompetenzen. Herausforderungen für die empirische Fachdidaktik, 5–10. Baltmannsweiler: Schneider Hohengehren. Frederking, Volker (2008b): Literarische bzw. literar(ästhetische) Kompetenzen. Möglichkeiten und Probleme der empirischen Erhebung eines Kernbereichs des Deutschunterrichts. In Volker Frederking (Hrsg.), Schwer messbare Kompetenzen. Herausforderungen für die empirische Fachdidaktik, 36–64. Baltmannsweiler: Schneider Hohengehren. Granzer, Dietlinde, Katrin Böhme & Olaf Köller (2008): Kompetenzmodelle und Aufgabenentwicklung für die standardisierte Leistungsmessung im Fach Deutsch. In Albert Bremerich-Vos, Dietlinde Granzer & Olaf Köller (Hrsg.), Lernstandsbestimmung im Fach Deutsch. Gute Aufgaben für den Unterricht, 10–28. Weinheim, Basel: Beltz. Gogolin, Ingrid, Imke Lange, Britta Hawighorst, Christiane Bainski, Andreas Heintze, Sabine Rutten & Wiebke Saalmann in Zusammenarbeit mit der FörMig-AG (2011): Durchgängige Sprachbildung. Qualitätsmerkmale für den Unterricht. Münster: Waxmann.

68

Iris Kleinbub

Gogolin, Ingrid, Imke Lange, Ute Michel & Hans H. Reich (Hrsg.) (2013): Herausforderung Bildungssprache – und wie man sie meistert. Münster: Waxmann. Gogolin, Ingrid, Rosemarie Tracy, Joana Duarte & Antje Hansen (2016): Mehrsprachigkeit als Ressource. In BMBF (Hrsg.), Bildungsforschung 2020. Zwischen wissenschaftlicher Exzellenz und gesellschaftlicher Verantwortung. Tagung des Bundesministeriums für Bildung und Forschung vom 27. bis 28. März 2014 in Berlin, 286–295. https://www.bmbf.de/pub/ Bildungsforschung_Band_42.pdf (01. 02. 2017). Hartig, Johannes (2007): Skalierung und Definition von Kompetenzniveaus. In Bärbel Beck & Eckhard Klieme (Hrsg.), Sprachliche Kompetenzen. Konzepte und Messung – DESI-Studie, 83–99. Weinheim: Beltz. Helmke, Andreas & Franz E. Weinert (1996): Bedingungsfaktoren schulischer Leistungen. In Franz E. Weinert (Hrsg.): Psychologie des Unterrichts und der Schule, 71–159. Göttingen: Hogrefe. Helmke, Andreas, Richard Goellner, Iris Kleinbub, Friedrich-Wilhelm Schrader & Wolfgang Wagner (2008): Standards – Motor oder Bremse der Unterrichtsentwicklung? SEMINAR 14 (1), 44–61. Helmke, Andreas (2015): Unterrichtsqualität und Lehrerprofessionalität. Diagnose, Evaluation und Verbesserung des Unterrichts. 6. Aufl. Seelze: Klett-Kallmeyer. Helmke, Andreas & Ingmar Hosenfeld (2004): Vergleichsarbeiten – Standards – Kompetenzstufen: Begriffliche Klärung und Perspektiven. In Marold Wosnitzka, Andreas Frey & Reinhold S. Jäger (Hrsg.), Lernprozess, Lernumgebung und Lerndiagnostik. Wissenschaftliche Beiträge zum Lernen im 21. Jahrhundert, 56–75. Landau: Verlag für Empirische Pädagogik. Hu, Adelheid (2005): Überlegungen zur Einführung von Bildungsstandards aus der Perspektive sprachlichen Lernens und Lehrens. In Karl-Richard Bausch, Eva Burwitz-Melzer, Frank G. Königs & Hans-Jürgen Krumm (Hrsg.), Bildungsstandards für den Fremdsprachenunterricht auf dem Prüfstand: Arbeitspapiere zur 25. Frühjahrskonferenz zur Erforschung des Fremdsprachenunterrichts, 123–131. Tübingen: Narr. Jeuk, Stefan (2014): Sprachvergleich als methodischer Zugang. In Hildegard Gornik (Hrsg.), Sprachreflexion und Grammatikunterricht, 385–397. Baltmannsweiler: Schneider Hohengehren. Jeuk, Stefan (2015): Deutsch als Zweitsprache in der Schule. Grundlagen – Diagnose – Förderung. 3. Aufl. Stuttgart: Kohlhammer. Kammler, Clemens (2006): Literarische Kompetenzen – Standards im Literaturunterricht. Anmerkungen zum Diskussionsstand. In Clemens Kammler (Hrsg.), Literarische Kompetenzen – Standards im Literaturunterricht. Modelle für die Primar- und Sekundarstufe, 7–23. Seelze: Klett/Kallmeyer. Kämper-van den Boogaart, Michael (2005): Lässt sich normieren, was als literarische Bildung gelten soll? Eine Problemskizze am Beispiel von Brechts Erzählung „Der hilflose Knabe“. In Heidi Rösch (Hrsg.), Kompetenzen im Deutschunterricht. Beiträge zur Literatur-, Sprach- und Mediendidaktik, 27–50. Frankfurt am Main: Lang. Klieme, Eckhard, Hermann Avenarius, Werner Blum, Peter Döbrich, Hans Gruber, Manfred Prenzel, Kristina Reiss, Kurt Riquarts, Jürgen Rost, Heinz-Elmar Tenorth & Helmut J. Vollmer (2003): Zur Entwicklung nationaler Bildungsstandards. Eine Expertise. Vorgestellt am 18. 2. 2003 in Berlin. Koordination: Deutsches Institut für Internationale pädagogische Forschung (DIPF), Frankfurt/Main. Bonn: BMBF. KMK (2005a): Bildungsstandards im Fach Deutsch für den Primarbereich. Beschluss vom 15. 10. 2004. München: Wolters Kluwer. KMK (2005b): Bildungsstandards der Kultusministerkonferenz. Erläuterungen zur Konzeption und Entwicklung. München: Wolters Kluwer. KMK (2015): Kompetenzstufenmodell zu den Bildungsstandards im Fach Deutsch im Kompetenzbereich Sprache und Sprachgebrauch untersuchen für den Primarbereich. Beschluss der Kultusministerkonferenz (KMK) vom 04. 03. 2010; Überarbeiteter Entwurf in der Version vom 24. März 2015.

Kompetenzmodellierung

69

Leisen, Josef (2011): Praktische Ansätze schulischer Sprachförderung – Der sprachsensible Fachunterricht.http://www.hss.de/fileadmin/media/downloads/Berichte/111027_RM_ Leisen.pdf (01. 02. 2017). Luchtenberg, Sigrid (2010): Language Awareness. In Bernt Ahrenholz & Ingelore Oomen-Welke (Hrsg.): Deutsch als Zweitsprache, 107–117. Baltmannsweiler: Schneider Hohengehren. Lüddecke, Julian, Sigrid Luchtenberg (2003): PISA und die Folgen aus Sicht interkultureller Erziehung. In Ulf Abraham, Albert Bremerich-Vos, Volker Frederking & Petra Wieler (Hrsg.), Deutschdidaktik und Deutschunterricht nach PISA, 309–329. Freiburg: Fillibach. Naumann, Alexander, Jan Hochweber, Eckhard Klieme (2016): A Psychometric Framework for the Evaluation of Instructional Sensitivity. Educational Assessment, 21 (02), 89–101. Oomen-Welke, Ingelore (2003): Ein Viertel laut PISA „ganz unten“. In Ulf Abraham, Albert Bremerich-Vos, Volker Frederking & Petra Wieler (Hrsg.), Deutschdidaktik und Deutschunterricht nach PISA, 279–296. Freiburg: Fillibach. Oomen-Welke, Ingelore (2006): Der Sprachenfächer. Freiburg: Fillibach. Oomen-Welke, Ingelore (2010): Didaktik der Sprachenvielfalt. In Bernt Ahrenholz & Ingelore Oomen-Welke (Hrsg.), Deutsch als Zweitsprache. Deutschunterricht in Theorie und Praxis, Band 9, 479–492. Baltmannsweiler: Schneider Hohengehren. Peek, Rainer (2001): Die Bedeutung vergleichender Schulleistungsmessungen für die Qualitätskontrolle und Qualitätsentwicklung von Schulen und Schulsystemen. In Franz E. Weinert (Hrsg.), Leistungsmessungen in Schulen, 323–335. Weinheim, Basel: Beltz. Peek, Rainer (2008): Kompetenzen und Kompetenzmessung im Kontext von Fachdidaktik, Psychometrie und Unterrichtsentwicklung. In Martin Böhnisch (Hrsg.), Beiträge zum 16. Symposion Deutschdidaktik „Kompetenzen im Deutschunterricht“, 162–172. Didaktik Deutsch, Sonderheft, 2. Baltmannsweiler: Schneider Hohengehren. Prediger, Susanne, Uta Quasthoff, Anna-Marietha Vogler & Vivien Heller (2015): How to elaborate what teachers should learn? Five steps for content specification of professional development programs, exemplified by “moves supporting participation in classroom discussions”. Journal für Mathematik-Didaktik, 36 (2), 233–257. Quasthoff, Uta, Sören Ohlhus & Juliane Stude (2009): Der Erwerb von Textproduktionskompetenz im Grundschulalter: Ressourcen aus der Mündlichkeit und ihre unterschiedliche Nutzung. Zeitschrift für Grundschulforschung 2, 56–68. Reich, Hans H. (2005): Forschungsstand und Desideratenaufweis zu Migrationslinguistik und Migrationspädagogik. In BMBF (Hrsg.), Anforderungen an Verfahren der regelmäßigen Sprachstandsfeststellung als Grundlage für die frühe und individuelle Förderung von Kindern mit Migrationshintergrund, 121–169. Bonn, Berlin. Röhner Charlotte & Britta Hövelbrinks (Hrsg.) (2012): Fachbezogene Sprachförderung in Deutsch als Zweitsprache. Theoretische Konzepte und empirische Befunde zum Erwerb bildungssprachlicher Kompetenzen. Weinheim: Juventa. Rost, Jürgen (2007): Definition von Kompetenzniveaus mit Hilfe von Mischverteilungsmodellen. In Bärbel Beck & Eckhard Klieme (Hrsg.), Sprachliche Kompetenzen. Konzepte und Messung – DESI-Studie, 100–106. Weinheim: Beltz. Rothstein, Björn (2010): Sprachintegrative Grammatikvermittlung. Tübingen: Stauffenburg. Rothstein, Björn (2011): Deutschunterricht und Qualifikation in der Herkunftssprache. In Björn Rothstein (Hrsg.), Sprachvergleich in der Schule, 9–26. Baltmannsweiler: Schneider Hohengehren. Sächsisches Bildungsinstitut (Hrsg.) (2013): Niveaubeschreibungen Deutsch als Zweitsprache für die Primarstufe. https://publikationen.sachsen.de/bdb/artikel/14490 (01. 02. 2017). Schmölzer-Eibinger, Sabine, Magdalena Dorner, Elisabeth Langer & Maria-Rita Helten-Pacher (2013): Sprachförderung im Fachunterricht in sprachlich heterogenen Klassen. Stuttgart: Fillibach bei Klett.

70

Iris Kleinbub

Spinner, Kaspar H. (2005): Der standardisierte Schüler. Didaktik Deutsch 18, 4–13. Staatsinstitut für Schulqualität und Bildungsforschung (Hrsg.) (2017): LehrplanPLUS Deutsch als Zweitsprache. https://www.isb.bayern.de (01. 08. 2017). Wild, Elke, Uta Quasthoff, Martin Heinrich, Birgit Lütje-Klose & Susanne Prediger (2016): Diversität und Chancengerechtigkeit im Bildungssystem – Darstellung von Erkenntnissen der Bildungsforschung in teilfiktiven Fallbeispielen. In BMBF (Hrsg.), Bildungsforschung 2020. Zwischen wissenschaftlicher Exzellenz und gesellschaftlicher Verantwortung. Tagung des Bundesministeriums für Bildung und Forschung vom 27. bis 28. März 2014 in Berlin, 25– 58. https://www.bmbf.de/pub/Bildungsforschung_Band_42.pdf (01. 02. 2017). Weinert, Franz E. (2001a): Vergleichende Leistungsmessung in Schulen – eine umstrittene Selbstverständlichkeit. In Franz E. Weinert (Hrsg.), Leistungsmessungen in Schulen, 17–31. Weinheim, Basel: Beltz. Weinert, Franz E. (2001b): Perspektiven der Schulleistungsmessung – mehrperspektivisch betrachtet. In Franz E. Weinert (Hrsg.), Leistungsmessungen in Schulen, 353–365. Weinheim, Basel: Beltz. Wildemann, Anja & Sarah Fornol (2016): Sprachsensibel unterrichten in der Grundschule. Anregungen für den Deutsch- Mathematik- und Sachunterricht. Seelze: Klett Kallmeyer.

Solveig Chilla

4 Spracherwerbsverzögerung – Spracherwerbsstörung 1 2 3 4 5 6 7

Sprachliche Auffälligkeiten im Erwerb des Deutschen als Zweitsprache Sprach- und Sprechstörungen im monolingualen Kontext Sprachliche Normen und Bezugssysteme im Kontext des Deutschen als Zweitsprache Sukzessiv-bilingualer Erwerb und Konsequenzen für die Diagnostik Diagnostik von Sprachstörungen im Deutschen als Zweitsprache im institutionellen Kontext Diagnostik von Sprechstörungen im Deutschen als Zweitsprache im institutionellen Kontext Zusammenfassung

1 Sprachliche Auffälligkeiten im Erwerb des Deutschen als Zweitsprache Sprachpädagogischer Diagnostik kommt im vorschulischen und schulischen Alltag eine bedeutende Rolle zu, da sprachpädagogische Prävention im Kontext des DaZErwerbs spezifischer Sprachstandserhebung bedarf (vgl. Jeuk & Settineri in diesem Band). Erzieher*innen sollen Spracherwerbsstörungen erkennen und sich eines Netzwerkes bedienen, das Logopädie einleitet oder Sprachtherapie im Kita-Alltag gewährleistet. In der Schule wird sonderpädagogischer Förderbedarf im Bereich Sprache (SPF Sprache) diagnostiziert und Lehrkräfte sollen – möglichst in interprofessionellen Teams – behindernde Bedingungen erkennen und daraus resultierende Entwicklungshürden möglichst frühzeitig abbauen. Die Unterstützung individueller sprachlicher Entwicklung durch pädagogische Fachkräfte sollte sich an wissenschaftlich fundierten Modellen orientieren und behindernde Bedingungen, wie beispielsweise das Vorliegen einer genetisch bedingten genuinen Spracherwerbsstörung, oder externe Faktoren, wie ein qualitativ und/oder quantitativ unzureichendes Sprachangebot, mitbedenken. Sprachauffälligkeiten und Störungen des Zweitspracherwerbs (L2-Erwerbs) stehen im Kontext mit den zugrunde gelegten Normen unauffälliger Sprachentwicklung. Die Forschungsbemühungen und -ergebnisse um den Sprachenerwerb, den Erwerb des Deutschen als Zweitsprache (DaZ) und der Beziehungen von Sprachen untereinander sind vielfältig, wobei der Erwerbsverlauf und seine Einflussfaktoren und Bedingungen besonders intensiv erforscht werden. Dabei decken sich sprachwissenschaftliche Theorien bzw. Erkenntnisse einerseits und die Anforderungen an die Fähigkeiten eines einzelnen Kindes oder Jugendlichen im institutionellen System (Kita/Schule) andererseits nicht unbedingt. Denn in nationalsprachlich geprägten Forschungskontexten gilt als Bezugsgröße vieler Studien der monolinguale Erwerb mit seinen Erwerbsmodellen für Morphologie, Syntax, Phonetik, Phonologie, https://doi.org/10.1515/9783110418712-004

72

Solveig Chilla

Semantik, Lexikon und Pragmatik. Sie werden auf die einzelsprachlichen Varietäten von Bilingualen übertragen, wobei Abweichungen vom monolingualen Erwerb im Erwerbsprozess als „Interlanguagephänomene“ (Lernersprachen, vgl. Dimroth in diesem Band) beschrieben werden. Wenn Kinder und Jugendliche in ihrer Zweitsprache Deutsch mit Verfahren getestet werden, die allein an monolingualen Probanden normiert wurden, schneiden sie in der überwiegenden Zahl der Fälle schlechter ab als die Vergleichsgruppe, so dass der Eindruck entstehen kann, der DaZ-Erwerb sei auffällig oder gar defizitär.

2 Sprach- und Sprechstörungen im monolingualen Kontext Für die Beschreibung einer von der Alters- und Entwicklungsnorm abweichenden Sprachentwicklung monolingualer Kinder haben sich verschiedene Termini etabliert. „Entwicklungsbedingte Sprachstörungen“ sind Störungen im Erwerb einer Erstsprache. Kinder mit Sprachentwicklungsstörungen unterscheiden sich von den sich typisch entwickelnden Kindern, indem sie typische Erwerbsphasen verzögert durchlaufen, in einigen Bereichen der Sprachentwicklung stagnieren, während andere Bereiche sich regelhaft entwickeln oder indem sie insgesamt untypische Erwerbsmuster zeigen (Hacker 2002). Vergleichsstudien zeigen, dass 20 % aller monolingualen Kinder sprachlich auffällig sind, unter ihnen sind ca. 10 % mit Sprachentwicklungsstörung (SES) mit primärer Ursache und 5–7 % mit Umschriebenen Sprachentwicklungsstörungen (USES). Die Prozentzahlen geben dabei die Auftretenshäufigkeit einer Störung bzw. Verzögerung innerhalb einer Alterskohorte an. Ursachen, Entwicklungsverläufe und Ausprägungsgrade der entwicklungsbedingten Sprachstörungen sind individuell unterschiedlich und betreffen alle sprachlichen Bereiche (Pragmatik, Semantik, Grammatik, Aussprache, metasprachliche Entwicklung und Schrifterwerb) (Füssenich 2012). Sprachentwicklungsverzögerungen (SEV) werden als Beeinträchtigungen der Sprachentwicklung definiert, bei denen sich der Erwerb grundsätzlich innerhalb der regulären Variationsbreite nach dem entsprechenden Erwerbsmodell vollzieht, der Erwerb einzelner Aspekte aber um mindestens sechs Monate verzögert verläuft. Als typisches Beispiel können hier Kinder mit einer phonologischen Verzögerung gelten. Im Erwerb der Phonetik und Phonologie des Deutschen gibt es bestimmte Übergangsphänomene (phonologische Prozesse), die von nahezu allen Kindern im Erwerb gezeigt werden, wie die Vorverlagerung von Velaren (katze = tatze; kuchen = tuchen). Dieser Prozess ist im Spracherwerb bis zum Alter von 3;6 Jahren typisch und sollte bis zum vierten Lebensjahr überwunden sein. Ist dies nicht der Fall, wird eine Verzögerung des Erwerbs angenommen (Fox 2005). Bei Sprachentwicklungsstörungen zeigen Kinder sprachliche Muster, die darauf schließen lassen, dass die Sprachentwicklung vollständig oder in Teilaspekten den

Spracherwerbsverzögerung – Spracherwerbsstörung

73

in den Erwerbsmodellen dargestellten Erwerbsschritten widerspricht. So wird der unauffällige Grammatikerwerb oft mit Clahsen (1988) modelliert: zunächst wird die deutsche Hauptsatzstruktur mit Verbzweitstellung und korrekter Subjekt-Verb-Kongruenz (SVK) erworben, dann werden Nebensätze produziert. Kinder, die bereits Nebensätze mit korrekter Verbendstellung bilden, bevor sie über die generalisierte Verbzweitstellung im Hauptsatz verfügen, weichen in diesem Sinne vom Erwerbsmodell qualitativ ab. Stagnationen im Erwerb werden besonders dort sichtbar, wo sich starke Unterschiede zwischen den sprachlichen Leistungen der Altersgruppe und dem Individuum zeigen. Störungen des Erwerbs von Lexikon und Semantik können sich in einem kleinen und beschränkten Wortschatz äußern. So ist es einem Schulkind mit semantisch-lexikalischer Störung nur sehr schwer möglich, sich einen Fachwortschatz anzueignen und/oder diesen abzurufen. Abrufgeschwindigkeit und -genauigkeit können eingeschränkt sein, so dass die schulischen Leistungen, z. B. im Fach Biologie, stark beeinträchtigt werden. SES im Rahmen von primären Störungsbildern werden ursächlich z. B. auf eine Hörbeeinträchtigung, eine sozial-emotionale Störung oder eine kognitive Einschränkung zurückgeführt. Zu berücksichtigen ist, dass es sich bei SES im Rahmen von Primärbeeinträchtigungen zwar einerseits um identifizierbare Gruppen von Kindern und Jugendlichen (z. B. mit Trisomie 21 oder fragile-x-syndrome) handelt, die Ausprägungen der Beeinträchtigungen auf den Spracherwerb jedoch nicht nur zwischen Gruppen mit verschiedenen Primärbeeinträchtigungen, sondern auch interindividuell bei gleichem Syndrom sehr unterschiedlich sind. Bei einer USES handelt es sich um eine Entwicklungsstörung, die sich im sprachlichen Bereich äußert, ohne dass die Auffälligkeiten auf kognitive, auditive oder neurologische Beeinträchtigungen zurückgeführt werden können (Überblick in Leonard 2014). Die Sprachentwicklung ist verzögert und qualitativ abweichend, wobei die Ausprägungen von USES abhängig von der Einzelsprache variieren. USES wird diagnostiziert, wenn die sprachlichen Leistungen in normierten Tests in mindestens zwei sprachlichen Bereichen mindestens –1,25 SD unter der Altersnorm liegen. Alle sprachlichen Bereiche können betroffen sein, wobei auffällige und langanhaltende Abweichungen von der Performanz altersgleicher, sich typisch entwickelnder Kinder, besonders in der Morphosyntax und der Phonologie, charakteristisch sind. Bei monolingual deutschsprachigen Kindern mit USES sind überwiegend Verbal- und Nominalflexion betroffen (Überblick in Hamann 2015). Verzögerte Phonologische Prozesse, die vor allem Konsonantencluster betreffen und durch vereinfachte Wiedergabe auffallen, sind ebenfalls vielfach belegt und werden mit einer Einschränkung des (phonologischen) Arbeitsgedächtnisses in Zusammenhang gebracht (Überblick in Fox-Boyer & Salgert 2014). Eine verlässliche Diagnose ist wichtig, da sich eine USES vielfältig auf den individuellen Bildungs- und Entwicklungsweg auswirkt (u. a. Snowling, Bishop & Stothard 2000; Heppt et al. 2014) und eine unbehandelte Sprachentwicklungsstörung im Schulalter oft unentdeckt bleibt. Hinzu kommen Verhaltensauffälligkeiten im Kindes- und Jugendalter und problemati-

74

Solveig Chilla

sche Peer- und Freundschaftsbeziehungen, ein erhöhtes Risiko für Depressionen und Angststörungen (Beitchman & Brownlie 2010) sowie das Phänomen des „absinkenden IQ“ im fortgeschrittenen Lebensalter (Krassowski & Plante 1997). Einige sprachliche Schwierigkeiten können persistieren (vgl. Schöler, Fromm & Kany 1998). Als Sprechstörungen oder „Psychoreative Redestörungen“ werden Redeunflüssigkeiten definiert, bei denen der Spracherwerb an sich nicht beeinträchtigt sein soll. Redeunflüssigkeiten an sich sind häufig und ein typisches Phänomen des Spracherwerbs; so zeigen bis zu 80 % aller Kinder im Vorschulalter entwicklungsbedingte Sprechunflüssigkeiten, die in der Regel nach wenigen Wochen oder Monaten spontan remittieren. Stottern wird definiert als zentralnervöse Störung des Sprechens und seiner Planung, die bei 3–5 % aller Kinder und ca. 1 % aller Erwachsenen durch das Zusammenspiel von genetischer Disposition und ggf. ungünstigen Umgebungsfaktoren entsteht. Es werden neuromorphologische und neurofunktionelle Korrelate angenommen, die zu Störungen von Sprechablauf, Sprechrhythmus, Sprechmotorik, Sprechatmung sowie Artikulation und Phonation führen. Stottern dauert meist über einen längeren Zeitraum hinweg an und ist durch ausgeprägtes Auftreten von mindestens einer der für Stottern typischen Unflüssigkeiten, wie Wiederholungen, Dehnungen oder Blockierungen, geprägt. Als Begleitsymptomatik können z. B. Mitbewegungen von Körperteilen und Vermeidung des Blickkontaktes auftreten. Oft wird dies durch kommunikative Ängste und Vermeidungsverhalten begleitet (Neumann et al. 2016). Bei selektivem Mutismus schweigen Kinder und Jugendliche in bestimmten Situationen oder gegenüber ausgewählten Menschen, obwohl sie in der Lage sind, altersgerecht zu sprechen (American Psychiatric Association 2013). Als „Störung sozialer Funktionen mit Beginn in der Kindheit und Jugend“ sind vom selektivem Mutismus mehr Mädchen als Jungen betroffen, wobei die Auftretenshäufigkeit insgesamt sehr gering ist (0,02–0,7 %). Prävalenzraten von genuinen und meist genetisch bedingten Erwerbsstörungen sind z. B. über Zwillings- und Familienstudien vergleichsweise leicht statistisch zu ermitteln, weil in der Regel medizinisch-diagnostische Kriterien vorliegen. Es zeigt sich, dass die diagnostisch festgestellten Förderbedarfe bei Störungen, für die eine genetische Basis vermutet wird, mit zunehmendem Lebensalter absinken. Kinder im Vorschulalter, bei denen die Diagnose „Spracherwerbsstörung bzw. Verzögerung“ ärztlich gestellt wird, haben nach dem Sozialgesetzbuch Anspruch auf Sprachtherapie. Gleiches gilt für Schüler*innen, die eine Sprechstörung wie selektiven Mutismus oder Stottern zeigen: sie haben Anspruch auf (außerschulische) Therapie und nehmen am Unterricht der Regelschule ggf. mit Nachteilsausgleich teil. Bei Vorliegen einer genuinen Spracherwerbsstörung wie der USES ist ein SPF (sonderpädagogischer Förderbedarf) Sprache und damit ggf. die sonderpädagogische Förderung an einer Sprachheilschule bzw. in einer inklusiven Schule mit Förderschwerpunkt Sprache angezeigt. Innerhalb der schulischen Diagnostik wird mit zunehmendem Alter immer seltener die Diagnose „SPF Sprache“ gestellt. Dies liegt nicht zuletzt

Spracherwerbsverzögerung – Spracherwerbsstörung

75

daran, dass es durch eine Spracherwerbsstörung zu Folgestörungen kommen kann, die wiederum zu insgesamt schwachen Schulleistungen führen. Schüler*innen können nur selten die ihren kognitiven Potentialen angemessenen Schulleistungen abrufen und fallen dann nicht mehr als Schüler*innen mit sonderpädagogischem Förderbedarf Sprache auf, sondern erhalten Lernförderung.

3 Sprachliche Normen und Bezugssysteme im Kontext des Deutschen als Zweitsprache Kinder, Jugendliche und Erwachsene, die DaZ erwerben, fordern die Routinen der Sprachdiagnostik heraus, da sich mehrsprachiger Erwerb nur bedingt modellieren lässt (Zurer-Pearson 2010). So koexistieren pädagogische, sprachwissenschaftliche und sprachdidaktische Erwerbsmodelle, die grundlegend übereinstimmen, aber nur auf einen Bruchteil der bi- und multilingualen Population übertragen werden können (Chilla 2014). Der monolinguale wie mehrsprachige Erwerb, insbesondere unter Migrationsbedingungen, und die sprachliche Bildung werden von vielen Variablen, wie sozioökonomischer Status und Bildungsgrad der Eltern, sprachförderliches Umfeld, Literalität und individuelle Voraussetzungen beeinflusst und sollten in ihrer Bedeutung für die Ermöglichung sprachlicher Bildung berücksichtigt werden. Bei mehrsprachigen Schüler*innen sind weiter die Erwerbsbedingungen einer Minderheitensprache in einer Mehrheitsgesellschaft und die (sprachliche) Migrationssituation, kulturelle Bezugssysteme, individuelle und familiäre Einstellungen zum Erwerb der Erst- und Zweitsprache(n) sowie heterogene sprachliche Konstellationen innerhalb der Familie und innerhalb einer sprachlichen Gemeinschaft bedeutsam (Überblick in Armon-Lotem, de Jong & Meir 2015). Unter Berücksichtigung des Erwerbskontextes und der Erwerbsstrategien wird der gleichzeitige oder sukzessive Erwerb zweier Sprachen von der monolingualen Norm aus betrachtet, wobei die Einzelsprachen eines Kindes, Jugendlichen oder Erwachsenen nach dem Erwerbsbeginn (age of onset, AoO) zeitlich-biografisch geordnet werden (L1, L2, … Ln). So hat es sich etabliert, zwischen simultan-bilingualem Erwerb, bei dem der Erwerbsbeginn von L1 und L2 innerhalb des ersten Lebensjahres erfolgen sollte (de Houwer 2009), und sukzessiv-bilingualem Erwerb zu unterscheiden. Sukzessiv-Bilinguale beginnen erst nach dem ersten Geburtstag mit ihrer L2, welche oft (aber nicht zwingend), die Sprache der Mehrheitsgesellschaft ist. Es gibt deutliche qualitative und quantitative Unterschiede im Erwerb simultan-bilingualer (AoO 0–2 Jahre); früh sukzessiv-bilingualer (AoO ca. 2–4 J.) und spät sukzessiv-bilingualer (AoO 6–8 J.) Kinder, wobei sich die Datenlage für Kinder, die zwischen 4–6 Jahren mit dem Deutschen beginnen, keinem Modell eindeutig, bzw. eher dem spät sukzessiven (child L2, cL2) als dem früh sukzessiven Erwerb (early L2, eL2) zuordnen lässt (Überblick in Meisel 2009). Studien mit Kindern und Jugendlichen

76

Solveig Chilla

mit Fluchterfahrung, die DaZ ab dem Alter von 3 Jahren erwerben, aber ihre Erstprache(n) unter anderen Bedingungen als in Deutschland geborene Sukzessiv-Bilinguale erworben haben, nehmen aktuell zu. Daneben fehlt es speziell in Deutschland an systematischen Studien zum bimodal-bilingualen Erwerb, d. h. zum parallelen Erwerb von Gebärden- und Lautsprache (Chilla, Hennies & Hofmann 2017). In wie weit frühe Literalitätserfahrungen und schriftsprachliche Fähigkeiten auf den Erwerb der L1 und der L2 im Kindesalter, d. h. vor dem Schuleintritt, wirken, ist ebenfalls noch ungeklärt. Darüber hinaus wird aktuell die Rolle des Eintritts in die Institutionen der Mehrheitsgesellschaft (Kita, Schule) als relevanter Faktor für den Erstund Zweitspracherwerb diskutiert (Tuller 2015). Die Sprachgebrauchsbedingungen und hier vor allem das individuelle Zusammenspiel zwischen Input und tatsächlicher Sprachverwendung im Alltag sind wichtige Schlüsselvariablen für den erfolgreichen DaZ-Erwerb (Conboy 2013). Modelle, die allein den Beginn des Erwerbs der L2 als Bezugsgröße berücksichtigen, vernachlässigen wesentliche Einflussfaktoren, wie z. B. das tatsächliche Entwicklungsalter oder die kognitive Reife, Inputbedingungen, Sprachfördermaßnahmen und -programme oder schulischen Unterricht in Erst- und Zweitsprache, was sich auf die Bewertung von DaZ-Leistungen und die Abgrenzung von Störungen und Verzögerungen vom typischen Erwerb auswirkt (Chilla 2014; Chilla & Niebuhr-Siebert 2017). Sprachpädagogische und soziale Aspekte wie die individuelle Bedeutsamkeit von Sprachen und die Wechselwirkung von Mehrsprachigkeit und Identitätsentwicklung (z. B. Diehm & Panagiotopoulou 2011) treten im diagnostischen Prozess ebenfalls in den Hintergrund und werden der (psycho-)linguistischen Beschreibung des Sprachstandes und der Abweichungen zum typischen L1-Erwerb untergeordnet.

4 Sukzessiv-bilingualer Erwerb und Konsequenzen für die Diagnostik Der Forschungsstand zum simultan-bilingualen Erwerb zeigt, dass zwei oder mehr Sprachen keine Überforderung darstellen. Kinder können ihre Sprachen früh trennen und der Erwerbsverlauf wie auch der zu erreichende Endzustand folgen in Abhängigkeit von einem qualitativ und quantitativ guten Input im Wesentlichen den Meilensteinen des L1-Erwerbs. Beide Sprachsysteme können sich asynchron entwickeln, d. h., es kommt im Vergleich zu Monolingualen zu Verzögerungen und Beschleunigungen im Erwerb, wobei Spracherwerbsverzögerungen oder Abweichungen gegenüber dem typischen L1-Erwerb innerhalb der monolingualen Altersnorm und Variationsbreite der typischen Entwicklung bleiben. Wie internationale Studien zeigen (Hammer et al. 2014; Hamann 2012), werden Kinder und Jugendliche durch ein Zweitsprachangebot weder verwirrt noch ist die Zweisprachigkeit an sich Ursache von Spracherwerbsstörungen. Sprachdominanz,

Spracherwerbsverzögerung – Spracherwerbsstörung

77

Sprachmischungen oder Transfer sind typische Erscheinungen von Bilingualität, kommen auf allen sprachlichen Ebenen vor und sind keine Indizien gestörten Spracherwerbs (vgl. Abschnitt 2 und 3 in diesem Beitrag). Sukzessiv bilinguale Kinder und Jugendliche, die DaZ erwerben, zeigen auf der Performanzebene oft sprachliche Fähigkeiten, die weder im monolingualen noch im simultanen oder frühen sukzessiven Erwerb beschrieben werden. Sie sind zu Beginn ihres Deutscherwerbs kognitiv weiter entwickelt als monolinguale Babys und können mit fünf oder sechs Jahren längere sprachliche Einheiten speichern und abrufen. Ein Weg, sich DaZ zu erschließen, liegt dann zum Beispiel darin, mittels unanalysierter bedeutsamer syntaktischer Einheiten („Ich heiße Amira und komme aus Tschetschenien“) schnell in die Sprachproduktion zu kommen. Für die Unterscheidung von typischem Erwerb und Spracherwerbsstörungen genügt es nicht, vorschulischen und schulischen DaZ-Erwerb zu kategorisieren, da sich die Lerner*innen in ihren Erwerbsverläufen auf den unterschiedlichen sprachlichen Ebenen, vor allem aber im AoO, unterscheiden. Eine Unterscheidung des (vorschulischen) sukzessiv-bilingualen Erwerbs in eL2 (AoO ≤ 4) und cL2 (AoO der L2 ab ca. 5 Jahren) ist äußerst wichtig, da sprachwissenschaftliche Studien belegen, dass die diagnostische Abgrenzung von typischen Erwerbschritten und Störungen oder Verzögerungen vom Alter zu Beginn der L2 beeinflusst wird. Auf phonetisch-phonologischer Ebene wird das AoO wichtig, da das Alter zu Beginn des Deutscherwerbs maßgeblich die Quantität und die Richtung der Interaktion der beiden phonetischen Systeme beeinflusst. Es ist für die Diagnostik äußerst relevant nachzuvollziehen, ob der DaZ-Erwerb beginnt, während das phonetische System der L1 noch erworben wird (z. B. mit 3–5 Jahren), oder ob der L1-Erwerb bereits weitgehend abgeschlossen ist (in den meisten Sprachen mit ca. 5–6 Jahren). Dies gilt nicht nur für die Produktion des phonetischen Systems, sondern auch für die Rezeption und Identifikation von Phonemen (Barlow 2014; Baker & Trofimovich 2008; McLeod & Goldstein 2012). Spracheneinfluss ist möglich, doch es ist wissenschaftlich umstritten, ob die Beeinflussung nur unidirektional, d. h. von der bereits erworbenen Sprache auf das Deutsche oder bidirektional erfolgt. Der semantisch-lexikalische DaZ-Erwerb ist durch seine Schnittstelle zum morphosyntaktischen Erwerb und für die Beherrschung der Bildungssprache besonders wichtig (Paradis 2010). Sukzessiv-bilinguale Kinder und Jugendliche verwenden ihre Sprachen häufig in verschiedenen Kontexten und zu unterschiedlichen Zwecken. Dies führt dazu, dass die semantisch-lexikalischen Fähigkeiten in beiden Sprachen zu keinem Zeitpunkt identisch sind (Überblick in Klassert & Kauschke 2014). Diagnostisch relevant ist die Feststellung, dass sich aus den Wortschatzleistungen in einer Sprache (in L1 oder L2) keine unmittelbaren Rückschlüsse auf die Zusammensetzung, die Quantität und die Qualität des Lexikons in der anderen Sprache ziehen lassen. Individuelle Lexika können sich kultur- und erwerbsumgebungsspezifisch aufbauen (Rinker, Budde-Spenger & Sachse 2016). Der durch die Bilingualität bedingte seltenere Abruf bestimmter Wörter aus der jeweiligen (nicht-

78

Solveig Chilla

dominanten) Einzelsprache kann erschwert sein, was für die Diagnose der Abrufgeschwindigkeit und -genauigkeit zu berücksichtigen ist, weil der – im Vergleich zu monolingualen Sprecherinnen der Einzelsprache – seltenere Abruf bestimmter Worteinträge dazu führen kann, dass sich schwächere Verbindungen zwischen den semantisch-konzeptuellen und den phonologischen Repräsentationen der Wörter aufbauen (Gollan et al. 2008). Motivationale Faktoren, Alltagsbedeutung, individuelle Bedeutsamkeit und die Wertigkeit von Sprachen beeinflussen den Erwerb von Semantik und Lexikon in besonderer Weise (Goldberg, Paradis & Crago 2008). Wird beiden Sprachen ein hohes gesellschaftliches Prestige zugeschrieben, ist es sehr wahrscheinlich, dass dann eher die Häufigkeit des Inputs (FoE, frequency of exposure) als das AoO für den semantisch-lexikalischen Erwerb bedeutsam ist (ArmonLotem & Ohana 2016). Der Erwerb der DaZ-Grammatik ist im Vergleich zu anderen sprachlichen Teilbereichen umfassender untersucht, was nicht zuletzt zu einem Screening für die Zweitsprachfähigkeiten unter Berücksichtigung des Erwerbsalters für bilinguale Kinder zwischen 3;0 und 7;11 Jahren geführt hat (Linguistische Sprachstandserhebung Deutsch (LiSe DaZ), Schulz & Tracy 2011). Die Erwerbsbedingungen in beiden Sprachen beeinflussen die Geschwindigkeit des morphosyntaktischen Erwerbs und die zu erwerbenden Strukturen (Paradis 2010), was in den zur Verfügung stehenden Verfahren bisher weitgehend unberücksichtigt ist. Weiter wird die Sprachdominanz zum Testzeitpunkt für die Erhebung sprachlicher Leistungen kaum betrachtet, obwohl diese eine wichtige Rolle für die Diagnostik spielt: meist verfügen DaZ-Lernende über eine stärker und eine schwächer ausgebildete Grammatik. Die stärkere Grammatik ist dabei nicht immer Erstsprache (Thordadottir 2015). Sukzessiv-bilinguale Kinder und Jugendliche erwerben die deutsche Satzstruktur innerhalb von 9–18 Kontaktmonaten zur Zweitsprache, wobei besonders Kinder im Schulalter oft auf so genannte Interlanguagestrukturen zurückgreifen, wie z. B. dummy verbs oder chunks (Chilla, Haberzettl & Wulff 2013). Der Nominal- und Präpositionalphrasenerwerb und den darin auszudrückenden Kongruenzen (z. B. Plural) verläuft im Vorschul- wie im Schulalter vergleichsweise heterogen. Dies wird nicht zuletzt darauf zurückgeführt, dass Genus- und Kasuszuweisungen besonders stark vom Umfang und der Zusammensetzung des Zweitsprachlexikons abhängig sind (Montanari 2010; Ruberg 2013; Schönenberger, Sterner & Rothweiler 2013; Wegener 1992). Der Erwerb der Nominal- und Präpositionalphrase dauert im Vergleich zu Monolingualen länger und kann als ein grammatischer Bereich identifiziert werden, der im DaZ-Erwerb lange auffällig bleibt und als Abweichung von der monolingualen Altersnorm wahrgenommen wird. Die Erwerbswege von monolingualen, simultan bilingualen und eL2-Kindern sind in den wesentlichen kerngrammatischen Bereichen (Erwerb der Satzstruktur und Verbstellung) in vielen Punkten vergleichbar. Bei sich typisch entwickelnden eL2-Kindern mit einem AoO ≤ 4 und ausreichendem Input im Deutschen werden grammatische Kernbereiche, wie Subjekt-Verb-Kongruenz (SVK), Verbzweitstellung

Spracherwerbsverzögerung – Spracherwerbsstörung

79

im Hauptsatz (V2), Verbklammer, Subjekt-Verb-Inversion, W-Fragen und Satzstruktur, stabil und innerhalb von eineinhalb Jahren Kontakt mit dem Deutschen erworben (Chilla 2008; Kostyuk 2005; Dimroth 2008; Lindner et al. 2014; Tracy & Thoma 2009). Allerdings sind genau diese Bereiche auch besonders stark vom AoO beeinflusst. CL2-Kinder, die um ihren fünften Geburtstag mit dem DaZ-Erwerb beginnen, können Erwerbsschritte zeigen, die stark von denen monolingualer bzw. simultanbilingualer peers abweichen. So ist auch bei bereits zielsprachlich ausgebildeter Haupt- und Nebensatzstruktur die SVK nicht immer korrekt. Die im Deutschen obligatorische Verbendstellung in Nebensätzen erfolgt nicht kontinuierlich. Viele formelhafte Wendungen, Verbdritt- und Verbviertsätze werden konstruiert, und nichtfinite Verben (Infinitive) treten in Verbzweitstellung auf (Haberzettl 2003; Chilla 2008; Chilla & Bonnesen 2011). Insgesamt ist die Forschung zum DaZ-Erwerb speziell im Hinblick auf den mehrsprachigen und den cL2-Erwerb noch lückenhaft und dem AoO kommt eine wichtige Rolle für die Bewertung der Performanz zu. In der Praxis sind Testverfahren etabliert, die auf monolingualen bzw. simultan-bilingualen Erwerbsreihenfolgen und -modellen basieren. Dies geschieht nicht zuletzt aus der Erkenntnis heraus, dass sich der simultan-bilinguale Erwerb in verschiedenen Aspekten als mit Modellen des monolingualen Erwerbs gut beschreibbar erwiesen hat und die überwiegende Zahl von bilingualen Kindern und Jugendlichen in Deutschland geboren ist. Der AoO wird dann bei vielen Kindern in Deutschland auf den Zeitpunkt der Geburt oder den Eintritt in die Krippe gesetzt. Die tatsächliche Inputsituation (z. B. der Besuch einer KiTa, in der sich überwiegend Kinder derselben L1 befinden, oder mehr als eine Familiensprache) werden mit diesem Faktor nicht erfasst. Dass der DaZErwerb aber von vielen weiteren Aspekten bestimmt wird, die jedoch schwerer zu operationalisieren und zu erfassen sind, fließt kaum in die Modellbildung ein. Gleichzeitig belegen aktuelle Forschungsergebnisse, dass der AoO allein kein hinreichendes Kriterium für die Beurteilung sprachlicher Fähigkeiten unter Berücksichtigung des Spracherwerbskontexts sein kann. Als bedeutsamer hat sich die Ermittlung eines Quotienten, der die Sprachgebrauchsbedingungen, den elterlichen Input und den familiären Sprachgebrauch mit dem AoO kombiniert, herausgestellt (Tuller 2015). Dieser kann mittels eines Elterninterviews (PaBiQ, Tuller 2015, deutsche Version von Hamann et al. 2010) ermittelt werden (vgl. Tuller et al. 2018). Neben diesen Einschränkungen für die Modellierung des sukzessiv-bilingualen Lautspracherwerbs fehlen nicht nur Studien zum Erwerb des Deutschen als Dritt-, Viert- oder Fünftsprache, sondern auch zur Interaktion des DaZ-Erwerbs mit verschiedenen Modalitäten (Schrift- und Gebärdenspracherwerb). Ebenfalls ungeklärt ist, ob sich Erkenntnisse zum sukzessiv-bilingualen Erwerb auf den Sprachenerwerb und die Charakterisierung von Abweichungen und Störungen bei Schüler*innen mit Fluchterfahrung, die z. T. schon mit Fähigkeiten in mehr als einer Sprache in das deutsche Schulsystem eintreten, übertragen lassen. Ein umfassendes und allgemeingültiges Modell des DaZ-Erwerbs kann es nicht geben und monolinguale Normen, Standards und Modelle müssen systematisch da-

80

Solveig Chilla

hingehend geprüft werden, unter welchen Bedingungen diese für die Konzeption diagnostischer Verfahren und für die Interpretation von Testergebnissen bei DaZ herangezogen werden können. Derzeit stehen kaum Instrumente zur Verfügung, welche eine eindeutige Abgrenzung von Auffälligkeiten des regelrechten mehrsprachigen Erwerbs von Sprach- und Kommunikationsstörungen erlauben. Werden Sprachleistungen im DaZ-Erwerb erhoben, so sollten diese mindestens in Bezug auf den Migrationsstatus, das Alter zu Beginn des Erwerbs, die Quantität des Sprachangebots (Inputs) in Erst- (L1) und Zweitsprache (L2) und ggf. weiteren Sprachen, die Qualität des Inputs, die Erwerbsdauer, den Erwerbsverlauf und/oder Endzustand des Erwerbs und die Beherrschung von Sprachen in verschiedenen Modalitäten (z. B. Schriftsprachen, bimodaler Erwerb von Laut- und Gebärdensprachen) reflektiert werden (vgl. Chilla 2015).

5 Diagnostik von Sprachstörungen im Deutschen als Zweitsprache im institutionellen Kontext Pädagogische Fachkräfte in den Institutionen und/oder die Eltern/Bezugspersonen des Kindes bzw. Jugendlichen, äußern oft den ersten Verdacht auf speziellen sprachlichen Förderbedarf im Deutschen als L2, bevor differenzialdiagnostische Maßnahmen in einem interdisziplinären Prozess durch Fachärzt*innen, Sprachtherapeut*innen, sonderpädagogische Fachkräfte oder sozialpsychologische Dienste eingeleitet werden. Eine Beschränkung auf die Diagnostik in der Zweitsprache ist hier nicht nur sinnvoll, weil es bislang nur sehr wenige Verfahren gibt, mit deren Hilfe sich der Erwerb von Minderheitensprachen als Erst- oder Erbsprachen in der Migration erheben und bewerten lässt. Es ist weiter Tatsache, dass die überwiegende Zahl der pädagogischen Fachkräfte in Deutschland nicht in der Lage ist, Testverfahren in einer Minderheitensprache durchzuführen oder zu interpretieren, weil es hier nicht nur ausgewiesener Fähigkeiten in dieser Sprache, sondern auch einer Einschätzung der sprachlichen Leistung eines Kindes oder Jugendlichen vor dem Hintergrund der migrationsbedingten Veränderungen von Sprachen bedarf (vgl. Abschnitt III in diesem Band und Colombo-Scheffold et al. 2008; Gagarina 2014; Chilla & Şan 2017). Auch der Einsatz von Dolmetscher*innen oder Fachxpert*innen gestaltet sich als schwierig, da sich – speziell im schulischen Kontext – nicht nur die diagnostische Tradition unterscheidet, sondern meist auch unterschiedliche Normen und Kategorisierungen von sprachlichen Beeinträchtigungen vorliegen. So wird beispielsweise „ein sonderpädagogischer Förderbedarf Sprache“ in den skandinavischen Ländern gar nicht diagnostiziert. Kinder und Jugendliche, die DaZ erwerben, werden überdurchschnittlich häufig als sprachauffällig eingestuft (Holler-Zittlau, Dux & Berger 2004; Tollkühn 2001). Solche Sprachauffälligkeiten bei Mehrsprachigkeit sind zunächst einmal Abweichun-

Spracherwerbsverzögerung – Spracherwerbsstörung

81

gen in der L2 Deutsch, und zwar im Vergleich zu monolingual deutschsprachigen Kindern zu einem bestimmten Testzeitpunkt. Kinder und Jugendliche, die DaZ erwerben, weisen entwicklungsbedingte Sprachstörungen auf, wenn sie in ihrem sprachlichen Lernen in L1 oder L2 stagnieren (Chilla 2008; Füssenich 2012). Meist sind es die externen Bedingungen des mehrsprachigen Erwerbs, wie z. B. die Quantität und Qualität des Inputs in der Zweitsprache oder soziökonomische Faktoren (Duarte et al. 2014), die zu den Abweichungen führen. Da die Erhebung der Sprachauffälligkeiten in der L2 erfolgt, ist die Berücksichtigung ethnolektaler und soziolektaler Phänomene wie auch der individuellen sozioökonomischen Entwicklungsbedingungen von besonderer Bedeutung. Es liegt nahe, dass eine Trennung zwischen Alltags- und Bildungssprache bei Kindern und Jugendlichen, die DaZ erwerben, für die Differenzierung von Spracherwerbsauffälligkeiten und -störungen ungeeignet ist, bzw. mit den Erwerbsbedingungen verknüpft werden muss. In Bezug auf Sprachstörungen im Zweitspracherwerb liegen internationale Forschungsergebnisse vor, die allerdings überwiegend mit von Geburt an bilingualen Proband*innen entstanden sind (Paradis 2010). SES und USES treten im DaZ-Erwerb nicht häufiger auf als bei monolingualen Kindern: die Prävalenzraten sind in etwa gleich hoch. Sprachentwicklungsstörungen wirken sich in allen Sprachen eines mehrsprachigen Kindes sprachspezifisch und spezifisch sprachlich aus (Genesee, Paradis & Crago 2004). Je nach Einzelsprache können unterschiedliche Bereiche von einer Sprachentwicklungsstörung betroffen sein, wobei die Charakteristika der USES leicht mit Übergangsphänomenen des typischen Erwerbs verwechselt werden können (Chilla 2008; Schöler, Fromm & Kany 1998). Dabei sind die Forschungsergebnisse zum Spracherwerb von bilingualen Kindern mit USES aufgrund der typologisch-sprachlichen Unterschiede der verschiedenen Sprachenkonstellationen kaum generalisierbar (vgl. auch Hamann 2012). Wenn die sprachlichen Leistungen allein an monolingualen Standards und Normen gemessen werden, besteht bei mehrsprachigen Kindern das Risiko der missed identity, d. h. dass mehrsprachige Kinder mit USES nicht als solche erkannt werden, weil ihre sprachlichen Auffälligkeiten als typisch für den L2-Erwerb missinterpretiert werden. Diesen Kindern wird u. U. eine störungsspezifische Therapie vorenthalten, was negative Folgen für die Bildungsbiografie hat. Umgekehrt werden viele mehrsprachige Kinder durch die Verwendung monolingualer Standards als Kinder mit USES fehldiagnostiziert (mistaken identity; Genesee, Paradis & Crago 2004). Viele mehrsprachige Schüler*innen mit fehlerhafter Diagnose verlassen die Schule ohne Abschluss oder werden zu Schüler*innen im Förderschwerpunkt Lernen und erhalten sonderpädagogische Förderung statt rechtzeitiger passgenauer Sprachförderung und bei vielen Schüler*innen an der Grundschule bleibt die USES unentdeckt (z. B. Zurer-Pearson 2010).

5.1 Diagnostisches Vorgehen Ausgehend von den Erkenntnissen, dass sich USES in allen Sprachen eines Kindes/ eines Jugendlichen ausprägt, ist eine Erhebung der Erstsprach- und der DaZ-Fähig-

82

Solveig Chilla

Tab. 1: Vorgehen bei Verdacht auf eine Sprach-/Sprechstörung bei DaZ. 1. Konsequente Dokumentation des gesamten diagnostischen Prozesses und der an der Diagnosefindung beteiligten Personen. 2. Interdisziplinäre Diagnostik, die das multifaktorielle Bedingungsgefüge vieler Sprach- und Sprechstörungen berücksichtigt: Beteiligung des*der Kindes/Jugendlichen, von Eltern, Kinderärzt*in, Abklärung des Hörstatus bei der Fachärzt*in, Erhebung der Status des nonverbalen IQ mit kultursensiblen und sprachfreien IQ-Tests (z. B. SON-R; Raven (CPM)). 3. Durchführung eines Elterngespräches mit kultur- und sprachsensiblen Leitfragen, die Rückschlüsse auf die Sprachdominanz zum Testzeitpunkt zulassen und Risikofaktoren für den DaZ-Erwerb, wie bedeutsame Inputfaktoren, operationalisiert berücksichtigen (LITMUSPaBiQ-Questionnaire; Tuller 2015). Idealerweise verläuft dieses Elterngespräch in der Sprache, in der die Eltern das Gespräch führen möchten. Dies kann die Erstsprache des/der Schüler*in/Elternteils/Bezugsperson, Deutsch oder eine andere Sprache (Englisch, Französisch) sein. Mindestens aber sollten wesentliche Hintergrundinformationen auf Deutsch erfragt werden, wobei sowohl den Eltern/der Schüler*in als auch den pädagogischen Fachkräften, die im Alltag mit dem Kind/Jugendlichen sprachlich agieren, genügend Raum für den Beschwerdevortrag, also die eigene Verbalisierung der Erwerbshürden gegeben wird. Oft lassen sich schon hier anhand von Beispielen aus dem Alltag erste Hinwiese darauf interpretieren, ob es sich um eine genuine Spracherwerbsstörung/-verzögerung handeln kann oder ob es die institutionellen Lernbedingungen oder familiären/sozialen Hintergrundvariablen sind, die dazu führen, dass ein Kind in seinem sprachlichen Lernen in der Zweitsprache stagniert. 4. DaZ-Screening (LiSe-DaZ, Schulz & Tracy 2011; HASE, Schöler & Brunner 2008).

keiten sinnvoll. In einem internationalen Forschungsverbund (COST IS0805) wurden die Möglichkeiten und Grenzen einer Abgrenzung von Spracherwerbsstörungen und Sprachauffälligkeiten in der Zweitsprache (der Mehrheitsgesellschaft) in europäischen Ländern intensiv erforscht (www.bi-sli.org). Da für die meisten der Erstsprachen von Kindern aus sprachlichen Minderheiten, die DaZ erwerben, weder valide Verfahren für die Diagnose von Spracherwerbsstörungen noch Fachkräfte vorhanden sind, um diese durchzuführen, gibt es verschiedene Vorschläge, wie mit den bereits etablierten Procedere eine Diagnostik von Erst- und Zweitsprachfähigkeiten erfolgen kann. Dabei wird vorausgesetzt, dass die Kinder/Jugendlichen selbst oder eine pädagogische bzw. medizinische Fachkraft bereits Sorgen über die DaZEntwicklung geäußert haben. Neben der Erhebung der Hintergrundinformationen und der psychologischen und ärztlichen Diagnostik kann das bisher einzige normierte Screening für DaZ (LiSe-DaZ, Schulz & Tracy 2011) angewandt werden, aber auch andere Verfahren, wie z. B. HASE (Schöler & Brunner 2008) können geeignet sein, um eine erste Vermutung verzögerter oder gestörter Sprachentwicklung zu festigen (vgl. Tabelle 1). Diese ersten Schritte sollten in jedem Fall altersunabhängig vor der eigentlichen einzelsprachlichen Diagnostik bzw. vor der Erhebung des sprachlichen

Spracherwerbsverzögerung – Spracherwerbsstörung

83

(Störungs-)Profils erfolgen. Verantwortlich für diesen ersten Prozess sollten die pädagogischen Fachkräfte sein, federführend wird je nach Alter des Kindes/ Jugendlichen die ärztliche/therapeutische/psychologische Fachkraft bzw. die/der Sonderpädag*in oder das sozialpsychologische Beratungszentrum sein, denen ebenfalls die Diagnosestellung bzw. Förderplanung/Laufbahnentscheidung obliegt.

5.2 Spracherwerbsstörungen mit primärer Ursache (SES): Trisomie 21, Autismus-Spektrum-Störung, Hörbeeinträchtigungen Bei Spracherwerbsstörungen mit kognitiver Ursache (Trisomie 21, Autismus-Spektrum-Störung) wird die zugrunde liegende Beeinträchtigung bei Kindern, die in Deutschland geboren sind, meist schon von früher Kindheit an bekannt sein. Bei geflüchteten Kindern und Jugendlichen ist dies nicht immer der Fall, so dass bei jedem Verdacht auf eine Primärbeeinträchtigung eine medizinisch-psychologische Abklärung angezeigt ist. Zum bilingualen Erwerb von Kindern mit ausgewählten Primärbeeinträchtigungen liegen international verschiedene Studien vor, aus denen sich auch für den DaZ-Erwerb Rückschlüsse auf Diagnose und Erwerbsverlauf ziehen lassen. Der Erwerb von mehr als einer Sprache überfordert bilingual aufwachsende Kinder mit Autismus und Trisomie 21 nicht, die sprachentwicklungsstörungsspezifischen Auffälligkeiten prägen sich nicht stärker aus (Ostad 2014), und bilinguale Kinder mit Autismus-Spektrum-Störung gleichen auch in ihren kognitiven und sozialen Fähigkeiten Monolingualen peers. Bei beiden Gruppen scheint sich eher ein Vorteil der bilingualen Erziehung herauszukristallisieren (u. a. Hambly & Fombonne 2011). Hörstörungen als weitere Primärbeeinträchtigungen werden jedoch nicht immer rechtzeitig erkannt. Dies gilt besonders für progrediente Hörstörungen, die unterhalb einer mittelgradigen Schwerhörigkeit (Hörverlust ab 40 dB) liegen. In den UUntersuchungen fallen diese Hörstörungen selten auf und nach der U9 zum Zeitpunkt der Einschulungsuntersuchung sind im Schulalter Hörtests nicht mehr obligatorisch. Dies ist besonders bedenklich, da verschiedene Studien belegen, dass die Hörgewohnheiten in Freizeit und Schule und Lärmbelastungen die Hörfähigkeit stark beeinflussen. Wie Dehnert et al. (2015) und die zeigen, weist jedes achte Kind zwischen 8 und 14 Jahren einen Hörverlust von über 20 dB auf, 2.4 % aller Schüler*innen zeigten bei einer einzelnen Testfrequenz einen Hörverlust von über 30 dB. Solche leichtgradigen Hörstörungen können sich auf die phonematische Diskriminierung und damit auf den Erwerb von Phonetik/Phonologie und Morphologie im Deutschen als L2 auswirken. Das tabletbasierte Screening AAST (Adaptiver Auditiver Sprachtest, Coninx 2005) ist derzeit in 14 Sprachen verfügbar und sollte flächendeckend bei Schüler*innen angewandt werden, um Hörbeeinträchtigungen als Ursache von Erwerbsbeeinträchtigungen allgemein auszuschließen.

84

Solveig Chilla

5.3 Umschriebene Sprachentwicklungsstörungen (USES)

USES sprachspezifisch

Internationale Studien zeigen, dass die Prävalenzrate für USES bei mehrsprachigen Kindern nicht größer ist als bei monolingualen Kindern (5–7 %). Eine USES wirkt sich sowohl spezifisch sprachlich, als auch sprachspezifisch, d. h. je nach Einzelsprache unterschiedlich, aus. Theoretisch wäre eine Differenzierung zwischen bilingualen Kindern mit und ohne USES möglich, wenn die sprachlichen Leistungen in beiden Sprachen erhoben würden (vgl. Abbildung 1). Ein Kind, das in nur einer der beiden Sprachen störungsspezifische Ausprägungen zeigt, kann keine USES haben, da sich die Störung aufgrund der genetischen Basis in beiden Sprachen ausprägen muss. Sofern nur der DaZ-Erwerb beeinträchtigt ist, sollten dann andere Gründe als eine genuine USES ursächlich für die Sprachauffälligkeiten sein. Dabei gilt es zu bedenken, dass die Diagnose in der Erstsprache aus verschiedenen Gründen meist unmöglich ist: Fehlende standardisierte/normierte diagnostische Verfahren in der L1; Schwierigkeiten der Adaption von T-Werten und Standardabweichungen (z-Werte) an den bilingualen Kontext; die Ermittlung von Sprachdominanz; Hürden der Diagnostik durch Nicht-Muttersprachler*innen; die Veränderungen von Minderheitensprachen im Migrationskontext; die Probleme des Einsatzes diagnostischer Verfahren aus dem standardsprachlichen Kontext im Migrationskontext; kulturspezifische Normen; der Einsatz von Dolmetscher*innen und die regionalen und kulturellen Unterschiede von Sprachgemeinschaften in der Minderheitensituation erschweren den Einsatz solcher Testverfahren (Überblick in: Chilla, Rothweiler & Babur 2013). Die Forschungsergebnisse zeigen, dass sich USES-Ausprägungen und DaZtypische Abweichungen vom monolingualen Erwerb überschneiden können, so dass es in der Praxis immer wieder zu Fehldiagnosen kommt (Genesee, Paradis & Crago 2004). Daher sind sprachwissenschaftlich und psycholinguistisch fundierte differenzialdiagnostische Methoden für Kinder und Jugendliche erforderlich. Es gilt zu prüfen, ob sich Testverfahren für USES, die sich im monolingualen Kontext bewährt haben, auf mehrsprachige Erwerbssituationen übertragen lassen (Armon-Lotem, de Jong & Meir 2015). Thordadottir (2015) schlägt für simultan-bilinguale Kinder/

USES müssen sich in beiden Sprachen ausprägen

einzelsprachspezifische Diagnostik

Abb. 1: Theoretische Basis der Diagnostik von USES.

Diagnostik in der Erstsprache Diagnostik DaZ

Diagnostik in der L2 Deutsch anhand eindeutiger Ausprägungen, die bei allen Kindern mit USES auftreten

Spracherwerbsverzögerung – Spracherwerbsstörung

85

Jugendliche vor, in beiden Sprachen standardisierte monolinguale Verfahren durchzuführen und die gewonnenen Testwerte unter Berücksichtigung der individuellen Sprachdominanz neu zu skalieren. Ein Kind, das dann beispielsweise in seiner nichtdominanten Sprache getestet wird, wird erst dann als USES identifiziert, wenn es in einem standardisierten Sprachtest –1,5 SD unterhalb der Norm abschneidet, in der nichtdominanten –2,25 SD. In eigenen Forschungsprojekten (u. a. Hamann et al. 2013–2016) wird erst dann USES diagnostiziert, wenn die Testwerte unter Berücksichtigung der Sprachdominanz nach Thordadottir (2015) in beiden Sprachen in je mindestens zwei sprachlichen Bereichen unterhalb der Norm liegen (Chilla & Hamann 2018). Wenn ein Kind nur in der L1, nur in DaZ oder nur in einem sprachlichen Bereich (z. B. Phonologie) in beiden Sprachen unterhalb der Norm liegt, wird es nicht als Kind mit USES charakterisiert (Tuller et al. in Begutachtung). Allerdings zeigen systematische Studien mit monolingualen normierten Testverfahren für Türkisch im sprachlichen Minderheitenkontext in Deutschland, Frankreich und den U. S. A., dass diese bei Sprecher*innen verschiedener Generationen und Sprachvarietäten auch bei der rein quantitativen SD-Anpassung zu Fehldiagnosen führen, weil standardisierte L1-Tests die qualitativen Veränderungen von Varietäten der L1 in der Migration nicht berücksichtigen (Chilla & Şan 2017). In aktuellen Studien wird der Frage nachgegangen, inwieweit sich tatsächlich sprachliche Merkmale ermitteln lassen, mit deren Hilfe Kinder/Jugendliche ohne USES von Kindern/Jugendlichen mit USES unterschieden werden können (für einen Überblick vgl. Chilla & Haberzettl 2014). Idealerweise ließen sich sprachliche Phänomene identifizieren, die unabhängig davon sind, ob Deutsch als L1 oder L2 erworben wird. Als vielversprechend für zukünftige praxistaugliche Testverfahren können Erhebungen mit den deutschsprachigen Versionen der LITMUS-Verfahren (Language Impairment Testing in Multilingual Settings, Armon-Lotem et al. 2015) gelten. Eine Kombination von sprachübergreifenden und sprachspezifischen Kriterien für USES scheint hier besonders effektiv. So zeigen Grimm & Hübner (2017), dass sich ein Test zum Nachsprechen von Nichtwörtern, bei dem die phonologische Komplexität bedeutsam ist (LITMUS-NWRT), für die Diagnose von USES bei Bilingualität eignet. Dieser Test ist unabhängig vom Erwerb des Lexikons und der Morphosyntax und kann so schon nach kurzer Kontaktzeit mit DaZ durchgeführt werden. Diese Erkenntnisse sollten dann in Testverfahren einfließen, die den testtheoretischen Haupt- und Nebengütekriterien entsprechen. Grundsätzlich ist zu berücksichtigen, dass sich USES nicht nur auf verschiedenen sprachlichen Ebenen zeigen kann, sondern dort auch unterschiedlich ausprägt. Es ist daher nicht zu erwarten, dass sich die Diagnose USES mit einem einzigen Erhebungsverfahren stellen lässt.

5.4 Phonetisch-phonologische Störungen Aussprachestörungen werden in phonetische und phonologische Störungen unterteilt. Bei phonetischen Störungen werden Phoneme nicht oder fehlerhaft gebildet

86

Solveig Chilla

(Sigmatismus), wobei die Fehlbildung meist nicht zu Bedeutungsänderungen führt und auf motorische Realisierungsschwächen zurückgeführt wird. Das ersetzende Phonem wird dabei meist als „nicht-muttersprachlich“ charakterisiert (Weinrich & Zehner 2008). Phonologische Störungen sind durch nicht altersgemäße Verwendung der Phoneme und Regeln „der Muttersprache“ (Kannengieser 2009: 61) gekennzeichnet. Während es folglich für die Diagnostik im Erstsprachkontext vergleichsweise einfach ist, nichtdeutsche Phoneme und systematische Ersetzungen in der lautlichen Produktion von Kindern und Jugendlichen als störungsspezifisch festzustellen, ist dieses diagnostische Kriterium bei DaZ nicht gegeben, weil hier speziell im Erwerb von Phonetik/Phonologie besonders in den ersten Erwerbsmonaten Übertragungen von der L1 in die L2 typisch sind. Die über eine Spontansprachprobe ermittelten Phoneminventare und phonologischen Prozesse müssen daher mit geeigneten Verfahren ergänzt werden. Über Benenntests, die in vielen Sprachen für die Diagnostik herangezogen werden, können bilinguale Kinder oftmals in beiden Sprachen untersucht werden. Die Leistungen der Kinder in diesen Verfahren hängen jedoch sehr von ihren individuellen Spracherfahrungen und Sprachkompetenzen – insbesondere dem Wortschatz – ab, was die Ergebnisinterpretation erschwert (Hambly et al. 2013). Ziel ist auch hier, einen Benenntest für DaZ zu entwickeln, der sprachunabhängig USES von typischem Erwerb unterscheiden kann. Mit der Normierung der deutschen Version des LITMUS-Verfahrens zum Wiederholen von Nichtwörtern (Grimm & Hübner 2017), und weiteren quasi-sprachenunabhängigen psycholinguistische Testaufgaben sollen diese Forschungs- und Diagnostiklücken geschlossen werden. Dies ist auch wichtig, da die phonetische Analyse (d. h. die Entscheidung darüber, welches Phonem als ein „muttersprachliches“ zu kennzeichnen ist), von Diagnostiker*innen durchgeführt wird, die ihre Entscheidungen nur auf Basis der standardsprachlichen Varietät (z. B. durch Abhören oder den Vergleich mit standardsprachlichen Phoneminventaren), nicht aber in Kenntnis dialektaler Färbungen treffen können. Computergestützte Verfahren, die versprechen, dass eine monolingual deutschsprachige Diagnostikerin Aussprachestörungen in der L1 durch Abhören und Vergleich der kindlichen Aussprache mit computergenerierten Phonemen feststellen kann, sind daher mit äußerster Vorsicht zu behandeln und oft ungeeignet.

5.5 Semantisch-lexikalische Störungen Semantische Störungen sorgen für einen im Vergleich zur Altersnorm geringeren Wortschatz. Kinder und Jugendliche mit semantischen Störungen fragen nur selten nach und ersetzen Wörter durch andere aus dem gleichen semantischen Feld, wobei Klassifikationen und Oberbegriffsbildungen eher selten sind. Wortfindungsstörungen sind häufig, viele Kinder greifen in direkter Kommunikation auf nonverbale Mittel zurück.

Spracherwerbsverzögerung – Spracherwerbsstörung

87

Da verschiedene Erwerbsfaktoren den DaZ-Erwerb des Lexikons beeinflussen, wird die Differenzialdiagnose von Störungen in diesem Bereich deutlich erschwert. Schwierigkeiten im Erwerb des Lexikons können sich aber nicht nur durch die Inputbedingungen, sondern auch durch Unterschiede in der konzeptuellen Äquivalenz ergeben. Neben der type/token-Auswertung einer geeigneten Spontansprachprobe sollte das Lexikon (in beiden Sprachen) mittels eines Testverfahrens ermittelt werden. Besonders in der Erhebung des Wortschatzumfangs ist die Kombination aus rezeptiven und produktiven Methoden unter Berücksichtigung beider Sprachen wichtig, wobei produktive Fähigkeiten eher über das konzeptuelle als über das totale Vokabular erfasst werden sollten (Klassert & Kauschke 2014). Ein praktikabler Test müsste dann die entsprechenden Äquivalente in mindestens den häufigsten Minderheitensprachen angeben und die Bewertung dieser Begriffe in der Berechnung von Rohwerten berücksichtigen. Da lexikalische Störungen nicht nur den Wortschatzumfang, sondern auch die Schnelligkeit der lexikalischen Verarbeitung (Wortabruf und Benenngenauigkeit) betreffen, sollten beide Aspekte Teil eines diagnostischen Verfahrens sein. Mit Haman, Łuniewska & Pomiechowska (2015) liegen konkrete Vorschläge für einen Wortschatztest für bilinguale Kinder mit USES im Vorschulalter vor. Ein Verfahren für das Schulalter, mit dessen Hilfe USES-spezifische Auffälligkeiten von DaZ-bedingten Begrenzungen des Wortschatzes abgegrenzt werden können, steht bisher noch aus. Ein geeignetes Verfahren müsste nicht nur an der Störungssymptomatik, sondern auch an den verfügbaren Monitoring- und Lernstrategien für neue Wörter ansetzen, um eine semantisch-lexikalische USES bei Mehrsprachigkeit zu identifizieren.

5.6 Morphologisch-syntaktische Störungen Grammatische Auffälligkeiten gelten als Leitsymptom einer USES. Überschneidungen zwischen DaZ-Phänomenen und USES zeigen sich insbesondere in morphosyntaktischen Abweichungen, die sowohl von DaZ-Kindern als auch Kindern mit USES produziert werden und oberflächlich ähnlich, linguistisch und ursächlich aber unterschiedlich zu interpretieren sind (Chilla 2008; Schöler, Fromm & Kany 1998; Håkansson & Nettelbladt 1993). Clahsen et al. (2014) schlagen vor, Schwierigkeiten mit der Subjekt-Verb-Kongruenz, die sowohl monolingual deutsche als auch bilingualtürkisch-deutsche Kinder mit USES zeigen, als wichtigen diagnostischen Marker für USES zu charakterisieren. Studien mit Schüler*innen belegen jedoch, dass sukzessiv-bilinguale Kinder, die eine zweite Sprache ab ca. 5 Jahren erwerben, in ihren beiden Sprachen dieselben Auffälligkeiten wie monolinguale und jüngere bilinguale Kinder mit USES zeigen können (u. a. Paradis 2008). So lassen DaZ-Kinder mit einem AoO von über 5 Jahren Verbalflexion aus, benutzen Infinitive und fallen durch -n-flektierte (infinite) Verbformen in V2-Position und finite Verbformen am Satzende auf, was auf der Performanzebene exakt den störungsspezifischen Aus-

88

Solveig Chilla

prägungen monolingualer Schüler*innen entspricht (Chilla 2008). Im bilingualen Erwerb sind in der L2 Deutsch, genau wie bei USES, außerdem charakteristische und anhaltende Probleme mit der Nominalmorphologie, besonders den Kasusmarkierungen, beschrieben worden (Schönenberger, Sterner & Rothweiler 2013). Allerdings konnten in internationalen Studien sprachübergreifend besonders im Bereich der Verbformen und der W-Fragen feine sprachliche Unterschiede zwischen L2-Kindern und Kindern mit USES aufgezeigt werden (u. a. Prévost et al. 2010). Erhebungsverfahren wie der LITMUS-SRT (Marinis & Armon-Lotem 2015), die Nachsprechleistungen von Nichtwörtern oder von Sätzen erheben, sind für die Diagnose von USES seit langem etabliert und erfassen Abweichungen in der syntaktischen oder phonologischen Verarbeitung, die charakteristisch für Kinder mit USES sind, aber bei typischem DaZ-Erwerb nicht auftreten sollten (u. a. Conti-Ramsden, Botting & Faragher 2001). Wie Hamann et al. (2017) und Tuller et al. (2018) zeigen, eignet sich der deutschsprachige LITMUS-SRT (Hamann et al. 2013), um bilinguale Kinder mit und ohne USES voneinander zu differenzieren. Hamann et al. (2017) belegen so, dass Objektrelativsätze für monolinguale und bilinguale Kinder (8–10 Jahre) gleich schwierig bzw. einfach waren, während gleichaltrige Monolinguale mit USES weder Subjekt- noch Objektrelativsätze wiederholen konnten. Ebenfalls interessant sind Ergebnisse zu Relativsatzproduktion und -verstehen von Schüler*innen zwischen 8 und 14 Jahren mit und ohne USES zu Hebräisch und Deutsch (u. a. Friedmann, Yachini & Szterman 2015). Objektrelativsätze haben sich hier als besonders geeignet für die Differenzialdiagnose herausgestellt. Bei grammatischen Entwicklungsstörungen sollten folglich mindestens eine qualitative Auswertung der Spontansprachprobe im Hinblick auf USES-Ausprägungen in den Bereichen Satzstruktur, Nominal- und Verbalflexion und ein geeigneter Test zum Nachsprechen von Sätzen durchgeführt werden. Der diagnostische Prozess bei Verdacht auf eine USES umfasst zusätzlich zu den in Tabelle 1 genannten mindestens die in Tabelle 2 dargestellten Schritte (Überblick in Chilla, Rothweiler & Babur 2013; Thordadottir 2015):

Tab. 2: Vorgehen bei Verdacht auf eine Spezifische Sprachentwicklungsstörung bei DaZ. 5. Durchführung von rezeptiven und produktiven Testverfahren, die für die Diagnose von USES in der Zweitsprache geeignet sind (LITMUS-Verfahren; Überblick in Armon-Lotem, de Jong & Meir 2015). 6. Erhebung einer Spontansprachprobe (in beiden Sprachen), idealerweise mit einem kultur- und sprachsensiblen Stimulusmaterial, z. B. MAIN (Gagarina et al. 2015), HAVAS-5 (Reich & Roth 2004). 7. Erhebung von Arbeitsgedächtnisleistungen mit einem Nachsprechtest für Nichtwörter, NWRTest, der einzelsprachunabhängige und -abhängige Items enthält (LITMUS-NWR-Test, Adaption auf das Deutsche, Grimm & Hübner 2017; oder, als Screening, HASE, Schöler & Brunner 2008).

Spracherwerbsverzögerung – Spracherwerbsstörung

89

6 Diagnostik von Sprechstörungen im Deutschen als Zweitsprache im institutionellen Kontext 6.1 Stottern und Deutsch als Zweitsprache In vielen Publikationen und Alltagsvorstellungen wird die bereits seit den 1930er Jahren vorherrschende Meinung repliziert, Mehrsprachigkeit würde Stottern verstärken oder sogar verursachen. Nicht selten wird Eltern von mehrsprachigen Kindern mit einer Stottersymptomatik geraten, das mehrsprachige Angebot zu reduzieren oder gänzlich auf eine Sprache zu verzichten, um das Stottern zu kurieren (Lattermann 2010). Gleichzeitig soll Fremdsprachlernen im Jugend- und Erwachsenenalter zu einer Reduzierung der Stottersymptomatik in der neu erlernten Sprache oder dazu führen, dass Stottern in dieser gar nicht mehr auftritt. Die weltweite Prävalenz für Stottern liegt bei einem Prozent. Stottern wurde bisher aus verschiedensten Kulturen und Gesellschaften berichtet, wobei die typischen Kernsymptome in Form von Wiederholungen, Dehnungen und Blockierungen bisher in jeder Sprache beschrieben wurden, von denen Aufzeichnungen existieren. Stottern tritt stärker in der schwächeren, weniger gut erworbenen Sprache auf. Dies ist für den DaZ-Erwerb bedeutsam, da vermutet wird, dass in der schwächeren Sprache eventuell noch nicht die sprachlichen Ausweichmöglichkeiten und Strategien zur Verfügung stehen, um das Stottern zu umgehen (Überblick in Zang 2014). Oft können Code-Switching und Verzögerungen in der Wortfindung nicht klar von Stottersymptomen abgegrenzt werden. Hier bedarf es einer Fachkraft, die in der Lage ist, über eine ausführliche Diagnostik typische Sprechunflüssigkeiten von Stottern abzugrenzen (Zang 2014). Innerhalb des multifaktoriellen Bedingungsgefüges werden genetische oder hirnorganische Dispositionen als ursächlich diskutiert. Daneben sind es individuelle auslösende und aufrechterhaltende Faktoren, die zu einer anhaltenden Stottersymptomatik beitragen. Kulturelle Sichtweisen und der gesellschaftliche Umgang mit Stottern beeinflussen die Störung. Auch gilt es im DaZ-Kontext der Vorstellung entgegenzuwirken, dass sich mit fortschreitendem L2Erwerb das Stottern von selbst verflüchtigt. Frühzeitige interdisziplinäre Diagnostik und Intervention sind bei jedem Verdacht auf Redeflussstörung bei Kindern/Jugendlichen, die DaZ lernen, angezeigt.

6.2 Selektiver Mutismus und Deutsch als Zweitsprache Von selektivem Mutismus sollen deutlich mehr mehrsprachige als einsprachige Kinder betroffen sein (u. a. Dummit et al. 1997). Dieses Bild wird durch Elizur & Perednik (2003) gestützt, die nachweisen, dass Kinder „mit Migrationshintergrund“ deutlich stärkere soziale Ängste aufweisen als die Vergleichsgruppe der Kinder „ohne Migrationshintergund“. Migration soll hier in Kombination mit einer Prädisposition für

90

Solveig Chilla

soziale Ängstlichkeit ursächlich für selektiven Mutismus sein. Starke (2016) zeigt dagegen in einer systematischen Vergleichsstudie mit 18 schweigenden Kindern, dass es nicht die Mehrsprachigkeit an sich ist, welche selektiven Mutismus verursacht. Vielmehr sind es die Faktoren Ängstlichkeit und, bei Kita-Kindern, zusätzlich der sozioökonomische Status, die selektivem Mutismus begünstigen können. Für den DaZ-Erwerb und die Diagnostik ist relevant, dass Schüchternheit als wesentliches Merkmal von Kindern mit selektivem Mutismus ein Risikofaktor im L2Erwerb ist. Da schüchterne Kinder in der Institution und damit dem prädominanten DaZ-Lernort seltener sprechen und eigenaktiv Kommunikationssituationen initiieren (Asendorpf & Meier 1993), zeigen Studien einen deutlichen negativen Zusammenhang zwischen Schüchternheit und Fähigkeiten in der L2 (u. a. Keller, Troesch & Grob 2013). Im diagnostischen Prozess sind folglich individuelle sozial-emotionale Faktoren, motivationale Aspekte des DaZ-Erwerbs, die Gestaltung und Begleitung von Übergängen (Elternhaus/Kita; Kita/Schule) und die individuelle soziale Eingebundenheit mit zu bedenken, da die institutionellen Bedingungen ursächlich für die Entwicklung und Manifestation des Schweigens sein können (Starke 2016).

7 Zusammenfassung Zusammenfassend lässt sich feststellen, dass die Differenzierung von Spracherwerbsstörungen, Spracherwerbsverzögerungen und Sprechstörungen im Deutschen als L2 nach wie vor an Modellen des monolingualen Erwerbs und seinen Störungen orientiert ist. Eine Vielzahl an Forschungsprojekten beschäftigt sich mit der Frage, welche Voraussetzungen gegeben sein müssen, um das diagnostische Dilemma sich überschneidender sprachlicher Auffälligkeiten zwischen Spracherwerbsstörungen und typischem DaZ-Erwerb zu lösen. Das diagnostische Vorgehen wird erleichtert, wenn zunächst für jeden Einzelfall reflektiert wird, ob sprachspezifische und/oder sprachunspezifische Erwerbsaspekte überprüft werden sollen und welches Modell/ Verständnis von DaZ-Erwerb und Spracherwerbsstörungen dem Vorgehen zugrunde liegt. Im diagnostischen Prozess sollte dann geklärt werden, welche Ziele mit der Diagnostik verfolgt werden (Verifizierung der Diagnose (U)SES; Förderplanung; Therapieplanung), ob eine Erhebung von DaZ- und Erstsprachfähigkeiten sprachwissenschaftlich und sprachpädagogisch fundiert möglich ist und welche praktikablen Verfahren zur Verfügung stehen. Die Ergebnisse des hier vorgeschlagenen systematischen Vorgehens sollten anschließend unter Berücksichtigung aktueller Forschungsergebnisse vorsichtig im Hinblick auf bildungsbiografische Entscheidungen interpretiert werden. Eine auf den Ergebnissen des diagnostischen Prozesses basierende Intervention sollte von jeweils spezifisch ausgebildeten Professionen (Sprachförderkräfte vs. Sprachtherapeut*innen; Lehrkräfte an der Allgemeinen Schule vs. Sonderpädagog*innen mit dem Förderschwerpunkt Sprache) durchgeführt werden. Risikofakto-

Spracherwerbsverzögerung – Spracherwerbsstörung

91

ren für einen erfolgreichen Spracherwerb sind Familiendynamik, Interaktion des Kindes mit den Eltern, Familienberatung, unmittelbares soziales Umfeld und die Förderung und Unterstützung des Kindes in seinen ersten Lebensjahren (Gurgel et al. 2014). Pädagogische Fachkräfte sind angehalten, die (un-)günstigen DaZ-Erwerbsbedingungen genauso zu reflektieren wie eigene Selbstwirksamkeitsvorstellungen für den Sprachenerwerb eines Kindes. Dies sollte in eine konsequent mehrsprachige Förderung der sprachlichen Bildung münden (Chilla & Niebuhr-Siebert 2017; Panagiotopoulou 2016). Elterntrainings und Coachings der pädagogischen Fachkräfte zum zweitspracherwerbsunterstützenden Verhalten für diejenigen Kinder und Jugendlichen, deren DaZ-Erwerb z. B. durch ungünstige Inputbedingungen bedroht scheint, sind wichtig, da der DaZ-Erwerb spezifische Besonderheiten, aber auch eine deutliche Varianz zeigt (vgl. Abschnitt 2 und 3 in diesem Beitrag). In der therapeutischen oder schulischen Intervention bei bereits festgestellten Sprech- und Sprachstörungen ist zu unterscheiden, ob unzureichender sprachlicher Input ursächlich für die Abweichungen ist oder ob beispielsweise eine genuine USES vermutet wird. In beiden Fällen ist zentral, es einem Kind oder Jugendlichen (mit Spracherwerbsstörungen) zu ermöglichen, das individuelle Kommunikationspotential zu erreichen. Bei ungünstigen Erwerbsbedingungen sollten verstärkt Anstrengungen unternommen werden indirekt auf den Spracherwerb einzuwirken, um diesen über die Eltern, die Lehrkräfte, Peers oder Partner*innen in der (sprachlichen) Gemeinschaft positiv zu beeinflussen. Methoden können u. a. die Manipulation des sprachlichen Angebots oder der Sprachumgebung (z. B. im Rahmen von Individualtherapie oder als Elterntraining/Schulung von pädagogischen Fachkräften im Hinblick auf Optimierung der sprachlichen Interaktionsmuster) sein. In Kombination mit direkter Intervention sollten generelle Empfehlungen zur Intervention bei bilingualen Kindern, etwa die Therapie in beiden Sprachen, berücksichtigt werden.

Literatur American Psychiatric Association (2013): Diagnostic an statistical manual of mental disorders (5. Aufl.). Arlington: American Psychiatric Publication Inc. Armon-Lotem, Sharon, Jan de Jong & Natalia Meir (Hrsg.) (2015): Assessing multilingual children: disentangling bilingualism from Language Impairment. Bristol u. a.: Multilingual Matters. Armon-Lotem, Sharon & Odelya Ohana (2016): CDI study of bilingual English-Hebrew children – frequency of exposure as a major source of variation. International Journal of Bilingual Education and Bilingualism, 1–7. Asendorpf, Jens B. & Gerd H. Meier (1993): Personality effects on children’s speech in everyday life: sociability-mediated exposure and shyness-mediated reactivity to social situation. Journal of the American Academy of Child & Adolescent Psychiatry 41, 938–946. Baker, Wendy, & Pavel Trofimovich (2008): Lexical and segmental influences on child and adult learners’ production of second language vowels. Concordia Working Papers in Applied Linguistics 1, 30–54. Barlow, Jessica A. (2014): Age of acquisition and allophony in Spanish-English bilinguals. Frontiers in Psychology 5, 1–14.

92

Solveig Chilla

Beitchman, Joseph & Elizabeth Brownlie (2010): Language Development and its Impact on Children’s Psychosocial and Emotional Development. Encyclopedia on Early Childhood Development − Language Development and Literacy. http://www.child-encyclopedia.com/sites/default/files/textes-experts/en/622/languagedevelopment-and-its-impact-on-childrens-psychosocial-and-emotional-development.pdf (22. 10. 2016). Chilla, Solveig (2008): Erstsprache, Zweitsprache, Spezifische Sprachentwicklungsstörung? Eine Untersuchung des Erwerbs der deutschen Hauptsatzstruktur durch sukzessiv-bilinguale Kinder mit türkischer Erstsprache. Hamburg: Dr. Kovac. Chilla, Solveig (2014): Behinderung des mehrsprachigen Erwerbs. In Solveig Chilla & Stefanie Haberzettl (Hrsg.), Handbuch Mehrsprachigkeit, 151–156. München: Elsevier. Chilla, Solveig (2015): Sprachbehindertenpädagogische Intervention bei mehrsprachigen Kindern und Jugendlichen. Praxis Sprache 2, 95–101. Chilla, Solveig & Matthias Bonnesen (2011): A cross-linguistic perspective on child SLA: The acquisition of questions in German and French. Linguistische Berichte 228, 413–442. Chilla, Solveig & Stefanie Haberzettl (Hrsg.), Handbuch Mehrsprachigkeit. München: Elsevier. Chilla, Solveig & Cornelia Hamann (2018): Mehrsprachigkeit und Umschriebene Sprachentwicklungsstörungen (USES): Methoden der Diagnostik in der Zweitsprache Deutsch. In: Sprache-Stimme-Gehör 42 (2), 78–81. Chilla, Solveig, Stefanie Haberzettl & Nadja Wulff (2013): Dummy Auxiliaries in First and Second Language Acquisition in German. In: Elma Blom, Ineke van de Craats, Josje Verhagen (Hrsg.), Dummy Auxiliaries in First and Second Language Acquisition, 209–250. Boston, Berlin: DeGruyter. Chilla, Solveig, Johannes Hennies & Kristin Hofmann (2017): Die Sprachentwicklung und Sprachförderung hörender Kinder gehörloser Eltern − Aktuelle Fragen an die Forschung. LOGOS interdisziplinär 25 (2), 181–189. Chilla, Solveig & Sandra Niebuhr-Siebert (2017): Mehrsprachigkeit in der KiTa. GrundlagenKonzepte-Bildung. Ein Lehrbuch. Stuttgart: Kohlhammer. Chilla, Solveig, Monika Rothweiler & Ezel Babur (2013): Kindliche Mehrsprachigkeit. Grundlagen − Störungen − Diagnostik (2. Aufl.). München: Reinhardt. Chilla, Solveig & Hilal Şan (2017): Möglichkeiten und Grenzen der Diagnostik erstsprachlicher Fähigkeiten: Türkisch- deutsche und türkisch-französische Kinder im Vergleich. In Cemal Yildiz, Christoph Schroeder, Natalia Gagarina, Insa Gülzow, Natalie Topaj, Reyhan Thomas (Hrsg.): Sprachen 2016. Russisch und Türkisch im Fokus, 175–205. Berlin: Peter Lang. Clahsen, Harald (1988): Normale und gestörte Kindersprache: linguistische Untersuchungen zum Erwerb von Syntax und Morphologie. Amsterdam: John Benjamins. Clahsen, Harald, Monika Rothweiler, Franziska Sterner & Solveig Chilla (2014): Linguistic markers of Specific Language Impairment in bilingual children: The case of verb morphology. Clinical Linguistics & Phonetics 28, 709–721. Colombo-Scheffold, Simona, Peter Fenn, Stefan Jeuk & Joachim Schäfer (2008): Ausländisch für Deutsche: Sprachen der Kinder − Sprachen im Klassenzimmer. Freiburg im Breisgau: Fillibach. Conboy, Barbara (2013): Neuroscience Research: How Experience with One or More Languages Affects the Developing Brain. In State Advisory Council on Early Learning and Care (Hrsg.), California’s Best Practices for Young Dual Language Learners. Research Overview Papers. Sacramento: California Department of Education. 150. Coninx Frans (2005): Konstruktion und Normierung des Adaptiven Auditiven Sprach-Test (AAST). DGPP 2005. http://www.egms.de/en/meetings/dgpp2005/05dgpp045.shtml# (22. 10. 2016). Conti-Ramsden, Gina, Nicola Botting & Brian Faragher (2001): Psycholinguistic Markers for Specific Language Impairment (SLI). Journal of Child Psychology and Psychiatry 42 (6), 741– 748.

Spracherwerbsverzögerung – Spracherwerbsstörung

93

Cummins, Jim (1991): Conversational and academic language proficiency in bilingual contexts. In Jan H. Hulstijn & Jan F. Matter (Hrsg.) Reading in Two Languages. 75–89. AILA-Review 8/91. Dehnert Knut, Ulla Raab, Carmelo Perez-Alvarez, Thomas Steffens, Gabriele Bolte, Hermann Fromme & Dorothee Twardella (2015): Total leisure noise exposure and ist association with hearing loss among adolescents. International Journal of Audiology 54(10), 665–673. Diehm, Isabell & Argyro Panagiotopoulou (2011): Bildungsbedingungen in europäischen Migrationsgesellschaften. Ergebnisse qualitativer Studien in Vor- und Grundschule. Wiesbaden: VS Verlag für Sozialwissenschaften. Dimroth, Christine (2008): Age effects on the process of L2 acquisition? Evidence from the acquisition of negation and finiteness in L2 German. Language Learning 58, 117–150. Duarte, Joana, Ingrid Gogolin, Thorsten Klinger & Birger Schnoor (2014): Mehrsprachige Kompetenzen in Abhängigkeit von familialen Sprachpraxen. Zeitschrift für Literaturwissenschaft und Linguistik (LiLi) 44 (174), 66–85. Dummit, Steve, Rachel G. Klein, Nancy K. Tancer, Barbara Asche, Jaqueline Martin & Janet A. Fairbanks (1997): Systematic assessment of 50 children with selective mutism. J Am Acad Child Adolesc Psychiatry 36 (5), 653–660. Elizur, Yoel & Ruth Perednik (2003): Prevalence and description of selective mutism in immigrant and native families: a controlled study. Journal of American Academic Child and Adolescent Psychiatry 42, 1451–1459. Fox Annette (2005): Kindliche Aussprachestörungen: Phonologische Entwicklung, Differentialdiagnostik, Therapie. Idstein: Schulz-Kirchner. Fox-Boyer, Annette & Katrin Salgert (2014): Erwerb und Störungen der Aussprache bei mehrsprachigen Kindern. In Solveig Chilla & Stefanie Haberzettl (Hrsg.), Handbuch Mehrsprachigkeit, 109–120. München: Elsevier. Füssenich, Iris (2012): Entwicklungsbedingte Sprachstörungen. In Braun, Otto, Ulrike Lüdtke (Hrsg.): Sprache und Kommunikation. Enzyklopädisches Handbuch der Behindertenpädagogik, Band 8, 331–337. Stuttgart: Kohlhammer. Friedmann Na´ama, Maya Yachini & Ronit Szterman (2015): Relatively easy relatives. In Elisa Di Domenico, Cornelia Hamann & Simona Matteini (Hrsg.) Structures, Strategies and Beyond. 303–320. Amsterdam: Johan Benjamins. Gagarina, Natalia (2014): Diagnostik von Erstsprachkompetenzen im Migrationskontext. In Solveig Chilla & Stefanie Haberzettl (Hrsg.), Handbuch Mehrsprachigkeit, 73–83. München: Elsevier. Gagarina, Natalia, Daleen Klop, Sari Kunnari, Koula Tantele, Taina Välimaa, Ingrida Balčiūnienė, Ute Bohnacker & Joel Walters (2015): Assessment of narrative abilities in bilingual children. In Sharon Armon-Lotem, Jan de Jong & Natalia Meir (Hrsg.), Assessing Multilingual Children. Disentangling Bilingualism from Language Impairment, 243–276. Bristol: Multilingual Matters. Genesee, Fred, Johanne Paradis & Martha Crago (2004): Dual language development and disorders: A handbook on bilingualism and second language learning. Baltimore: Brookes. Goldberg, Heather, Johanne Paradis & Martha Crago (2008): Lexical acquisition over time in minority first language children learning English as a second language. Applied Psycholinguistics 29 (1), 4–65. Gollan, Tamar H., Rosa I. Montoya, Cynthia Cera, Tiffany C. Sandoval (2008): More use almost always means a smaller frequency effect: aging, bilingualism, and the weaker links hypothesis. Journal of Memory and Language 58, 787–814. Grimm, Angela & Julia Hübner (2017): Nonword repetition by bilingual learners of German. The role of language-specific complexity. In Christophe dos Santos & Laetizia de Almeida (Hrsg.), Bilingualism and Specific Language Impairment. Amsterdam: Benjamins (erscheint). Gurgel, Léia Gonçalves, Deisi Cristina Gollo Marques Vidor, Maria Cristina Rodrigues Azevedo Joly & Caroline Tozzi Reppold (2014): Risk factors for proper oral language development in children: a systematic literature review. CoDAS 26 (5), 350–356.

94

Solveig Chilla

Haberzettl, Stefanie (2003): ‘Tinkering’ with chunks: Form-oriented strategies and idiosyncratic utterance patterns without functional implications in the IL of Turkish speaking children learning German. In Christine Dimroth & Marianne Starren (Hrsg.), Information structure, linguistic structure and the dynamics of language acquisition, 45–63. Amsterdam, Philadelphia: Benjamins. Håkansson Gisela & Ulrika Nettelbladt (1996): Similarities between SLI and L2 children. Evidence from the acquisition of Swedish word order. In John Gilbert J & Caroline Johnson (Hrsg.), Children’s Language Vol 9. 135–151. Mahwah, NJ: Lawrence Erlbaum. Hacker, Detlef (2002): Phonologie. In Stephan Baumgartner & Iris Füssenich (Hrsg.): Sprachtherapie mit Kindern. 5. Aufl., 13–62. München, Basel: UTB. Haman, Ewa, Magdalena Łuniewska & Barbara Pomiechowska (2015): Designing cross-linguistic lexical tasks (CLTs) for bilingual preschool children. In Sharon Armon-Lotem, Jan de Jong & Natalia Meir (Hrsg.): Assessing Multilingual Children Disentangling Bilingualism from Language Impairment, 196–242. Bristol: Multilingual Matters. Hamann, Cornelia (2012): Bilingual Development and Language Assessment. In Alia Biller, Esther Chung & Amelia Kimball (Hrsg), Proceedings of the 36th Annual Boston University Conference on Language Development, 1–28. Somerville: Cascadilla Press. Hamann, Cornelia (2015): Language Impairment in German Children. In Stavroula Stavrakaki (Hrsg.), Specific Language Impairment. Current Trends in Research, 215–252. Amsterdam: Benjamins. Hamann, Cornelia, Solveig Chilla, Natalia Gagarina & Lina Abed Ibrahim (2017): Syntactic Complexity and Bilingualism: How (a)typical bilinguals deal with complex structures. In Elisa Di Domenico (Hrsg.), Complexity in acquisition, 142–178. Cambridge: Cambridge Scholars Publishing. Hamann, Cornelia, Solveig Chilla & Monika Rothweiler (2010): PaBiQ-Questionnaire, deutsche Version, online verfügbar unter: www.bi-sli.org. Hamann, Cornelia, Solveig Chilla, Monika Rothweiler, Laurie Tuller, Philippe Prévost, Sandrine Ferré & Christophe Dos Santos (2013–2016): Bilinguale Sprachentwicklung (BiLaD): Kinder mit typischer Sprachentwicklung und Kinder mit einer Sprachentwicklungsstörung (DFG/ANR-Projekt). Hamann, Cornelia, Solveig Chilla, Esther Ruigendijk & Lina Abed Ibrahim (2013): A German sentence repetition task: Testing bilingual Russian/German children. Poster presented at the COST meeting in Krakow, May 2013. Hambly, Catherine & Eric Fombonne (2011): The impact of bilingual environments on language development in children with autism spectrum disorders. J Autism Dev Disord 42 (7), 1342– 1352. Hambly, Helen, Yvonne Wren, Sharynne McLeod & Sue Roulstone (2013): The influence of bilingualism on speech production: A systematic review. International Journal of Language and Communication Disorders 48 (1), 1–24. Hammer, Svenja, Carol Scheffner, Erika Hoff, Yuuko Uchikoshi, Cristina Gillanders, Dina C. Castro & Lia E. Sandilos (2014): The language and literacy development of young dual language learners: A critical review. Early Child Res Q 29 (4), 715–733. Heppt, Birgit, Petra Stanat, Nina Dragon, Karin Berendes & Sabine Weinert (2014): Bildungssprachliche Anforderungen und Hörverstehen bei Kindern mit deutscher und nichtdeutscher Familiensprache. Zeitschrift für Pädagogische Psychologie 28 (3), 139–149. Holler-Zittlau, Inge, Winfried Dux & Roswitha Berger (2004): Evaluation der Sprachentwicklung 4- bis 4,5-jähriger Kinder in Hessen. Wiesbaden: Hessisches Sozialministerium. Houwer, Annick de (2009): Bilingual First Language Acquisition. Bristol: Multilingual Matters. Kannengieser, Simone (2009): Sprachentwicklungsstörungen: Grundlagen, Diagnostik und Therapie. München: Elsevier, Urban & Fischer.

Spracherwerbsverzögerung – Spracherwerbsstörung

95

Keller, Karin, Larissa M. Troesch & Alexander Grob (2013): Shyness as a risk factor for second language acquisition of immigrant preschoolers. Journal of Applied Developmental Psychology 34 (6), 328–335. Klassert, Annegret & Christina Kauschke (2014): Semantisch-lexikalische Entwicklungsstörungen bei mehrsprachigen Kindern. In Solveig Chilla & Stefanie Haberzettl (Hrsg.), Handbuch Mehrsprachigkeit, 121–134. München: Elsevier. Kostyuk, Natalia (2005): Der Zweitspracherwerb beim Kind: Eine Studie am Beispiel des Erwerbs des Deutschen durch drei russischsprachige Kinder. Hamburg: Kovac. Krassowski, Elaine & Elena Plante (1997): IQ variability in children with SLI: Implications for use of cognitive referencing in determining SLI. Journal of Communication Disorders 30 (1), 1–9. Lattermann, Christina (2010): Das Lidcombe-Programm zur Behandlung frühkindlichen Stotterns. Neuss: Natke. Leonard, Laurence (2014): Children with specific language impairment (2. Aufl.). Cambridge, MA: MIT Press. Lindner Karin, Julia Held, Julia Lomako & Natalia Gagarina (2014): Verbale und nonverbale Indikatoren zur Identifizierung von umschriebenen Sprachentwicklungsstörungen bei sukzessiv bilingualen Kindergartenkindern. Forschung Sprache 2, 58–68. Marinis, Theo & Sharon Armon‐Lotem (2015): Sentence repetition. In Sharon Armon- Lotem, Sharon, Jan de Jong & Natalia Meir (Hrsg.), Assessing multilingual children: disentangling bilingualism from Specific Language Impairment, 95–124. Bristol u. a.: Multilingual Matters. McLeod, Sharynne & Brian Goldstein (2012): Multilingual aspects of speech sound disorders in children. Bristol: Multilingual Matters. Meisel, Jürgen M. (2009): Second language acquisition in childhood. Zeitschrift für Sprachwissenschaft 28, 5–34. Montanari, Elke (2010) Kindliche Mehrsprachigkeit: Determination und Genus. Dissertation. Münster: Waxmann. Neumann, Katrin, Harald Euler, Hans-Georg Bosshardt, Susanne Cook, Patricia Sandrieser, Peter Schneider, Martin Sommer, Georg Thum (2016): Pathogenese, Diagnostik und Behandlung von Redeflussstörungen. Evidenz- und konsensbasierte S3-Leitlinie. AWMF-Registernummer 049–013. Version 1. 2016; http://www.awmf.org/leitlinien/detail/ll/049-013.html. (01. 09. 2016). *im Auftrag der Leitliniengruppe. Ostad, Joanne (2014): Mehrsprachigkeit im Kontext von primären Störungsbildern. In Solveig Chilla & Stefanie Haberzettl (Hrsg.), Handbuch Mehrsprachigkeit, 85–96. München: Elsevier. Panagiotopoulou, Argyro (2016): Mehrsprachigkeit in der Kindheit: Perspektiven für die frühpädagogische Praxis. WiFF-Expertise. Deutsches Jugendinstitut. Paradis, Johanne (2008): Tense as a clinical marker in English L2 acquisition with language delay/impairment. In Belma Haznedar & Elena Gavruseva (Hrsg.), Current Trends in Child Second Language Acquisition: A Generative Perspective. Amsterdam: Benjamins, 337–356. Paradis, Johanne (2010): The interface between bilingual development and specific language impairment. Applied Psycholinguistics 31 (3), 227–252. Prévost Philippe, Laurie Tuller, Maurie Scheidnes, Sandrine Ferré S & Martin Haiden (2010): Computational complexity effects in the acquisition of wh-questions in child L2 French. In Laura Dominguez & Pedro Guijarres-Fuentes (Hrsg.) New directions in language acquisition: Romance languages in the generative perspective, 415–443. Newcastle: Cambridge Scholar Publishing. Reich, Hans-H. & Hans-J. Roth (2004): Hamburger Verfahren zur Analyse des Sprachstands Fünfjähriger − HAVAS 5. Landesinstitut für Lehrerbildung und Schulentwicklung Hamburg. Rinker, Tanja, Nadine Budde-Spenger & Steffi Sachse (2016): The relationship between L1 and L2 lexical development in young Turkish-German children. Special issue: Risk and Protective Factors for Early Bilingual Language Acquisition, International Journal of Bilingual Education and Bilingualism, 1–16.

96

Solveig Chilla

Ruberg, Tobias (2013): Der Genuserwerb ein- und mehrsprachiger Kinder. Hamburg: Dr. Kovac. Schöler, Hermann & Monika Brunner (2008): HASE Heidelberger Auditives Screening in der Einschulungsuntersuchung (2. über. Aufl.). Göttingen: Hogrefe. Schöler, Hermann, Werner Fromm & Werner Kany (Hrsg.). (1998): Spezifische Sprachentwicklungsstörung und Sprachlernen. Erscheinungsformen, Verlauf, Folgerungen für Diagnostik und Therapie. Heidelberg: Edition Schindele im Universitätsverlag C. Winter. Schönenberger Martina, Franziska Sterner & Monika Rothweiler (2013): The Acquisition of Case in Child L1 and Child L2 German. In Stavoroula Stavrakaki, Marina Lalioti, Polyxeni Konstantinopoulou (Hrsg.) Advances in Language Acquisition, 191–199. Cambridge: Cambridge Scholars Publishing. Schulz, Petra & Rosemarie Tracy (2011): Linguistische Sprachstanderhebung – Deutsch als Zweitsprache (LiSe-Daz). Göttingen. Snowling, Margaret, Dorothy V. M. Bishop & S. E. Stothard (2000): Is preschool language impairment a risk factor for dyslexia in adolscence? Journal of Child Psychology and Psychiatry 41, 587–600. Starke, Anja (2016): Selektiver Mutismus bei merhsprachigen Kindern- Welchen Einfluss haben Deutschkompetenzen, Ängstlichkeit und kulturelle Unterschiede auf die Entwicklung des Schweigens? In Ulrich Stitzinger, Stefan Sallat & Ulrike Lüdtke (Hrsg.): Sprache und Inklusion als Chance?!, 355–361. Idstein-Schulz-Kirchner. Thordardottir, Elin (2015): Proposed Diagnostic Procedures for Use in Bilingual and CrossLinguistic Context. In Sharon Armon-Lotem, Jan de Jong, Jan & Natalia Meir (Hrsg.): Assessing Multilingual Children. Disentangling Bilingual from Language Impairment, 331–358. Bristol: Multilingual Matters. Tollkühn, Steffi (2001): Die sprachlichen Fähigkeiten von Erstklässlern. Eine Untersuchung an den Grund- und Förderschulen im Freistaat Sachsen. Universität Leipzig: Dissertation. Tracy Rosemarie & Dieter Thoma (2009): Convergence on finite V2 clauses in L1, bilingual L1 and early L2 acquisition. In Peter Jordens & Christine Dimroth (Hrsg.) Functional categories in learner language. 1–43. Berlin: De Gruyter, Berlin. Tuller, Laurie (2015): Clinical Use of Parental Questionnaires in Multilingual Contexts. In Sharon Armon-Lotem, Jan de Jong & Natalia Meir (Hrsg.): Assessing Multilingual Children. Disentangling Bilingual from Language Impairment. 301–330. Bristol: Multilingual Matters. Tuller, Laurie, Cornelia Hamann, Solveig Chilla, Sandrine Ferré, Eleonore Morin, Philippe Prevost, Christophe dos Santos, Lina Abed Ibrahim & Racha Zebib (2018): Identifying language impairment in bilingual children in France and Germany. International Journal of Language and Communication Disorders, online preview, 1–17. Wegener, Heide (1992): Kindlicher Zweitspracherwerb. Untersuchungen zur Morphologie des Deutschen und ihrem Erwerb durch Kinder mit polnischer, russischer und türkischer Erstsprache. Eine Längsschnittuntersuchung. Habilitationsschrift, Universität Augsburg. Weinrich Martine & Heidrun Zehner (2008): Phonetische und phonologische Störungen. 3. Aufl. Heidelberg: Springer. Zang, Jana (2014): Mehrsprachige Stottertherapie. In Solveig Chilla & Stefanie Haberzettl (Hrsg.), Handbuch Mehrsprachigkeit, 195–203. München: Elsevier. Zurer-Pearson, Barbara. (2010): We can no longer afford a monolingual norm. Commentary. Applied Psycholinguistics, 31, 339–343.

Nazan Gültekin-Karakoç

5 Sprachdiagnostische Grundverfahren 1 2 3

Einleitung Sprachdiagnostische Grundverfahren Schluss

1 Einleitung Das Thema Sprachdiagnostik ist nach der Veröffentlichung der Ergebnisse der Schulleistungsstudie PISA (Programme for International Student Assessment, Baumert et al. 2003) im Jahr 2000 im politischen wie auch wissenschaftlichen Kontext verstärkt in den Fokus gerückt. Die PISA-Ergebnisse und weitere Befunde aus Schulleistungsstudien wie IGLU (Internationale Grundschul-Lese-Untersuchung, Bos et al. 2004) sowie darauffolgender Untersuchungen zeigen […] deutliche Nachteile von Kindern und Jugendlichen mit Zuwanderungshintergrund in den sprachlichen Voraussetzungen und zugleich einen engen Zusammenhang zwischen Sprachkompetenz und der Rückstellung von der Einschulung sowie der fachlichen schulischen Leistung. (Kempert et al. 2016: 157; vgl. auch Rauch, Schastak & Richter 2016)

Die „Nach-PISA-Phase“ führte nicht nur im schulischen, sondern vor allem im vorschulischen Bereich zu weitreichenden Veränderungen. In den Bundesländern wurden unterschiedlichste Sprachfördermaßnahmen im Elementarbereich implementiert, mit dem Ziel, frühzeitig, also noch vor Schulbeginn, die Kompetenzen der Kinder mit Migrationshintergrund in der Zweitsprache Deutsch zu fördern. Um vor der Zuweisung zu oder im Rahmen von Sprachfördermaßnahmen die zweitsprachliche Entwicklung der Kinder dokumentieren zu können, wurden verpflichtend Sprachstandsdiagnoseverfahren eingeführt. Dies führte nach dem Jahr 2000 vor allem im Elementarbereich zur Entwicklung vieler neuer Sprachstandsdiagnoseverfahren (vgl. hierzu auch Reich 2005). Auf Grundlage der Ergebnisse der eingesetzten Sprachstandsdiagnoseverfahren kann zum einen über eine Zuweisung zu Sprachfördermaßnahmen entschieden werden (Selektionsdiagnostik), zum anderen können die Ergebnisse der Identifizierung von Sprachbereichen dienen, die einer Förderung bedürfen (Förderdiagnostik) (vgl. Breitenbach 2014; Lengyel 2013). Darüber hinaus sind die Erhebung des Sprachstandes und die Beschreibung der sprachlichen Entwicklung einer bestimmten Teilpopulation auch mit wissenschaftlichen Anliegen verbunden. Einen Überblick über die Vielfalt an Verfahren, die in Deutschland an verschiedenen Stellen in der Bildungsbiografie eingesetzt werden, geben u. a. Fried (2004), Lisker (2010), Redder et al. (2011), Lengyel (2012), Schneider et al. (2012), Döll (2012), Döll (2013) und Neugebauer & Becker-Mrotzek (2013). Im Elementarbereich liegt die https://doi.org/10.1515/9783110418712-005

98

Nazan Gültekin-Karakoç

Zahl der Verfahren nach einer Analyse des Mercator-Instituts (2013) bei 21 unterschiedlichen Verfahren.1 Neben der Heterogenität der verschiedenen Verfahren ist ihnen allen gemein, dass sie den Sprachstand bzw. die Zweitsprachentwicklung zu einem oder auch mehreren Zeitpunkten erheben. Sprachstand definiert Ehlich (2007: 25, Herv. i. O.; vgl. auch Reich & Roth 2007: 72; Reich 2014: 421) als […] eine eigenaktiv aufgebaute Varietät zum Erhebungszeitpunkt t0 . Diese Varietät besteht einerseits aus zum Erhebungszeitpunkt sicheren, festen (korrekten oder nicht korrekten) Strukturen, andererseits aus spezifischen (korrekten/nicht korrekten) Strategien zur Gewinnung neuen Wissens. Strukturen und Strategien (interaktive, kognitive und native) beziehen sich auf verschiedene sprachliche Teilqualifikationen. Diese sind nicht unabhängig voneinander, sie werden aneinander entwickelt und können zu den unterschiedlichen Zeitpunkten Gegenstand von Umbauprozessen werden (U-Kurven-Effekt).

Um zuverlässige Aussagen über den Sprachstand erhalten zu können, wird die Einhaltung psychometrischer Standards gefordert (Melzer, Rißling & Petermann 2015: 58). Diese Forderung stößt jedoch, gerade im Bereich Deutsch als Zweitsprache, an Grenzen, da beispielsweise die Frage der Normierung im DaZ-Bereich sehr komplex ist (vgl. Abschnitt 2.1 in diesem Beitrag). Kritisiert wird diesbezüglich, dass bei vielen Verfahren eine ausreichende empirische Überprüfung bzw. Angaben hierzu von Seiten der Testentwickler fehlen (Neugebauer & Becker-Mrotzek 2013: 41; Fried 2004). Der Begriff der Diagnostik bezeichnet die Feststellung von empirisch zugänglichen Merkmalen bzw. Merkmalsausprägungen einer Person oder einer Gruppe. Dabei ist es das Ziel der Diagnostik, eine Diagnose zu stellen, auf der nachfolgende Entscheidungen aufbauen (vgl. Jürgens & Lissmann 2015: 58–60). Bezogen auf den hier vorliegenden Kontext fokussiert Sprachdiagnostik […] den gesamten Prozess und alle Tätigkeiten […], mit dem Daten zum Sprachstand von Kindern sowie weiterführende Informationen gesammelt, erhoben, analysiert, bewertet, in Beziehung gesetzt und interpretiert werden. (Lengyel 2012: 8)

Entscheidend ist im Falle eines förderdiagnostischen Zusammenhangs der obigen Definition folgend, ob sich „aus der durchgeführten Sprachstandsdiagnostik bei entsprechendem Bedarf auch eine angemessene Förderung ergibt und diese Erfolge zeitigen kann“ (Böhme & Hoffmann 2014: 36; vgl. auch Jeuk 2009: 155; Kempert et al. 2016). Während mit einer Förderdiagnostik das Ziel verfolgt wird, individuelle Sprachaneignungsprofile prozesshaft zu erfassen und passgenaue Fördermaßnahmen anzuschließen, steht bei einer Selektionsdiagnostik die Ermittlung eines

1 Aufgrund der zahlreichen sprachdiagnostischen Verfahren, die für den Elementarbereich vorliegen, sind angeführte Beispiele überwiegend aus dieser Bildungsetappe entnommen (vgl. hierzu Decker-Ernst in diesem Band).

Sprachdiagnostische Grundverfahren

99

(Sprachförder-)Bedarfs einer Gruppe zu einem bestimmten Zeitpunkt im Vordergrund. Die untersuchte Gruppe wird dann auf Basis einer sozialen Bezugsnorm zu Gruppen zugeteilt (z. B. Zuweisung zur Sprachfördermaßnahmen, Entscheidungen über Schullaufbahn). Die damit verbundenen (teilweise) folgenreichen Entscheidungen müssen deshalb auf Basis von methodisch geprüften, standardisierten Verfahren getroffen werden, die neben spracherwerbstheoretischen Standards messtheoretischen Qualitätskriterien genügen müssen (vgl. Abschnitt 2.1 in diesem Beitrag). An nicht-standardisierte Verfahren werden nicht dieselben strengen Anforderungen gestellt, da diese Verfahren sich nicht an einer Vergleichsnorm, sondern meist an einer kriterialen Norm orientieren (vgl. Abschnitt 2.1 in diesem Beitrag). Hierfür sind Kenntnisse über Sprachentwicklungsverläufe und empirisch belegte Erwerbsequenzen für die Interpretation und Einordnung der erhobenen Daten notwendig (vgl. Jeuk 2014; Döll 2012; Breitenbach 2014; Kany & Schöler 2009). Der vorliegende Beitrag hat zum Ziel, sprachdiagnostische Grundverfahren mit ihren je spezifischen Merkmalen vor- und einander gegenüberzustellen und auf die Unterschiede in den Vorgehensweisen bei der Erhebung und Analyse einzugehen. In Anlehnung an Reich (2003) werden die sprachdiagnostische Grundverfahren Test, Screening, Beobachtung, Profilanalyse und Schätzverfahren, beginnend mit den stark standardisierten hin zu nicht standardisierten Verfahren, dargestellt (vgl. auch Abschnitt IV in diesem Band). Bei der Besprechung der Verfahrenstypen wird u. a. Bezug genommen auf die Gütekriterien, die Normierung, das Alter der Zielgruppe und auf die Unterscheidung Förder- vs. Selektionsdiagnostik.

2 Sprachdiagnostische Grundverfahren Bevor in diesem Abschnitt auf die einzelnen Grundverfahren eingegangen wird, soll exemplarisch anhand der kleinsten Erfassungseinheit eines Verfahrens (also Items), die Heterogenität von sprachdiagnostischen Verfahren auf der Ebene der Itemformulierung, der Bewertungskategorien sowie der Auswertung an einem kurzen Beispiel aufgezeigt werden. Hierzu werden im Folgenden drei Items aus drei verschiedenen sprachdiagnostischen Verfahren (Reich & Roth 2004; Schulz & Tracy 2011; Zimmer 2014) betrachtet, mit denen die Nebensatzstruktur bzw. die Verbendstellung im Nebensatz (Nebensatz mit der Konjunktion weil) erhoben werden kann (vgl. Tab. 1). Der thematische Bezug der Items a) und b) sowie der direkte Hinweis auf „das Kind“ in Item c) zeigen, dass es sich bei der Zielgruppe um (jüngere) Kinder handelt. Es fällt außerdem auf, dass Item c) im Gegensatz zu den ersten beiden Items nicht als Frage, sondern als Aussage formuliert ist. Während also die ersten beiden Items als Frage direkt an das zu untersuchende Kind gerichtet sind, wird im dritten Item von einem Außenstehenden etwas über das Kind festgehalten. Dies hat Einfluss auf die Erhebungssituation, da das untersuchte Kind im Falle von Item a) und b) aktiv

100

Nazan Gültekin-Karakoç

Tab. 1: Beispielhaft ausgewählte Items zur Erhebung der Nebensatzstruktur. Items

Item a) „Warum weint die Katze?“

Item b) „Warum macht der Hund so ein trauriges Gesicht?“

Item c) „Das Kind kann auf WarumFragen antworten […]“.

Tab. 2: Beispielhaft ausgewählte Items zur Erhebung der Nebensatzstruktur mit Bewertungskategorien. Items

Item a) „Warum weint die Katze?“

Item b) „Warum macht der Hund so ein trauriges Gesicht?“

Item c) „Das Kind kann auf WarumFragen antworten […].“

Bewertungskategorien

–

–

– – – –

– – –

keine (inhaltlich passende) Reaktion, einfacher Aussagesatz, einfacher Begründungssatz, mehrere Aussageoder Begründungssätze bzw. kleine Erzählung.

Einwortäußerungen mit einem Verb oder Verbpartikel, – Mehrwortäußerungen mit besetzter Satzklammer, – Hauptsätze mit Verbzweitstellung, Nebensätze mit Verbendstellung.

1 = trifft noch nicht zu 2=2 3=3 4 = trifft voll und ganz zu

handeln muss, während es bei Item c) im besten Fall nicht einmal bemerkt, dass es sich in einer Untersuchungssituation befindet. Um das Verhalten der Kinder in Bezug auf diese Items zu bewerten, wird, abgesehen von der Verwendung einer vierstufigen Skalierung für die Bewertung, unterschiedlich vorgegangen (vgl. Tab. 2). Obwohl mit allen drei Items der gleiche sprachliche Aspekt dokumentiert werden soll, unterscheiden sich die Items nicht nur in der Form (Frage vs. Aussage) und damit verbunden auch in der Erhebungssituation, sondern auch in den Antwortdimensionen. Die Antwortskalen liegen entweder verbalisiert vor, wie in Item a) und b), und/oder in Zahlenformat wie in Item c). Dies liegt u. a. daran, dass die sprachdiagnostischen Verfahren, aus denen die drei Items entnommen sind, entweder eine qualitative oder quantitative Auswertung oder auch beides anvisieren. In Bezug auf die hier präsentierten Items ist für Item a) eine qualitative, für Item b) eine qualitative und quantitative und für Item c) eine quantitative Auswertung vorgesehen. Diese kurze Betrachtung auf der Ebene von Items zeigt bereits deutlich, wie different bei der Erhebung desselben sprachlichen Aspekts vorgegangen wird und auf welche Ebenen dies Einfluss haben kann. Neben den kurz aufgeführten Unterschieden bezüglich der Itemformulierung, der Antwortdimension sowie der Auswer-

Sprachdiagnostische Grundverfahren

101

Tab. 3: Beispielhaft ausgewählte Items zur Erhebung der Nebensatzstruktur mit Bewertungskategorien und Hinweis auf die Auswertung sowie Quellenhinweis auf die Verfahren. Items

Item a) „Warum weint die Katze?“

Item b) „Warum macht der Hund so ein trauriges Gesicht?“

Item c) „Das Kind kann auf Warum-Fragen antworten […]“.

Erhebungsmoment der Items

Das Item wird unter dem Aspekt „Vertiefende Beobachtung“ als Abschlussfrage zur mündlichen Erzählung einer Bildergeschichte gestellt.

Die Elizitierung von Nebensätzen fällt in die Skala Sprachproduktion − Untertest „Satzklammer“.

Die Beobachtung zum Item erfolgt unter dem Sprachbereich „Morphologischsyntaktische Kompetenzen (Wortbildung, Satzbau)“.

Bewertungskategorien

–

–

–

– – –

keine (inhaltlich passende) Reaktion, einfacher Aussagesatz, einfacher Begründungssatz, mehrere Aussageoder Begründungssätze bzw. kleine Erzählung.

–

– –

Einwortäußerungen mit einem Verb oder Verbpartikel, Mehrwortäußerungen mit besetzter Satzklammer, Hauptsätze mit Verbzweitstellung, Nebensätze mit Verbendstellung.

– – –

1 = trifft noch nicht zu 2=2 3=3 4 = trifft voll und ganz zu

Auswertung

Qualitativ

Qualitativ und Quantitativ2

Quantitativ

Verfahren

Profilanalytisches Verfahren HAVAS 5 (Reich & Roth 2004)

Testverfahren LiseDaZ (Schulz & Tracy 2011)

Beobachtungsbogen BaSiK Ü3 (Zimmer 2014)

tung werden weitere Unterschiede deutlich, wenn man die zugrundeliegenden Grundverfahren und die damit verbundenen Vorgehensweisen bei der Erhebung und Analyse näher betrachtet. Auf diese und weitere Aspekte wird nun im Folgenden näher eingegangen.

2.1 Test Rost (2007: 150) definiert einen Test als Untersuchungsverfahren […], mit dem unter möglichst konstanten Bedingungen interindividuell unterschiedliches Verhalten in bestimmten, genau definierten Bereichen möglichst zuver-

2 Zusätzlich liegen für dieses Item kumulierte Prozentangaben vor, die einen Vergleich der Leistung eines Kindes mit einer Vergleichsgruppe ermöglichen (Schulz & Tracy 2011: 124).

102

Nazan Gültekin-Karakoç

lässig und möglichst gültig erfasst und einer möglichst objektiven Auswertung und einheitlichen Interpretation zugänglich gemacht wird.

Für einen guten Test müsste, so Rost (2007: 153), das „möglichst“ in der obigen Definition, mit Verweis auf die klassischen Gütekriterien Objektivität, Reliabilität und Validität, „im hohen Ausmaß verwirklicht“ werden. Das Gütekriterium der Objektivität besagt, dass die Datenerhebung, Datenauswertung und Dateninterpretation unabhängig vom jeweiligen Untersucher sein müssen. Eine zweite Bewertung müsste somit bei derselben Untersuchungsgruppe und unter denselben Erhebungsbedingungen zu denselben (bzw. zu ähnlichen) Ergebnissen kommen. Objektivität kann durch eine Standardisierung der Erhebungssituation, eine Analyse mit festgelegten Auswertungskriterien sowie eine Ergebnisinterpretation, die aus gleichen Ergebnissen auch gleiche Schlüsse zieht, erreicht werden (Döring & Bortz 2016: 442–443; Lienert & Raatz 1998: 8). Das Gütekriterium der Reliabilität betrifft die Zuverlässigkeit oder auch Genauigkeit der Messungen des jeweiligen Merkmals. Bei wiederholter Messung sollte das Messinstrument den gleichen Messwert liefern. Zur Prüfung der Reliabilität können folgende Verfahren verwendet werden, die zur Einschätzung der Reliabilität ein Korrelationsmaß ermitteln: Retest-Reliabilität, Paralleltest-Reliabilität, Split-half-Reliabilität und interne Konsistenz (Döring & Bortz 2016: 442–445). Für den vorliegenden Kontext muss einschränkend angemerkt werden, dass wir Menschen untersuchen, „die sich daran erinnern, dass wir sie ,gemessen‘ haben“ (Brosius, Koschel & Haas 2008: 65). D. h., dass bei einer wiederholten Messung mit Erinnerungseffekten sowie Lern- und Reifungsprozesse zu rechnen ist, die zu einer Über- oder Unterschätzung der Reliabilität führen können (vgl. Raithel 2008: 46; Brosius, Koschel & Haas 2008: 65; Himme 2007: 377; Mummendey & Grau 2008: 102). Die Validität gibt an, „wie gut der Test in der Lage ist, genau das zu messen, was er zu messen vorgibt“ (Bortz & Döring 2006: 200). Als wichtigstes Gütekriterium prüft die Validität also, ob tatsächlich das gemessen wurde, was gemessen werden sollte. Hier spielt insbesondere die Operationalisierung des zu überprüfenden Konstrukts eine wichtige Rolle. Die Validität wird unterteilt in Inhalts-, Kriteriums- und Konstruktvalidität (Döring & Bortz 2016: 445–448). Die drei Hauptgütekriterien stehen in Abhängigkeit zueinander. So ist Objektivität eine Bedingung für Reliabilität, ebenso ist Reliabilität eine Bedingung für die Validität. Der Umkehrschluss ist jedoch nicht zulässig: Wird ein Verfahren als objektiv eingestuft, so bedeutet dies nicht zwangsläufig, dass es auch zuverlässig sein muss. Ebenso wenig kann aus reliablen Ergebnissen einer wiederholten Messung Validität abgeleitet werden. Neben den drei klassischen Gütekriterien existieren sog. Nebengütekriterien, die sich auf die Normierung, Ökonomie, Nützlichkeit, Zumutbarkeit und Fairness beziehen (Döring & Bortz 2016: 449). Bei der Vergleichbarkeit der sprachlichen Leistung spielen statistische (Bezugs-) Normen eine wichtige Rolle, die in soziale, kriteriale und individuelle Normen un-

Sprachdiagnostische Grundverfahren

103

terteilt werden können (Kany & Schöler 2009: 52–59; vgl. auch Rauch, Schastak & Richter 2016: 119–123; Lengyel 2012; Kracht 2003). Auf Basis einer sozialen Bezugsnorm wird ein individuelles Testergebnis in Relation zu einer spezifischen Referenzgruppe gesetzt. Wird z. B. ein Testverfahren für eine Gruppe von vier- bis sechsjährigen Kindern entwickelt, so besteht die soziale Bezugsnorm eben aus Kindern dieser Altersgruppe. Auf Basis dieser Normen wird der jeweilig erreichte Punktwert einer Person im Vergleich mit der Gruppe gedeutet und es kann abgelesen werden, „ob der Proband im Vergleich zu seinen Alters- oder Geschlechtsgenossen eine überoder unterdurchschnittliche Merkmalsausprägung aufweist“ (Bortz & Döring 2006: 195). Zu beachten ist hier allerdings, dass „die Erhebung der Normstichprobe […] nicht viele Jahre zurückliegen [darf], damit man den Normen noch vertrauen kann“ (Rost 2007: 166).3 Im Kontext der sprachstandsdiagnostischen Erhebung bei Kindern mit Deutsch als Zweitsprache kommt zusätzlich hinzu, dass „mehrsprachig aufwachsende Kinder in Sprachtests an einer für einsprachig Gleichaltrige entwickelten Altersnorm gemessen werden […]“. Dies ist insofern problematisch, da „wichtige Bedingungsfaktoren wie Erwerbsbeginn, Kontaktdauer und Kontaktqualität im Zweitspracherwerb […] unberücksichtigt [bleiben]“ (Rauch, Schastak & Richter 2016: 119; vgl. auch Jeuk 2015: 119). Werden für einsprachige Personen genormte Verfahren bei zwei- oder mehrsprachigen Personen eingesetzt, kann dies zum einen zur Verfälschung der Ergebnisse und zum anderen auch zur Unterschätzung4 der sprachlichen Leistungen führen (Lengyel 2002: 200). Nach Lengyel (2012) ist die getrennte Normierung für Kinder mit Deutsch als Zweitsprache jedoch ebenfalls problematisch und könnte zu einer positiven Diskriminierung führen. Dies liegt u. a. auch daran, dass Lerner des Deutschen als Zweitsprache sprachlich, kulturell sowie sozial eine heterogene Gruppe darstellen, z. B. hinsichtlich der Kontaktdauer, des Erwerbsverlaufs und der Intensität des Inputs (vgl. Böhme & Hoffmann 2014: 26; Lengyel 2012: 14; Rauch, Schastak & Richter 2016: 122). Die genannten Kritikpunkte in Bezug auf die soziale Norm gelten nicht für die kriteriale Norm. Denn eine kriteriale Norm, auch als sachliche Norm bezeichnet (Lengyel 2012: 12), orientiert sich an empirisch belegten Erwerbssequenzen, die als sprachliche (Untersuchungs-)Ziele festgelegt werden. Die kriteriale Bezugsnorm wird […] aus Beschreibungen des ,normalen‘ Erwerbsprozesses gewonnen, aus dem hervorgeht, wann Kinder etwa syntaktische oder morphologische Formen im Deutschen korrekt bilden. Ein auf derartigen Beobachtungen basierendes Entwicklungsmodell liefert den Maßstab (die

3 Die Normierung eines Tests sollte spätestens alle acht Jahre aktualisiert werden (vgl. Döring & Bortz 2016: 449; Bühner 2006: 43). 4 Auch kulturspezifische Merkmale von Verfahren können neben soziokulturellen, ethnischen oder geschlechtsspezifischen Merkmalen dazu führen, dass die von zweisprachigen Personen erreichten Ergebnisse schlechter ausfallen (Hollenweger 1996: 13), womit ein Verfahren das Nebengütekriterium der Fairness verletzt.

104

Nazan Gültekin-Karakoç

kriteriale Bezugsnorm) für die Einordnung der Beobachtungen. Danach wäre beispielsweise zu erwarten, dass Kinder zunächst Nominativ- und Akkusativformen bilden, bevor sie den schwierigen Dativ und Genitiv korrekt produzieren können. (Kany & Schöler 2007: 88)

So kann untersucht werden, ob sich ein Kind ein sprachliches Merkmal bereits angeeignet hat. Die Bevorzugung einer kriterialen Bezugsnorm wird auch mit Blick auf schulische Erwartungen verbunden, da so festgelegt werden kann, „welche sprachlichen Fähigkeiten Voraussetzung dafür sind, am Unterricht des Primarschulbereichs teilnehmen und davon profitieren zu können“ (Böhme & Hoffmann 2014: 27). Einschränkend muss an dieser Stelle jedoch festgehalten werden, dass es nicht für alle Sprachbereiche festgelegte Erwerbssequenzen gibt (vgl. genauer Dimroth in diesem Band). Während mit einer sozialen Norm ein Testergebnis im Vergleich zu Ergebnissen einer Normstichprobe eingeordnet wird und die kriteriale Norm sich am Spracherwerbsprozess orientiert, wird bei der individuellen Bezugsnorm, auch idiografische Norm genannt (Lengyel 2012), die sprachliche Leistung eines Kindes zu unterschiedlichen Zeitpunkten betrachtet und verglichen. Die idiografische Norm eignet sich auch, um der Frage nachzugehen, in welchem Verhältnis das, was ein Kind kann, zu seinem Potenzial steht. Um hierauf mögliche Antworten zu finden, müssen Informationen gesammelt werden, die über die Ergebnisse der Sprachstandserhebung oder Beobachtung hinausgehen, z. B. Informationen über die primärsprachliche Sozialisation, die Bedingungen und Voraussetzungen der Aneignung sowie zum sozialen und kulturellen Kapital der Familie […]. (Lengyel 2012: 12)

Zusammenfassend hält Lengyel (2012: 13) fest: Die Frage nach der geeigneten Bezugsnorm für soziale Vergleiche ist derzeit noch ungelöst, nicht zuletzt aufgrund der großen Forschungslücken zur mehrsprachigen Sozialisation speziell unter den Bedingungen der Migration […] Insofern ist für sprachpädagogische Prozesse die individuelle wie auch die sachliche Norm gut geeignet, während die soziale Bezugsnorm in den Hintergrund tritt […].

Das Kriterium der Ökonomie wäre bei Anwendung von Sprachstandserhebungsverfahren in pädagogischen Kontexten dann erfüllt, wenn Verfahren mit geringen zeitlichen (Vorbereitung, Durchführung, Auswertung) und finanziellen (Materialaufwand) Ressourcen, auch bei großen Gruppen, durchführbar sind. Die Nützlichkeit eines Verfahrens ist gegeben, wenn mit der Untersuchung eines Merkmals eine praktische Relevanz verbunden ist und kein alternatives Verfahren zur Erhebung des Merkmals existiert. Im vorliegenden Kontext wäre das Kriterium der Nützlichkeit erfüllt, wenn sich aus der Erhebung und Auswertung des untersuchten Merkmals Fördermöglichkeiten ableiten lassen. Das Nebengütekriterium der Zumutbarkeit umfasst die zeitliche, psychische oder körperliche Belastung auf die zu untersuchenden Personen. So wäre eine Erhebungsdauer von 20 Minuten für Lerner*innnen in der Sekundarstufe 2 durchaus zumutbar, während dies auf ein

Sprachdiagnostische Grundverfahren

105

vierjähriges Kind im Elementarbereich nicht zutrifft. Von Testfairness spricht man, wenn soziokulturelle, ethnische oder geschlechtsspezifische Zugehörigkeit einer Person zu keinerlei Benachteiligungen führen. Wie weiter oben bereits angesprochen, wäre das Kriterium der Testfairness verletzt, wenn Verfahren, die für einsprachige Personen genormt wurden, bei zwei- oder mehrsprachigen Personen eingesetzt werden. Die Einhaltung der Haupt- sowie Nebengütekriterien ist essenziell bei der Entwicklung von Testverfahren, da nur über diese Angaben die Qualität eines Testverfahrens durch den Anwender eingeschätzt werden kann. Testverfahren sind standardisierte Sprachstandserhebungsverfahren, die in stark kontrollierten Settings eingesetzt werden (vgl. Fried 2004: 5–6; Gerspach 2006: 125–130; Hebenstreit-Müller & Kühnel 2004). Mit Testverfahren wird jeweils ein bestimmter Ausschnitt des sprachlichen Handelns ermittelt, der als repräsentativ für die gesamte Sprachkompetenz gilt. Dafür wird das kommunikative Handeln nicht nur gesteuert (Elizitierung), sondern reduziert auf das jeweils interessierende Phänomen ausgewertet. Ein Test stellt somit eine ausschnittartige Momentaufnahme dar, in der nicht immer die tatsächliche Kompetenz eines Kindes gemessen wird. Dies kann unter anderem an der Tagesform des Kindes liegen oder aber auch an der Testsituation selbst. Bei Testverfahren wird zumeist externes, speziell geschultes Personal eingesetzt. Diese Situation kann beim Kind zu Unbehagen führen, was Messfehler erzeugen kann (vgl. Apeltauer 2004: 13). Durch eine gezielte Elizitierung kann jedoch mit Testverfahren eine relativ zügige Erhebung ausgewählter Sprachstandsindikatoren bei einer großen Zahl von Personen vorgenommen werden. Die anschließende quantitative Auswertung erfolgt meist durch Aufsummierung der erreichten Punktwerte, die dann durch einen Vergleich mit einer Normtabelle Aussagen zur jeweiligen Person zulassen (vgl. Ehlich 2007: 44). Testverfahren sind dazu geeignet, relativ schnell bei einer großen Gruppe durch Ankreuzen einer Antwort quantitative Aussagen über den untersuchten Sprachbereich zu treffen. Die Ableitung konkreter Hinweise für eine individuelle Förderung ist jedoch nicht bei jedem Test gegeben.

2.2 Screening Screenings sind bezüglich der Standardisierung und Normierung vergleichbar mit Tests. Anders als Testverfahren geht es jedoch bei einem Screeningverfahren nicht um einen Vergleich eines individuellen Testergebnisses mit einer Vergleichsgruppe, sondern um das Erreichen (oder Nicht-Erreichen) eines kritischen Wertes. Es wird also eine Leistungsgrenze definiert, die angibt, „ob ein Kind hinsichtlich seiner weiteren Entwicklung in dem untersuchten Entwicklungs- oder Leistungsbereich als Risikokind gilt“ (Kany & Schöler 2009: 101). Es sollte transparent dargestellt sein, wie diese Leistungsgrenze bzw. der kritische Wert festgelegt wurde. Aufgrund des testähnlichen Aufbaus und der damit verbundenen testtheoretischen Anforderungen von Screenings wird auch hier lediglich ein Teilausschnitt

106

Nazan Gültekin-Karakoç

der sprachlichen Leistung untersucht, für den jedoch die prognostische Validität bestimmt werden muss (Kany & Schöler 2009: 101). D. h., der untersuchte Teilbereich der Sprache muss eine Vorhersagekraft über einen anderen Teilbereich der Sprache aufweisen, wie z. B. die Überprüfung der phonologischen Bewusstheit als Indikator für den Schriftspracherwerb (Lengyel 2012: 18). Mit dem Einsatz eines standardisierten Screeningverfahrens wird ermittelt, ob ein Förderbedarf besteht oder nicht (Selektionsdiagnostik). Die daraufhin getroffene Entscheidung (Förderbedarf vs. kein Förderbedarf) bedarf jedoch bei Zuweisung zu einer Fördermaßname einer weiteren differenzierten Untersuchung, um genau abklären zu können, in welchen sprachlichen Bereichen genau der Förderbedarf besteht. Hierfür wäre der Einsatz eines weiteren Verfahrens nötig, das im Gegensatz zu einem Screening ermöglicht, den Sprachförderbedarf differenziert zu erfassen. Screenings können als zeitlich ökonomische Verfahren bezeichnet werden, die schnell mit einer ganzen Gruppe durchführbar sind, mit denen jedoch nur ein grobes Ergebnis für einzelne Teilbereiche abgegeben werden kann (Lengyel 2012: 18). Sie werden in allen Stufen der Bildungsbiographie eingesetzt, vom Elementarbereich bis hin zu Berufsschulen (Redder et al. 2011). Da eine Testung aber gerade bei jüngeren Kindern mit den erwähnten unterschiedlichen Schwierigkeiten behaftet ist (Rißling & Petermann 2015), werden vor allem im Elementarbereich Beobachtungsverfahren bevorzugt.

2.3 Beobachtung Unter einer wissenschaftlichen Beobachtung versteht man „die zielgerichtete, systematische und regelgeleitete Erfassung, Dokumentation und Interpretation von Merkmalen, Ereignissen oder Verhaltensweisen […]“, die sich durch geplantes und strukturiertes Vorgehen von Alltagsbeobachtungen unterscheidet (Döring & Bortz 2016: 324, 328). Beobachtungsverfahren können je nach Strukturiertheit des Beobachtungsrasters qualitativ und/oder quantitativ ausgerichtet sein. Bei der Erhebung des Sprachstandes mit Beobachtungsverfahren wird der Sprachstand im Gegensatz zu Testverfahren im natürlichen Handlungszusammenhang erfasst. Dies ermöglicht, dass nicht nur Aussagen im Hinblick auf einzelne Teilqualifikationen getroffen werden können, sondern eine komplexe sprachliche Handlung des Kindes beschrieben werden kann. Genau hier liegt auch der Fokus einer Beobachtung: Beschreiben statt Bewerten (Reich 2014: 423). Zudem ist es mit Beobachtungsverfahren möglich, die sprachliche Fähigkeit der Kinder über einen längeren Zeitraum zu erfassen und somit longitudinal tiefergehende Daten zu erheben, als es mit einer Momentaufnahme möglich wäre. Während Tests in den meisten Fällen von externem Personal durchgeführt werden, werden Beobachtungen im Vorschulbereich von internem Personal durchgeführt, welches die Kinder bereits aus dem Kontext der KiTa kennen (vgl. Apeltauer 2004: 13). Beobachtungsbögen können gleichzeitig sowohl eine qualitativ-orientierte Auswertung wie auch eine

Sprachdiagnostische Grundverfahren

107

quantitative Auswertung ermöglichen (je nach Anlage des Bogens). In welcher Form die Auswertung erfolgt, kann in solch einem Fall zu Beginn der Beobachtung offenbleiben. Soll eine qualitative Auswertung durchgeführt werden, orientiert man sich an den verbalen Bezeichnungen der Skalen, während bei der quantitativen Auswertung die Zahlen der Skalen von Bedeutung sind. Die Objektivität von Beobachtungsbögen wird als gering eingestuft, da die Beobachtungen nicht in standardisierten Situationen vorgenommen werden und der zeitliche Rahmen stark variieren kann (Durchführungsobjektivität; vgl. Demirkaya, Gültekin-Karakoç & Settinieri 2009). Durch vorgegebene Anleitungen im Manual und durch einen strukturierten Beobachtungsbogen kann jedoch diesem Mangel teilweise entgegnet werden (vgl. Ehlich 2007: 43–44). Unsystematische Beobachtungen können hingegen zu selektiven Wahrnehmungen und subjektiven Interpretationen führen. Mögliche Beobachtungsfehler, die sowohl auf die Beobachtungssituation als auch auf die Person des Beobachters zurückzuführen sind, werden im Folgenden überblicksartig aufgeführt (Döring & Bortz 2016: 330–332): – Wahrnehmungsfehler: Ein möglicher Wahrnehmungsfehler der beobachtenden Person ist der Halo-Effekt. „So bemerken Beobachtende im Sinne selektiver Wahrnehmung v. a. jene Aspekte des Beobachtungsgeschehens, die sie aufgrund von Vorannahmen erwarten, die sie persönlich interessant finden oder die dem Gesamteindruck entsprechen […], während andere Aspekte evtl. ausgeblendet werden.“ (Döring & Bortz 2016: 331) So kann eine als positiv oder negativ wahrgenommene Eigenschaft des Kindes die gesamte Leistung überstrahlen, was dann evtl. zu einer insgesamt besseren oder schlechteren Einschätzung führen kann. – Interpretations- bzw. Urteilsfehler: Bei Beobachtungsbögen, in denen zu beobachtende Aspekte über Skalen erfasst werden, sind mögliche Urteilsfehler z. B. eine Tendenz zur Mitte (Vermeidung der Endpunkte/Extrempunkte einer Skala), Ankereffekte (Einfluss der Verbalisierung der Skalenpunkte) sowie persönliche Urteilstendenz (Härte-Milde-Effekt). Bei weniger strukturierten Beobachtungen kann es zu Verzerrungen bei der Interpretation des Beobachteten kommen. Wahrnehmungs-, Interpretations- bzw. Urteilsfehler können durch Einsatz von erfahrenem und geschultem Personal vermindert werden. Eine andere, mit mehr Personalaufwand verbundene Möglichkeit ist der Einsatz von zwei Beobachter*innen, deren Ergebnisse miteinander abgeglichen werden können. Auch wenn Beobachtungsverfahren also „Wahrnehmungstäuschungen“ unterliegen, sind sie mit vielen Vorteilen verbunden. Die Beobachtung hat insbesondere den Vorteil, über einen längeren Zeitraum die Sprachaneignung verfolgen und dokumentieren zu können, was vor allem bei Kindern, die Deutsch als Zweitsprache lernen, notwendig erscheint, da so der Sprachstand vor dem Hintergrund der Spracherwerbsgelegenheiten und Inputbedingungen genauer bestimmt werden kann. (Lengyel 2012: 20)

108

Nazan Gültekin-Karakoç

Gerade mit Blick auf eine anschließende individuell angepasste sprachliche Förderung sind Beobachtungsverfahren gewinnbringend einsetzbar (Förderdiagnostik).

2.4 Profilanalyse Profilanalysen sind nachträgliche Auswertungen von gesprochener Sprache, die auf Ton- (oder Ton-Bild-)Trägern aufgenommen ist. Die Analysen richten sich auf unterschiedliche Aspekte der Sprache, die ein ‚profiliertes‘ Bild des Sprachstandes ergeben sollen. Die Aufnahmesituationen sollen so gestaltet sein, dass sie es erlauben, der natürlichen spontanen Sprache des Kindes nahe zu kommen. […] Gegenüber Tests und testartigen Verfahren hat die Profilanalyse den Vorteil, der spontanen Sprache des Kindes näher zu kommen und an ein und demselben Text Analysen unterschiedlicher Tiefe und unterschiedlicher Blickrichtung zuzulassen. […] Gegenüber völlig offenen oder nur schwach strukturierten Beobachtungen der sprachlichen Kommunikation des Kindes hat die Profilanalyse den Vorteil einer deutlich erhöhten Objektivität, die vor allem durch die Vorgabe präziser Auswertungskategorien gewährleistet wird. (Reich & Roth 2007: 82–83)

Bei der Profilanalyse werden Spontandaten von Lernern in natürlichen oder quasinatürlichen Situationen mit Ton und/oder Video aufgenommen. Hierfür werden überwiegend Bildimpulse oder auch Bildgeschichten eingesetzt. Ähnlich den Beobachtungsverfahren wird dabei die gesamte Sprachhandlung des Lerners einbezogen. Dies führt bei der qualitativen Analyse der Daten dazu, dass diese zum einen sehr zweitaufwändig sein kann und zum anderen umfangreiche linguistische Qualifikationen des Durchführenden voraussetzt (vgl. Ehlich 2007: 44). Im Zusammenhang mit den hohen Anforderungen, die an die Auswerter gestellt werden, sieht Lengyel (2012: 19) den Vorteil, dass gerade die Auseinandersetzung mit der Struktur und Funktion von Sprache bei pädagogischen Fachkräften zu einer „sprachdiagnostischen Kompetenzsteigerung“ führen kann. So können in der Analyse neben sprachlichen Aspekten auch weitere Sprachbereiche wie etwa pragmatische oder diskursive Merkmale betrachtet werden, was für die Ableitung von Förderinhalten genutzt werden kann. Profilanalysen werden für den Einsatz im Primar- wie auch Sekundarbereich als geeignet angesehen (Aulbert o. J.: 5). Profilanalytische Verfahren, wie z. B. HAVAS 5 (Reich & Roth 2004), können durch klare Instruktionen zur Erhebung und Auswertung eine hohe Objektivität erreichen. Mit der Orientierung an Erwerbsstufen kann eine Profilanalyse als kriterial normiert eingeordnet werden (siehe Abschnitt 2.1 in diesem Beitrag).

2.5 Schätzverfahren Schätzverfahren sind „bewertende Einordnungen von Sprachkenntnissen nach dem persönlichen Eindruck, sei es des Sprechers/der Sprecherin selbst, sei es eines Kommunikationspartners, anhand vorgegebener Skalen“ (Reich 2014: 423). Schätzver-

Sprachdiagnostische Grundverfahren

109

fahren sind als Instrument im Kontext von Deutsch als Zweitsprache wenig verbreitet (Döll 2012: 77). Im Gegensatz zu den zuvor vorgestellten Grundverfahren werden hier keine Sprachdaten erhoben, sondern Informationen zum Sprachstand eingeholt (Ehlich 2007: 43). Bei jüngeren Kindern werden Schätzverfahren vor allem bei Eltern5 bzw. dem Kind nahestehenden Personen, wie etwa den Erzieher*innen, eingesetzt, die dabei über das sprachliche Vermögen des Kindes berichten (Ehlich 2007: 43). Während die zeitsparende Erhebung als ein Vorteil von Schätzverfahren angesehen wird (Reich 2014: 423), sind als Nachteile die mangelnde Standardisierung und hohe Subjektivität der Angaben sowie Erinnerungseffekte zu nennen (Aulbert o. J.: 4). Diese subjektive Selbst- oder Fremdeinschätzung mindert die Validität der Ergebnisse, kann jedoch auch dazu führen, dass sie bei älteren Schüler*innen zur Reflexion der eigenen Sprachentwicklung beitragen (Michalak 2013: 63). Schätzverfahren können mit dieser Zielsetzung im Schulbereich als Teil von Sprachportfolios zur Anwendung kommen (Döll 2012: 77, Michalak 2012: 63; vgl. Ricart Brede in diesem Band). In Tabelle 4 werden Vor- und Nachteile der besprochenen sprachdiagnostischen Grundverfahren zusammenfassend gegenübergestellt. Die in Tabelle 4 aufgeführten Nachteile einzelner Grundverfahren, wie beispielsweise der Aspekt der Zeitökonomie oder die aufwändige linguistische Einarbeitung bei der Durchführung einer Profilanalyse, führen dazu, dass der Einsatz einzelner Grundverfahren überwiegt. In jüngster Zeit wird jedoch immer stärker dafür plädiert, zur Beschreibung eines sprachlichen Teilbereichs mehrere Verfahren einzusetzen, d. h. multimethodal vorzugehen. So könnten beispielsweise Beobachtungsverfahren und Testverfahren zur Erhebung des Sprachstandes bei einer ausgewählten Gruppe kombiniert eingesetzt werden, um zu prüfen, inwiefern die Ergebnisse der beiden sprachdiagnostischen Grundverfahren sich im untersuchten Aspekt ähneln bzw. voneinander abweichen (vgl. hierzu die Korrelationsstudie von Settinieri 2012). Vorteile eines multimethodalen Vorgehens sind die Erhebung und Analyse verschiedener sprachlicher Aspekte oder auch verschiedener Facetten eines sprachlichen Aspektes sowie mögliche Aussagen zur Validität der eingesetzten Verfahren. Der Einsatz mehrerer Verfahren setzt natürlich bei den Anwendern das Wissen um die Vor- und Nachteile der Verfahren sowie deren Anwendungsgebiete voraus (Eid & Petermann 2006: 20–21).

5 Vgl. hierzu auch den in zehn Sprachen vorliegenden Elternfragebogen DaZ-E (Keller & Grob 2013), der für mehrsprachige Vorschulkinder entwickelt wurde. Neben der Erfassung von Daten zur Sprachbiographie und zum Sprachkontakt machen Eltern Angaben zu den Deutschkenntnissen ihrer Kinder.

– – – –

– – – –

Beobachtung

Profilanalyse

Schätzverfahren

– – – – –

Screening

– – –

–

–

– – – –

Test

Einbezug verschiedener Perspektiven möglich (Selbst- und Fremdwahrnehmung) Anregung zur Selbstreflexion Dokumentation von Fortschritten zeitökonomisch durchführbar

Ausgleich zwischen Kontrolle und Natürlichkeit detaillierte Analyse quasi-natürlicher Sprachdaten Orientierung an Erwerbssequenzen Besonderer Fokus auf diskursiven und pragmatischen Kompetenzen möglich konkrete Hinweise für anschließende Förderung

breiter Überblick über sprachliche Kompetenzen natürliche Kommunikationssituation longitudinal ganzheitlich und tiefgehend

kontrolliert, objektiv, standardisiert Vergleichbarkeit der Ergebnisse (Normierung) zeitlich und finanziell ökonomisch Bestimmung der prognostischen Validität man muss die Lerner*innen nicht kennen/länger sehen

kontrolliert, objektiv, standardisiert Vergleichbarkeit der Ergebnisse (Normierung) gezielte Elizitierung sprachlicher Teilaspekte man muss die Lerner*innen nicht kennen/länger sehen

Vorteile

Sprachdiagnostische Grundverfahren

Tab. 4: Überblick zu Vor- und Nachteilen sprachdiagnostischer Grundverfahren.

– – –

–

– –

– – –

– –

– –

– –

–

mangelnde Standardisierung Subjektivität keine verlässlichen Ergebnisse

aufwändige Aufbereitung (Transkription) und Auswertung langwierige Einarbeitung, linguistische Kenntnisse erforderlich Kenntnisse über asynchrone Spracherwerbsverläufe notwendig

Subjektivität Beobachtungsfehler Vergleichbarkeit der Ergebnisse nicht immer gegeben

keine differenzierten Aussagen zur Sprachfähigkeit möglich umfassende Aussagen für eine anschließende Förderung kaum möglich Arbiträrer Cut-off-Wert weitere Erhebung notwendig, um genaues sprachliches Profil zu erhalten

kein umfassendes Bild der Sprachkompetenz, Sprachmerkmale werden isoliert erfasst punktuelle Messung künstliche und stark gesteuerte Kommunikationssituation

Nachteile

110 Nazan Gültekin-Karakoç

Sprachdiagnostische Grundverfahren

111

Auch das Mercator-Institut (2013: 18) spricht sich für ein mehrstufiges Verfahren aus und schlägt vor, im ersten Diagnoseschritt mit einem Screeningverfahren abzuklären, ob ein Förderbedarf besteht, und im zweiten Diagnoseschritt den genauen Förderbedarf zu diagnostizieren, um darauf basierend Maßnahmen zur Förderung abzuleiten (vgl. auch Böhme & Hoffmann 2014: 35). Lengyel (2002: 201) spricht sich für eine biographische Analyse, verbunden mit einer ausgedehnten Familienanamnese, aus (ein biographischer Fragebogen ist z. B. bei Jeuk 2015: 138 zu finden) und sieht die Beobachtung als zu bevorzugendes Verfahren an, da Beobachtungen neben allen anderen Vorteilen auch die Dynamik von Spracherwerbprozessen berücksichtigen können. Verantwortungsvolle Diagnostik, so Kany & Schöler (2009: 33) zusammenfassend, „verlässt sich nicht ausschließlich auf eine Informationsquelle, sondern zieht Informationen aus verschiedenen Quellen heran, die mit unterschiedlichen Methoden und Verfahren gewonnen wurden“.

3 Schluss Die sprachliche Qualifizierung von Kindern, Jugendlichen und Erwachsenen mit Deutsch als Zweitsprache ist für die Bildungsbiographie wie auch für die berufliche Qualifizierung die entscheidende und zentrale Qualifikation. Umso wichtiger ist es, dass die Zweitsprachaneignung mit Verfahren begleitet wird, die die geforderten sprachwissenschaftlichen und empirischen Kriterien einhalten. Doch auch 16 Jahre nach dem PISA-Schock bestehen bei den bisher eingesetzten Verfahren teilweise noch erhebliche Mängel. Viele der gängigen Verfahren zur Bestimmung des so genannten Sprachstandes vermögen die sprachliche Qualifizierung nur unzureichend einzuschätzen. Das liegt daran, dass „viele Verfahren mit nur sehr eingeschränkten Kriterien operieren, nicht ausreichend sprachwissenschaftlich (oder generell wissenschaftlich) fundiert sind und zudem isolierte Teilbereiche der sprachlichen Qualifizierung untersuchen, die keine Generalisierungen bezüglich anderer oder gar der ‚gesamten‘ sprachlichen Qualifizierung erlauben“ (Blaschitz 2014: 8–9). Moniert wird auch, dass es kaum Verfahren gibt, die die Zweisprachigkeit, also auch die erstsprachlichen Fähigkeiten, fokussieren; dies gilt insbesondere für das Erwachsenenalter (Rauch, Schastak & Richter 2016: 127) und ist dem Umstand geschuldet, dass die Erfassung der Sprachen eine komplexe, umfassende und longitudinale Erhebung und Analyse erfordert (vgl. Jeuk 2007: 106). Auch die langjährigen Bestrebungen, gerade im Kontext des Elementarbereichs, haben keine Verfahren hervorgebracht, die „allgemein anerkannt sind und sicher und zuverlässig genaue Auskünfte über den Stand der Sprachaneignung eines Kindes geben“ (Jeuk & Reeb-Ramos 2013: 76). Einer der Gründe hierfür wird in den unterschiedlichen Disziplinen gesehen, die sich isoliert und mit unterschiedlichen Ansprüchen mit der Entwicklung von Verfahren beschäftigen (Jeuk & Reeb-Ramos 2013: 76). Gefordert wird deshalb eine interdisziplinäre Zusammenarbeit von Sprach-

112

Nazan Gültekin-Karakoç

wissenschaftler*innen, Logopäd*innen, Pädagog*innen sowie Psycholog*innen, die mit ihren für die Verfahrensentwicklung wichtigen Expertisen gemeinsam dazu beitragen können, die sprachliche Entwicklung mit Verfahren zu erheben, die sich den hier an unterschiedlichen Stellen genannten Kritikpunkten zumindest nicht mehr in dem Maße aussetzen müssen (Settinieri 2012; Melzer, Rißling & Petermann 2015). Um bei der Vielfalt der Verfahren das für den eigenen Kontext angemessene Diagnoseinstrument auszuwählen, bedarf es einiger Vorüberlegungen. Abschließend soll deshalb auf Kriterien hingewiesen werden, die bei der Auswahl einer geeigneten Diagnostik eingesetzt werden können (in Anlehnung an Rauch, Schastak & Richter 2016: 109): – Über welchen sprachlichen Teilbereich sollen Aussagen gemacht werden? Welches Verfahren ermöglicht die Erhebung dieses Teilbereichs der Sprache? – Um welche Zielgruppe handelt es sich? Liegen dem Verfahren Normierungsdaten zugrunde, die sich mit der anvisierten Zielgruppe decken? – Werden im Verfahrensmanual die sprachwissenschaftlichen Grundlagen transparent und nachvollziehbar dargelegt und testtheoretische Angaben zu den Gütekriterien gemacht? – Welche Art der Diagnostik wird angestrebt (Selektionsdiagnostik, Förderdiagnostik)? – Ist der zeitliche Aufwand, der mit der Erhebung und der Analyse des ausgewählten Verfahrens verbunden ist, dem Kontext angemessen? – Ist eine Einarbeitung und Handhabung des Verfahrens für die Anwender mit den Angaben im Manual zeitökonomisch möglich? – Mit welchem finanziellen Aufwand ist bei der Anschaffung und mit welchem personellen Aufwand bei der Durchführung und Auswertung zu rechnen? – Werden Hinweise zur anschließenden Förderung gegeben?

Literatur Apeltauer, Ernst (2004): Beobachten oder Testen? Möglichkeiten zur Erfassung des Sprachentwicklungsstandes von Vorschulkindern mit Migrationshintergrund. Flensburg: Rux. Aulbert, Antje (o. J.): Sprachstandserhebungsverfahren – eine Einführung (Teil 1). Redigiert von Susanne Reif und Andrea Abel. http://maledive.ecml.at/Portals/45/HandbuchI.pdf (12. 12. 2016). Baumert, Jürgen, Cordula Artelt, Eckhard Klieme, Michael Neubrand, Manfred Prenzel, Ulrich Schiefele, Wolfgang Schneider, Klaus-Jürgen Tillmann & Manfred Weiß (Hrsg.) (2003): PISA 2000 – Ein differenzierter Blick auf die Länder der Bundesrepublik Deutschland. Opladen: Leske + Budrich. Blaschitz, Verena (2014): Narrative Qualifizierung. Dimensionen ihrer Erfassung bei Kindern mit Deutsch als Zweitsprache. Münster, New York: Waxmann. Bortz, Jürgen & Nicola Döring (2006): Forschungsmethoden und Evaluation für Human- und Sozialwissenschaftler. 4. Aufl. Heidelberg: Springer.

Sprachdiagnostische Grundverfahren

113

Bos, Wilfried, Eva-Maria Lankes, Manfred Prenzel, Knut Schwippert, Renate Valtin & Gerd Walther (2004): IGLU Einige Länder der Bundesrepublik Deutschland im nationalen und internationalen Vergleich. Zusammenfassung ausgewählter Ergebnisse. Münster: Waxmann. Böhme, Kathrin & Lars Hoffmann (2014): Sprachstandsdiagnostik bei mehrsprachigen Grundschulkindern – Empirische Befunde zum Einsatz diagnostischer Verfahren in Deutschland. Zeitschrift für Interkulturellen Fremdsprachenunterricht – Didaktik und Methodik im Bereich Deutsch als Fremdsprache 19 (2), 20–39. Breitenbach, Erwin (2014): Psychologie in der Heil- und Sonderpädagogik. Unter Mitarbeit von Anett Kuschel. Stuttgart: Kohlhammer. Brosius, Hans-Bernd, Friederike Koschel & Alexander Haas (2008): Methoden der empirischen Kommunikationsforschung. Eine Einführung. 4. überarb. u. erw. Aufl. Wiesbaden: VS. Bühner, Markus (2006): Einführung in die Test- und Fragebogenkonstruktion. 2., aktual. u. erw. Aufl. München u. a.: Pearson. Demirkaya, Sevilen, Nazan Gültekin-Karakoç, & Julia Settinieri (2009): Mit Sismik punkten? Zum quantitativen Einsatz des Beobachtungsbogens. In Bernt Ahrenholz (Hrsg.), Empirische Befunde zu DaZ-Erwerb und Sprachförderung, 43–62. Freiburg im Breisgau: Fillibach Verlag. Döll, Marion (2012): Beobachtung der Aneignung des Deutschen bei mehrsprachigen Kindern und Jugendlichen. Modellierung und empirische Prüfung eines sprachdiagnostischen Beobachtungsverfahrens. Münster: Waxmann. Döll, Marion (2013): Sprachdiagnostik und Durchgängige Sprachbildung – Möglichkeiten der Feststellung sprachlicher Fähigkeiten mehrsprachiger Jugendlicher in der Sekundarstufe. In Ingrid Gogolin, Imke Lange, Ute Michel & Hans H. Reich (Hrsg.), Herausforderung Bildungssprache − und wie man sie meistert, 170–180. Münster u. a.: Waxmann. Döring, Nicola & Jürgen Bortz (2016): Forschungsmethoden und Evaluation in den Sozial- und Humanwissenschaftlen. 5., vollst. überarb., aktual. u. erw. Aufl. Berlin: Springer. Ehlich, Konrad (2007): Sprachaneignung und deren Feststellung bei Kindern mit und ohne Migrationshintergrund. Was man weiß, was man braucht, was man erwarten kann. In Konrad Ehlich et al. (Hrsg.), Anforderungen an Verfahren der regelmäßigen Sprachstandsfestellung [sic!] als Grundlage für die frühe und individuelle Förderung von Kindern mit und ohne Migrationshintergrund, 11–75. Bonn u. a.: BMBF. Eid, Michael & Franz Petermann (2006): Aufgaben, Zielsetzungen und Strategien der Psychologischen Diagnostik. In Franz Petermann & Michael Eid (Hrsg.), Handbuch der psychologischen Diagnostik, 15–25. Göttingen u. a.: Hogrefe. Fried, Lilian (2004): Expertise zu Sprachstandserhebungen für Kindergartenkinder und Schulanfänger. Eine kritische Betrachtung. http://www.ph-karlsruhe.de/fileadmin/user_ upload/dozenten/schlemminger/evaluation/02_Expertise_Sprachstand.pdf (12. 12. 2016). Gerspach, Manfred (2006): Elementarpädagogik. Eine Einführung. Stuttgart: Kohlhammer. Hebenstreit-Müller, Sabine & Barbara Kühnel (Hrsg.) (2004): Kinderbeobachtung in Kitas. Erfahrungen im ersten Early Excellence Centre in Berlin. Berlin: Dohrmann. Himme, Alexander (2007): Gütekriterien der Messung: Reliabilität, Validität und Generalisierbarkeit. In Sönke Albers, Daniel Klapper, Udo Konradt, Achim Walter & Joachim Wolf (Hrsg.), Methodik der empirischen Forschung. 2., überarb. u. erw. Aufl., 375–390. Wiesbaden: Gabler. Hollenweger, Judith (1996): Fremd(-sprachigkeit) in der Schule. Sonderpädagogische und testpsychologische Überlegungen zum schulischen Erfolg fremdsprachiger Kinder. In Hansjakob Schneider & Judith Hollenweger (Hrsg.), Mehrsprachigkeit und Fremdsprachigkeit. Arbeit für die Sonderpädagogik?, 11–32. Luzern: Ed. SZH/SPC. Jeuk, Stefan (2007): Einschätzung des Sprachstands bei mehrsprachigen Kindern. In Ulrike Graf & Elisabeth Moser Opitz (Hrsg.), Diagnostik und Förderung im Elementarbereich und Grundschulunterricht, 105–116. Baltmannsweiler: Schneider.

114

Nazan Gültekin-Karakoç

Jeuk, Stefan (2009): Probleme der Sprachstandserhebung bei mehrsprachigen Kindern. Zeitschrift für Soziologie der Erziehung und Sozialisation 29 (2), 141–156. Jeuk, Stefan (2014): Differenzierte Förderdiagnostik sprachlicher Entwicklung in der Sekundarstufe I. Unterrichtspraxis. Beilage zu „bildung und wissenschaft“ 47/6, 1–8. Jeuk, Stefan (2015): Diagnose und Sprachstandsbeobachtung. In Zeynep Kalkavan-Aydln (Hrsg.), Deutsch als Zweitsprache − Didaktik für die Grundschule, 114–138. Berlin: Cornelsen. Jeuk, Stefan & Irene Reeb-Ramos (2013): Konzeption eines Verfahrens im Bereich des mündlichen Erzählens. In Stefan Jeuk (Hrsg.), Sprachförderung und Förderdiagnostik in der Sekundarstufe I, 73–92. Stuttgart: Fillibach. Jürgens, Eiko & Urban Lissmann (2015): Pädagogische Diagnostik. Grundlagen und Methoden der Leistungsbeurteilung in der Schule. Weinheim, Basel: Beltz. Kany, Werner & Hermann Schöler (2007): Fokus: Sprachstandsdiagnostik. Leitfaden zur Sprachstandsbestimung im Kindergarten. 1. Aufl. Berlin u. a.: Cornelsen. Kany, Werner & Hermann Schöler (2009): Diagnostik schulischer Lern- und Leistungsschwierigkeiten. Ein Leitfaden mit einer Anleitung zur Gutachtenerstellung. Stuttgart: Kohlhammer. Keller, Karin & Alexander Grob (2013): Elternfragebogen zu den Deutschkenntnissen mehrsprachiger Kinder. Zeitschrift für Pädagogische Psychologie 27, 169–180. Kempert, Sebastian, Aileen Edele, Dominique Rauch, Katrin M. Wolf, Jennifer Paetsch, Annkathrin Darsow, Jessica Maluch & Petra Stanat (2016): Die Rolle der Sprache für zuwanderungsbezogene Ungleichheiten im Bildungserfolg. In Claudia Diehl, Christian Hunkler & Cornelia Kristen (Hrsg.), Ethnische Ungleichheiten im Bildungsverlauf: Mechanismen, Befunde, Debatten, 157–241. Wiesbaden: VS. Kracht, Annette (2003): Sprachliche Normen und Zielsetzungen von Sprachstandserhebungsverfahren – einige kritische Anmerkungen. In Beauftragte der Bundesregierung für Migration, Flüchtlinge und Integration (Hrsg.), Förderung von Migranten und Migrantinnen im Elementar- und Primarbereich, 37–43. Berlin, Bonn. Lengyel, Drorit (2002): Diagnostik bei zweisprachigen Kindern. In Manfred Grohnfeldt (Hrsg.), Lehrbuch der Sprachheilpädagogik und Logopädie. Band 3: Diagnostik, Prävention und Evaluation, 199–204. Stuttgart: Kohlhammer. Lengyel, Drorit (2012): Sprachstandsfeststellung bei mehrsprachigen Kindern im Elementarbereich. Eine Expertise der Weiterbildungsinitiative Frühpädagogische Fachkräfte (WIFF). Frankfurt am Main: Deutsches Jugendinstitut e.V. http://www.poliglotti4.eu/docs/ Expertise_Sprachstandsfeststellung.pdf (12. 12. 2016). Lengyel, Drorit (2013): Pädagogische Sprachdiagnostik als Grundlage für die durchgängige Sprachbildung. In Ingrid Gogolin, Imke Lange, Ute Michel & Hans H. Reich (Hrsg.), Herausforderung Bildungssprache − und wie man sie meistert, 154–169. Münster u. a.: Waxmann. Lienert, Gustav A. & Ulrich Raatz (1998): Testaufbau und Testanalyse. 6. Aufl. Weinheim: Beltz. Lisker, Andrea (2010): Sprachstandsfeststellung und Sprachförderung im Kindergarten sowie beim Übergang in die Schule. Expertise im Auftrag des Deutschen Jugendinstituts. Deutsches Jugendinstitut. Melzer, Jessica, Julia-Katharina Rißling & Franz Petermann (2015): Sprachdiagnostik im Vorschulalter Analyse aktueller Testverfahren für Kinder im Alter zwischen 4 und 5 Jahren. Monatsschrift Kinderheilkunde 163, 58–66. Mercator-Institut für Sprachförderung und Deutsch als Zweitsprache (Hrsg.) (2013): Qualitätsmerkmale für Sprachstandsverfahren im Elementarbereich. Ein Bewertungsrahmen für fundierte Sprachdiagnostik in der Kita. Köln. Michalak, Magdalena (2013): Von der Sprachdiagnose zur sprachlichen Förderung. In Magdalena Michalak & Michaela Kuchenreuther (Hrsg.), Grundlagen der Sprachdidaktik Deutsch als Zweitsprache, 57–84. Baltmannsweiler: Schneider.

Sprachdiagnostische Grundverfahren

115

Mummendey, Hans Dieter & Ina Grau (2008): Die Fragebogen-Methode. 5., überarb. u. erw. Auf. Göttingen u. a.: Hogrefe. Neugebauer, Uwe & Michael Becker-Mrotzek (2013): Die Qualität von Sprachstandsverfahren im Elementarbereich. Eine Analyse und Bewertung. Köln: Mercator-Institut für Sprachförderung und Deutsch als Zweitsprache. Raithel, Jürgen (2008): Quantitative Forschung. Ein Praxisbuch. 2., durchges. Aufl. Wiesbaden: VS. Rauch, Dominique P., Martin Schastak & Katja Richter (2016): Diagnostik sprachlicher Kompetenzen bei Personen mit Migrationshintergrund. In Débora B. Maehler & Heinz Ulrich Brinkmann (Hrsg.), Methoden der Migrationsforschung. Ein interdisziplinärer Forschungsleitfaden, 97–133. Wiesbaden: Springer. Redder, Angelika, Knut Schwippert, Marcus Hasselhorn, Sabine Forschner, Detlef Fickermann & Konrad Ehlich (2011): Bilanz und Konzeptualisierung von strukturierter Forschung zu „Sprachdiagnostik und Sprachförderung“. ZUSE-Berichte Band 2 [Elektronische Version]. Hamburg: Hamburger Zentrum für Unterstützung der wissenschaftlichen Begleitung und Erforschung schulischer Entwicklungsprozesse (ZUSE). http://epub.sub.uni-hamburg.de/ epub/volltexte/2011/9874/pdf/zuse_berichte_02.pdf (12. 12. 2016). Reich, Hans H. (2003): Tests und Sprachstandsmessungen bei Schülern und Schülerinnen, die Deutsch nicht als Muttersprache haben. In Ursula Bredel, Hartmut Günther, Peter Klotz, Jakob Ossner & Gisela Siebert-Ott (Hrsg.), Didaktik der deutschen Sprache. Band 2, 914–923. Paderborn: UTB- Schöningh. Reich, Hans H. (2005): Auch die „Verfahren zur Sprachstandsanalyse bei Kindern und Jugendlichen mit Migrationshintergrund“ haben ihre Geschichte. In Ingrid Gogolin, Ursula Neumann & Hans-Joachim Roth (Hrsg.), Sprachdiagnostik bei Kindern und Jugendlichen mit Migrationshintergrund, 87–95. Münster: Waxmann. Reich, Hans H. (2014): Sprachstandserhebungen, ein- und mehrsprachig. In Bernt Ahrenholz & Ingelore Oomen-Welke (Hrsg.), Deutsch als Zweitsprache, 420–429. 3., korr. Aufl. Baltmannsweiler: Schneider. Reich, Hans H. & Hans-Joachim Roth (2004): Hamburger Verfahren zur Analyse des Sprachstands Fünfjähriger − HAVAS 5. Landesinstitut für Lehrerbildung und Schulentwicklung Hamburg. Reich, Hans H. & Hans-Joachim Roth (2007): HAVAS 5 − das Hamburger Verfahren zur Analyse des Sprachstands bei Fünfjährigen. In Hans H. Reich, Hans-Joachim Roth & Ursula Neumann (Hrsg.), Sprachdiagnostik im Lernprozess. Verfahren zur Analyse von Sprachständen im Kontext von Zweisprachigkeit, 71–94. Münster: Waxmann. Rißling, Julia-Katharina & Franz Petermann (2015): Standardisierte Sprachdiagnostik in der KiTa: Pro und Contra. Frühe Bildung, 4, 226–228. Rost, Detlef H. (2007): Interpretation und Bewertung pädagogisch-psychologischer Studien − eine Einführung. 2., überarb. u. erw. Aufl. Weinheim, Basel: Beltz. Schneider, Wolfgang, Jürgen Baumert, Michael Becker-Mrotzek, Marcus Hasselhorn, Gisela Kammermeyer, Thomas Rauschenbach, Hans-Günther Roßbach, Hans-Joachim Roth, Monika Rothweiler & Petra Stanat (2012): Expertise „Bildung durch Sprache und Schrift (BISS)“ (Bund-Länder-Initiative zur Sprachförderung, Sprachdiagnostik und Leseförderung) http:// www.biss-sprachbildung.de/pdf/BiSS-Expertise.pdf (12. 12. 2016). Schulz, Petra & Rosemarie Tracy (2011): LiSe-DaZ. Linguistische Sprachstandserhebung – Deutsch als Zweitsprache. Manual. Göttingen u. a.: Hogrefe. Settinieri, Julia (2012): Zur Messgüte sprachstandsdiagnostischer Verfahren im Vorschulalter. Erste Ergebnisse der Korrelationsstudie Sismik/Seldak – Delfin 4. In Bernt Ahrenholz & Werner Knapp (Hrsg.), Sprachstand erheben – Spracherwerb erforschen. Beiträge aus dem 6. Workshop „Kinder mit Migrationshintergrund“ 2010, 35–52. Freiburg im Breisgau: Fillibach. Zimmer, Renate (2014): BaSiK. Begleitende alltagsintegrierte Sprachentwicklungsbeobachtung in Kindertageseinrichtungen. Manual. Unter der Mitarbeit von Nadine Madeira Firmino, Stefanie Rieger, Carolin Eckrodt. Freiburg im Breisgau: Herder.

Stefan Jeuk und Julia Settinieri

6 Der sprachdiagnostische Prozess 1 2 3 4 5 6

Einleitung Der diagnostische Prozess in der Psychologie Der förderdiagnostische Prozess in der Sonderpädagogik Sprachdiagnostische Prozesse im Hinblick auf Deutsch als Zweitsprache Ein sprachprozessdiagnostisches Modell Schlussbemerkungen

1 Einleitung Verschiedene Disziplinen setzen sich mit sprachdiagnostischen Prozessen auseinander; entsprechend unterschiedlich fallen Modellvorstellungen, Vorgehensweisen und Ansprüche an Qualitätsmerkmale aus. Von Seiten der Psychologie werden diagnostische Prozesse als Modelle beschrieben, die in verschiedenen Kontexten, wie z. B. bei der Arbeits- und Betriebspsychologie, der Organisationspsychologie, der klinischen Psychologie, der forensischen Psychologie und nicht zuletzt der pädagogischen Psychologie, Anwendung finden und in der Regel im Kontext einer Gutachtenerstellung auf Initiative eines externen Auftraggebers zur Anwendung kommen (Schmidt-Atzert & Amelang 2012; Krohne & Hock 2015). In pädagogischen und schulischen Kontexten gibt es erziehungswissenschaftlich fundierte Modelle, hier wird von Pädagogischer Diagnostik gesprochen (Horstkemper 2006). Eine lange Tradition der Sprachdiagnostik gibt es auch in der Sprachbehindertenpädagogik und der Sprachpathologie. Hier sind die Prozesse und Vorgehensweisen auf Schwierigkeiten bei der Sprachaneignung im Sinne von Sprachentwicklungsverzögerungen oder Sprachbehinderungen bezogen (von Knebel & Schuck 2007). Auch in diesen sonderpädagogischen Feldern finden sich verschiedene Akteure mit teilweise konträren Vorstellungen über Diagnostik und diagnostische Prozesse (wie Pädiatrie, Logopädie, Psychologie oder Sprachheilpädagogik; vgl. Chilla in diesem Band). In der Fremdsprachendidaktik bzw. in der Zweitspracherwerbsforschung spielen diagnostische Prozesse ebenfalls eine Rolle, u. a. im Kontext von Testen, Prüfen und Bewerten, z. B. zur Erlangung eines Sprachdiploms. In jüngerer Zeit haben sich hier vor allem im außerschulischen Bereich Testverfahren im Rahmen des Gemeinsamen Europäischen Referenzrahmens für Sprachen (GER) etabliert (vgl. Porsch & Wendt in diesem Band). Auch in der Didaktik Deutsch als Zweitsprache (DaZ) hat sich in den letzten Jahren zunehmend eine Auseinandersetzung mit diagnostischen Prozessen entwickelt, hier vor allem im Kontext einer Förderdiagnostik, bei der es darum geht zu ergründen, was eine Schülerin oder ein Schüler kann, wo ihre bzw. seine Lernpotentiale sind und wo die Förderung ansetzen soll. Außerdem werden Diagnoseverfahren in verschiedenen Bundesländern zur Steuerung von Bildungsgängen https://doi.org/10.1515/9783110418712-006

118

Stefan Jeuk und Julia Settinieri

eingesetzt, wobei bei hier eingesetzten Screenings nur in Ansätzen von einem diagnostischen Prozess die Rede sein kann. In vielen Bundesländern wurden seit der Jahrtausendwende in den Einschulungsuntersuchungen verstärkt Sprachtests und Screenings entwickelt, unter anderem mit dem erklärten Ziel, frühzeitig Sprachförderbedarfe (für mehrsprachige und, wie immer betont wird, auch für einsprachige Kinder) zu erkennen, um frühzeitig bildungspolitisch steuernd eingreifen zu können. Nicht immer wird hier zwischen einsprachigen und mehrsprachigen Erwerbsprozessen unterschieden. In der Regel handelt es sich um selektierende Screenings, und nicht in allen Fällen erhalten Kinder, bei denen Sprachförderbedarf festgestellt wird, anschließend eine zusätzliche Unterstützung bzw. sprachliche Förderung (bspw. wenn nicht genügend Kinder Förderbedarf haben, um eine Gruppe zu bilden). Eine zusätzliche Sprachförderung in der Kita baut demgegenüber nicht in jedem Fall auf (förder-)diagnostischen Ergebnissen auf. Auch die Zweitspracherwerbsforschung und die Sprachwissenschaft haben sich insbesondere in jüngerer Zeit mit diagnostischen Modellen befasst. Ehlich et al. (2007, 2009) erstellten entsprechende Gutachten für das BMBF. Hier ist eher von Sprachstandserhebung, Sprachstandsbeschreibung oder Sprachbeobachtung die Rede, und naturgemäß spielt die Grundlagenforschung von Sprachaneignungsprozessen (einsprachig und mehrsprachig) eine große Rolle (vgl. Chilla in diesem Band). Aus den Gutachten von Ehlich et al. (2007, 2009) wird deutlich, dass mehrsprachige Erwerbsprozesse bei weitem nicht so gut erforscht sind, als dass eindeutige Anforderungen an Sprachstandserhebungsverfahren formuliert werden könnten. Es zeigt sich auch, dass Anforderungen an sprachdiagnostische Prozesse und Verfahren, die sich auf fundierte Analysen von Erwerbsprozessen beziehen, sich in wichtigen Punkten von psychologischen Modellvorstellungen unterscheiden. Bredel (2007) spricht in diesem Zusammenhang von einer „verlassenen Landschaft“ der Sprachstandsmessung im Hinblick auf die Kommunikation zwischen Psychologen und Zweit- und Fremdsprachenforschenden. Im Kontext der Bildungsforschung gab es hier in jüngerer Zeit jedoch einige Annäherungsversuche. Insbesondere in pädagogischen und psychologischen Kontexten hat sich in den letzten Jahren eine Prozessdiagnostik bzw. Lernverlaufsdiagnostik etabliert (Hasselhorn, Schneider & Trautwein 2014), bei der Lernprozesse als solche begleitet werden sollen. Im Kontext einer formativen Diagnostik soll nicht nur der Lernstand am Anfang oder am Ende eines Lernprozesses dokumentiert werden, um weitere Entscheidungen treffen zu können; vielmehr soll der Lernprozess selbst fortlaufend unterstützt werden. Auch hier gibt es wiederum zum Teil unterschiedliche Modellvorstellungen, z. B. aus der Psychologie einerseits und der Erziehungswissenschaft bzw. Sprachdidaktik andererseits. In gewisser Weise sind Lehrkräfte aller Schularten täglich mit diagnostischen Prozessen befasst, müssen sie doch, um Unterricht planen, durchführen und reflektieren zu können, (sprachliche) Entwicklungsstände ihrer Schülerinnen und Schüler einschätzen und einordnen können. Der „Einsetzpunkt didaktischer Maßnahmen“

Der sprachdiagnostische Prozess

119

muss bestimmt werden können (Ossner 2006: 87). Allerdings sind diese diagnostischen Prozesse immer an die Prozesse des Unterrichtens und des Förderns gekoppelt und teilweise auch an Benotung und Bewertung gebunden (Jürgens & Lissmann 2015). Sie unterscheiden sich fundamental von einem einmaligen, in der Regel summativen diagnostischen Prozess mit dem Ziel einer Gutachtenerstellung. In Bezug auf schulische Diagnostik ist die Lehrkraft nach Jürgens & Lissmann (2015) Auftraggeber, Gutachter, Umsetzer und Evaluierer in einem. In einer unterrichtsbezogenen Förderdiagnostik spielen auch Fragen der Klassennorm, der Motivation, des Curriculums usw. eine Rolle. Insofern wäre zu fragen, ob die im Kontext der PISA-Studie immer wieder geäußerte Einschätzung, nach der Lehrkräfte schlechte Diagnostiker seien, so überhaupt getroffen werden kann, denn das PISA-Konsortium führt ein Testverfahren bei sehr vielen Schülerinnen und Schülern zu einem einmaligen Messzeitpunkt mit einem einzigen Instrument mit dem Ziel des internationalen Vergleichs großer Populationen durch. Diagnostische Prozesse an Schulen verfolgen demgegenüber völlig andere Ziele. Sie sind u. a. von der Notwendigkeit geprägt, Möglichkeiten, Kompetenzen und Grenzen bei einzelnen Individuen zu erfassen und zu verstehen und darauf aufbauend Lernprozesse anzuregen und zu unterstützen (vgl. auch Settinieri & Jeuk in diesem Band zu politischer vs. pädagogischer Diagnostik). Dazu gehört, die Langfristigkeit von Lernprozessen im Blick zu haben und sich an möglichen Bildungslaufbahnen zu orientieren, ebenso wie die Eingebundenheit des Lernens in die Klassengemeinschaften und soziale Umgebungen. Es wird also bereits an dieser Stelle deutlich, dass es den diagnostischen Prozess genauso wenig wie das diagnostische Verfahren gibt; vielmehr müssen der Kontext, die Fragestellung, die methodischen Möglichkeiten und das Ziel des jeweiligen Prozesses differenziert werden. In diesem Beitrag wird zunächst der gewissermaßen klassische diagnostische Prozess dargestellt, wie er auch über die pädagogische Psychologie hinaus bei der Gutachtenerstellung relevant ist. Diese Form des diagnostischen Prozesses wird in der Psychologie in der Regel idealisiert und idealtypisch dargestellt, denn mit einem solchen Vorgehen ist die Erwartung verbunden, zu objektiven, reliablen und validen Ergebnissen zu kommen. Wie an der hohen bildungspolitischen Bedeutung der Ergebnisse internationaler Vergleichsstudien abgelesen werden kann, werden Vorgehensweisen, die sich an den testtheoretischen Gütekriterien orientieren, derzeit schulpolitisch favorisiert. In einem zweiten Schritt wird der aus der Sonderpädagogik hervorgegangene förderdiagnostische Ansatz vorgestellt, dem in der unterrichtlichen Praxis eine wesentlich höhere Bedeutung zukommt, der bildungspolitisch jedoch derzeit eher um Anerkennung ringen muss, vermutlich, weil förderdiagnostische Prozesse aufwändig, langwierig und damit ressourcenintensiv sind. Der Beitrag schließt mit Anforderungen an einen sprachdiagnostischen Prozess bei mehrsprachigen Lernerinnen und Lernern sowie mit der Vorstellung eines förderdiagnostischen Werkzeugkoffers.

120

Stefan Jeuk und Julia Settinieri

2 Der diagnostische Prozess in der Psychologie In der Psychologie stellt die Psychologische Diagnostik ein eigenes Arbeitsfeld dar, innerhalb dessen die Beschreibung von diagnostischen Prozessen einen großen Stellenwert einnimmt. In einer Reihe von Lehrbüchern wird versucht, diagnostische Prozesse über verschiedene Anwendungsgebiete und Kontexte hinweg zu beschreiben und Vorschläge für den Prozessverlauf zu formulieren (Schmidt-Atzert & Amelang 2012, Krohne & Hock 2015, Stemmler & Margraf-Stiksrud 2015). Dabei herrscht Einigkeit, dass es zwar Übereinstimmungen und Grundtendenzen gibt, die diagnostische Prozesse ausmachen, der konkrete diagnostische Prozess aber vom Arbeitsgebiet, von der Fragestellung und dem Kontext, also vom konkreten Einzelfall abhängig ist. Ein diagnostischer Prozess im Fachgebiet der Psychologie wird initiiert, indem ein Klient (ein Gericht, ein Arbeitgeber, eine Schule, Eltern, eine Krankenkasse) mit einer Fragestellung an eine Diagnostikerin oder einen Diagnostiker herantritt, mit dem Auftrag, ein Gutachten zu erstellen. Neben den Aufträgen im juristischen und im medizinischen Bereich gehören Aufträge an Sonderpädagog*innen seitens der Schulverwaltung, einen sonderpädagogischen Förderbedarf bei einem Kind festzustellen, zu den klassischen Bereichen der Gutachtenerstellung. Auch schulpsychologische Gutachten im Hinblick auf die Laufbahnentscheidung bzw. die Wahl einer weiterführenden Schule gehören in diesen Bereich. Der diagnostische Prozess beginnt mit dem ersten Kontakt zwischen der Diagnostikerin bzw. dem Diagnostiker und dem Klienten (vgl. Schmidt-Atzert & Amelang 2012: 386). Der Klient tritt mit einer Fragestellung an die Diagnostikerin bzw. den Diagnostiker heran, die Fragestellung kann aus einer oder mehreren Fragen bestehen. Zum Kernbereich der pädagogisch-psychologischen Diagnostik gehört „die Analyse der Bedingungen, des Verlaufs und der Ergebnisse institutionalisierter Lehr-Lernprozesse. Ihr wesentliches Ziel ist es, Informationen zu gewinnen, die für eine Optimierung individuellen Lernens benötigt werden“ (Krohne & Hock 2015: 506). Typische Fragestellungen aus der pädagogischen Psychologie beziehen sich auf die Ursachen von Leistungseinbrüchen bei Kindern und Jugendlichen, auf Schullaufbahnberatungen, auf Lernstandserhebungen oder auf die Klärung von Hintergründen von Verhaltensschwierigkeiten. Immer wieder kommen z. B. Eltern oder auch Jugendämter auf schulpsychologische Beratungsstellen oder andere psychologische Dienste mit einer solchen Fragestellung zu. Bei Erwachsenen kommen psychologische Gutachten z. B. im Kontext von Gerichtsverfahren zum Einsatz. Der Auftrag setzt nun den diagnostischen Prozess in Gang: „Als diagnostischer Prozess wird die Abfolge von Maßnahmen zur Gewinnung diagnostisch relevanter Informationen und deren Integration zur Beantwortung der Fragestellung bezeichnet.“ (SchmidtAtzert & Amelang 2012: 386) Schmidt-Atzert & Amelang (2012: 387) führen an, dass psychologische Diagnostik in der Regel als gezielte Beantwortung konkreter und präziser Fragestellungen

Der sprachdiagnostische Prozess

121

zu verstehen sei. Sie sehen eine Parallele zu diagnostischen Fragestellungen außerhalb der Psychologie: Der KFZ-Mechaniker frage bei der Überprüfung von Fehlfunktionen bei der Zündung eines Autos auch nicht danach, das Auto „ganzheitlich“ zu sehen. Vielmehr suche er an konkreten Bauteilen nach Fehlfunktionen, die gezielt mit der Zündung (und nicht mit anderen Funktionen) zu tun haben. Es sei klar, dass psychologische Diagnostik, wenn sie präzise sein wolle, nur selektiv im oben erläuterten Sinne sein könne. Das ganzheitliche Persönlichkeitsbild des Klienten interessiere nur, wenn es zur Beantwortung der Fragestellung relevant sei. Diese Feststellung wird auch vor dem Hintergrund der Ansicht geäußert, dass statistisch abgesicherte Urteile, insbesondere wenn sie auf standardisierten Verfahren basieren, letztlich zu den valideren Prognosen führen. Das Vorgehen von Diagnostiker*innen im Prozess kann in idealisierter Weise abstrahiert werden. Es wird versucht, einen theoretisch perfekten Ablauf zu modellieren, der für möglichst viele Kontexte einen Rahmen geben kann. Einige Autor*innen sind der Ansicht, dass Planung, Durchführung und Evaluation der Interventionen, die auf die Diagnose folgen, kein Bestandteil des diagnostischen Prozesses seien. Viele Auftraggeber (z. B. im Fall von Gerichtsverfahren) erwarten gar keine konkreten Interventions- oder Handlungsvorschläge. Selbst das Verfassen des Gutachtens wird nicht einheitlich als Teil der Diagnostik gesehen. Eine mögliche schematische Darstellung des diagnostischen Prozesses bieten Schmidt-Atzert & Amelang (2012: 387; s. Abb. 1). Dieser Modellierung zufolge beginnt der diagnostische Prozess mit der Fragestellung eines Auftraggebers. Die Fragestellung wird angenommen, wenn sie aus Sicht der Diagnostikerin bzw. des Diagnostikers klar formuliert und grundsätzlich beantwortbar ist. Ist dies nicht der Fall, kann sie abgelehnt werden bzw. es sollte versucht werden, die Fragestellung zu präzisieren oder zu modifizieren. Dabei kann der Diagnostikerin bzw. dem Diagnostiker durchaus eine beratende Funktion gegenüber dem Auftraggeber zukommen. Gründe, Aufträge abzulehnen, können z. B. darin bestehen, dass der Diagnostikerin bzw. dem Diagnostiker die Sachkenntnis fehlt bzw. dass die Fragestellung nicht oder nur zum Teil in ihr/sein Arbeitsgebiet fällt. Es ist aber auch möglich, dass die Diagnostikerin bzw. der Diagnostiker ethische Bedenken hat oder persönlich befangen ist. In vielen Fällen besteht die Beratung darin klarzustellen, was die Diagnostikerin bzw. der Diagnostiker leisten kann und was ökonomisch machbar und sachlich angemessen ist. Ein Auftrag sollte letztlich nur angenommen werden, wenn der Umfang des Auftrags klar ist. Die endgültige Fragestellung muss dokumentiert werden, häufig in Form eines Vertrags oder eines Arbeitsauftrags. In der Regel sind Fragestellungen so komplex, dass sie nicht direkt und einfach beantwortbar sind. Zur Beantwortung der Fragestellung geht die Diagnostikerin bzw. der Diagnostiker daher hypothesengeleitet vor. Es werden Fragen formuliert, deren Beantwortung zur Lösung des Problems führt. „Bei der Formulierung der konkreten psychologischen Fragen kommt es darauf an, nicht alle Faktoren zu berück-

122

Stefan Jeuk und Julia Settinieri

Auftraggeber

Bericht

Präzisieren, modifizieren Untersuchungsanlass, Vorliegende Informationen

Klare, beantwortbare Fragestellung

Hypothesen (psychologischeFragen)

nein

Auftrag ablehnen

ja Auswahl geeigneter Verfahren nein Diagnostische Untersuchung nein

Fragestellung beantwortet?

ja

Fragen beantwortet?

Abb. 1: Der idealtypische diagnostische Prozess (eigene Darstellung in Anlehnung an SchmidtAtzert & Amelang 2012: 387; vgl. ferner auch Krohne & Hock (2015) sowie Stemmler & MargrafStiksrud (2015)).

sichtigen, die grundsätzlich relevant sein können. Vielmehr gilt es, die im vorliegenden Fall naheliegenden Faktoren zu erkennen.“ (Schmidt-Atzert & Amelang 2012: 389) Die psychologischen Fragen müssen so gewählt werden, dass sie grundsätzlich durch geeignete diagnostische Verfahren geklärt werden können. z. B. sind Fragen, ob eine Probandin bzw. ein Proband mindestens durchschnittlich intelligent ist oder ob sie/er emotional stark belastet ist, grundsätzlich beantwortbar. Die diagnostischen Auswertungen von Daten sind immer als hypothesengeleitete Interpretationen zu sehen (Krohne & Hock 2015: 196). Zur Beantwortung der Frage, ob eine Schülerin eine Förderschule besuchen soll, könnte z. B. ein IQ-Test einen ersten Hinweis geben. Die Hypothese wäre, dass ein in einem Intelligenztest gemessener niedriger IQ-Wert (z. B. 80) ein Hinweis auf kognitive Einschränkungen des Kindes ist, die die Feststellung eines sonderpädagogischen Förderbedarfs mit dem Förderschwerpunkt Lernen gerechtfertigt erscheinen ließen. Vermutlich würde aber

Der sprachdiagnostische Prozess

123

ein Intelligenztest nicht ausreichen und man würde, wenn bei der Durchführung des Tests Fragen oder Unsicherheiten aufkommen, einen zweiten, anders aufgebauten Intelligenztest hinzuziehen. Dies könnte z. B. der Fall sein, wenn das Kind im ersten IQ-Test insbesondere an sprachlich gestellten Aufgaben scheiterte und die Diagnostikerin sich nicht sicher ist, ob bei einem weniger sprachgebundenen Intelligenztest bessere Ergebnisse herauskommen könnten. Darüber hinaus können auch weitere Gründe (emotional, sozial, sprachlich, familiär) dazu führen, dass eine Empfehlung der Feststellung eines sonderpädagogischen Förderbedarfs ausgesprochen wird. Zu Beginn des Auftrags sollte die Diagnostikerin bzw. der Diagnostiker so viele Vorinformationen wie möglich einholen. Handelt es sich um die Darstellung und Analyse von Vorerkrankungen, so ist von Anamnese die Rede. Die Vorinformationen können aus Gesprächsprotokollen, Akten über vorhergehende Untersuchungen und Diagnosen oder familiären Hintergrundinformationen bestehen. Im nächsten Schritt müssen die geeigneten Verfahren bzw. Diagnosemethoden gefunden werden (vgl. Stemmler & Margraf-Stiksrud 2015: 341). Auswahlkriterien können eindeutige Validitätsbelege, aktuelle Normen, Zumutbarkeit, Zeitaufwand usw. sein. Kommt einem Verfahren hohe Bedeutung für die Beantwortung der Fragestellung zu, werden hohe Anforderungen an die Gütekriterien gestellt. Dies ist z. B. bei Gerichtsverfahren hoch relevant. Die Verfahren werden nun eingesetzt, die Daten werden erhoben. Im Idealfall beantworten die eingesetzten Verfahren die psychologischen Fragen. Die Antwort kann aber auch unbefriedigend sein. Oder die Antworten können widersprüchlich sein, etwa wenn die Ergebnisse zweier Methoden sich scheinbar widersprechen. Z. B. ergibt ein Intelligenztest einen niedrigen IQ-Wert, der Schüler hat aber gute Noten und die Verhaltensbeobachtung ergibt, dass er Zusammenhänge gut erfassen kann und sich differenziert ausdrückt. Möglicherweise hatte der Schüler mit den ausschließlich figuralen Aufgaben des Tests Schwierigkeiten. Auch in einem solchen Fall könnte ein weiterer Intelligenztest Klarheit verschaffen. Ist die Diagnostikerin bzw. der Diagnostiker der Ansicht, dass mit den eingesetzten Verfahren und Methoden die Fragestellung beantwortet werden kann, kommt der diagnostische Prozess zu seinem Ende. Er wird mit einem diagnostischen Urteil abgeschlossen, mit dem die Fragestellung unter Verwendung der vorliegenden Informationen beantwortet wird. In der Regel fertigt der Diagnostiker ein Gutachten an, das er dem Auftraggeber übergibt und in dem eine (je nach Auftrag) Empfehlung ausgesprochen wird. Ein wie oben beschriebener Prozess wird in der pädagogisch-psychologischen Diagnostik in der Regel im Kontext einer so genannten summativen Diagnostik ablaufen, in deren Rahmen der Entwicklungsstand zu einem gewissen Zeitpunkt abschließend diagnostiziert wird. Ein anderer Zugang wäre das Modell einer formativen Diagnostik, bei dem nicht nur Entwicklungsfortschritt dokumentiert wird, sondern zugleich der Prozess selbst gefördert werden soll (Klauer 2014). Dies soll

124

Stefan Jeuk und Julia Settinieri

bspw. im schulischen Kontext durch Rückmeldung von Lernergebnissen an die Lehrenden und an die Lernenden erfolgen. In der Psychologie wird z. B. der Einsatz von mehreren Verfahren in gewissen Abständen vorgeschlagen. So gesehen wäre ein formativer Diagnoseprozess gewissermaßen eine Aneinanderreihung mehrerer kleiner Prozesse. Klauer (2014: 11) legt Wert drauf, dass auch solche Teilverfahren den Gütekriterien zu genügen haben. In der Pädagogik und insbesondere in der Sonderpädagogik werden in Abgrenzung zum eben beschriebenen psychologischen Vorgehen seit den 1970er Jahren Modelle förderdiagnostischer Prozesse diskutiert, in denen normierten Verfahren ein geringerer Stellenwert zugewiesen wird. Diese Ansätze werden im folgenden Abschnitt vorgestellt.

3 Der förderdiagnostische Prozess in der Sonderpädagogik Nach von Knebel & Schuck (2007) ist sonderpädagogische Diagnostik nichts anderes als pädagogische Diagnostik. Diagnostik bei Kindern mit dem Förderschwerpunkt Sprache z. B. ist demzufolge pädagogische Diagnostik mit einem Schwerpunkt auf einem bestimmten Förderbereich. Gegenstand der Sprachdiagnostik in der Sprachbehindertenpädagogik ist nicht allein die Sprache als solche, sondern auch der Erwerb und der Gebrauch der Sprache durch ein Subjekt, das sich in einer bestimmten Lebenswelt entwickelt. Insofern wird in der Sonderpädagogik Wert auf ein entwicklungsorientiertes und sozialwissenschaftlich orientiertes Paradigma gelegt, das sich weg von einem Institutionenbezug hin zu einem Personenbezug wandeln muss. In gewisser Weise wird hier eine Ganzheitlichkeit gefordert, die SchmidtAtzert & Amelang (2012, s. o.) für die Psychologie gerade systematisch aus dem diagnostischen Prozess ausgeschlossen wissen wollen. Bis Ende der 1990er Jahre wurde pädagogische Diagnostik eher selten als Aufgabe einer Lehrkraft gesehen, bzw. die Tätigkeiten des Einschätzens der Möglichkeiten und Potentiale der Schülerinnen und Schüler sowie das Testen, Bewerten und Rückmeldung Geben seitens der Lehrkraft wurden nicht als Diagnostik bezeichnet. In der Sonderpädagogik stellt Diagnostik demgegenüber bereits seit den 1970er Jahren einen eigenen Arbeitsbereich dar. Im Rahmen von Entscheidungsprozessen, ob ein Kind einen sonderpädagogischen Förderbedarf aufweist, wurden und werden sonderpädagogische Gutachten erstellt, die auf der Grundlage von diagnostischen Prozessen entstehen, deren Grundstruktur dem oben beschriebenen idealtypischen psychologischen Diagnoseprozess entspricht. Wenn beispielsweise einer Grundschullehrkraft auffällt, dass sie ein Kind im Rahmen ihrer Möglichkeiten nicht angemessen unterstützen bzw. fördern kann, kann die Schule auf der Grundlage der Zusammenarbeit mit den Eltern (oder die Eltern selbst) bei der Schulbehörde (z. B.

Der sprachdiagnostische Prozess

125

einem Schulamt) eine Meldung machen. Daraufhin beauftragt diese Behörde (das Schulamt) eine Sonderschullehrerin bzw. einen Sonderschullehrer mit der sonderpädagogischen Überprüfung. Unter Zuhilfenahme von bereits bestehenden Gutachten (z. B. ärztliche Untersuchungen), Gesprächen, Beobachtungen und Testverfahren muss die Sonderschullehrerin bzw. der Sonderschullehrer nun ein Gutachten vorlegen, das eine Empfehlung abgibt. Diese Empfehlung konnte bis vor kurzer Zeit z. B. darin bestehen, dass vorgeschlagen wurde, das Kind an einer Förderschule einzuschulen. Außerdem soll das Gutachten so präzise wie möglich festhalten, worin der genaue Förderbedarf des Kindes besteht und wo die Förderung ansetzen soll. Spätestens seit Inklusion ein fester Bestandteil der Schulgesetzgebung in Deutschland geworden ist, besteht die Empfehlung weniger in der Festlegung eines Förderorts als vielmehr in der Beschreibung eines Förderbedarfs. Daraus kann z. B. resultieren, wie viele zusätzliche Lehrerwochenstunden eine aufnehmende Schule für die sonderpädagogische Betreuung dieses Kindes erhält. Die genaue Vorgehensweise ist in den entsprechenden Erlassen der Bundesländer geregelt. Auch in jüngerer Zeit spielen solche Gutachten eine Rolle. In BadenWürttemberg ist es z. B. so, dass die Eltern seit 2015 ein freies Wahlrecht haben, ob sie ihr Kind an einem sonderpädagogischen Bildungs- und Beratungszentrum einschulen möchten oder an einer Regelschule. Grundlage der Beratung der Eltern ist nach wie vor das sonderpädagogische Gutachten. Im Falle einer Beschulung des Kindes in der Regelschule bekommt diese ein bestimmtes Kontingent an zusätzlichen Lehrerwochenstunden. Da die Höhe dieser Zuweisung abhängig vom Förderschwerpunkt des Kindes ist (Sprache, Lernen, geistige Entwicklung, Hören, Sehen, Körperliche Entwicklung, Verhalten), ist das Ergebnis des Gutachtens von erheblicher Relevanz.1 Bis in die 1980er Jahre dominierte bei der sonderpädagogischen Gutachtenerstellung die Feststellung eines Förderbedarfs auf der Grundlage normierter Tests. Dieses „medizinische“ 2 Modell kam besonders im Kontext der Differenzierung von 1 Die Praxis, dass für Kinder mit einem sonderpädagogischen Förderbedarf im Bereich „geistige Entwicklung“ mehr zusätzliche Lehrerwochenstunden beantragt werden können als für ein Kind mit einem sonderpädagogischen Förderbedarf im Bereich „Lernen“ oder „Sprache“, widerspricht dem Prinzip der Inklusion grundsätzlich. Durch unterschiedliche Ressourcenzuteilungen kann es für Schulen attraktiver oder weniger attraktiv sein, ein Kind mit einer bestimmten „Diagnose“ aufzunehmen. So werden „Inklusionskinder“ zum Gegenstand ressourcenbezogener Argumentationen. Inklusion bezieht sich demgegenüber auf generelle Effekte einer Lernervielfalt im gemeinsamen Unterricht. Inklusive Schulen müssten so verstanden nicht vor dem Hintergrund der Zuteilung von Ressourcen auf der Grundlage der Zuweisung von Behinderung an einzelne Kinder konstituiert werden, sondern grundsätzlich für alle Kinder die notwendigen Lernbedingungen bereitstellen. Diagnostik wäre dann nicht dem Ziel der Zuweisung untergeordnet, sondern könnte sich auf Förderdiagnostik konzentrieren. Zu diesem „Ressourcen-Etikettierungs-Dilemma“ vgl. auch Böttinger (2016: 18). 2 Im sonderpädagogischen Diskurs wurde das „medizinische“ Modell häufig als Gegenpool zu einer am Kind orientieren Förderdiagnostik konstruiert. Dabei wurde übersehen, dass es in der Medizin eine vergleichbare Debatte gegeben hatte (vgl. Meehl 1954).

126

Stefan Jeuk und Julia Settinieri

Lernbehinderung und geistiger Behinderung zum Tragen, die vorrangig über entsprechende IQ-Werte definiert wurden. In den 1970er Jahren wurde zunehmend Kritik an dieser Selektionsdiagnostik laut und es wurde eine an den Förderbedürfnissen der Kinder orientierte Diagnostik eingefordert. Kobi (1977) stellte in 28 Thesen die Förderdiagnostik der Selektionsdiagnostik gegenüber (vgl. Settinieri & Jeuk in diesem Band). Im Folgenden sollen einige Aspekte des förderdiagnostischen Ansatzes genannt werden, die sich auf den diagnostischen Prozess beziehen (vgl. Bundschuh 2013: 54–56): − Im Vordergrund der Förderdiagnostik steht die Intervention (nicht die Selektion bzw. Zuweisung zu einem Förderort). − Der förderdiagnostische Prozess beruht auf der Interaktion. Das zur Diskussion stehende Kind wird, wie alle übrigen Personen, als integrierendes Unterganzes eines Kommunikationssystems und nicht als Diagnosegegenstand gesehen. − Wichtiger als eine Produkt-Analyse ist eine Lernprozessanalyse. − Förderdiagnostik ist per se ein Prozess, der nicht zwingend abgeschlossen wird oder abgeschlossen werden kann. Förderdiagnostik erfordert demzufolge kontinuierliche Situationsanalysen, und die Diagnostik findet dort statt, wo das Kind lernt. − Der förderdiagnostische Prozess ist eingebunden in den Lernprozess des Kindes. Diagnostik und Intervention bzw. Förderung bilden eine untrennbare Einheit. − Förderdiagnostik endet nicht mit der Ausfertigung eines Gutachtens, denn im Vordergrund steht die kontinuierliche Förderung des Kindes. Ausgehend von den Forderungen Kobis formuliert Bundschuh (2014: 135) ein förderdiagnostisches Modell, das er „Akzentuierung förderdiagnostischer Aktivitäten im Verlauf des Förderungsprozesses“ nennt. Dabei versucht er, Anforderungen an eine valide, reliable und objektive, also normorientierte Diagnostik zu wahren und diese in ein förderdiagnostisches Modell, das zum einen eine Vielzahl anderer Verfahren einbezieht und das zum anderen am förderdiagnostischen Prozess orientiert ist, einzubinden (vgl. Abb. 2). Wie gezeigt werden kann, ist der Prozess in einem so verstandenen förderdiagnostischen Modell nicht grundsätzlich anders als der oben beschriebene klassische diagnostische Prozess in der Psychologie, geht aber im grundsätzlichen Ziel durch die Fokussierung auf die konkrete Förderung und Unterstützung des Kindes, die Einbindung in die weitere Förderung und die ständige Weiterentwicklung weit darüber hinaus und endet nicht mit der Erstellung eines Gutachtens, sondern ist vielmehr zyklisch angelegt. Fragestellung und Erstellen eines Förderplans, die Umsetzung des Förderplans und die Weiterführung im Prozess gehören explizit zum förderdiagnostischen Prozess dazu (vgl. Braun & Schmischke 2010). Darüber hinaus wird das Kind in seiner Lebens- und Lernwelt in stärkerem Maße ganzheitlich betrachtet, so dass Aspekte einer Analyse der Umwelt- und der Lernbedingungen in

Der sprachdiagnostische Prozess

127

Phase der Vorinformation Problem / Fragestellung Anamnese Hypothesenbildung (Vorinformation einer Schule, (erste Informationsgespräche (Vermutungen über Ursachen, von Eltern, Ärzten, mit Eltern, dem Kind, Planung der Untersuchung, Erzieherinnen, …) Bezugspersonen) einzusetzende Verfahren) Psychologisch/pädagogische / medizinische Informationsphase Einsatz von Verfahren: Sichtung, Auswertung, Explorierendes, teils beratendes Gespräch Interpretation der – Überprüfung der Sinnestüchtigkeit mit dem Kind, den Informationen – Formelle / normierte Verfahren Eltern, mit weiteren – Informelle Verfahren wie Bezugspersonen Verhaltensbeobachtung, Lernverhalten, Entscheidung, Spontansprachanalyse, … Gutachten Förderungsprozess Beratung der Eltern bzw. der Familie Förderung / Unterstützung in der Familie Beratung der Lehrkräfte Förderung / Unterstützung in der Schule Beratung über zukünftigen Förderort Konkrete Fördermaßnahmen / Unterricht Permanente Effektivitätskontrolle Ggf. Ziel der Aufhebung eines anderen Förderortes, Modifikation / Überprüfung der Fördermaßnahmen.

Abb. 2: Der förderdiagnostische Prozess (eigene Darstellung in Anlehnung an Bundschuh 2014: 138–139).

die Diagnose einfließen können. Da psychometrische Verfahren tendenziell nicht beliebig oft eingesetzt werden können und häufig nur in Ansätzen in der Lage sind, individuelle Entwicklungen zu dokumentieren, kommen in förderdiagnostischen Prozessen vergleichsweise viele informelle oder kriterienorientierte Verfahren zum Einsatz. Letztlich hängt die Wahl der Methoden und Verfahren vom Einzelfall ab und weniger davon, ob es sich um einen summativen oder um einen förderdiagnostischen Prozess handelt. Dieser umfassende diagnostische Prozess kann in sonderpädagogischen Kontexten nur mit zusätzlichen Ressourcen, die an die diagnostische Aufgabe geknüpft sind, umgesetzt werden. Werden an Lehrkräfte in Regelschulen Anforderungen gestellt, diagnostische Prozesse in einem vergleichbaren Umfang durchzuführen und damit verbunden mit einem differenzierten Förderplan zu arbeiten, könnte dies nur unter Bereitstellung entsprechender Ressourcen verlangt werden.

4 Sprachdiagnostische Prozesse im Hinblick auf Deutsch als Zweitsprache Sprachdiagnostik spielt in jüngerer Zeit im Hinblick auf mehrsprachige Lernerinnen und Lerner eine große Rolle. Allerdings bezieht sich der Diskurs auf die Frage nach den geeigneten Verfahren und nicht auf den diagnostischen Prozess. Spätestens seit Beginn der 2000er Jahre wurde zum einen die Gruppe der Lernerinnen und Lerner

128

Stefan Jeuk und Julia Settinieri

mit Migrationshintergrund in diversen Vergleichsstudien als besondere Gruppe mit einem erhöhten Förderbedarf identifiziert, andererseits entstanden verschiedene Verfahren, mit denen Sprachkompetenzen mehrsprachiger Kinder und Jugendlicher eingeschätzt oder gemessen werden sollen. Diese Verfahren sollen als Instrumente im diagnostischen Prozess eingesetzt werden können, allerdings verfolgen sie, je nach Provenienz, teilweise recht unterschiedliche Ziele. Eine mögliche Argumentationslinie verläuft zwischen psychologischen Zugängen auf der einen und auf die Zweitspracherwerbsforschung, die Sprachdidaktik oder auch die Linguistik bezogenen Zugängen auf der anderen Seite. Dabei findet eine Verständigung zwischen den Disziplinen nur teilweise statt. Bereits 2007 merkt Bredel an: „Eine interdisziplinäre Kultur zwischen Sprachwissenschaft, Sprachdidaktik und Psychologie konnte sich weder theoretisch noch institutionell etablieren.“ (Bredel 2007: 77) Ein Kritikpunkt aus zweitsprachenerwerbstheoretischer Sicht ist, dass psychometrische Verfahren häufig unabhängig von spracherwerbsbezogenen Erkenntnissen entwickelt wurden und nicht immer auf die Faktorenkomplexion sprachlicher Entwicklungsverläufe Bezug nehmen (vgl. auch Riemer 2011: 197, vgl. Bredel 2007:78– 79), da bei der Eichung allein die Leistung der Bezugsgruppe bei bestimmten Aufgaben zur Grundlage genommen wird und keine Spracherwerbsprozesse. Kritiker führen außerdem an, dass der einmalige Testzeitpunkt nicht der Dynamik bzw. dem Prozess kindlicher Entwicklung gerecht werde (vgl. Bredel 2007: 106–108). Dies kann beispielhaft am U-kurven-förmigen Verlauf der sprachlichen Entwicklung gezeigt werden (vgl. Settinieri & Jeuk in diesem Band). Bei vielen bestehenden Verfahren werden nur kleine Ausschnitte aus den vielfältigen sprachlichen Kompetenzbereichen überprüft. Von Seiten der Spracherwerbsforschung wird unter Berufung auf die Komplexität sprachlichen Handelns ein umfangreicheres Vorgehen gefordert, da die Testergebnisse aus normierten Verfahren lediglich eine Momentaufnahme, d. h. einen kleinen Ausschnitt aus der kommunikativen und sprachlichen Kompetenzen eines Kindes, darstellen. Im Rahmen von Normierungen sei es kaum möglich, idiosynkratrische und individuelle Entwicklungen und Prozesse zu erfassen, die für die Förderung aber durchaus wichtig sein können (vgl. Horstkemper 2006). Als Faktoren, die den L2-Erwerb beeinflussen können, werden häufig genannt (vgl. z. B. Riemer 2002): – Biologische Faktoren – Alter – Geschlecht – Affektive Faktoren – Einstellungen (gegenüber Zielkultur und -sprache bzw. den Sprecher*innen) – Motivation (integrativ vs. instrumentell, intrinsisch vs. extrinsisch, Selbstwirksamkeitsüberzeugungen) – Angst (Sprechangst, Prüfungsangst, soziale Angst) – Soziale Faktoren: Kontaktqualität und -quantität – Kognitive Faktoren – Sprachlerneignung

Der sprachdiagnostische Prozess

– – – – –

129

Feldunabhängigkeit Ambiguitätstoleranz Risikobereitschaft Lernertypen Vorhandene Sprachlernerfahrungen

Inwiefern das Zusammenspiel dieser Faktoren auf Prozesse und Produkte des Spracherwerbs wirkt, zeigen Edmondson und House in Anlehnung an Spolsky (vgl. Abb. 3): Werden Verfahren, die für einsprachige Lernerinnen und Lerner normiert sind, bei mehrsprachigen Lernerinnen und Lernern angewendet, besteht die Gefahr, dass die einsprachige Norm zum Standard bei mehrsprachigen Personen wird. Mehrsprachige Menschen werden, unabhängig von ihren bisherigen Lerngelegenheiten, nahezu zwangsläufig als defizitäre Einsprachige aufgefasst (vgl. Jeuk 2015). Dass die Lernerinnen und Lerner in ihrer ersten Sprache Kompetenzen besitzen, wird vor dem Hintergrund des Ziels, dass sie die Bildungsstandards in Deutschland erreichen müssen, marginalisiert. Dies ist unter anderem auch deshalb bedeutsam, weil z. B. ein Kind, das in der Zweitsprache noch einiges lernen muss, aber über eine gut

liefert

Der soziale Kontext und führt zu

verschiedene Einstellungen Motivation

die sich auswirken als

die zusammen mit anderen personen-

bezogenen Merkmalen wie

Alter

Persönlichkeit

Kognitive Fähigkeiten

Vorheriges Wissen

determinieren, welcher Gebrauch gemacht wird von den vorhandenen

Lernmöglichkeiten (formeller und informeller Art) Diese Interaktion zwischen Lerner und Situation bestimmt

Sprachliche und nicht-sprachliche Ergebnisse für den Lerner

Abb. 3: Modell des L2-Lernens (Spolksy 1989; entnommen aus Edmondson und House 2006: 22).

130

Stefan Jeuk und Julia Settinieri

ausgebaute Erstsprache verfügt, vermutlich eine andere Art von Förderung benötigt als ein Kind, welches in der Erstsprache keine altersgemäße Entwicklung aufweist (vgl. Reich & Jeuk 2017: 551). Die Frage der Bezugsnorm ist im Hinblick auf mehrsprachige Lernerinnen und Lerner nicht einfach zu beantworten. Dies zeigen die folgenden Überlegungen: Bei einsprachigen Kindern im Kita- und Grundschulalter wird z .B. das Alter als Bezugsnorm herangezogen. Aus der Spracherwerbsforschung ist jedoch bekannt, dass dies insbesondere im frühen Spracherwerb nur begrenzt sinnvoll ist, denn die Bandbreite individueller Entwicklungsverläufe ist enorm (vgl. Kauschke 2012). So kann es z. B. sein, dass ein einsprachiges Kind mit drei Jahren noch gar nicht aktiv Sprache produziert, mit 3;5 Jahren aber evtl. so spricht wie andere Kinder, die seit dem ersten Lebensjahr in die aktive Sprachproduktion eingetreten sind (sog. late bloomer). So müsste man zumindest im frühen Zweitspracherwerb ebenso mit enormen Entwicklungsbandbreiten rechnen. Bei mehrsprachigen Lernerinnen und Lernern würde sich anbieten, die Kontaktdauer bzw. die Erwerbsdauer als Vergleichswert zu nehmen. Die Lernmöglichkeiten der Kinder stehen jedoch in engem Zusammenhang mit dem Lebensalter. Es ist ein Unterschied, ob ein zehnjähriges Kind oder ein dreijähriges seit zwei Jahren Deutsch lernt. Außerdem müssten die Kontaktquantität und -qualität möglichst genau erfasst werden, denn es macht ebenso einen Unterschied, ob ein Kind drei Stunden am Tag die Zweitsprache lernt oder ob es der Zweitsprache den ganzen Tag über ausgesetzt ist und ob das Kind Fernsehen guckt oder mit Gleichaltrigen spielt. Darüber hinaus beeinflussen verschiedene Erstsprachen den Zweitspracherwerb in unterschiedlicher Weise (vgl. Haberzettl 2005) und (bei Kindern und Jugendlichen, die im Laufe der Schulzeit einwandern) ebenso die Frage nach Art und Grad der Bildung in der Herkunftssprache. So ist fraglich, ob mehrsprachige Kinder und Jugendliche überhaupt als eine einheitliche Population gesehen werden können. Aus diesen Gründen gibt es bisher kaum Verfahren zur Sprachstandsfeststellung, die für den Erwerb des Deutschen als Zweitsprache normiert sind. Eine Ausnahme ist LiSeDaZ (Schulz & Tracy 2013), in dem Lebensalter und Kontaktdauer als Bezugsnormen herangezogen werden (vgl. Grimm & Müller in diesem Band). Wählt man ein am einzelnen Lernenden orientiertes Vorgehen, impliziert dies einen Wechsel vom Norm- zum Kriterienbezug (vgl. Reich 2006: 915). Bei einem förderdiagnostischen, kriterienbezogenen Prozess können Erwerbsfolgen aus der Spracherwerbs- und der Zweitspracherwerbsforschung als Beschreibungsfolie dienen. Es geht nicht um eine Identität des Verlaufs, sondern um die Vergleichbarkeit von Sprachentwicklungsschritten. In Bezug auf die morphosyntaktische Entwicklung hat sich die Profilalanalyse nach Grießhaber (2005) bewährt (vgl. Grießhaber in diesem Band). Diese zeigt ebenfalls nur einen Ausschnitt der sprachlichen Entwicklung und bedarf, z. B. im Hinblick auf die Wortschatz- und Bedeutungsentwicklung, einer Ausweitung. Andererseits konnte Grießhaber (2005) auf Grundlage einer funktionalpragmatischen Analyse zeigen, dass den Profilstufen Indikatorenfunktion im Hinblick auf sprachliche Gesamtentwicklungsstände zukommt.

Der sprachdiagnostische Prozess

131

Die Annahme von solchen Stufen kann selbstverständlich nur als grobe Orientierung dienen; die individuelle Entwicklung muss im Zentrum der Betrachtung stehen. In welchem Alter und in welchen zeitlichen Schritten die Lernerinnen und Lerner diese Entwicklung vollziehen, hängt vom Kontaktalter, der Kontaktintensität, der Struktur der Erstsprache, sowie von sozio-kulturellen und individuellen Faktoren ab. Einige aktuelle Studien der Zweitspracherwerbsforschung haben gezeigt, dass gemeinsam mit diesen Stufen eine Reihe anderer sprachlicher Fähigkeiten erworben werden, so dass das Erreichen dieser Stufen Hinweise auf komplexe Fortschritte beim Erwerb der Sprachaneignung geben kann (vgl. Ahrenholz 2006; vgl. Dimroth in diesem Band). Diese Indikatorenfunktion kann für Sprachstandsuntersuchungen genutzt werden. Prozesse zur Feststellung des Sprachstands, mit deren Hilfe eine Aussage über sprachliche Kompetenzen von Lernerinnen und Lernern, die Deutsch als Zweitsprache lernen, getroffen werden sollen, müssen sich an solchen Kriterien sprachlichen Lernens orientieren. In einem vom BMBF geförderten Projekt stellten Ehlich et al. (2007, 2009) auf der Grundlage der aktuellen Spracherwerbs- und Zweitspracherwerbsforschung ein Bündel von Basisqualifikationen zusammen, das als Sprachkompetenzmodell zu verstehen ist (vgl. Kleinbub in diesem Band). Das Modell verdeutlicht die Mehrdimensionalität der Sprachaneignung und soll eine Grundlage für die differenzierte Sprachdiagnostik bilden. Ehlich et al. (2007, 2009) identifizieren phonische (phonetisch-phonologische), pragmatische, diskursive, semantische, morphosyntaktische und literale Basisqualifikationen. Diese Mehrdimensionalität verweist darauf, dass auch eine umfassende Sprachdidagnostik nur Ausschnitte bearbeiten kann.

5 Ein sprachprozessdiagnostisches Modell Die Diskussion um Sprachstandserhebungsverfahren und Sprachdiagnostik bei mehrsprachigen Lernerinnen und Lernern hatte bislang weniger den diagnostischen Prozess im Blick als vielmehr die Konzeption spezifischer Verfahren. Im Hinblick auf schulische Bildungsprozesse wurden in den letzten Jahren zum Beispiel Verfahren entwickelt, die das Lernalter in der L2 als Grundlage der Normierung heranziehen (LiseDaZ, Schulz & Tracy 2011) oder die kriterienbezogen Lernprozesse mehrsprachiger Kinder und Jugendlicher in den Blick nehmen (HAVAS 5: Reich & Roth 2004; Der Sturz ins Tulpenbeet: Reich, Roth & Gantefort 2008; Profilanalyse: Heilmann 2012; vgl. die Beiträge von Döll und Grießhaber in diesem Band). Für neu nach Deutschland eingewanderte Erwachsene, die nicht mehr der Schulpflicht unterliegen, gibt es ein „Einstufungssystem für Integrationskurse in Deutschland“. Hier kann insofern von einem diagnostischen Prozess gesprochen werden, als dass das Einstufungssystem mündliche und schriftliche Bausteine und ggf. einen Baustein zur Feststellung des Alphabetisierungsbedarfs enthält. Die Bausteine werden

132

Stefan Jeuk und Julia Settinieri

variabel und in Bezug auf die jeweils individuellen Lernenden eingesetzt (vgl. Feldmeier 2015). Die im Kontext des FörMig-Projekts (Gogolin 2005) entstandenen Niveaubeschreibungen Deutsch als Zweitsprache für die Primarstufe bzw. für die Sekundarstufe I und II (z. B. Döll 2009; vgl. auch Döll in diesem Band) gehen darüber hinaus. Es handelt sich um ein Beobachtungsverfahren, das über einen Zeitraum von vier bis sechs Wochen eine Schülerin bzw. einen Schüler in folgenden Bereichen beobachten kann: Weite der sprachlichen Handlungs- und Verstehensfähigkeit, Wortschatz, Aussprache, Lesen, Schreiben, Grammatik – mündlich & schriftlich, Persönlichkeitsmerkmale der Schülerin/des Schülers (vgl. Döll 2009). Alle Bereiche sind weiter untergliedert, so dass ein sehr differenziertes Beobachtungsinstrument zur Verfügung steht. Die Niveaubeschreibungen sind vierstufig aufgebaut und die Zielvorgaben korrespondieren mit den Bildungsstandards im Fach Deutsch. Für den Einsatz der einzelnen Verfahrensteile bzw. Beobachtungsinstrumente wird empfohlen, dass verschiedene Fachlehrer unter Federführung eines Betreuungslehrers die Ergebnisse und deren Auswertung gemeinsam zusammentragen. Auf der Grundlage der Beobachtungen wird ein Profil erstellt, das Auskunft darüber gibt, was die Schülerin bzw. der Schüler bereits kann und woraufhin sie/er gefördert werden soll. So können die Niveaubeschreibungen als prozessdiagnostisches Instrument betrachtet werden. In einem Forschungsprojekt der Pädagogischen Hochschule Ludwigsburg wurde ein Werkzeugkoffer entwickelt, der Methoden und Materialien für den förderdiagnostischen Prozess bei Jugendlichen, die Deutsch als Zweitsprache in der Schule lernen, bereithält (Klasse 5/6 oder neu eingewanderte Schülerinnen und Schüler; Junk-Deppenmeier & Jeuk 2015). Dabei wurde versucht, die Kompetenzbereiche des Deutschunterrichts möglichst umfassend abzubilden, um so der Lehrkraft die Möglichkeit zu geben, die Werkzeuge auszuwählen, die zum jeweiligen Zeitpunkt sinnvoll und zielführend sind. Selbstverständlich können jeweils nur Einzelaspekte der Kompetenzbereiche erfasst werden. Die Bereiche Wortschatz und Grammatik wurden nicht mit eigenen Verfahren erhoben, da diese in allen Werkzeugen in unterschiedlicher Tiefe berücksichtigt werden. Der Werkzeugkoffer ist auch für den Einsatz im Unterricht gedacht, allerdings muss die Lehrkraft die Werkzeuge bzw. Teile der Werkzeuge auswählen, die jeweils angemessen und zielführend und im Kontext des Unterrichtsalltags bearbeitbar sind. Der Werkzeugkoffer enthält die folgenden Bestandteile: Werkzeug 1: Sprachbiographie und Sprachbeobachtung, Werkzeug 2: C-Test als Screening, Werkzeug 3: Hörverstehen, Werkzeug 4: Leseverstehen, Werkzeug 5: Mündliches Erzählen, Werkzeug 6: Schriftliches Erzählen. Das Verfahren ist in sechs Werkzeuge untergliedert, um deutlich zu machen, dass, je nach Anforderung und Bedarf, einzelne Teile auch unabhängig voneinander ein-

Der sprachdiagnostische Prozess

133

gesetzt werden können. Einige Verfahrensteile können als Gruppen- oder Klassentests durchgeführt sowie auch als Gruppentests ausgewertet werden, andere sind Individualverfahren. Die Bausteine werden im Rahmen eines förderdiagnostischen Prozesses eingesetzt, wie er in Abschnitt 3 beschrieben wird. In einem ersten Schritt (Werkzeug 1) sollen die Sprachbiographie und die Lernerfahrung in verschiedenen Kompetenzbereichen der Schülerinnen und Schüler mit Hilfe von Beobachtungsbögen erfasst werden. Dabei werden verschiedene Einflussgrößen des (Zweit-)Spracherwerbs, wie die Lernzeit, die Lernchancen und die familiären Ressourcen, erfasst. In einem zweiten Schritt (Werkzeug 2) besteht die Möglichkeit, mit Hilfe eines ersten Screenings die Schülerinnen und Schüler zu identifizieren, bei denen eine genauere Beobachtung angebracht scheint. Dieser C-Test (vgl. Grotjahn in diesem Band) kann als Gruppentest durchgeführt werden und ermöglicht eine erste Einschätzung der Kompetenzen in der deutschen Sprache der Schülerinnen und Schüler einer Klasse oder Lerngruppe. Selbstverständlich müssen die Ergebnisse des Screenings mit den Unterrichtsbeobachtungen und Erfahrungen der Lehrkräfte abgeglichen werden. In einem dritten Schritt (Werkzeuge 3 bis 6) kann ein detaillierter Blick auf den Lernstand in den Bereichen geworfen werden, die als förderrelevant angesehen werden (Hörverstehen, Leseverstehen, mündliches Erzählen, schriftliches Erzählen). Die Verfahrensteile der einzelnen Bereiche können dabei unabhängig voneinander eingesetzt werden, da sie nicht aufeinander aufbauen. Auch sind sie in der Reihenfolge flexibel einsetzbar. Darüber hinaus ist es bei den einzelnen Verfahren möglich, einen ersten, grob einschätzenden Blick auf die Kompetenzen der Schülerinnen und Schüler zu werfen, um in einem weiteren Schritt genauer und differenzierter zu beobachten. Beim mündlichen Erzählen (Werkzeug 5) und beim schriftlichen Erzählen (Werkzeug 6) wird u. a. die Profilanalyse (nach Grießhaber 2005, 2010; vgl. auch Grießhaber in diesem Band) eingesetzt. Aus den Beobachtungen sind Hinweise abzuleiten, wo der Unterricht und die Förderung bei der jeweiligen Schülerin bzw. bei dem jeweiligen Schüler ansetzen soll. Am Ende ist es möglich, für jede Schülerin und jeden Schüler eine Gesamtdokumentation des Förderbedarfs zu erstellen (Förderplan). Selbstverständlich bleibt es der Lehrkraft überlassen, welche Werkzeuge in welcher Tiefe für den je individuellen diagnostischen Prozess möglich, sinnvoll und machbar sind. Einzelne Verfahrensteile können auch häufiger eingesetzt werden.

6 Schlussbemerkungen Wenn dem so ist, dass der jeweilige diagnostische Prozess auf die spezifischen Fragestellungen und Aufgaben des Einzelfalls angepasst werden muss, so unterscheiden sich sprachdiagnostische Prozesse bei mehrsprachigen Kindern, Jugendlichen und Erwachsenen nicht grundlegend von sprachdiagnostischen Prozessen bei einsprachigen Kindern, Jugendlichen und Erwachsenen. Unterschiede beziehen sich

134

Stefan Jeuk und Julia Settinieri

auf die Wahl der konkreten Verfahren und die Notwendigkeit, Mehrsprachigkeit einzubeziehen, nicht jedoch auf den Prozess als solchen. Entsprechend gibt es in der DaZ-Didaktik dieselben Diskussionen wie in der Sprachbehindertenpädagogik und der pädagogischen Psychologie hinsichtlich der Selektions- vs. der Förderdiagnostik, der Prozess- vs. der Statusdiagnostik sowie der Frage, ob normierte, kriterienorientierte oder informelle Verfahren besser für den sprachdiagnostischen Prozess geeignet sind. Letztlich entscheiden die Fragestellung bzw. allzu häufig auch die zur Verfügung stehenden Ressourcen im konkreten Fall, welche Verfahren in welcher Gewichtung Anwendung finden.

Literatur Ahrenholz, Bernt (2006): Wortstellung in mündlichen Erzählungen von Kindern mit Migrationhintergrund. In Bernt Ahrenholz (Hrsg.), Kinder mit Migrationshintergrund: Spracherwerb und Fördermöglichkeiten, 221–240. Freiburg i. Br.: Fillibach. Böttinger, Tragott (2016): Exklusion durch Inklusion? Stolpersteine bei der Umsetzung. Stuttgart: Kohlhammer. Braun, Dorothee & Judith Schmischke (2010): Kinder individuell fördern. Hilfen und Beispiele für die Förderdiagnostik. Entwicklung schuleigener Förderkonzepte für die Klassen 1 bis 4. 2. Aufl. Berlin: Cornelsen-Scriptor. Bredel, Ursula (2007): Sprachstandsmessung – Eine verlassene Landschaft. In Konrad Ehlich (Hrsg.), Anforderungen an Verfahren der regelmäßigen Sprachstandsfeststellung als Grundlage für die frühe und individuelle Förderung von Kindern mit und ohne Migrationshintergrund, 77–120. 2. Aufl. Berlin: BMBF. Bundschuh, Konrad (2014): Einführung in die sonderpädagogische Diagnostik. 7., überarb. Aufl. München: Reinhardt. Döll, Marion (2009): Beobachtung und Dokumentation von Kompetenz und Kompetenzzuwachs im Deutschen als Zweitsprache mit den Niveaubeschreibungen DaZ. In Drorit Lengyel, Hans H. Reich, Hans-Joachim Roth & Marion Döll (Hrsg.), Von der Sprachdiagnose zur Sprachförderung, 109–114. Münster: Waxmann. Edmondson, Willis J. & Juliane House (2006): Einführung in die Sprachlehrforschung. 2. Aufl. Tübingen und Basel: Francke. Ehlich, Konrad (Hrsg.) (2007): Anforderungen an Verfahren der regelmäßigen Sprachstandsfeststellung als Grundlage für die frühe und individuelle Förderung von Kindern mit und ohne Migrationshintergrund. 2. Aufl. Berlin: BMBF. Ehlich, Konrad (Hrsg.) (2009): Referenzrahmen zur altersspezifischen Sprachaneignung. 2. Aufl. Berlin: BMBF. Feldmeier, Alexis (2015): Konzept für einen bundesweiten Alphabetisierungskurs. Überarbeitete Neuauflage. Nürnberg: Bundesamt für Migration und Flüchtlinge. http://www.bamf.de/ SharedDocs/Anlagen/DE/Downloads/Infothek/Integrationskurse/Kurstraeger/ KonzepteLeitfaeden/konz-f-bundesw-ik-mit-alphabet.html?nn=1367372 (26. 01. 2018). Gogolin, Ingrid (Hrsg.) (2005): Sprachdiagnostik bei Kindern und Jugendlichen mit Migrationshintergrund. Dokumentation einer Fachtagung am 14. Juli 2004 in Hamburg. Münster: Waxmann. Grießhaber, Wilhelm (2005): Sprachstandsdiagnose im kindlichen Zweitspracherwerb: Funktionalpragmatische Fundierung der Profilanalyse. https://spzwww.uni-muenster.de/griesha/pub/ tprofilanalyse-azm-05.pdf (08. 12. 2018).

Der sprachdiagnostische Prozess

135

Grießhaber, Wilhelm (2010): Spracherwerbsprozesse in Erst- und Zweitsprache. Eine Einführung. Duisburg: Universitätsverlag Rhein-Ruhr. Haberzettl, Stefanie (2005): Der Erwerb der Verbstellungsregeln in der Zweitsprache Deutsch durch Kinder mit russischer und türkischer Erstsprache. Tübingen: Niemeyer. Hasselhorn, Marcus, Wolfgang Schneider & Ulrich Trautwein (2014): Lernverlaufsdiagnostik. Göttingen, Bern, Wien: Hogrefe. Heilmann, Beatrix (2012): Diagnostik & Förderung – leicht gemacht. Stuttgart: Klett. Horstkemper, Marianne (2006): Fördern heißt diagnostizieren. Friedrich Jahresheft 06, 4–7. Jeuk, Stefan (2015): Mehrsprachige Kinder an Schulen für Sprachbehinderte. In Heidi Rösch & Julia Webersik (Hrsg.), Deutsch als Zweitsprache – Erwerb und Didaktik, 231–247. Stuttgart: Fillibach bei Klett. Junk-Deppenmeier, Alexandra & Stefan Jeuk (Hrsg.) (2015): Praxismaterial Förderdiagnostik. Werkzeuge für den Sprachunterricht in der Sekundarstufe I. Stuttgart: Fillibach bei Klett. Jürgens, Eiko & Urban Lissmann (2015): Pädagogische Diagnostik. Weinheim, Basel: Beltz. Kauschke, Christina (2012): Kindlicher Spracherwerb im Deutschen: Verläufe, Forschungsmethoden, Erklärungsansätze. Berlin: De Gruyter. Klauer, Karl Josef (2014): Formative Leistungsdiagnostik. Historischer Hintergrund und Weiterentwicklung zur Lernverlaufsdiagnostik. In Marcus Hasselhorn, Wolfgang Schneider & Ulrich Trautwein (Hrsg.), Lernverlaufsdiagnostik, 1–18. Göttingen u. a.: Hogrefe. Knebel, Ulrich von & Karl-Dieter Schuck (2007): Diagnostik und Differenzialdiagnostik: Allgemeine Fragestellungen. In Hermann Schöler & Alfons Welling (Hrsg.), Handbuch Sonderpädagogik: Sonderpädagogik der Sprache, 475–503. Göttingen: Hogrefe. Kobi, Emil E. (1977): Einweisungsdiagnostik – Förderdiagnostik: eine schematische Gegenüberstellung. Vierteljahresschrift Heilpädagogik 46, 115–123. Krohne, Heinz W. & Michael Hock (2015): Psychologische Diagnostik. Stuttgart: Kohlhammer. Meehl, Paul E. (1954): Clinical vs. statistical prediction. Minneapolis: University of Minnesota Press. Ossner, Jakob (2006): Sprachdidaktik Deutsch. Paderborn: Schöningh. Reich, Hans H. (2006): Tests und Sprachstandsmessungen bei Schülern und Schülerinnen, die Deutsch nicht als Muttersprache haben. In Ursula Bredel, Hartmut Günther, Peter Klotz, Gesa Siebert-Ott (Hrsg.), Didaktik der deutschen Sprache, Band 2, 914–923. 2. Aufl. Paderborn: Schöning. Reich, Hans H. & Stefan Jeuk (2017): Sprachstandserhebungen, ein- und mehrsprachig. In Bernt Ahrenholz & Ingelore Oomen-Welke (Hrsg.), Deutsch als Zweitsprache, 548–559. 4. Auflage. DTP 10. Baltmannsweiler: Schneider. Reich, Hans H. & Hans-Joachim Roth (2004): HAVAS 5. Hamburger Verfahren zur Analyse des Sprachstandes bei Fünfjährigen. Hamburg: Landesinstitut für Lehrerbildung und Schulentwicklung. Reich Hans H., Hans-Joachim Roth & Christoph Gantefort (2008): Der Sturz ins Tulpenbeet. Deutsche Sprachversion. Auswertungsbogen und Auswertungshinweise. In Thorsten Klinger, Knut Schwippert & Birgit Leiblein (Hrsg.), Evaluation im Modellprogramm FörMig, 209–237. Münster: Waxmann. Riemer, Claudia (2002): Wie lernt man Sprachen? In Jürgen Quetz & Gerhard von der Handt (Hrsg.), Neue Sprachen lehren und lernen. Fremdsprachenunterricht in der Weiterbildung, 49–83. Bielefeld: wbv-Verlag. Riemer, Claudia (2011): Empirie und Fremdsprachenforschung: Herausforderung Forschungsmethodik. In Karl-Richard Bausch, Eva Burwitz-Melzer, Frank G. Königs & Hans-Jürgen Krumm (Hrsg.), Fremdsprachen lehren und lernen: Rück- und Ausblick. Arbeitspapiere der 30. Frühjahrskonferenz zur Erforschung des Fremdsprachenunterrichts, 194–203. Tübingen: Gunter Narr.

136

Stefan Jeuk und Julia Settinieri

Schmidt-Atzert, Lothar & Manfred Amelang (2012): Psychologische Diagnostik. Heidelberg: Springer. Schulz, Petra & Rosemarie Tracy (2011): Linguistische Sprachstandserhebung – Deutsch als Zweitsprache (Lise-DaZ). Göttingen: Hogrefe. Spolsky, Bernard (1989): Conditions for second language learning: Introduction to a general theory. Oxford: Oxford University Press. Stemmler, Gerhard & Jutta Margraf-Stiksrud (2015): Lehrbuch Psychologische Diagnostik. Bern: Huber.

II Sprachdiagnostik und Bildungsverlauf

Yvonne Decker-Ernst

7 Sprachdiagnostik im Elementarbereich 1 2 3 4 5 6

Einleitung Früher Zweitspracherwerb im Elementarbereich Bildungspolitische Hintergründe und Entwicklungen in Bezug auf Sprachdiagnostik im Elementarbereich Zwecke und Ziele von Sprachdiagnosen im Elementarbereich Verfahren zur Sprachdiagnose im Elementarbereich Diskussion und Ausblick

1 Einleitung Den Ergebnissen verschiedener international vergleichender Schulleistungsstudien (PISA, IGLU, DESI u. a.) ist es zu verdanken, dass Sprache mehr denn je als eine Schlüsselkompetenz gilt. Sowohl die Persönlichkeitsentwicklung als auch die individuellen Bildungs- und gesellschaftlichen Teilhabechancen hängen eng mit den Sprachkompetenzen eines Menschen zusammen (vgl. Robert Bosch Stiftung 2008: 101). Um allen Kindern die Möglichkeit zu bieten, „Sprache als einen Schlüssel zur Welt“ zu nutzen, ist es wichtig, sie von Anfang an beim Erwerb ihrer Sprache(n) zu unterstützen und Nachteilen gezielt entgegenzuwirken. Vor dem Hintergrund der o. g. Ergebnisse geriet seit Beginn des 21. Jahrhunderts v. a. der Elementarbereich – d. h. außerfamiliäre, vorschulische Betreuungseinrichtungen – in den bildungspolitischen und gesellschaftlichen Blick. Während die Aufgabenbereiche von Kindertageseinrichtungen (KiTas) ursprünglich v. a. in einer familienergänzenden und -unterstützenden Betreuung und Erziehung gesehen wurden, wird mittlerweile auch die Bedeutung frühkindlicher Bildungsprozesse betont (vgl. Robert Bosch Stiftung 2008: 18). Laut dem Achten Sozialgesetzbuch umfasst der Förderungsauftrag von KiTas aktuell die Erziehung, Bildung und Betreuung des Kindes und bezieht sich auf die soziale, emotionale, körperliche und geistige Entwicklung des Kindes. […] Die Förderung soll sich am Alter und Entwicklungsstand, den sprachlichen und sonstigen Fähigkeiten, der Lebenssituation sowie den Interessen und Bedürfnissen des einzelnen Kindes orientieren und seine ethnische Herkunft berücksichtigen. (SGB VIII §22, Abs. 3)

Dass dem Elementarbereich neben der Erziehung und Betreuung von Kindern auch eine Bildungsfunktion zukommt, ist also gesetzlich verankert. Ein nicht unbedeutender Teil dieser Bildung bezieht sich auf die Sprachbildung. Je nach individueller Lebenssituation ist der Unterstützungsbedarf eines Kindes an sprachlicher Bildung in der KiTa verschieden; besonders hoch scheint er bei Kindern mit nicht deutscher https://doi.org/10.1515/9783110418712-007

140

Yvonne Decker-Ernst

Familiensprache zu sein. Immer wieder zeigten die Bildungsberichte der letzten Jahre, dass gerade diese Kinder vor Schuleintritt weitaus häufiger Sprachförderbedarf aufweisen als ihre monolingualen peers (vgl. zuletzt Autorengruppe Bildungsberichterstattung 2016: 66). Wie im Verlauf dieses Beitrags noch diskutiert wird, sind derartige Aussagen jedoch durchaus kritisch zu hinterfragen, da z. B. die Trennwerte, die förderbedürftige von nicht förderbedürftigen Kindern unterscheiden, willkürlich festgelegt und oftmals mehrsprachige Kinder an monolingualen Normen gemessen werden. Um Kinder, denen eine Sprachförderung besonders zugutekommen könnte, möglichst frühzeitig zu identifizieren, wurden zwischen 2002 und 2008 in fast allen Bundesländern sprachdiagnostische Verfahren entwickelt; in dreizehn Bundesländern werden diese mittlerweile flächendeckend eingesetzt (vgl. Autorengruppe Bildungsberichterstattung 2016: 66). I. d. R. handelt es sich um Verfahren, die sich an „vier- bis fünfjährige Kinder“ (Mercator-Institut 2013: 9) richten und punktuell im Rahmen der Schuleingangsdiagnostik verwendet werden. In den meisten Bundesländern erfolgt die Durchführung durch pädagogische Fachkräfte oder Grundschullehrkräfte, seltener durch Mitarbeiter*innen von Gesundheitsämtern (vgl. Schneider et al. 2012: 10–11). In den letzten 15 Jahren erschienen verschiedene Expertisen, die sich kritisch mit dem aktuellen Stand der Sprachdiagnostik im Elementarbereich auseinandersetzten (vgl. v. a. Fried 2004; Ehlich et al. 2005; Lisker 2010, 2013; Redder et al. 2011; Lengyel 2012; Schneider et al. 2012; Mercator-Institut 2013; Neugebauer & BeckerMrotzek 2013). Im Überblick zeigt sich, dass sowohl Einsatz und Durchführung wie auch die Verfahren selbst in den Ländern heterogen sind. Unterschiede bestehen z. B. – im Grad ihrer Verbindlichkeit: verpflichtend vs. empfohlen; – in den anvisierten Zielgruppen: alle Kinder vs. ausschließlich zwei-/mehrsprachige Kinder vs. ausschließlich Kinder, die keine KiTa besuchen; – in ihrer Zweckorientierung: politische Zwecke vs. pädagogische Zwecke; – in ihrer Zielsetzung: Feststellung eines grundsätzlichen Förderbedarfs vs. Erfassung des konkreten Förderbedarfs; – in den erfassten Kompetenzen: Fokus auf einige wenige sprachliche Teilbereiche im Deutschen vs. Fokus auf mehrere sprachliche Teilbereiche im Deutschen und in der/den anderen Sprachen; – in den Verfahrenstypen: standardisierte vs. informelle Verfahren; – in den Qualitätsmerkmalen der Verfahren (vgl. hierzu v. a. Neugebauer & BeckerMrotzek 2013). Aufgrund dieser Vielfalt sind auch die Daten zum Anteil an sprachförderbedürftigen Kindern in den einzelnen Bundesländern nicht vergleichbar, weil sie unterschiedlich ermittelt wurden (vgl. hierzu Autorengruppe Bildungsberichterstattung 2016: 66).

Sprachdiagnostik im Elementarbereich

141

Neben Verfahren, die punktuell vor der Einschulung eingesetzt werden, nutzen pädagogische Fachkräfte im KiTa-Alltag zahlreiche weitere Instrumente, um individuelle kindliche Entwicklungsverläufe kontinuierlich zu beobachten, zu fördern, zu dokumentieren. Meist werden prozessdiagnostische Beobachtungs- und Dokumentationsverfahren genutzt, die von landespolitischer Seite empfohlen, jedoch nicht verpflichtend vorgegeben werden (für eine Übersicht vgl. Autorengruppe Bildungsberichterstattung 2016: Tab. H3-7web). Über die Spannbreite und Qualität dieser in der Praxis tatsächlich verwendeten Verfahren ist wenig bekannt (vgl. Schneider et al. 2012: 10–11). Während zu Beginn des 21. Jahrhunderts vorwiegend über die Bedeutung und Notwendigkeit punktueller Statusdiagnosen vor der Einschulung diskutiert wurde, liegt der Fokus seit einiger Zeit v. a. auf der soeben erwähnten alltagsbegleitenden Diagnostik und auf alltagsintegrierter Sprachbildung. So haben bspw. NordrheinWestfalen und Sachsen-Anhalt zuletzt ihre landesweiten Sprachdiagnosen zugunsten einer alltagsintegrierten Sprachbeobachtung und -förderung zurückgestellt (vgl. Autorengruppe Bildungsberichterstattung 2016: 66). Der vorliegende Beitrag stellt den aktuellen Forschungs- und Entwicklungsstand der Sprachdiagnose bei zwei- und mehrsprachigen Kindern im Elementarbereich im Überblick dar. Zunächst werden Hintergrundinformationen zum frühen Zweitspracherwerb sowie zu bildungspolitischen Entwicklungen geliefert. Daran anschließend werden verschiedene Zwecke und Ziele von Sprachdiagnosen im Elementarbereich voneinander abgegrenzt und differente Verfahrenstypen und Instrumente vorgestellt, die aktuell zur Verfügung stehen. Der Beitrag schließt mit einem kritischen Blick auf die Qualität dieser Verfahren und den daraus resultierenden Anforderungen an pädagogische Fachkräfte.

2 Früher Zweitspracherwerb im Elementarbereich Ein Großteil der zwei- und mehrsprachigen Kinder in Deutschland lebt bereits seit mehreren Jahren hier oder wurde hier geboren. Selten wuchsen sie jedoch von Anfang an mit zwei Sprachen, d. h. „bilingual“ bzw. mit „doppelter Erstsprache“ auf. Weitaus häufiger wurden die Kinder zunächst in der Familie in ihrer Erstsprache sozialisiert. Mit der deutschen Sprache kommen sie meist bei Eintritt in die KiTa – mehrheitlich im Alter von drei bis vier Jahren – in Kontakt; in diesem Falle handelt es sich also um einen frühen Zweitspracherwerb. Voet Cornelli, Schulz & Tracy (2013: 911–912) konstatieren für früh zweisprachig aufwachsende Kinder, dass deren Deutschkenntnisse bei Schuleintritt zwar oftmals geringer sind als die ihrer monound bilingualen Altersgenossen; dieser Rückstand aber keinesfalls mit einer Spezifischen Sprachentwicklungsstörung (SSES) verwechselt werden dürfe. Deren Prävalenz liege bei monolingualen, bilingualen und auch bei früh zweisprachig aufwachsenden Kindern bei 6–8 %. Stattdessen sei der Rückstand früh zweisprachig

142

Yvonne Decker-Ernst

aufwachsender Kinder im Deutschen v. a. in einer kürzeren Kontaktdauer, einer entsprechend geringeren Lernzeit sowie weniger In- und Output in der Zweitsprache Deutsch begründet. Sowohl in Deutschland geborene als auch vor Schuleintritt selbst eingewanderte, früh zweisprachig aufwachsende Kinder haben meist die grundlegenden sprachlichen Regelsysteme in ihrer Erstsprache erworben, wenn sie mit dem Erwerb der Zweitsprache beginnen; der Erstspracherwerb ist aber längst noch nicht abgeschlossen. Nach Rösch (2011: 80) stellt der frühe Zweitspracherwerb eine „Mischform zwischen Erst- und Zweitspracherwerb“ dar, da er dem monolingualen und dem doppelten Erstspracherwerb z. T. ähnelt, zugleich aber auch Unterschiede festzustellen sind. Kaltenbacher & Klages (2006) sowie Thoma & Tracy (2006) zeigen in ihren Untersuchungen zum frühen Zweitspracherwerb, dass der Erwerb grundlegender syntaktischer Baupläne (Satzkonstituenten und deren Reihenfolge) im Wesentlichen der Erwerbsfolge im Erstspracherwerb entspricht und „in der Regel relativ schnell und problemlos“ (Kaltenbacher & Klages 2006: 83) erfolgt. Mehrheitlich haben die Kinder die deutsche Satzstruktur nach zwei Jahren erworben, einige sogar schneller. Im Erstspracherwerb ist für diesen Bereich von einer Erwerbsdauer zwischen 30 und 42 Monaten auszugehen (vgl. Rothweiler & Ruberg 2011: 11). Auch die Aneignung der zielsprachlichen Aussprache scheint zu diesem Zeitpunkt problemlos möglich, auch wenn die Lautbildung in der Erstsprache bereits weitestgehend abgeschlossen ist. In anderen sprachlichen Teilbereichen dauert der Erwerb hingegen länger, z. T. existieren offenbar „Problembereiche“ (Ruberg 2015: 23). Bspw. weisen verschiedene Studien auf eine besondere Schwierigkeit bei der Deklination nominaler Gruppen hin. Viele früh zweisprachig aufwachsende Kinder verfügen zum Zeitpunkt des Schuleintritts „nicht über ein vollständig ausdifferenziertes Genussystem und [produzieren] viele falsche Genusmarkierungen“ (Ruberg 2015: 23; vgl. auch Kaltenbacher & Klages 2006; Jeuk 2008). Auch die Aneignung räumlicher Präpositionen (vgl. Kaltenbacher & Klages 2006: 88–89; Lütke 2011) sowie der Aufbau eines umfangreichen, differenzierten Wortschatzes gelten als schwierig (vgl. Rothweiler & Ruberg 2011: 11). V. a. das Wortschatzlernen ist stets erfahrungsbasiert. Es erfordert eine anregende Lernumgebung, ausreichend sprachliche Vorbilder, vielfältige Anwendungsmöglichkeiten und qualitativ hochwertige Lernzeit (vgl. Oomen-Welke & DeckerErnst demn. 2018). Ein wesentlicher Unterschied zum monolingualen und doppelten Erstspracherwerb besteht darin, dass früh zweisprachig aufwachsende Kinder bereits über vorherige (Sprach-) Lernerfahrungen und Wissen zu unterschiedlichen Gegenständen und Zusammenhängen verfügen. Der Weg zur Zielsprache verläuft zwar ebenfalls in Etappen, er benötigt jedoch je nach Kind und dessen Vorerfahrungen unterschiedlich viel Zeit. Die Möglichkeit, sprachliche Einheiten zu kombinieren und die Einzelelemente ggf. zu verändern, ist den Kindern aus ihrer Erstsprache bekannt.

Sprachdiagnostik im Elementarbereich

143

Neu sind die Regeln der Kombination und Veränderung, die nicht zwangsläufig intuitiv korrekt in natürlichen Situationen erworben werden, sondern deren Aneignung von internen und externen Faktoren determiniert wird. Als wesentliche Einflussgrößen gelten das Sprachvermögen, der Antrieb/die Motivation, der Zugang zur Zweitsprache sowie der sozioökonomische Status und familiäre Bildungshintergrund (vgl. Klein 1992; Kniffka & Siebert-Ott 2007; Jeuk 2015; zusammenfassend Decker-Ernst 2017). In welchem Maße diese Faktoren den Zweitspracherwerb eines Kindes beeinflussen, ist individuell verschieden. Für Sprachdiagnosen resultiert daraus die Anforderung, nicht nur die sprachlichen Fertigkeiten eines Kindes, sondern auch umfangreiche (sprach)biografische Daten zu erfassen; ohne diese können der Zweitspracherwerb nicht beurteilt und Förderentscheidungen nicht abgeleitet werden. Ein weiterer wichtiger Aspekt ist, wie in Abschnitt 1 in diesem Beitrag angemerkt, die Frage nach der festgelegten Norm. Während Alterszeitfenster im Erstspracherwerb einigermaßen verlässliche, wenn auch keinesfalls universell gültige Orientierungspunkte zur Beurteilung des sprachlichen Kompetenzerwerbs bieten, gilt dies im Zweitspracherwerb nicht. Anstelle des Lebensalters müssen Informationen zum Alter bei Erstkontakt sowie zur Kontaktdauer erfasst werden (vgl. die Referenzrahmen zur altersspezifischen Sprachaneignung von Ehlich, Bredel & Reich 2008a, b). Werden die Deutschkenntnisse früh zweisprachig aufwachsender Kinder ausschließlich mit denen von monolingualen Altersgenossen verglichen, besteht die Gefahr, dass zweisprachige Kinder per se als normabweichend und förderbedürftig stigmatisiert werden. Darüber hinaus muss, wenn der Sprachstand eines Kindes erfasst und beurteilt werden soll, stets beachtet werden, dass sich dieser einerseits auf dessen Bestand an sprachlichen Symbolen wie Lauten, Wörtern, Wortstellungs- und Satzbauregeln bezieht, andererseits aber auf differente sprachliche Handlungsroutinen (vgl. Reich & Roth 2007: 72). Bei Kindern vor Schuleintritt bezieht er sich bspw. auf das Repertoire und die Möglichkeiten zu fragen, zu bitten oder von Erlebtem zu erzählen. Für ein differenziertes Bild des Sprachstandes sollten sich sprachdiagnostische Verfahren nicht nur auf die Erfassung einer oder weniger, leicht überprüfbarer Teilfertigkeiten beschränken, sondern möglichst Kompetenzen in verschiedenen sprachlichen Teilbereichen berücksichtigen (s. die Kompetenzen in Teil III des vorliegenden Handbuches). Im Falle zweisprachiger Kinder ist weiterhin zu bedenken, dass deren Sprachstand stets den Bestand an sprachlichen Symbolen und Routinen in beiden Sprachen meint. Bezieht sich die Diagnostik ausschließlich auf die deutsche Sprache, lassen sich allenfalls Aussagen über den Sprachstand im Deutschen treffen. Rückschlüsse auf den Gesamtbestand an sprachlichen Mitteln sind ebenso wenig möglich wie verlässliche Aussagen darüber, ob ggf. eine spezifische Spracherwerbsstörung (SSES) vorliegt. Schließlich muss festgehalten werden, dass jedweder Spracherwerb, so auch der frühe Zweitspracherwerb, dynamisch und nicht linear erfolgt. Wird der Sprach-

144

Yvonne Decker-Ernst

stand eines Kindes lediglich einmal punktuell erfasst, ergibt sich maximal ein Hinweis auf den momentanen IST-Zustand, d. h. eine „Momentaufnahme“ (Reich & Roth 2007: 72). Da Spracherwerb grundsätzlich in Teilschritten bzw. Sequenzen erfolgt, muss folglich auch der momentane Stand der Sprachaneignung im Deutschen als eine eigenaktiv aufgebaute Varietät zum Erhebungszeitpunkt Null verstanden werden. I. d. R. weist diese Varietät immer sowohl korrekte, normgerechte als auch inkorrekte Strukturen auf (vgl. Bredel 2005: 97–98). Um den Zweitspracherwerb eines Kindes langfristig begleiten und unterstützen zu können, sollten Aneignungsbereiche mehrfach, d. h. prozessdiagnostisch erfasst werden. Inwiefern diese Erkenntnisse sich auch in den politischen Diskussionen zur Sprachdiagnose im Elementarbereich widerspiegeln, wird nachfolgend dargestellt.

3 Bildungspolitische Hintergründe und Entwicklungen in Bezug auf Sprachdiagnostik im Elementarbereich Wie gezeigt, herrscht über die Bedeutung des Elementarbereichs in Bezug auf einen möglichst frühzeitigen Auf- und Ausbau individueller Sprachkompetenzen mittlerweile Konsens. In allen Bundesländern wurden in den letzten Jahren Arbeitsgruppen zur Aus- bzw. Überarbeitung der gesetzlichen Rahmenbedingungen gebildet (vgl. Lisker 2010: Vorwort). Den Ausgangspunkt dieser Entwicklungen bildeten die Vereinbarungen der Kultusministerkonferenz (KMK) und der Länder vom Oktober 2002. Infolge der schlechten PISA-Ergebnisse hatten sich diese auf sieben Handlungsfelder geeinigt, in denen sie zukünftig aktiv(er) werden und so die Bildungssituation in Deutschland verbessern wollten. An erster Stelle (Handlungsfeld 1) sollten „Maßnahmen zur Verbesserung der Sprachkompetenz bereits im vorschulischen Bereich“ (KMK 2002: 6) geschaffen werden, um sozialen Benachteiligungen entgegenzuwirken. Als besonders wichtig erachtete die KMK (2002: 8) „die Sprachstandsfeststellung vor Beginn der Schulpflicht und daran anschließende Sprachförderkurse“, um für alle Kinder „die für den Grundschulunterricht notwendigen Sprachkenntnisse“ sicherzustellen. Um pädagogische Fachkräfte im Bereich (Sprach)Diagnostik zu qualifizieren, sollten ihnen „Screeningverfahren“ an die Hand gegeben werden, mittels derer sie u. a. die Sprachentwicklung der Kinder „im Alltagsgeschehen beobachten und Hinweise für eine notwendige vertiefende Diagnostik und für Fördermaßnahmen erhalten“ (KMK 2002: 8) konnten. 2004 verständigten sich die Länder auf den „Gemeinsame[n] Rahmen der Länder für die frühe Bildung in Kindertageseinrichtungen“ (JFMK & KMK 2004), in dem u. a. die Bedeutung von Sprachentwicklung und -förderung nachdrücklich betont wurde (vgl. JFMK & KMK 2004: 9). Im Nationalen Integrationsplan (Die Bundesregierung 2007) verpflichteten sich schließlich alle Länder dazu, „Verfahren zur Sprachstands-

Sprachdiagnostik im Elementarbereich

145

feststellung vor der Einschulung einzusetzen und bei Bedarf eine anschließende Sprachförderung zu ermöglichen“ (Lisker 2013: 9). Nachfolgend wird dargestellt, wie der aktuelle Stand der Sprachdiagnostik im Elementarbereich aussieht, welche Verfahren eingesetzt werden und welche Zielsetzungen mit diesen erreicht werden sollen.

4 Zwecke und Ziele von Sprachdiagnosen im Elementarbereich Bereits in den 1970er Jahren wurde in Wissenschaft und Praxis viel über die Bedeutung und Notwendigkeit von Sprachdiagnosen diskutiert, und v. a. für den Schulsektor wurden aussagekräftige Instrumente gefordert. In den damaligen Debatten konnten ebenso wie in aktuellen verschiedene Zweckorientierungen und Zielsetzungen ausgemacht werden: Einerseits werden mit dem Einsatz sprachdiagnostischer Verfahren häufig administrative bzw. (bildungs-/gesundheits-)politische Zwecke verfolgt; andererseits sollen sie zu pädagogischen Zwecken dienen (vgl. z. B. Fried 2004; Reich 2005; Kany & Schöler 2010; Lisker 2010; 2013; Schulz, Kersten & Kleissendorf 2009; Geist 2014). Lengyel (2012: 11) nennt außerdem Verfahren mit evaluativer Zweckorientierung, die in Verbindung mit der Frage stehen, „ob Kinder das erreicht haben, was mit einem Förderangebot angestrebt wurde“. Meist dienen sie dazu, den Erfolg bzw. die Effekte von Fördermaßnahmen oder Interventionen zu überprüfen. Hierzu finden mindestens zwei Erhebungszeitpunkte statt, i. d. R. vor Beginn und nach Abschluss einer Fördermaßnahme. Je nach Zielsetzung können evaluative Zwecke sowohl von administrativer bzw. politischer als auch von pädagogischer Seite verfolgt werden; sie werden daher an dieser Stelle nicht separat dargestellt.

4.1 Ziele administrativer und/oder politisch motivierter Sprachdiagnostik Sofern der Einsatz sprachdiagnostischer Verfahren primär politisch motiviert ist, handelt es sich meist um Zuweisungs- und/oder Selektionsdiagnostik. I. d. R. sollen damit die sprachlichen Leistungen von Kindern gruppiert, verglichen und auf Basis der Ergebnisse ggf. die Zuweisung zu spezifischen Fördermaßnahmen gerechtfertigt werden (vgl. Geist 2014: 26; Leutner 1998: 379). Z. T. dienen die Verfahren auch dazu, finanzielle und personelle Ressourcen zu verteilen; im Vordergrund stehen also „Aspekte der Steuerung und Organisation von Prozessen öffentlich verantworteter Bildung“ (Lengyel 2012: 11). Aus Ökonomiegründen, d. h. um Zeit, Materialund Personalkosten zu sparen, werden oft breit angelegte, standardisierte Screenings oder Tests genutzt (vgl. Reich 2005: 165; Jeuk 2015: 82). Damit lassen sich im

146

Yvonne Decker-Ernst

Idealfall möglichst alle Kinder einer Kohorte erfassen, weshalb Verfahren dieser Art häufig im Rahmen von Schuleingangsuntersuchungen genutzt werden (vgl. Kany & Schöler 2010: 119–120). Daneben werden sie bspw. genutzt, um die Einleitung von Fördermaßnahmen oder die Zuweisung von (finanziellen) Mitteln zu legitimieren. Zu beachten ist, dass gerade Screenings zugunsten der kürzeren Durchführungszeit „eine niedrigere Validität und Reliabilität“ aufweisen, die ggf. „systematische Verzerrungen in der Diagnostik verursacht – die teilweise nicht mehr bemerkt werden können“ (Mercator-Institut 2013: 16). Gerade dann, wenn auf Screeningergebnisse Zuweisungsentscheidungen folgen, können sich diese u. U. negativ auf eine Bildungslaufbahn auswirken (vgl. Lengyel 2012: 11).

4.2 Verfahren mit pädagogischer Zweckorientierung Für den pädagogischen Alltag in Kindertageseinrichtungen und die dort tätigen Fachkräfte sind v. a. Verfahren wichtig, die pädagogischen Zwecken dienen und einem förderdiagnostischen Anspruch folgen. Dies ist dann der Fall, wenn sprachdiagnostische Ergebnisse als Grundlage für die „Planung und Individualisierung von Förderangeboten“ sowie zur „Optimierung von (individuellen) Bildungsprozessen“ (Lengyel 2012: 11) genutzt werden. Meist steht dahinter das Ziel, die Sprachaneignung von Kindern im pädagogischen Alltag zu erfassen, zu begleiten und zu dokumentieren, um nicht zuletzt auch bestehende Lernbedingungen zu verbessern (vgl. Leutner 1998: 379–380). Bei mehrfachem Einsatz geeigneter Verfahren können individuelle Entwicklungen sichtbar gemacht und Fördereffekte aufgezeigt werden (vgl. Fried 2004: 45). Weiterhin trägt die Verwendung aussagekräftiger Verfahren im pädagogischen Alltag dazu bei, subjektiv gefärbte Alltagswahrnehmungen pädagogischer Fachkräfte zu objektivieren und bspw. einen Austausch im Team über die Sprachentwicklung eines Kindes zu initiieren (vgl. Fried 2004: 10). Um die o. g. Ziele zu erreichen, müssen die Verfahren differenzierte Ergebnisse ermitteln und theoretisch fundiert sein. Häufig handelt es sich um qualitativ angelegte, informelle Verfahren (vgl. Reich 2005: 165; Jeuk 2015: 81–82), die zeitaufwändiger sind als Screenings. Trotz der genannten Unterschiede von Verfahren mit politischer versus pädagogischer Zweckorientierung plädiert Geist (2014: 27) zu Recht dafür, Selektions-/Zuweisungsdiagnostik und Förderdiagnostik weniger als Gegensätze, als vielmehr als sich ergänzende Ansätze zu diskutieren. In der Praxis erscheint es durchaus sinnvoll, zunächst mittels eines ökonomisch handhabbaren Verfahrens diejenigen Kinder zu identifizieren, bei denen ein Unterstützungsbedarf besteht. Im nächsten Schritt kann dann der individuelle Förderbedarf mittels eines informellen Verfahrens erfasst und als Grundlage für die Förderplanung genutzt werden.

Sprachdiagnostik im Elementarbereich

147

5 Verfahren zur Sprachdiagnose im Elementarbereich Um die sprachlichen Fertigkeiten eines Kindes zu erfassen, existieren differente Erhebungsmethoden (Verfahrenstypen) und Instrumente, die in Abhängigkeit von o. g. Zwecken und Zielsetzungen verschieden häufig genutzt werden. In der Literatur werden sie teilweise uneinheitlich klassifiziert, was z. T. zu Verwirrung führt. Eine grobe Unterscheidung lässt sich zunächst entlang der Kriterien „standardisierte bzw. normierte Verfahren“ versus „informelle Verfahren“ (Jeuk 2015: 80–82) treffen. Z. T. ist auch die Rede von „unsystematische[n] Einschätzungen“ versus „systematische[n] Testverfahren“ (Schulz, Kersten & Kleissendorf 2009: 126) bzw. von „Tests“ versus „informellen Verfahren“ (Lengyel 2012: 16). Auf diese grobe Einteilung folgt meist eine feingliedrigere Kategorisierung, entlang der Methoden, mittels derer Sprachdaten erfasst werden sollen. Kany & Schöler (2010) unterscheiden bspw. bei informellen Verfahren zwischen „Elizitationsverfahren“, mittels derer sprachliche Äußerungen eines Kindes hervorgelockt bzw. elizitiert werden und „Beobachtungsverfahren“. Eine weitere Erhebungsmethode sind für sie „Fragebögen“, die z. T. standardisiert, z. T. aber auch informell sind. Eine andere Gruppierung findet sich in einer 2013 veröffentlichten Expertise des Mercator-Instituts für Sprachförderung und Deutsch als Zweitsprache. In Anlehnung an den Bildungsbericht 2012 wird dort zwischen „Beobachtungsbögen, Screenings und Tests“ (Mercator-Institut 2013: 16) unterschieden. Spontansprachoder Profilanalysen (sie gehören nach Kany & Schöler 2010 zu den „Elizitationsverfahren“), werden hier den Beobachtungsbögen zugerechnet (vgl. Mercator-Institut 2013: 19). Die Autorinnen und Autoren betonen, die aufgeführten Verfahrenstypen seien insgesamt „weniger unterschiedlich, als es auf den ersten Blick wirken mag“. Vielmehr seien sie alle „dem gleichen Zweck verpflichtet – entweder den Sprachstand eines Kindes möglichst genau zu erfassen, oder aber zumindest, die Kinder mit Förderbedarf auf Grundlage des jeweiligen Sprachstandes möglichst valide, sensitiv und spezifisch zu identifizieren“ (Mercator-Institut 2013: 16). Dem vorliegenden Beitrag wird die Kategorisierung von Ehlich (2005: 43–45), Reich (2005: 154–159) sowie zuletzt auch Reich & Jeuk (2017) zugrunde gelegt, da diese Kategorisierung im Vergleich zu o. g. noch weiter differenziert. Unterschieden wird hier zwischen Schätzungen, Beobachtungen, Profilanalysen (als besondere Form von Beobachtung) sowie Tests, zu denen auch Screenings als Kurzform von Tests zählen. Im Folgenden werden die zentralen Merkmale jedes Verfahrenstypus näher beschrieben und für jeden Typus exemplarisch Instrumente vorgestellt, die aktuell in den Bundesländern zur Sprachdiagnostik bei zwei-/mehrsprachigen Kindern im Elementarbereich genutzt werden. Eine Einzelbeschreibung aller im Rahmen von Einschulungsuntersuchungen in den Bundesländern eingesetzten Verfahren findet sich bei Lisker (2013) sowie Neugebauer & Becker-Mrotzek (2013).

148

Yvonne Decker-Ernst

5.1 Schätzungen Unter „Schätzungen“ versteht Reich (2005) Verfahren, bei denen die Sprachkenntnisse von Kindern anhand vorgegebener Skalen auf der Basis persönlicher Eindrücke eingeschätzt werden. Die Einschätzung kann sowohl durch ein Kind selbst als auch durch andere Personen erfolgen. Ein Vorteil von Schätzverfahren liegt in ihrer Ökonomie; i. d. R. lassen sie sich ohne größeren Zeit-, Kosten- und Personalaufwand einsetzen und erfordern keine besonderen räumlichen oder materiellen Ressourcen. Reich & Jeuk (2017: 450) sehen in Schätzungen aber auch „die doppelte Gefahr, dass die Bedeutung der Skalenwerte vage bleibt und die Zuordnung von Sprachwahrnehmungen zu den Kategorien auf subjektiven Urteilen beruht.“ Im Elementarbereich sind Schätzverfahren ein beliebtes Mittel, um die sprachlichen Fertigkeiten von Kindern im Alltag zu beobachten, zu dokumentieren und einzuschätzen. Ein häufig eingesetztes Schätzinstrument sind Portfolios (vgl. Ricart Brede in diesem Band), in denen die Entwicklungsprozesse eines Kindes in unterschiedlichen Bereichen dokumentiert werden. Die Sprachentwicklung kann dabei entweder einen Teilbereich bilden oder explizit im Fokus stehen. Letzteres ist bspw. beim Europäischen Sprachenportfolio für den Elementarbereich (Filtzinger 2011; Filtzinger, Montanari & Catanese 2011; IPE 2011) der Fall, das in Anlehnung an das Europäische Sprachenportfolio für Jugendliche und Erwachsene (Europarat 2003) für die Arbeit mit 3- bis 7-jährigen Kindern modifiziert wurde. Es handelt sich um einen Ordner mit verschiedenen Kopiervorlagen, der in die Bereiche Sprachenbiografie, Sprachenpass und Dossier unterteilt ist. Das Portfolio soll Kinder „zum Nachdenken über den eigenen Sprachlernprozess und den Gebrauch von Sprachen“ (Filtzinger 2011: 22) anregen, Mehrsprachigkeit als Ressource anerkennen und sie entsprechend konzeptionell verankern. Durch das Sammeln individueller Lernprodukte im Dossier soll der Sprachlernprozess der Kinder dokumentiert werden. Eine Einschätzung der Kompetenzen erfolgt sowohl durch das Kind selbst als auch durch pädagogische Fachkräfte und Eltern; dies ermöglicht eine Kombination aus punktueller Statusund longitudinaler Prozessdiagnostik. Offiziell erprobt und eingesetzt wird das Europäische Sprachenportfolio für den Elementarbereich in Hessen – genauer in der Stadt Mainz (vgl. IPE 2011). Ob es auch in anderen Bundesländern verwendet wird, ist unklar, da keine nachprüfbaren Ergebnisse dazu vorliegen, welche Portfolios in KiTas genutzt werden. Ein besonderer Vorteil von Portfolios liegt grundsätzlich darin, dass Kinder (und deren Eltern) eine wertschätzende Rückmeldung zu ihrem Spracherwerb erhalten, Kompetenzen in allen Sprachen berücksichtigt werden und zugleich das eigene Sprachlernen kontinuierlich reflektiert und überprüft werden kann (vgl. OomenWelke 2006; Decker 2007).

Sprachdiagnostik im Elementarbereich

149

5.2 Beobachtungen Die Beobachtung und Dokumentation kindlicher Bildungs- und Entwicklungsprozesse werden als „bedeutende Elemente professionellen Handelns im Bereich der frühkindlichen Bildung, Betreuung und Erziehung“ (Fröhlich-Gildhoff, Mischo & Weltzien 2011: 9) betrachtet. Beobachtungsverfahren zielen nicht auf eine Bewertung, sondern auf eine Beschreibung des kindlichen Sprachhandelns in alltäglichen bzw. natürlichen Handlungssituationen (vgl. Ehlich 2005: 43; Demirkaya, Gültekin-Karakoç & Settinieri 2009: 45, vgl. Döll in diesem Band). Meist werden sie von pädagogischen Fachkräften in KiTas durchgeführt. Weil dabei grundsätzlich die subjektive Beziehung zum Kind leicht in den Vordergrund tritt und persönliche Wahrnehmungen u. U. zu Fehlinterpretationen führen können, sollten verschiedene Beobachtungen in unterschiedlichen Situationen durchgeführt werden (vgl. z. B. Oomen-Welke 2008: 44). Außerdem ist wichtig, dass die Beobachtenden ihre diagnostische Kompetenz kontinuierlich weiterentwickeln, bspw. durch regelmäßige kollegiale Beratungen auf der Basis von Videoaufnahmen (vgl. hierzu z. B. das Beobachtungsinstrument zur Selbst- und Teamqualifizierung DO-RESI von Briedigkeit & Fried 2008 sowie das Beobachtungs- und Reflexionsverfahren GInA von Weltzien 2014). Neben offenen Alltagsbeobachtungen sollten strukturierte Beobachtungen auf der Basis von Beobachtungsbögen durchgeführt werden. Diese bergen, sofern sie theoretisch fundiert und begründet sind, den Vorteil, dass sie Vorgaben zur Durchführung und zum Beobachtungsgegenstand enthalten und den Beobachtungsfokus auf verschiedene Kontexte sprachlichen Handelns lenken (vgl. Ehlich 2005: 43–44). Ferner trägt die Strukturierung zur Erhöhung der Objektivität bei. Der Gewinn von Beobachtungen liegt darin, dass nicht nur „Aussagen in Hinblick auf einzelne Teilqualifikationen getroffen werden können, sondern die komplexe sprachliche Handlung des Kindes beschrieben werden kann“ (Demirkaya, Gültekin-Karakoç & Settinieri 2009: 45). Durch Mehrfachbeobachtung lassen sich individuelle Lern- und Entwicklungsprozesse über einen längeren Zeitraum hinweg erfassen (vgl. Mercator-Institut 2013: 16; Demirkaya, Gültekin-Karakoç & Settinieri 2009: 45). Ein Problem liegt aber häufig im immensen Personalaufwand. Ein Großteil der Beobachtungsverfahren für den Elementarbereich dient dazu, die kindliche Entwicklung in unterschiedlichen Domänen zu beobachten und zu dokumentieren. Sprachliche Bildungs- und Entwicklungsprozesse bilden darunter einen Bestandteil unter mehreren. Insbesondere die Mehrsprachigkeit von Kindern stellt meist keinen eigenen Schwerpunkt dar. Berlin und Schleswig-Holstein empfehlen als allgemeines Beobachtungs- und Dokumentationsverfahren die Bildungsund Lerngeschichten (Leu, Fläming & Frankenstein 2007). In anderen Bundesländern (BW, HB, HE, NI, SN, ST, TH) obliegt die Auswahl des/der Verfahren/s den Trägern und Einrichtungen selbst (vgl. Autorengruppe Bildungsberichterstattung 2016: H3-7web); wissenschaftliche Daten zur tatsächlichen Auswahl fehlen auch an dieser Stelle.

150

Yvonne Decker-Ernst

Neben allgemeinen Beobachtungsverfahren existieren solche, die explizit die (mehrsprachige) Sprachentwicklung fokussieren. Eines der bekanntesten Verfahren dieser Art ist SISMIK; es zielt darauf ab, das „Sprachverhalten und Interesse an Sprache bei Migrantenkindern“ (Ulich & Mayr 2003) zu beobachten. In Bayern und Schleswig-Holstein wird das Verfahren im Rahmen der Einschulungsuntersuchung für zwei- und mehrsprachige Kinder genutzt (vgl. Autorengruppe Bildungsberichterstattung 2016: 252). In insgesamt sieben Bundesländern (BY, BE, HH, NRW, RHP, SL, SH) wird es als ein mögliches prozessdiagnostisches Verfahren zur alltagsbegleitenden Beobachtung und Dokumentation sprachlicher Entwicklungsprozesse sowie als Grundlage von Förderentscheidungen empfohlen (vgl. Autorengruppe Bildungsberichterstattung 2016: H3-7web). Neben lexikalisch-semantischen, morpho-syntaktischen und pragmatischen Fertigkeiten eines Kindes werden v. a. literale Erfahrungen sowie das grundsätzliche Interesse an Sprache erfasst. SISMIK richtet sich explizit an zwei- und mehrsprachig aufwachsende Kinder; in die Beobachtung werden Informationen zur Aneignung des Deutschen, zur Erstsprache und zum häuslichen Sprachgebrauch einbezogen. Als Stärken des Verfahrens nennen Demirkaya, Gültekin-Karakoç & Settinieri (2009: 46–47) dessen „Vielschichtigkeit“, seine praxisgerechte Konzeption, den strukturierten Aufbau des Beobachtungsbogens, der „bei der Dokumentation der unterschiedlichen (sprachlichen) Teilaspekte“ hilft und bei mehrfacher Beobachtung „schnell und einfach Vergleiche zwischen bestimmten Items“ ermöglicht. Damit können Fortschritte und Unterstützungsbedarf ermittelt werden. Zugleich konstatieren die Autorinnen aber auch methodische Schwierigkeiten des Verfahrens, bspw. im Hinblick auf den Umgang mit fehlenden Werten, die Skalenbeschriftung sowie z. T. die Formulierung von Items, die an einigen Stellen die Gefahr subjektiver Interpretationen bergen und entsprechend einer sprachlichen Überarbeitung bedürften (vgl. Demirkaya, Gültekin-Karakoç & Settinieri 2009: 50– 52). Ein anderes Beobachtungsverfahren, das sowohl für ein- als auch für zwei- und mehrsprachige Kinder genutzt werden kann, ist das Berliner Verfahren Mein Sprachlerntagebuch für Kindertagesstätten und die Kindertagespflege (Senatsverwaltung für Bildung, Jugend und Wissenschaft 2016). Eine differenzierte Beschreibung und Analyse des Verfahrens findet sich bei Lengyel (2012: 26–27).

5.3 Profilanalysen Profilanalysen wurden ursprünglich v. a. in der Sprachheildiagnostik genutzt, seit Mitte der 1980er Jahre werden sie auch zur Modellierung und Analyse zweitsprachlicher Aneignungsprozesse eingesetzt (vgl. Clahsen 1985; Gogolin, Goll & Reich 1989; vgl. Grießhaber in diesem Band). Hierbei werden zunächst in quasi-natürlichen Situationen freie oder elizitierte Sprachproben (im Schulsektor auch Schreibproben) erhoben, die mittels Audio- oder Videoaufnahmen aufgezeichnet, anschließend meist transkribiert und anhand festgelegter Kriterien analysiert werden. Als Stimulusbzw. Impulsmaterial eignen sich im Elementarbereich v. a. Spielmaterialien, freie

Sprachdiagnostik im Elementarbereich

151

und impulsgesteuerte Spiel-, Bastel- und Gesprächssituationen, Bilder(-geschichten) und -bücher. Profilanalysen ermöglichen differenzierte Analysen in allen sprachlichen Teilbereichen und lassen bei Mehrfacheinsatz individuelle Aneignungsprozesse sichtbar werden. Auch häufig vernachlässigte Kompetenzen, wie z. B. die Erzählfertigkeiten eines Kindes, können mittels geeigneter Impulse zumindest in Teilaspekten erfasst werden. Kompetenzvergleiche zwischen mehreren Sprachen eines Kindes sind möglich, sofern Sprachproben nicht nur auf Deutsch, sondern auch in der/den anderen Sprache/n eines Kindes erhoben werden; Voraussetzung für eine spätere Analyse ist jedoch, dass Personal mit Kenntnissen in der/den anderen Sprache/n zur Verfügung steht. Die Datenerhebung erfordert i. d. R. nur einen geringen Zeitaufwand; anders verhält es sich mit der Datenaufbereitung und -analyse. V. a. für ungeübte Fachkräfte ist die Transkription von Audiomaterial nicht nur zeitaufwändig, sondern sachlich schwierig. Für eine fundierte Analyse der Sprachdaten, eine angemessene Interpretation der Ergebnisse sowie das Ableiten von Förderentscheidungen sind sprachwissenschaftliches und sprachdidaktisches Wissen vonnöten. Mit zunehmender Erfahrung reduziert sich jedoch der Aufwand. Die Aussagekraft mündlicher Sprachproben steht und fällt mit der Beschaffenheit der Erhebungssituation, der Beziehung bzw. der allgemeinen Gesprächsatmosphäre zwischen den Gesprächspartnern sowie der Motivation des Kindes, sich mit dem ausgewählten Stimulus zu beschäftigen. Auch Persönlichkeitsmerkmale (z. B. Introvertiertheit) oder – insbesondere im Falle von Bildimpulsen – kulturelle Unterschiede können die Richtung der kindlichen Äußerungen bestimmen. Zu beachten ist grundsätzlich, dass bei der Auswertung mündlicher Aufnahmen die zugrunde gelegten Normen und Auswertungskriterien ebenfalls an mündliche und nicht an schriftsprachliche Konventionen angelehnt sind (vgl. auch Reich 2005). Ein Vorteil dieses Verfahrenstypus besteht darin, dass sprachliche Kompetenzen mehrfach erfasst, Entwicklungsschritte und (Sprach-)Lernstrategien sichtbar gemacht und individuelle Förderentscheidungen abgeleitet werden können. Daneben basiert die Feststellung sprachlicher Entwicklungsstände hier weniger auf subjektiven Einschätzungen und Beschreibungen von Fachkräften, sondern auf authentischen Sprachdaten. Entwicklungsphasen können so am konkreten Datenmaterial aufgezeigt und nachvollzogen werden. Da für die Durchführung von Profilanalysen fundierte Fachkenntnisse erforderlich sind und der Zeitaufwand zu Beginn meist hoch ist, sind sie im Elementarbereich vergleichsweise selten vertreten. Eines der wenigen profilanalytischen Verfahren für den Elementarbereich ist das HAVAS-5 – Hamburger Verfahren zur Analyse des Sprachstands Fünfjähriger (Reich & Roth 2004). In Schleswig-Holstein wird es zur einmaligen Statusdiagnostik bei zwei- und mehrsprachigen Kindern neun Monate vor der Einschulung genutzt (vgl. Autorengruppe Bildungsberichterstattung 2016: 252). In Hamburg wird es als prozessdiagnostisches Beobachtungs- und

152

Yvonne Decker-Ernst

Dokumentationsverfahren im pädagogischen Alltag zur Ableitung von Förderentscheidungen empfohlen (vgl. Autorengruppe Bildungsberichterstattung 2016: Tab. H3-7web). Das Verfahren lässt sich v. a. bei Kindern zwischen fünf und sechs Jahren einsetzen und ermittelt auf Basis einer mündlichen Sprachprobe ein Sprachprofil. Als Stimulus für die Sprachaufnahme dient die Bildergeschichte „Katze und Vogel“. Die Äußerungen des Kindes zur Bildergeschichte werden aufgezeichnet, transkribiert und in einem Auswertungsbogen (u. a. nach Aufgabenbewältigung, Strategieneinsatz, verbalem Wortschatz, syntaktischer Komplexität und Satzverbindungen, sprachlichen Übergangsphänomenen etc.) analysiert. Neben der deutschen Version existieren für HAVAS-5 Versionen in Italienisch, Polnisch, Portugiesisch, Russisch, Spanisch und Türkisch. Bei Mehrfacheinsatz lassen sich Veränderungen in der Sprachentwicklung aufzeigen und Förderentscheidungen ableiten. Der Nachteil von HAVAS-5 besteht darin, dass die Transkription und Auswertung der kindlichen Äußerungen „je nach Länge des Gesprächs zwischen 30 und 45 Minuten“ (Lengyel 2012: 33) erfordert. Die Vorteile liegen jedoch darin, dass das Verfahren kompetenzorientiert vorgeht, tiefe Einblicke in die sprachlichen Fertigkeiten des Kindes in unterschiedlichen Teilbereichen und Sprachen bietet, damit parallel auch Fachkräfte für Prozesse der kindlichen Sprachaneignung sensibilisiert werden und eine passgenaue Förderkonzeption möglich ist (vgl. Lengyel 2012: 33).

5.4 Testverfahren Zuletzt sei auf Testverfahren eingegangen, die v. a. aus politischen Zwecken durchgeführt werden, z. B. im Rahmen „einer ersten Ermittlung von Sprachförderbedarf“ (Reich & Jeuk 2017: 452, vgl. Paetsch in diesem Band). Ein nicht ganz unproblematisches Ziel standardisierter Verfahren besteht darin, dass „aus wenigen Indikatoren ebenso weitreichende wie verläßliche [sic!] Schlußfolgerungen [sic!]“ (Ehlich 2005: 51) gezogen und infolgedessen eine objektivere Leistungsmessung erreicht werden soll. Mit dem Anspruch auf Standardisierung geht einher, dass die Testgütekriterien der Validität (Gültigkeit), der Reliabilität (Genauigkeit, Zuverlässigkeit) sowie der Objektivität (vgl. Bundschuh 2014: 74–77) erfüllt werden. Zur Eignung im pädagogischen Kontext sollten Tests außerdem ökonomisch sein, d. h., sie sollten sich ohne großen Zeit-, Kosten-, Raum- und Personalaufwand durchführen lassen (vgl. Fried 2004: 12). Grundsätzlich kann zwischen differentiellen und kompakten Tests (vgl. Reich 2005: 158–159) bzw. zwischen speziellen Sprachleistungs- und allgemeinen Sprachentwicklungstests (vgl. Fried 2004: 50–70) unterschieden werden. Spezielle Sprachleistungstests (SSTs) zielen auf eine Überprüfung in einzelnen, ausgewählten Teilbereichen ab. Im Schulsektor sind sie das häufigste Instrument der Leistungsmessung; meist sollen Lese- und Rechtschreib- oder morphologischsyntaktische Kompetenzen damit erfasst werden (vgl. Ehlich 2005: 45). Im Elementarbereich kommt ihnen eine eher untergeordnete Bedeutung zu.

Sprachdiagnostik im Elementarbereich

153

Allgemeine Sprachentwicklungstests (ASTs) werden v. a. im Rahmen frühkindlicher Diagnostik oder bei Einschulungsuntersuchungen genutzt, um Entwicklungsverzögerungen in der Sprache frühzeitig erkennen oder die sprachbezogene Schulfähigkeit von Kindern überprüfen und ggf. Rückstellungen oder Fördermaßnahmen einleiten zu können. Je nach sprachtheoretischer Ausrichtung basieren ASTs auf einer verschiedenen Anzahl an Untertests, die sich mehrheitlich auf bestimmte morpho-syntaktische Kategorien und/oder einige wenige (v. a. passive) Wortschatzitems konzentrieren. Aufgrund von Schwierigkeiten bei der Testkonstruktion und der Einhaltung o. g. Gütekriterien werden weniger eindeutig erfassbare sprachliche Teilbereiche i. d. R. ebenso außer Acht gelassen, wie die Sprachfertigkeiten in der Erstsprache (vgl. Fried 2004; Ehlich et al. 2005). Eine der wenigen Ausnahmen bildet das Verfahren CITO-Test Zweisprachigkeit (http://www.de.cito.com/), das in Bremen im Rahmen der Einschulungsdiagnostik eingesetzt wird (vgl. Autorengruppe Bildungsberichterstattung 2016: 252) und zumindest auch in der Erstsprache Türkisch durchgeführt werden kann (zur Kritik an diesem Verfahren vgl. z. B. Lengyel 2012: 23). Nach Reich & Jeuk (2017: 451–452) ist nach wie vor strittig, ob und inwieweit Tests „dazu geeignet sind, ungesteuert erworbene Sprache, insbesondere im Kontext von Zwei- und Mehrsprachigkeit, angemessen zu erfassen“. Gerade bei mehrsprachigen Kindern bilden sie nur einen kleinen Teil der sprachlichen Realität ab. Eine weitere Problematik, die in Abschnitt 2 in diesem Beitrag bereits erwähnt wurde, ist die Frage nach der zugrundeliegenden Norm. Da das Alter eines zwei-/mehrsprachig aufwachsenden Kindes keine verlässliche Vergleichsbasis darstellt, sind Test- und Screeningverfahren problematisch, in denen die Durchschnittswerte und Normalverteilungen auf den Messwerten gleichaltriger Monolingualer beruhen. Werden zweisprachige Kinder an der Norm monolingualer Altersgenossen gemessen, ergibt sich „das irreführende Bild vom Zweisprachigen als einem zweimal unvollkommenen Einsprachigen“ (Reich 2005: 151). Eine Lösung dieses Dilemmas scheint auch dann nicht gegeben, wenn die Messwerte sowohl auf eine einsprachige als auch auf eine zweisprachige Population bezogen und ein zweisprachig aufwachsendes Kind am Durchschnittswert der Zweisprachigen gemessen wird, wie z. B. im SET 5–10 (Petermann et al. 2012). Dahinter stände die Annahme einer universellen Zweitsprachaneignung, individuell verschiedene Einflussfaktoren im Zweitspracherwerb würden nicht berücksichtigt. Betrachtet man den gegenwärtigen Stand sprachdiagnostischer Verfahren in den deutschen Bundesländern, zeigt sich, dass fast in allen Ländern bei Einschulungsuntersuchungen standardisierte Tests und Screenings genutzt werden; im pädagogischen Alltag dominieren hingegen informelle Verfahren. Es verwundert, dass die Länder bei der Auswahl standardisierter Verfahren offensichtlich nur in einem Falle (s. Tab. 1 „Delfin 4“ in SN und ST) Ressourcen gemeinsam nutzen; ansonsten werden jeweils eigene Verfahren gewählt. Eine engere Zusammenarbeit erschiene hier v. a. aus Gründen der Ökonomie und Qualitätssicherung sinnvoll (vgl. auch Neugebauer & Becker-Mrotzek 2013: 4).

154

Yvonne Decker-Ernst

Tab. 1: Länder mit standardisierten Sprachdiagnoseverfahren bei der Einschulungsuntersuchung (Eigene Darstellung auf Basis der Daten der Autorengruppe Bildungsberichterstattung 2016: 252). Bundesland

Sprachdiagnoseverfahren:

BW BY BE BB HB HH HE MV NI NRW, ST RHP SN

HASE (Screening), SETK 3–5 (Test), optional LiSe-DaZ (Test) Kenntnisse in DaZ erfassen (Screening) Deutsch Plus 4 (Screening) KISTE (Test) Cito Sprachtest Version 3 (Test) Bildimpuls (Screening) KiSS Version 2.0 (Screening) DESK 3–6 (Screening) Fit in Deutsch (Screening) Delfin 4 (Screening) VER-ES (Screening) SSV (Screening), SOPESS (Screening)

Ein Verfahren, das im Auftrag der Landesstiftung Baden-Württemberg „zur Ermittlung des individuellen sprachlichen Entwicklungsstands“ (Schulz & Tracy 2011: 5) von DaZ-Kindern entwickelt wurde, ist die Linguistische Sprachstandserhebung – Deutsch als Zweitsprache (LiSe-DaZ) (Schulz & Tracy 2011). Es besteht aus sieben Untertests: drei zum Sprachverständnis und vier zur Sprachproduktion. Im Fokus steht die Überprüfung des „sprachliche[n] Wissen[s] von Kindern in zentralen syntaktischen, morphologischen und semantischen Bereichen“ (Schulz & Tracy 2011: 15). Hauptzielgruppe sind zwei- und mehrsprachig aufwachsende Kinder im Alter von 3;0 bis 7;11 Jahren; das Verfahren kann aber auch bei monolingualen Kindern zwischen 3;0 bis 6;11 Jahren eingesetzt werden. Ziel ist es, den sprachlichen Entwicklungsstand eines Kindes im Deutschen zuverlässig einzuschätzen und ausgehend von den Ergebnissen konkrete Förderentscheidungen zu treffen (vgl. Schulz & Tracy 2011: 15–16). Bei Mehrfacheinsatz ist nach Angabe der Autorinnen auch eine Überprüfung von Fortschritten möglich (vgl. Schulz & Tracy 2011: 18). Die Normwerte orientieren sich für DaZ-Kinder v. a. an der Kontaktdauer. Ergebnisse können auf zwei Ebenen ermittelt werden: (1) T-Werte liefern Hinweise dazu, „ob ein Kind mit DaZ im Hinblick auf sein Alter (und die Kontaktdauer) für DaZ-Lerner und -Lernerinnen erwartungsgemäße Leistungen zeigt“. (2) Über die erreichten Rohwerte lassen sich Aussagen darüber treffen, „ob in dem erfassten Bereich Förderbedarf vorliegt“ (Schulz & Tracy 2011: 18–19). LiSe-DaZ konzentriert sich auf regelhafte Teilbereiche der deutschen Sprache (v. a. Morpho-Syntax) und berücksichtigt, im Gegensatz zu vielen älteren Testverfahren (vgl. hierzu ausführlich Ehlich et al. 2005), die Merkmale mündlicher Sprache. In Baden-Württemberg kann das Verfahren optional im Rahmen der Einschulungsuntersuchung genutzt werden (vgl. Neugebauer & Becker-Mrotzek 2013: 8). Zur alltagsbegleiteten Sprachdiagnostik erscheint LiSe-DaZ jedoch weniger geeignet, es

Sprachdiagnostik im Elementarbereich

155

sollte in jedem Falle mit informellen Verfahren kombiniert werden, um zusätzliche (sprach)biografische Informationen und Kompetenzen in weiteren sprachlichen Teilbereichen zu erfassen. Ferner stellt sich bei Mehrfacheinsatz des Verfahrens die Frage, wie häufig eine Überprüfung von Fortschritten tatsächlich möglich ist, ohne dass Wiederholungseffekte durch Übungs- oder Gedächtniswirkungen auftreten, die die Aussagekraft der Ergebnisse schmälern. Ferner ist beim Einsatz von LiSe-DaZ mit ähnlich hohen zeitlichen und fachlichen Anforderungen an pädagogische Fachkräfte zu rechnen wie bspw. im Falle von Profilanalysen. Für die Durchführung sind im Manual 20 bis 30 Minuten angegeben (vgl. Schulz & Tracy 2011: 16). Für die fachlich anspruchsvolle und komplexe Auswertung fehlen Zeitangaben.

6 Diskussion und Ausblick Sprachdiagnostische Verfahren für den Elementarbereich wurden in den letzten 15 Jahren schnell und zahlreich entwickelt. In nahezu allen Ländern werden mittlerweile flächendeckend Verfahren – meist Tests und Screenings – eingesetzt, um Kinder mit Sprachförderbedarf rechtzeitig vor der Einschulung identifizieren und ggf. Fördermaßnahmen einleiten zu können. Zwischen diesen Verfahren bestehen jedoch große Unterschiede. Weiterhin werden im Alltag von Kindertageseinrichtungen verschiedene informelle, meist Beobachtungsverfahren genutzt, um die sprachlichen Entwicklungsprozesse von Kindern begleiten und dokumentieren zu können. Da die Auswahl der Verfahren i. d. R. den Trägern und Einrichtungen obliegt, ist unklar, um welche Verfahren es sich handelt und wie es um ihre Qualität bestellt ist. In Bezug auf die Qualität und Wirksamkeit von Verfahren, die flächendeckend in den Ländern eingesetzt werden, konstatierte eine auf Initiative des MercatorInstituts für Sprachförderung und Deutsch als Zweitsprache initiierte Expertengruppe z. T. „große[n] Handlungsbedarf“ (Neugebauer & Becker-Mrotzek 2013: 4). Sie legte zehn verschiedene Handlungsfelder mit insgesamt 32 Qualitätsmerkmalen fest (vgl. Mercator-Institut 2013: 20–36), anhand derer die sprachdiagnostischen Verfahren der Länder analysiert und bewertet wurden. Gemäß Neugebauer & Becker-Mrotzek (2013: 45–46) befindet sich die Entwicklung sprachdiagnostischer Verfahren im Elementarbereich zwar „insgesamt auf einem guten Weg“, mehr als die „Hälfte der Verfahren“ erfüllt jedoch die angelegten Qualitätsmerkmale (noch) „nicht ausreichend“. Schwächen bestehen v. a. bei der Berücksichtigung verschiedener sprachlicher Teilbereiche, der Validität, der Objektivität sowie beim Einbezug von Mehrsprachigkeit. Für das Handlungsfeld „Mehrsprachigkeit“ liegen insgesamt fünf Merkmale vor, von denen die Mehrzahl der Verfahren drei nicht ausreichend erfüllt. ⅔ der Verfahren berücksichtigen die Sprachbiografie nicht ausreichend, 17 der 21 Verfahren erfassen keine Einschätzung der Eltern zu den Kompetenzen in der

156

Yvonne Decker-Ernst

Erstsprache des Kindes, ⅔ der Verfahren enthalten keine separaten Normwerte für DaZ-Kinder (vgl. Neugebauer & Becker-Mrotzek 2013: 37). Auch Lengyel (2012: 21) betont in ihrer Expertise zur Sprachdiagnose bei zweiund mehrsprachigen Kindern im Elementarbereich, dass die Qualität der Verfahren u. a. durch das Maß, in dem die Erstsprache(n) eines Kindes einbezogen und „mehrsprachige Sprachgebrauchsformen“ berücksichtigt werden, bestimmt wird. Infolgedessen betont auch sie die Notwendigkeit, sprachbiografische Informationen zu erfassen und Eltern um eine Einschätzung der sprachlichen Fähigkeiten in Erst- und Zweitsprache zu bitten. Weiterhin führt sie als Anforderungen an Verfahren auf, dass die überprüften Sprachbereiche begründet, Übergangserscheinungen berücksichtigt werden und das zugrundeliegende Verständnis von Sprachkompetenz geklärt wird. Nach Lengyel (2012: 21–22) sollten die Verfahren qualitative, förderdiagnostische Analysen sowie prozessbegleitende „Mehrfacherhebungen“ ermöglichen, alters- und kindgerecht sein und individuelle Daten des Kindes und seiner Familie miterfassen. Im Hinblick auf testtheoretische Gütekriterien betont sie, dass deren Einhaltung v. a. bei Verfahren, die zu bildungsbiografischen Selektions- bzw. Zuweisungszwecken herangezogen werden, erforderlich ist. Für informelle Verfahren sind hingegen, wie in der qualitativen Forschung insgesamt, v. a. eine intersubjektive Nachvollziehbarkeit und Transparenz sowie die Offenlegung und Angemessenheit von Maßstäben und Normen notwendig. Da es zwischen den verschiedenen Anforderungen z. T. zu Widersprüchen kommt, sind sie als „Kriterien, die Zielvorstellungen abbilden, an denen sich die Verfahren jeweils messen lassen müssen“, zu verstehen. Pädagogische Fachkräfte sollten „über die Anforderungen reflektieren und vor dem Hintergrund des Verwendungszusammenhangs (Zweck der Sprachstandserhebung) auf Basis des Anforderungskatalogs begründete Entscheidungen für oder gegen ein Instrument treffen können“ (Lengyel 2012: 22). Die letztgenannte Forderung betont auch Reich (2005: 152). Er plädiert dafür, dass bei der Auswahl geeigneter Verfahren v. a. ein grundsätzliches „Problembewusstsein bei allen Beteiligten“ aufgebaut werden muss, d. h. ein Bewusstsein dafür, Verfahren vor ihrem Einsatz kritisch auf ihre Eignung zu überprüfen und dem Zweck der Überprüfung anzupassen. Je nach Zweck tritt auch der Bedarf an normativen Maßstäben in den Hintergrund. Döll & Dirim (2010: 157) betonen, das vorrangige Ziel von Sprachdiagnosen sollte die Erfassung sprachlicher Lernfortschritte und eine angemessene Ableitung von Förderentscheidungen sein. Auch Jeuk (2015: 85) konstatiert, dass im pädagogischen Alltag v. a. nicht standardisierte (qualitative) Verfahren gefordert seien, „die in der Lage sind, auch individuelle Profile mit Stärken und Schwächen zu erfassen“. Dieser Umstand scheint in den deutschen Bundesländern bereits angekommen, wenn man bedenkt, dass Screening- und Testverfahren primär zu politischen Zwecken genutzt werden, im pädagogischen Alltag jedoch primär Beobachtungs- und Schätzverfahren, selten auch

Sprachdiagnostik im Elementarbereich

157

Profilanalysen eingesetzt werden. Die Offenheit und Entscheidungsfreiheit, die innerhalb der Länder gegenüber Trägern und Einrichtungen bei der Auswahl informeller Verfahren geboten ist, bietet dabei Chancen und Gefahren zugleich. Die freie Auswahl und Zusammenstellung eigener Verfahren bietet die Chance, dass sich die pädagogischen Fachkräfte intensiv mit Vorhandenem auseinandersetzen und es vor der Auswahl kritisch abwägen. Dies ist jedoch nur dann realisierbar, wenn die Sensibilität und Qualifizierung gegeben sind. Infolgedessen ist davon auszugehen, dass Qualität der ausgewählten Verfahren und Qualifizierung der Fachkräfte in engem Zusammenhang stehen. In der Konsequenz sind die Frage, ob und ggf. welche Förderentscheidungen in den Einrichtungen getroffen werden, eng an die Qualität der Verfahren und Fachkräfte gekoppelt. Auch in der Expertise des Mercator-Instituts (2013: 8) wird die Notwendigkeit herausgestellt, pädagogische Fachkräfte einerseits für die „Durchführung von Sprachstandsverfahren“ zu qualifizieren, andererseits „allgemeine Kenntnisse über den kindlichen Spracherwerb“, inklusive linguistischer Grundlagen und Besonderheiten des Zweitspracherwerbs schon im Rahmen der Ausbildung an Fachund Hochschulen zu vermitteln. Schließlich benötigen die Fachkräfte einen mehrfachen, d. h. multiperspektivisch ausgerichteten Blick auf den sprachlichen Kompetenzerwerb von Kindern. Dies impliziert – eine Kombination verschiedener sprachdiagnostischer Verfahren, um den aktuellen IST-Stand zu bestimmen und eine prozessdiagnostische Begleitung zu ermöglichen, die Entwicklungsschritte sichtbar macht; – die Berücksichtigung von Kompetenzen in der Erst- und Zweitsprache, indem beide Sprachen im Alltag zugelassen und nach Möglichkeit vielfältige sprachbiografische Informationen zum Kind erfasst werden; – eine Berücksichtigung und Erfassung der verschiedenen Einflussfaktoren im Zweitspracherwerb sowie Kenntnis über spezifische Schwierigkeiten und Übergangserscheinungen; – die enge Kooperation mit den Bezugspersonen der Kinder, um sprachliche und nicht-sprachliche Informationen auszutauschen (vgl. hierzu auch Decker 2011).

Literatur Autorengruppe Bildungsberichterstattung (Hrsg.) (2016): Bildung in Deutschland 2016. Ein indikatorengestützter Bericht mit einer Analyse zu Bildung und Migration. Bielefeld: Bertelsmann. Bredel, Ursula (2005): Sprachstandsmessung – Eine verlassene Landschaft. In Konrad Ehlich, Ursula Bredel, Britta Garme u. a. (Hrsg.), Anforderungen an Verfahren der regelmäßigen Sprachstandsfeststellung als Grundlage für die frühe und individuelle Förderung von Kindern mit und ohne Migrationshintergrund. Bildungsforschung Bd. 11, 78–119. Berlin: BMBF. Briedigkeit, Eva & Lilian Fried (2008): Sprachförderkompetenz: Selbst- und Teamqualifizierung für Erzieherinnen, Fachberatungen und Ausbilder. Berlin: Cornelsen Scriptor.

158

Yvonne Decker-Ernst

Bundschuh, Konrad (2014): Einführung in die sonderpädagogische Diagnostik. 8. Auflage. Stuttgart: UTB. Clahsen, Harald (1985): Profiling Second Language Development. A Procedure for Assessing L2 Proficiency. In Kenneth Hyltenstam & Manfred Pienemann (Hrsg.), Modelling and Assessing Second Language Aquisition, 283–331. Clevdon: Multilingual Matters. Decker, Yvonne (2007): „Meine Sprachen und ich.“ Praxis der Portfolioarbeit in Internationaler Vorbereitungsklasse und Förderkurs. In Bernt Ahrenholz (Hrsg.), Deutsch als Zweitsprache. Voraussetzungen und Konzepte für die Förderung von Kindern und Jugendlichen mit Migrationshintergrund, 169–186. Freiburg i. Br.: Fillibach. Decker, Yvonne (2011): Die Bedeutung diagnostischer Kompetenzen als Grundlage von Förderentscheidungen. In Alfred Holzbrecher (Hrsg.), Interkulturelle Schule. Eine Entwicklungsaufgabe, 350–365. Schwalbach/Ts.: Wochenschau. Decker-Ernst, Yvonne (2017): Deutsch als Zweitsprache in Vorbereitungsklassen. Eine Bestandsaufnahme in Baden-Württemberg. Stuttgart: Fillibach bei Klett. Demirkaya, Sevilen, Nazan Gültekin-Karakoç & Julia Settinieri (2009): Mit Sismik punkten? Zum quantitativen Einsatz des Beobachtungsbogens. In: Bernt Ahrenholz (Hrsg.), Empirische Befunde zu DaZ-Erwerb und Sprachförderung, 43–62. Freiburg i. Br.: Fillibach. Die Bundesregierung (2007): Der Nationale Integrationsplan. Neue Wege – neue Chancen. Baden-Baden: Koelblin-Fortuna. Döll, Marion & Inci Dirim (2010): Mehrsprachigkeit in der Sprachdiagnostik. In Sarah Fürstenau & Mechthild Gomolla (Hrsg.), Migration und schulischer Wandel, 153–167. Wiesbaden: VS. Ehlich, Konrad (2005): Sprachaneignung und deren Feststellung bei Kindern mit und ohne Migrationshintergrund – Was man weiß, was man braucht, was man erwarten kann. In Konrad Ehlich, Ursula Bredel, Birgitta Garme, Anna Komor, Hans-Jürgen Krumm, Tim McNamara, Hans H. Reich, Guido Schnieders, Jan D. ten Thije & Huub van den Bergh, Anforderungen an Verfahren der regelmäßigen Sprachstandsfeststellung als Grundlage für die frühe und individuelle Förderung von Kindern mit und ohne Migrationshintergrund. Bildungsforschung Bd. 11, 11–75. Berlin: BMBF. Ehlich, Konrad, Ursula Bredel, Birgitta Garme, Anna Komor, Hans-Jürgen Krumm, Tim McNamara, Hans H. Reich, Guido Schnieders, Jan D. ten Thije & Huub van den Bergh (2005): Anforderungen an Verfahren der regelmäßigen Sprachstandsfeststellung als Grundlage für die frühe und individuelle Förderung von Kindern mit und ohne Migrationshintergrund. Bildungsforschung Bd. 11. Berlin: BMBF. Ehlich, Konrad, Ursula Bredel & Hans H. Reich (Hrsg.) (2008a): Referenzrahmen zur altersspezifischen Sprachaneignung. Bildungsforschung Band 29/1. Berlin: BMBF. Ehlich, Konrad, Ursula Bredel & Hans H. Reich (Hrsg.) (2008b): Referenzrahmen zur altersspezifischen Sprachaneignung. Bildungsforschung Band 29/2. Berlin: BMBF. Europarat (Hrsg.) (2003): Europäisches Sprachenportfolio für Jugendliche und Erwachsene. Bern: Berner Lehrmittel- und Medienverlag. Filtzinger, Otto (2011). Europäische Sprachenpolitik und frühe Mehrsprachigkeit – Sprachpolitische und bildungspolitische Zusammenhänge. In Otto Filtzinger, Elke Montanari & Giovanni Cicero Catanese (Hrsg.), Europäisches Sprachenportfolio. Mehrsprachigkeit in der frühkindlichen Bildung wertschätzen und dokumentieren, 15–37. Köln: Bildungsverlag EINS. Filtzinger, Otto, Elke Montanari & Giovanni Cicero Catanese (Hrsg.) (2011): Europäisches Sprachenportfolio. Mehrsprachigkeit in der frühkindlichen Bildung wertschätzen und dokumentieren. Köln: Bildungsverlag EINS. Fried, Lilian (2004): Expertise zu Sprachstandserhebungen für Kindergartenkinder und Schulanfänger. Eine kritische Betrachtung. München: DJI.

Sprachdiagnostik im Elementarbereich

159

Fröhlich-Gildhoff, Klaus, Christoph Mischo & Dörte Weltzien (2011): Einführung. In: Christoph Mischo, Dörte Weltzien & Klaus Fröhlich-Gildhoff (Hrsg.): Beobachtungs- und Dokumentationsverfahren in der Frühpädagogik, 9–18. Köln & Kronach: Wolters Kluwer. Geist, Barbara (2014): Sprachdiagnostische Kompetenz von Sprachförderkräften. DaZ-Forschung Bd. 3. Berlin u. a.: de Gruyter. Gogolin, Ingrid, Alfred Goll & Hans H. Reich (1989): Sprachwahrnehmungstraining für Lehrer ausländischer Schüler. Soest: Landesinstitut für Schule und Weiterbildung. IPE = Institut für Interkulturelle Pädagogik im Elementarbereich e.V. (2011). Das Europäische Sprachenportfolio für den Elementarbereich. Entwicklung und Validierung eines deutschen Modells (Abschlussbericht). http://www.ipe-mainz.de/Download/Dokumentation-SDW.pdf (31. 07. 2015). Jeuk, Stefan (2008): „Der Katze jagt den Vogel.“ Aspekte des Genus und Kasus im Grundschulalter. In Bernt Ahrenholz (Hrsg.), Zweitspracherwerb, Diagnosen, Verläufe, Voraussetzungen, 135–150. Freiburg: Fillibach. Jeuk, Stefan (2015): Deutsch als Zweitsprache in der Schule. Grundlagen – Diagnose – Förderung. 3. Auflage. Stuttgart: Kohlhammer. JFMK & KMK = Kultus- und Jugendministerkonferenz (2004): Gemeinsamer Rahmen der Länder für die frühe Bildung in Kindertageseinrichtungen. Beschluss der Jugendministerkonferenz vom 13./14. 05. 2004 und Beschluss der Kultusministerkonferenz vom 03./04. 06. 2004. Bonn. Kaltenbacher, Erika & Hana Klages (2006): Sprachprofil und Sprachförderung bei Vorschulkindern mit Migrationshintergrund. In Bernt Ahrenholz (Hrsg.), Kinder mit Migrationshintergrund. Spracherwerb und Fördermöglichkeiten, 80–97. Freiburg i. Br.: Fillibach. Kany, Wolfgang & Hermann Schöler (2010): Fokus Sprachdiagnostik. Leitfaden zur Sprachstandsbestimmung im Kindergarten. 2. Auflage. Berlin: Cornelsen. Klein, Wolfgang (1992): Zweitspracherwerb. Eine Einführung. 3. Auflage. Frankfurt a. M.: Anton Hain. KMK = Ständige Konferenz der Kultusminister der Länder (2002): PISA 2000 – Zentrale Handlungsfelder. Beschluss der 299. Kultusministerkonferenz vom 17./18. 10. 2002. http:// www.kmk.org/fileadmin/pdf/PresseUndAktuelles/2002/massnahmen.pdf (16. 11. 2016). KMK (2006): Bericht „Zuwanderung“. Beschluss der Kultusministerkonferenz vom 24. 05. 2002, i.d.F. vom 16. 11. 2006. http://www.kmk.org/fileadmin/veroeffentlichungen_beschluesse/ 2002/2002_05_24-Zuwanderung.pdf (16. 11. 2016). Kniffka, Gabriele & Gesa Siebert-Ott (2007): Deutsch als Zweitsprache. Lehren und lernen. Paderborn: Schöningh. Lengyel, Drorit (2012): Sprachstandsfeststellungen bei mehrsprachigen Kindern im Elementarbereich. München: DJI e.V. & WiFF. Leu, Hans Rudolf, Katja Flämig, Yvonne Frankenstein, Irene Pack, Kornelia Schneider & Martina Schweiger (2007): Bildungs- und Lerngeschichten. Bildungsprozesse in früher Kindheit beobachten, dokumentieren und unterstützen. Weimar & Berlin: das Netz. Leutner, Detlev (1998): Pädagogisch-psychologische Diagnostik. In Detlev Rost (Hrsg.), Handwörterbuch Pädagogische Psychologie, 379–386. Weinheim: PVU. Lisker, Andrea (2010): Sprachstandsfeststellung und Sprachförderung im Kindergarten sowie beim Übergang in die Schule. Expertise im Auftrag des Deutschen Jugendinstituts. München: DJI. Lisker, Andrea (2013): Sprachstandsfeststellung und Sprachförderung vor der Einschulung – Eine Bestandsaufnahme in den Ländern. Expertise im Auftrag des Deutschen Jugendinstituts. München: DJI. Lütke, Beate (2011): Deutsch als Zweitsprache in der Grundschule. Eine Untersuchung zum Erlernen lokaler Präpositionen. Berlin: De Gruyter. Mercator-Institut für Sprachförderung und Deutsch als Zweitsprache (Hrsg.) (2013): Qualitätsmerkmale für Sprachstandsverfahren im Elementarbereich. Ein Bewertungsrahmen für fundierte Sprachdiagnostik in der Kita. Köln: Mercator-Institut für Sprachförderung und Deutsch als Zweitsprache.

160

Yvonne Decker-Ernst

Neugebauer, Uwe & Becker-Mrotzek, Michael (2013): Die Qualität von Sprachstandsverfahren im Elementarbereich. Eine Analyse und Bewertung. Köln: Mercator-Institut für Sprachförderung und Deutsch als Zweitsprache. Oomen-Welke, Ingelore (2006): „Meine Sprachen und ich“. Inspiration aus der Portfolio-Arbeit für DaZ in Vorbereitungsklassen und Kindergarten. In Bernt Ahrenholz (Hrsg.), Kinder mit Migrationshintergrund. Spracherwerb und Fördermöglichkeiten, 115–131. Freiburg i. Br.: Fillibach. Oomen-Welke, Ingelore (2008): Sprachstandsdiagnose im Elementarbereich: Beobachten, messen und deuten als integrativer Teil der Sprachförderung. In Bernt Ahrenholz (Hrsg.), Zweitspracherwerb. Diagnosen, Verläufe, Voraussetzungen, 43–63. Freiburg: Fillibach. Oomen-Welke, Ingelore & Yvonne Decker-Ernst (demn. 2018): Wörter verstehen – üben – gebrauchen. 1000 Wörter für DaZ und DaM und was man damit machen kann. Stuttgart: Klett. Petermann, Franz (2012): SET 5–10. Sprachstandserhebungstest für Kinder im Alter zwischen 5 und 10 Jahren. Göttingen u. a.: Hogrefe. Redder, Angelika, Knut Schwippert, Marcus Hasselhorn, Sabine Forschner, Detlef Fickermann, Konrad Ehlich, Michael Becker-Mrotzek, Marianne Krüger-Potratz, Hans-Günther Roßbach, Petra Stanat & Sabine Weinert (2011): Bilanz und Konzeptualisierung von strukturierter Forschung zu „Sprachdiagnostik und Sprachförderung“. Hamburg: ZUSE. Reich, Hans H. (2005): Forschungsstand und Desideratenaufweis zu Migrationslinguistik und Migrationspädagogik für die Zwecke des Anforderungsrahmens. In Konrad Ehlich, Ursula Bredel, Birgitta Garme, Anna Komor, Hans-Jürgen Krumm, Tim McNamara, Hans H. Reich, Guido Schnieders, Jan D. ten Thije & Huub van den Bergh, Anforderungen an Verfahren der regelmäßigen Sprachstandsfeststellung als Grundlage für die frühe und individuelle Förderung von Kindern mit und ohne Migrationshintergrund. Bildungsforschung Bd. 11, 121–169. Berlin: BMBF. Reich, Hans H. & Stefan Jeuk (2017): Sprachstandserhebungen, ein- und mehrsprachig. In Bernt Ahrenholz & Ingelore Oomen-Welke (Hrsg.), Deutsch als Zweitsprache. Deutschunterricht in Theorie und Praxis Bd. 9, 447–458. Baltmannsweiler: Schneider. Reich, Hans H. & Hans-Joachim Roth (2007): HAVAS-5. Das Hamburger Verfahren zur Analyse des Sprachstands bei Fünfjährigen. In Hans Reich, Hans-Joachim Roth & Ursula Neumann (Hrsg.), Sprachdiagnostik im Lernprozess. Verfahren zur Analyse von Sprachständen im Kontext von Zweisprachigkeit, 71–94. Münster u. a.: Waxmann. Reich, Hans H. & Hans-Joachim Roth (2004): HAVAS-5. Hamburger Verfahren zur Analyse des Sprachstandes bei 5-Jährigen. Hamburg: LI. Robert-Bosch Stiftung (2008): Frühpädagogik studieren – ein Orientierungsrahmen für Hochschulen. Stuttgart: Robert-Bosch Stiftung. Rösch, Heidi (2011): Deutsch als Zweit- und Fremdsprache. Berlin: Akademie. Rothweiler, Monika & Tobias Ruberg (2011): Der Erwerb des Deutschen bei Kindern nichtdeutscher Erstsprache. Sprachliche und außersprachliche Einflussfaktoren. Eine Expertise der Weiterbildungsinitiative Frühpädagogische Fachkräfte (WiFF). München: DJI. Ruberg, Tobias (2015): Diagnostische Aspekte des Genuserwerbs zwei- und mehrsprachiger Kinder. In: Forschung Sprache 2/2015, 22–40. Schneider, Wolfgang, Jürgen Baumert, Michael Becker-Mrotzek, Marcus Hasselhorn, Gisela Kammermeyer, Thomas Rauschenbach, Hans-Günther Roßbach, Hans-Joachim Roth, Monika Rothweiler und Petra Stanat (2012): Expertise „Bildung durch Sprache und Schrift (BiSS)“. (Bund-Länder-Initiative zur Sprachförderung, Sprachdiagnostik und Leseförderung). https:// www.bmbf.de/files/BISS_Expertise.pdf (16.11. 2016). Schulz, Petra & Rosemarie Tracy (2011): LiSe-DaZ. Linguistische Sprachstandserhebung – Deutsch als Zweitsprache. Manual. Göttingen u. a.: Hogrefe.

Sprachdiagnostik im Elementarbereich

161

Schulz, Petra, Anja Kersten & Barbara Kleissendorf (2009): Zwischen Spracherwerbsforschung und Bildungspolitik. Sprachdiagnostik in der frühen Kindheit. Zeitschrift für Soziologie der Erziehung und Sozialisation 29 (2), 122–140. Senatsverwaltung für Bildung, Jugend und Wissenschaft (Hrsg.) (2016): Mein Sprachlerntagebuch für Kindertagesstätten und Kindertagespflege. Berlin: Senatsverwaltung für Bildung, Jugend und Wissenschaft. SGB VIII = Achtes Buch Sozialgesetzbuch (2014): Kinder- und Jugendhilfe. Berlin: BMFSFJ. Thoma, Dieter & Rosemarie Tracy (2006): Deutsch als frühe Zweitsprache: zweite Erstsprache? In Bernt Ahrenholz (Hrsg.), Kinder mit Migrationshintergrund. Spracherwerb und Fördermöglichkeiten, 58–79. Freiburg i. Br.: Fillibach. Ulich, Michaela & Toni Mayr (2003): SISMIK. Sprachverhalten und Interesse an Sprache bei Migrantenkindern im Kindergarten. Freiburg: Herder. Voet Cornelli, Barbara, Schulz, Petra, Tracy, Rosemarie (2013): Sprachentwicklungsdiagnostik bei Mehrsprachigkeit. Eine Herausforderung für die pädiatrische Praxis. In: Monatsschrift Kinderheilkunde 10/2013, 911–917. Weltzien, Dörte (2014): Pädagogik: Die Gestaltung von Interaktionen in der Kita: Merkmale – Beobachtung Reflexion. Weinheim: Beltz.

Stefan Jeuk und Beate Lütke

8 Sprachdiagnostik im Primarund Sekundarbereich 1 2 3 4 5 6

Einleitung Bildungspolitische und institutionelle Zielsetzungen Gütekriterien sprachdiagnostischer Verfahren Erfassen von Kompetenzen in mehreren Sprachen Verfahren für die Schule Schlussbemerkungen

1 Einleitung Innerhalb der Gruppe mehrsprachig aufwachsender Kinder und Jugendlicher zeigt sich ein breites Spektrum an unterschiedlichen Spracherwerbsbedingungen. Aufgrund dieser Bedingungen treten mehrsprachige Kinder mit ganz unterschiedlichen sprachlichen Voraussetzungen in die Schule ein und diese heterogenen sprachlichen Lernvoraussetzungen bestimmen häufig langfristig die individuelle Schullaufbahn und den Bildungserfolg. Neben Kindern, die im Sinne eines doppelten Erstspracherwerbs von Geburt an mit zwei Sprachen aufwachsen, z. B. wenn beide Elternteile zwei unterschiedliche Sprachen mit dem Kind sprechen, kommen andere Kinder nach der Geburt hauptsächlich mit einer oder auch zwei anderen Familiensprachen als dem Deutschen in Kontakt. Manche von ihnen kommunizieren erst dann verstärkt in der deutschen Sprache, wenn sie in Institutionen wie den Kindergarten oder die Schule eintreten. In anderen Familien, z. B. wenn mehrere Kinder in die Schule gehen, kommt der Umgebungssprache Deutsch eine größere Bedeutung zu. Es ist davon auszugehen, dass die gelebte Mehrsprachigkeit von Kindern und Jugendlichen weitaus heterogener ist, als in den Statistiken erfasst wird (vgl. Busch 2015). Die individuelle Sprachkompetenz ist durch weitere Faktoren beeinflusst: Ein späteres Kontaktalter im sukzessiven Zweitspracherwerb und ein daraus resultierender, in Qualität und Quantität geringerer deutschsprachiger Input in den ersten Lebensjahren können sich, einhergehend mit der jeweils kürzeren oder längeren Kontaktdauer mit der deutschen Sprache, auf den individuellen Sprachaneignungsprozess auswirken. In der Sekundarstufe lernt eine Vielzahl an Jugendlichen, die bereits in der Familie, in der Kita und/oder in der Grundschule Deutsch als zweite Sprache erworben hat; einige dieser Schülerinnen und Schüler benötigen dennoch weitere Unterstützung bei der Aneignung der Zweitsprache Deutsch, insbesondere im Hinblick auf schulisches Lernen im bildungssprachlichen Register (Oomen-Welke 2017). Auf den Erwerb bildungssprachlicher Kompetenzen ein- und mehrsprachiger Kinder wirkt sich statistisch gesehen außerdem der sozioökonomihttps://doi.org/10.1515/9783110418712-008

164

Stefan Jeuk und Beate Lütke

sche Status aus (vgl. u. a. Berendes et al. 2015: 2016–127).1 Da Kinder und Jugendliche mit einem Migrationshintergrund häufiger in Familien mit einem niedrigen sozioökonomischen Status aufwachsen und deshalb vermehrt von Armut und Erwerbslosigkeit betroffen sind (vgl. Autorengruppe Bildungsberichterstattung 2012: 28), kumulieren diese ungünstigen Erwerbsbedingungen oftmals. Eine weitere, in sich wiederum nicht nur sprachlich sehr heterogene Gruppe, bilden die neu eingewanderten mehrsprachigen Kinder und Jugendlichen, die über eine vorbereitende Phase (Willkommens- oder Vorbereitungsklassen) in den Regelunterricht der verschiedenen Jahrgangsstufen eintreten. Um zu entscheiden, ob ein Kind oder Jugendlicher bei der Einschulung oder im weiteren Verlauf seiner Schullaufbahn Sprachförderung in der L2 Deutsch benötigt, ob eine additive Deutschförderung, fachintegrierte Sprachförderung im Regelunterricht oder wegen Neuzuwanderung aufgrund geringer Sprachkompetenzen im Deutschen zunächst eine Willkommensoder Vorbereitungsklasse gewählt werden soll, werden sprachdiagnostische Verfahren benötigt. Noch bedeutsamer sind sprachdiagnostische Prozesse im Hinblick auf förderdiagnostische Fragestellungen in der weiteren Schullaufbahn (vgl. Settinieri & Jeuk in diesem Band). Für die Sprachdiagnose bei mehrsprachigen Kindern und Jugendlichen in der Grundschule und in der Sekundarstufe liegen vergleichsweise wenige Verfahren vor, die die oben genannten spezifischen Erwerbssituationen berücksichtigen. Die meisten Instrumente sind für monolingual deutschsprachig aufwachsende Kinder entwickelt worden und orientieren sich an Forschungserkenntnissen über deren typische Spracherwerbsverläufe (vgl. Redder et al. 2011: 41). Damit bieten die vorliegenden Verfahren kaum eine zuverlässige Basis für die Erfassung sprachlicher Kompetenzen und der allgemeinen Spracherwerbsstände mehrsprachiger Kinder (vgl. z. B. kritisch Jeuk 2018: 87–88). Lediglich einzelne Verfahren berücksichtigen die Mehrsprachigkeit der Kinder, dies jedoch in unterschiedlichem Maße. Teilweise wird lediglich erfragt, ob generell ein mehrsprachiger Hintergrund vorliegt, andere Verfahren wurden zwar an größeren Gruppen von Kindern, die sich Deutsch als Zweitsprache aneignen, normiert, ohne jedoch Aspekte von Zweitspracherwerbsprozessen zu bearbeiten. Nur in seltenen Fällen erheben die Verfahren auch die nichtdeutsche Erstsprache und deren Erwerbsstand. In der sehr kritischen Fachdebatte über die Qualität vorliegender Sprachdiagnoseinstrumente (vgl. BMBF 2005; Redder et al. 2011) wird außerdem problematisiert, dass die Verfahren nur Abbildungen von an der performativen Oberfläche

1 Da der Fokus des vorliegenden Bandes auf mehrsprachigen Personen liegt, die sich Deutsch als Zweit- oder Drittsprache aneignen, erfolgt in diesem Beitrag keine Auseinandersetzung mit Fragen der Sprachdiagnostik und Sprachförderung für Kinder und Jugendliche mit deutscher Erstsprache. Es sei aber darauf hingewiesen, dass auch in dieser Gruppe häufig ein Sprachförderbedarf festgestellt wird und die Probleme der Diagnostik und Förderung auch für diese Gruppe bisher nicht ausreichend gelöst worden sind.

Sprachdiagnostik im Primar- und Sekundarbereich

165

sichtbaren und durch das jeweilige Instrument elizitierten Teilbereichen der Sprachkompetenz ermöglichen. Gerade im Bereich pragmatischer Fähigkeiten werde ein unzureichender Eindruck abgerufen, die gesamte Sprachkompetenz des Kindes sei so nicht erfassbar (vgl. zu weiteren Desiderata Redder et al. 2011: 69). Ein weiteres Problem bildet vor dem Hintergrund der linguistischen und methodischen Komplexität der Verfahren die mangelnde Qualifizierung des pädagogischen Personals für die Durchführung sprachdiagnostischer Erhebungen und darauf abgestimmter Förderentscheidungen, zumal „von beobachteten Phänomenen auf eine ihnen zugrundeliegende allgemeinere Kompetenz geschlossen werden“ müsse (Gogolin 2010: 1306). Kritisch merkt Gogolin an, dass die „hohe Praxisbedeutung sprachdiagnostischer Tätigkeiten […] weder mit einer entsprechend regen Forschung noch mit einer gründlichen Qualifizierung des pädagogischen Personals für die diagnostischen Tätigkeiten“ korrespondiere (ebd.), und auch in der Lehrkräfteausbildung sei dieser Bereich „randständig“ (Gogolin 2010: 1310). Vor dem Hintergrund dieser Problematik gibt der folgende Beitrag einen Überblick über die bildungspolitischen und institutionellen Zielsetzungen von Sprachdiagnostik in der Primar- und Sekundarstufe, bemüht sich um eine Differenzierung hinsichtlich der verschiedenen Zielgruppen und linguistischen Diagnosebereiche, benennt Qualitätskriterien normierter und nicht normierter Verfahren und beschreibt einzelne sprachdiagnostische Verfahren, die den mehrsprachigen Hintergrund von Schülerinnen und Schülern berücksichtigen (vgl. Beitrag von Settinieri & Jeuk in diesem Band).

2 Bildungspolitische und institutionelle Zielsetzungen Aspekte der Sprachdiagnose werden neben schulischen Fragestellungen u. a. auch im Kontext der Zertifizierung von sprachlichen Leistungen relevant, die von ausländischen Deutschlernenden für die Aufnahme eines Studiums, einer Ausbildung oder eines Berufs benötigt werden oder im Rahmen von Einbürgerungsprozessen zu erbringen sind. Als curriculare Orientierung für die Einstufung sprachlicher Teilkompetenzen in der Fremdsprache dient hierfür der Gemeinsame Europäische Referenzrahmen für Sprachen (GER). Insbesondere bei der Einstufung bzw. Einordnung von Kompetenten von neu eingewanderten Jugendlichen findet bildungspolitisch derzeit eine Orientierung an den GER Kategorien statt, z. B. bei der Konzeption des Verfahrens 2P: Potentiale und Perspektiven (s. u.). Auch in Deutsch-als ZweitspracheLehrwerken für die Primar- und Sekundarstufe für neu eingewanderte Kinder und Jugendliche findet sich die GER basierte Einstufung wieder (A1 bis C2). Der nicht evidenzbasierte GER wird jedoch nicht als geeignet erachtet, um sprachliche Kompetenzen von Deutsch-als-Zweitsprache-Lernenden in schulischen Kontexten zu di-

166

Stefan Jeuk und Beate Lütke

agnostizieren (vgl. Kleinbub in diesem Band). Unter anderem geht der GER a priori von in einer L1 alphabetisierten Lernern aus und ist daher kaum geeignet, Kompetenzen von Kindern und Jugendlichen zu beschreiben, die in der L2 Deutsch alphabetisiert werden. Außerdem ist der GER auf einen akademischen Kontext ausgerichtet; ursprünglich war er zur Selbstbeschreibung von Kompetenzen von Studierenden in mehreren Sprachen gedacht (Sprachenportfolio). Die Zielrichtung, dass Studierende in Europa mit Hilfe des GER und ihres Sprachenportfolios in die Lage versetzt werden, sprachliche Kompetenzen in verschiedenen (Fremd-)Sprachen vergleichend darzustellen, ist begrüßenswert. Kritisch zu sehen ist die Übertragung auf schulische Kontexte, in denen es um die Aneignung einer Zweitsprache als Bildungssprache geht. Da die Schülerinnen und Schüler häufig nicht auf bildungssprachliche Kompetenzen in ihrer Erstsprache bzw. Herkunftssprache zurückgreifen können, unterscheidet sich die Erwerbssituation deutlich vom (schulischen) Fremdsprachenerwerb und auch die Zielsetzungen sind andere. U. a. sind die Beschreibungen des GER nicht oder nur zum Teil anschlussfähig an die Bildungsstandards der KMK (vgl. Kleinbub in diesem Band). z. B. findet sich kein Hinweis auf den Umgang mit Literatur, der bei allen maßgeblichen Abschlussprüfungen im Zentrum steht und auch der Bereich der grundlegenden Alphabetisierung findet sich nicht. Des Weiteren ist der in den Bildungsstandards zentrale Bereich der Sprachreflexion nicht repräsentiert. Innerhalb des deutschen Regelschulsystems besteht die Aufgabe von Sprachdiagnostik darin, Lernfortschritte und Entwicklungen von DaZ-Lernenden abzubilden, um den Unterricht und additive Fördermaßnahmen darauf abstimmen zu können, andererseits dienen Sprachstandsfeststellungen dazu, Zuweisungsentscheidungen zu legitimieren (vgl. Gogolin 2010, 1307). Dies betrifft bei Kindern, die bereits eine längere Zeit eine Kita besucht haben, z. B. die Identifizierung derjenigen, die durch eine frühe Feststellung sprachlicher Förderbedarfe in der L2 Deutsch die Möglichkeit einer möglichst früh einsetzenden Sprachförderung erhalten sollen. Von zentraler Bedeutung sind weiterhin sprachdiagnostische Erhebungen im Vorfeld der Einschulung und bei kürzlich eingewanderten Kindern und Jugendlichen, um spezielle Sprachförderangebote (z. B. Deutsch-Förder- oder DaZ-Unterricht) oder die Beschulung in einer Vorbereitungsklasse zuweisen zu können (vgl. Maak 2010: 310). Hier können Lernfortschrittsdiagnosen Zuweisungsentscheidungen nach sich ziehen, z. B. bei ausreichenden Sprachkompetenzen in der L2 den Übergang von einer Vorbereitungsklasse in den Regelunterricht veranlassen oder zu der Entscheidung führen, ein Kind aus der additiven Deutschförderung herauszunehmen. In der frühen Sekundarstufe spielen solche Zuweisungsentscheidungen an Schulen mit einem hohen Anteil an Schülerinnen und Schülern, die sich Deutsch als Zweitsprache aneignen oder die (als häufig sich überlagerndes Merkmal) aus Familien mit einem niedrigen sozioökonomischen Status kommen, eine Rolle. Ähnliche Fragen spielen auch eine Rolle, wenn es um die Steuerung des Ressourceneinsatzes geht. Hier werden zunehmend zentrale (psychometrische) Gruppenerhebungen durchgeführt, in denen u. a. sprachliche Kompetenzen wie Lesen, Schreiben

Sprachdiagnostik im Primar- und Sekundarbereich

167

oder Hörverstehen im Deutschen erfasst werden, um Rückmeldungen an Regierungen und/oder Schulleitungen zu Jahrgangsstufenleistungen zu geben. Gogolin (2010) verweist in diesem Zusammenhang kritisch auf das Sprachstandsdiagnoseinstrument Delfin 4 (Fried 2009), das in Nordrhein-Westfalen von 2007 bis 2014 jährlich eingesetzt wurde, um Vierjährige mit Förderbedarf zu identifizieren. In Berlin wurde für die Einschulungsuntersuchung das Screening-Verfahren Deutsch Plus 4 (Berliner Senatsverwaltung für Bildung, Jugend und Sport 2004) eingesetzt (vgl. Dietz & Lisker 2008: 15). Die verschiedenen Verfahren führten jedoch zu höchst unterschiedlichen Zahlen in Bezug auf die Anzahl der Kinder, die als förderbedürftig angesehen wurden (vgl. Jeuk 2009). In beiden Bundesländern wurde mittlerweile Abstand von normierten Verfahren zur Feststellung des Sprachförderbedarfs zum Zeitpunkt der Einschulung genommen, zu Gunsten förderdiagnostisch orientierter Beobachtungsinstrumente wie sismik (Ulich & Mayr 2003; vgl. Decker-Ernst in diesem Band).

3 Gütekriterien sprachdiagnostischer Verfahren In der Diskussion über die Qualität von Sprachdiagnoseinstrumenten werden normierte und nicht normierte Verfahren einander gegenübergestellt (vgl. z. B. Gogolin 2010: 1308; Jeuk 2018: 86; Gültekin-Karakoc in diesem Band). Aus psychometrischer Sicht werden nicht normierte Verfahren teilweise wegen ihrer mangelnden Aussagefähigkeit kritisiert: „Man erhält zwar ein Resultat, aber es gibt keine fundierten Anhaltspunkte für Antworten auf die Frage, was genau dieses Resultat eigentlich bedeutet – anders gesagt: Man erzeugt die Illusion einer relevanten Information über den Sprachstand der lernenden Person“ (Gogolin 2010: 1308). Aus vornehmlich sonderpädagogischer Perspektive wird hingegen seit den siebziger Jahren kritisiert, dass statistische Normen und Ergebnisse individuelle Potentiale und Möglichkeiten ausblenden; das Ziel sei Einordnung und Zuweisung von Zahlenwerten, die eine Stigmatisierung zur Folge habe (Bundschuh 2014: 56–58). Eine funktionale Kombination quantitativer und qualitativer Diagnoseverfahren hebt Paetsch (in diesem Band) hervor. Zu den Grundprinzipien einer solchermaßen professionellen Diagnostik, die Paetsch in Orientierung an Hesse & Latzko (2009: 60) aufführt, gehören u. a. eine genaue Definition und Operationalisierbarkeit der zu messenden Sprachkompetenz und die Gewährleistung, dass in einem kontrollierten Prozess die Gütekriterien Objektivität, Reliabilität und Validität erfüllt würden (Hesse & Latzko (2009: 60). Das Vorgehen solle standardisiert sein, also unter jeweils vergleichbaren Bedingungen durchgeführt werden. Wichtig seien weiterhin Maßstäbe für die Beurteilung der individuellen Messergebnisse, also eine empirisch geprüfte kriteriale Bezugsnorm, die Spracherwerbsverläufe beschreibt oder eine soziale Bezugsnorm, die einen Vergleich mit einer Bezugsgruppe ermöglicht (vgl. ausführlich die Kriterien professioneller Diagnostik Paetsch in diesem Band).

168

Stefan Jeuk und Beate Lütke

In dem Gutachten für das Bundesministerium für Bildung und Forschung (BMBF 2005) setzen sich Ehlich u. a. ausführlich mit „Anforderungen an Verfahren der regelmäßigen Sprachstandsfeststellung für die frühe und individuelle Förderung von Kindern mit und ohne Migrationshintergrund“ auseinander. Für mehrsprachige Kinder formuliert Reich (2005) in diesem Kontext Empfehlungen für die Entwicklung von Sprachstandsfeststellungsverfahren. Neben der Orientierung an der Sprachaneignung, an individuellen sprachlichen Profilen und an sprachlichen Qualifikationen gehören dazu die Orientierung am Bildungsziel Mehrsprachigkeit, die Berücksichtigung von individuellen Sprachaneignungskontexten und Lebenswelten, die Ermöglichung eines longitudinalen Aufbaus, die Verbindung von Sprachdiagnose und Sprachförderung sowie die Berücksichtigung einer pädagogischen Inklusion. Besonderen Wert legt Reich (2005: 165) auf die Feststellung, dass die Sprachstandsfeststellung von einer gut geschulten Person durchgeführt werden solle, die zugleich die pädagogische Fachkraft ist, die auch mit der Förderung des Schülers bzw. der Schülerin beauftragt ist.

4 Erfassen von Kompetenzen in mehreren Sprachen Von Seiten der Migrationspädagogik und der Sprachdidaktik wird immer wieder eingefordert, dass die Erfassung des Sprachstands bei mehrsprachigen Kindern und Jugendlichen nur dann der mehrsprachigen Entwicklung gerecht werde, wenn die Kompetenzen in allen für das Kind relevanten Sprachen erfasst werden (vgl. Reich & Jeuk 2017). Diese Forderung ist zunächst unter anderem deshalb von zentraler Bedeutung, weil es bei der Anwendung von Verfahren, die für einsprachig deutsche Kinder und Jugendliche konzipiert sind, bei mehrsprachigen Kindern immer wieder zu unzulässigen Aussagen kommt. Wenn ein Kind z. B. in einem Untertest zur Messung grammatischer Kompetenzen in der L2 Deutsch in einem für einsprachige Kinder konzipierten Verfahren einen niedrigen Prozentrang erreicht, kann die Aussage in der Auswertungsanleitung, dass das Kind nicht in der Lage sei, grammatische Strukturen zu bilden, nicht übertragen werden. Diese Aussage ist selbstverständlich völlig unzulässig, da sie ja allenfalls auf die L2 Deutsch zutrifft, die L1 wurde gar nicht erfasst (zur Problematik dieser Aussage auch in Bezug auf die grammatischen Kompetenzen in der L2 vgl. Jeuk 2009). Im pädagogischen Alltag wird jedoch häufig so vorgegangen, was u. a. zu der Defizitorientierung im Hinblick auf die Aneignung der L2 Deutsch bei mehrsprachigen Kindern und Jugendlichen beiträgt. In Verwaltungsvorschriften zur Erhebung eines sonderpädagogischen Förderbedarfs wird in Bezug auf mehrsprachige Kinder und Jugendliche darauf verwiesen, dass zur Feststellung einer Spezifischen Sprachenwicklungsstörung auf Expertinnen und Experten der Herkunftssprache zurückzugreifen sei. So begrüßenswert und sinnvoll diese Anweisung zunächst erscheint, so schwer ist sie umzusetzen: Die Kinder und Jugendlichen erhalten in der Herkunftssprache in den seltensten Fällen

Sprachdiagnostik im Primar- und Sekundarbereich

169

eine adäquate Beschulung. So muss davon ausgegangen werden, dass in Bezug auf bildungssprachliche Kompetenzen bei den Kindern und Jugendlichen kein oder nur ein begrenzter Ausbau in der Herkunftssprache stattfindet. Der Ausbau der Bildungssprache in der L1 bleibt häufig den Eltern überlassen. Es kann folglich nicht davon ausgegangen werden, dass ein mehrsprachiges Kind nach ein paar Jahren der Beschulung in der L2 Deutsch in der L1 Kompetenzen aufweist, die bei gleichaltrigen Schülerinnen und Schülern im Herkunftsland der Familie zu beobachten sind. Somit sind Verfahren aus den Herkunftsländern für das Schulalter, die sich auf die Bildungssprache in der L1 der Kinder und Jugendlichen beziehen, vermutlich ungeeignet bzw. kommen zu Ergebnissen, die wiederum der lebensweltlichen Mehrsprachigkeit der Kinder und Jugendlichen in keiner Weise gerecht werden (vgl. Busch 2015: 63). Verfahren aus den Herkunftsländern sind also nicht übertragbar. Chilla (2008: 284) weist darüber hinaus darauf hin, dass „muttersprachliche“ Expertinnen und Experten in der Lage sein müssten, Veränderungen, denen Sprachen und Sprachgebrauch in der Migration unterliegen, mit in ihre Begutachtung aufzunehmen. Die genannten Argumente sprechen keineswegs dagegen, Kompetenzen in den Erstsprachen der Kinder und Jugendlichen bei der Erfassung des Stands der Sprachaneignung mit zu berücksichtigen. Es darf allerdings nicht einfach eine einsprachige Norm aus dem L1-Erwerb übertragen werden. Vielmehr ist es die Aufgabe einer mehrsprachigen Diagnostik, die Gesamtheit der Kompetenzen in den verschiedenen Sprachen aufzuzeigen. So sollte z. B. berücksichtigt werden, dass die lebensweltliche Mehrsprachigkeit unter anderem dazu führen kann, dass einem alltagssprachlichen Register in der mehrsprachigen familiären Umwelt in der L1 eine größere Bedeutung zukommt, in der schulischen Umwelt der L2 hingegen einem bildungssprachlichen Register (vgl. Busch 2015: 64–65). Zur Frage der Diagnostik bei mehrsprachigen Kindern und Jugendlichen mit einer Spezifischen Sprachentwicklungsstörung (SSES) vgl. Chilla in diesem Band.

5 Verfahren für die Schule In den folgenden Kapiteln werden standardisierte und informelle Verfahren für die Grundschule und die Sekundarstufe I vorgestellt. Dabei handelt es sich um Verfahren, die derzeit bei mehrsprachigen Kindern und Jugendlichen eingesetzt werden. Schulleistungstests werden nicht vorgestellt, da sie nicht auf mehrsprachige Erwerbsprozesse Bezug nehmen. In Bezug auf einzelne sprachliche Kompetenzen kann im Sinne einer Kriterienorientierung durchaus auf Schulleistungstests zurückgegriffen werden, wenn mit dem Verfahren überprüft werden soll, ob die Schülerinnen und Schüler das gelernt haben, was in der Schule vermittelt wurde. In Bezug auf den Orthographieerwerb bspw. kann bei Kindern und Jugendlichen, die in Deutschland Lesen und Schreiben gelernt haben, durchaus auf Verfahren zurückge-

170

Stefan Jeuk und Beate Lütke

griffen werden, die für einsprachige Kinder und Jugendliche konzipiert sind, da sich die Schwierigkeiten in der Orthographie bei einsprachigen und mehrsprachigen Lernern in diesem Falle kaum unterscheiden (vgl. Becker in diesem Band). Da einige der hier vorgestellten Verfahren in anderen Beiträgen bezogen auf die sprachlichen Teilkompetenzen ebenfalls beschrieben werden, wird an dieser Stelle auf eine überblicksartige, tabellarische Darstellung zurückgegriffen. Außerdem finden sich Verweise auf Beiträge in diesem Band, in denen das jeweilige Verfahren vorgestellt wird. Auf die Beschreibung des C-Tests wird verzichtet, da für diesen ein eigener Beitrag (Grotjahn in diesem Band) vorliegt.

Schulz & Tracy 2011

Kinder mit Deutsch als Zweitsprache: 3;0 bis 7;11 Jahre (Kontaktdauer 0 bis 71 Monate), Kinder mit Deutsch als Muttersprache: 3;0 bis 6;11 Jahre. Wesentliches Kriterium für die Normierung bei mehrsprachigen Kindern ist die Kontaktdauer zur L2 Deutsch.

Individualverfahren mit sieben Untertests, das auch für mehrsprachige Kinder geeignet ist und linguistischen und psychometrischen Kriterien standhalten kann.

Durchführungsdauer (laut Manual) zwischen 20 und 30 Minuten (Individualtest), Auswertung 30 bis 45 Minuten. Altersnormen liegen in Form von T-Werten und Prozenträngen vor.

Überprüft wird mit sieben Untertests das sprachliche Können von Kindern in syntaktischen, morphologischen und semantischen Bereichen. Im produktiven Sprachgebrauch werden Satzbaupläne, Wortklassen, die Subjekt-Verb-Kongruenz sowie die Kasusmarkierung überprüft, im Sprachverständnis werden ausgewählte Verbklassen, W-Fragen und Verneinungen überprüft.

Aus einzelnen Untertests können Hinweise auf zu fördernde Bereiche der Sprachaneignung entnommen werden (z. B. Wortschatz). Neben der Einschätzung des sprachlichen Entwicklungsstandes erlaubt das Verfahren, aus den Testergebnissen konkrete Förderentscheidungen abzuleiten und Entwicklungsfortschritte durch Wiederholungsmessungen zu prüfen. Im Manual finden sich Förderszenarien z. B. zur Förderung der Satzklammer, des Kasus oder des Verstehens von Negation.

Das Verfahren ist genuin für mehrsprachige Kinder, die Deutsch als Zweitsprache erwerben, konzipiert. Teilweise gibt es für ein- und für mehrsprachige Kinder unterschiedliche Normen. Durch die Berücksichtigung von Lebensalter und Kontaktalter wird ermöglicht, erwartungsgemäße von unterdurchschnittlichen Leistungen zu unterscheiden.

Das Verfahren ist auf Grundlage der aktuellen Zweitspracherwerbsforschung entstanden. Es ist das einzige psychometrische Verfahren, dessen Normierung das Kontaktalter in der L2 berücksichtigt. Im Unterschied zu den meisten normierten Verfahren finden sich Hinweise zur Förderung im Handbuch. Werden die Daten aufgezeichnet und transkribiert, sind auch weitergehende, qualitative Auswertungen möglich. Die Auswertung erfordert eine gute Einarbeitung und linguistische Grundkenntnisse und ist für Lehrkräfte ohne Zusatzqualifikation kaum zu bearbeiten.

Abschnitt II: Decker-Ernst Abschnitt III: Grimm & Müller

Autoren/ Erscheinungsjahr

Alter

Beschreibung

Durchführung und Auswertung

Untertests / Überprüfte Bereiche

Hinweise auf Förderung

Bezug zu Mehrsprachigkeit

Bemerkungen

Darstellung in diesem Band

LiSe-DaZ: Linguistische Sprachstandserhebung – Deutsch als Zweitsprache.

5.1 Normierte Verfahren

Sprachdiagnostik im Primar- und Sekundarbereich

171

Petermann 20122 (Erstauflage 2010)

5;0 bis 10;11 Jahre.

Individualverfahren mit zehn Untertests zur Erfassung von Kindern mit spezifischen Sprachentwicklungsstörungen (SSES).

Durchführungsdauer 45 Minuten (Individualverfahren), Auswertungszeit 30 bis 60 Minuten (je nach Alter) Altersnormen für die Subtests in Form von T-Werten und Prozenträngen.

Zehn Untertests, die die Bereiche Wortschatz, semantische Relationen, Verarbeitungsgeschwindigkeit, Sprachverständnis, Sprachproduktion, Grammatik/Morphologie und die auditive Merkfähigkeit überprüfen.

Aus einzelnen Untertests können Hinweise auf zu fördernde Bereiche entnommen werden (z. B. Wortschatz). Diese sind auf Kinder mit SSES bezogen (vgl. Chilla in diesem Band). Im Manual finden sich keine Hinweise zur Förderung.

Es gibt zwar Normen für mehrsprachige Kinder, die untersuchten Bereiche sind jedoch ausschließlich auf die Erstspracherwerbsforschung bezogen. Wesentliche Kriterien, die für mehrsprachige Kinder relevant sind, werden nicht überprüft.

Der SET 5–10 wurde an 1052 Kindern in sieben verschiedenen Altersgruppen normiert, 17 % davon waren mehrsprachig. Die umfangreiche Datenerhebung, die auch das Nacherzählen einer Bildergeschichte umfasst, ermöglicht tiefergehend e Analysen, z. B. im Rahmen einer Profilanalyse. Auswertung und Interpretation verlangen testpsychologische Kenntnisse, für Lehrkräfte ohne Zusatzausbildung ist das Verfahren kaum zu bearbeiten.

Autoren / Erscheinungsjahr

Alter

Beschreibung

Durchführung und Auswertung

Untertests / Überprüfte Bereiche

Hinweise auf Förderung

Bezug zu Mehrsprachigkeit

Bemerkungen

SET 5–10: Sprachstandserhebungsverfahren für Kinder zwischen 5 und 10 Jahren.

172 Stefan Jeuk und Beate Lütke

Glück 20112 (Erstauflage 2007)

5;6 bis 10;11 Jahre.

Individualtest zur Erfassung von semantisch-lexikalischen Fähigkeiten und der (differential-)diagnostischen Abklärung von Spracherwerbsstörungen.

Individualtest in der Langform 45 Minuten, in der Kurzform 20 Minuten. Auswertung manuell oder am PC 20 bis 30 Minuten. Eine Software kann weitgehend automatisch die quantitative und die qualitative Auswertung erstellen, die Äußerungen der Probanden werden als MP3 gespeichert. Mit der Software kann auch eine türkisch-deutsche Testvariante durchgeführt werden. Es liegen Altersnormen für 9 Altersgruppen vor.

Der Leitsubtest ist ein quantitativer Bildbenennungstest mit Farbfotos mit einer rezeptiven Nachprüfung. Eine qualitative Auswertung kann bezüglich der Interpretation der nicht korrekt benannten Items erfolgen. Überprüft werden Nomen, Verben, Adjektive, Adverbien und Kategoriebegriffe. Optionale Subtests gibt es zur Wirksamkeit von Abrufhilfen und zur Abrufstabilität.

Die qualitativen Auswertungen geben Hinweise für die Gestaltung einer lexikalisch-semantischen Therapie und/oder Wortschatzförderung, insbesondere im Hinblick auf Förderziele.

Im Hinblick auf eine kriteriale Wortschatznorm können die quantitativen Daten mit der gebotenen Vorsicht auf Zweitspracherwerbsprozesse übertragen werden. Für Kinder mit Türkisch als L1 gibt es eine deutsch-türkische Testvariante.

Wenn man die Altersnormen nicht hinzuzieht, können die Werte im Sine einer kriterialen Norm auch auf den Zweitspracherwerb übertragen werden. Im Hinblick auf die qualitative Auswertung bezüglich Abrufhilfen und Abrufstabilität ist der WWT 6–10 der einzige Wortschatztest, der solche Aspekte abprüft.

Abschnitt III: Montanari

Autoren / Erscheinungsjahr

Alter

Beschreibung

Durchführung und Auswertung

Untertests / Überprüfte Bereiche

Hinweise auf Förderung

Bezug zu Mehrsprachigkeit

Bemerkungen

Darstellung in diesem Band

WWT 6–10: Wortschatz- und Wortfindungstest für Kinder zwischen 6 und 10 Jahren.

Sprachdiagnostik im Primar- und Sekundarbereich

173

Ermonies-Jargielo, Klages & Kaltenbacher 2014

4;0 bis 8;11 Jahre.

Das Verfahren wurde im Kontext des Sprachfördermaterials Deutsch für den Schulstart entwickelt. Es besteht aus einer Einstiegsdiagnostik (Wortschatz, Satzbau, Formenbildung und Erzählen) und einer Zusatzdiagnostik (Genus, Kasus, Präpositionen). Es ist nicht normiert, ist aber Teil eines umfangreichen und differenzierten Förderkonzepts.

Einstiegsdiagnostik: Durchführungsdauer (Einzelbilder und Bildergeschichte) ca. 15 Minuten, Auswertungsdauer (Transkription und Auswertungsbögen) ca. 60 Minuten. Zusatzdiagnostik: Sechs Untertests mit jeweils ca. zehn Minuten Durchführungs- und Auswertungszeit.

Einstiegsdiagnostik: Das Verfahren besteht aus zwei Teilen, mit denen der Sprachentwicklungsstand in verschiedenen Bereichen erfasst wird. Bei Teil I hat das Kind die Aufgabe, auf Einzelbildern abgebildete Situationen sprachlich auszudrücken. Damit werden Fähigkeiten im Satzbau, im Wortschatz und in der Formenbildung ermittelt. Im zweiten Teil zum Erzählen unterhält sich die Testleiterin mit dem Kind über die Bildergeschichte, anschließend wird diese verdeckt und das Kind muss die Geschichte einer Handpuppe nacherzählen. Die Auswertung erfolgt nach den Kriterien: Vollständigkeit und Differenziertheit der Erzählung, korrekte zeitliche Abfolge der erzählten Inhalte sowie Verknüpfung der Sätze. Zusatzdiagnostik: Auf der Grundlage von Bildkarten (Benennungen) erfolgen Genuszuweisungen bei Nomen im Hinblick auf das Natürliche-Geschlecht-Prinzip und das grammatische-Geschlecht-Prinzip (Schwa-Regel und Silbenregel) abgefragt, in Bezug auf Kasus Akkusativ und Dativ als Objekt- und als Präpositionalkasus. Die Zusatzdiagnostik wird im Kontext der Förderung gezielt eingesetzt.

Eingebunden in das Förderprogramm Deutsch für den Schulstart können umfangreiche teils spezifische, teils unspezifische Förderempfehlungen abgeleitet werden. Es sind vielfältige Fördermaterialien enthalten.

Ein Bezug zur DaZ-Forschung ist gegeben. Das Verfahren ist explizit für Kinder konzipiert, die Deutsch als Zweitsprache erwerben.

Es handelt sich eigentlich um ein Förderprogramm, bei dem das Sprachstandserhebungsverfahren nur ein Bestandteil ist. In Bezug auf die Erzählforschung kann kritisiert werden, dass interaktive und kommunikative Fähigkeiten nicht erfasst werden.

Abschnitt III: Webersik

Autoren / Erscheinungsjahr

Alter

Beschreibung

Durchführung und Auswertung

Untertests / Überprüfte Bereiche

Hinweise auf Förderung

Bezug zu Mehrsprachigkeit

Bemerkungen

Darstellung in diesem Band

Deutsch für den Schulstart.

5.2 Nicht normierte Verfahren für die Primarstufe

174 Stefan Jeuk und Beate Lütke

Holler-Zittlau, Dux & Berger 2017, basierend auf der ersten Auflage 2003

4;0 bis 6;11 Jahre, somit vor allem für die Einschulung geeignet.

Individualtest zur Erfassung sprachlicher Fähigkeiten. Der Schwerpunkt liegt auf der Einschätzung einer Sprachentwicklungsverzögerung.

Durchführungsdauer ca. 30 Minuten, Auswertung etwas länger. Auswertung nach „auffällig“ und „unauffällig“ anhand von Punkten je Untertest.

Erhebung der Sprachlernsituation in der Familie, Sprachverständnis, Sprachproduktion (Bildbeschreibung), Artikulation, Gegenstände benennen, Adjektive, Verben („Was machen die Kinder?“), Pluralbildung, Satzbildung, Präpositionen, Konjunktionen, Partizipienbildung, Reimwörter, Wortlänge beurteilen.

Aus einzelnen Untertests können Hinweise auf zu fördernde Bereiche entnommen werden (z. B. Pluralbildung). Die Zuweisung individueller Fördermaßnahmen im Hinblick auf zu fördernde Bereiche ist recht differenziert.

Erhebung der Herkunftssprache, darüber hinaus findet keine Berücksichtigung der L1 statt, Vergleichbarkeit nur mit einsprachigen Kindern gegeben. Die Kriterien sind teilweise für mehrsprachige Kinder relevant.

Verfahren, das in der Sonderpädagogik (Förderschwerpunkt Sprache) häufig angewendet wird. Nahezu alle Untertests sind im Hinblick auf bestimmte Kriterien bei mehrsprachigen Kindern anzuwenden. Die Ergebnisse müssen individuell interpretiert werden. Problematisch ist, dass häufig korrekte Antworten erwartet werden, die eher an der schriftlichen Norm orientiert sind (z. B.: Auf die Frage: „Was macht das Mädchen? Das Mädchen …“ wird die Antwort „rennt“ erwartet, dabei wäre „rennen“ im mündlichen Sprachgebrauch ebenfalls korrekt.).

Autoren / Erscheinungsjahr

Alter

Beschreibung

Durchführung und Auswertung

Untertests/ Überprüfte Bereiche

Hinweise auf Förderung

Bezug zu Mehrsprachigkeit

Bemerkungen

MSS: Marburger Sprach-Screening.

Sprachdiagnostik im Primar- und Sekundarbereich

175

5;0 bis 6;11 Jahre, somit vor allem für die Einschulung geeignet.

Das Verfahren wurde explizit für die Anwendung bei mehrsprachigen Kindern entwickelt. Es liegt in mehreren Sprachen vor (Deutsch, Russisch, Türkisch, Spanisch, Italienisch, Polnisch, Portugiesisch). Das Kind soll eine Bildergeschichte mit 6 Bildern („Katze und Vogel“) erzählen, die Äußerungen werden aufgezeichnet, transkribiert und ausgewertet.

Durchführungsdauer 10 bis 15 Minuten, Auswertung mit etwas Routine ca. 45 Minuten. Auswertung und Zuteilungen von Punkten erfolgt bei einigen Untertests auf Grund von Einschätzungen, hierzu gibt es genaue Anweisungen.

Aufgabenbewältigung: sprachliche Vollständigkeit und Kohärenz der Erzählung, Gesprächsstrategien, sprachliche Strategien wie Ausweichverhalten, Umgang mit fehlenden Ausdrücken, Sprechweise, verbaler Wortschatz, Formen und Stellungen des Verbs (Morphologie und Syntax), Verbindung von Sätzen, Präpositionen.

Der Förderbedarf wird auf der Grundlage des für das jeweilige Kind und die jeweilige Mehrsprachigkeitskonstellation charakteristischen Qualifikationsprofils erstellt. Hinweise auf Zuweisung individueller Fördermaßnahmen ergeben sich auf Grund der Bearbeitung der Kriterien durch das Kind.

Dezidierter Bezug zur Mehrsprachigkeit. Im Idealfall wird der Test zunächst in der besser beherrschten Sprache des Kindes durchgeführt (in der Regel die Erstsprache) und dann erst in der Zweitsprache Deutsch. Die untersuchten Kriterien in der Zweitsprache sind hoch relevant für den Zweitspracherwerb.

Die Auswertung auf der Grundlage von Tonaufnahmen und Transkripten erscheint gewöhnungsbedürftig, ist aber auf Grund der ansonsten kurzen Durchführungs- und Auswertungsdauer zu rechtfertigen. Das Verfahren ist durch aufwändige und genaue Vorgaben gut auszuwerten. Ausgewertet wird nicht nach richtig/falsch, sondern nach Bereichen differenziert-qualitativ abwägend. Mit der Durchführung dieses Verfahrens gewinnt die Lehrkraft einen differenzierten Einblick in den Stand der Sprachaneignung des Kindes. Allerdings ist eine Fortbildung der Lehrkräfte im Vorfeld wünschenswert.

Abschnitt Abschnitt Abschnitt Abschnitt

Alter

Beschreibung

Durchführung und Auswertung

Untertests/ Überprüfte Bereiche

Hinweise auf Förderung

Bezug zu Mehrsprachigkeit

Bemerkungen

Darstellung in diesem Band

II: Decker-Ernst III: Grimm & Müller III: Webersik III: Heller

Reich & Roth 2004

Autoren / Erscheinungsjahr

HAVAS 5: Hamburger Verfahren zur Analyse des Sprachstands Fünfjähriger.

176 Stefan Jeuk und Beate Lütke

Heilmann 2012

1. und 2. Schuljahr, ggf. auch 3. und 4. Schuljahr.

Es handelt sich um ein Individualverfahren. Das Kind soll eine Bildergeschichte erzählen (6 Bilder, analog HAVAS 5, analog der-die-das 1/2), die Situation wird mit einem Diktiergerät aufgezeichnet und transkribiert. Die Äußerungen werden nach der Profilanalyse (Grießhaber 2005) ausgewertet.

Durchführungsdauer 10 bis 15 Minuten, Auswertung (mit Transkription) mit etwas Routine ca. 45 bis 60 Minuten.

Ausgewertet wird das Transkript fast ausschließlich im Hinblick auf die Profilstufen nach Grießhaber. Weitere Analysen des Transkripts sind möglich, erfordern aber weitergehendes Wissen über den Zweitspracherwerb.

Förderbedarf wird auf der Grundlage des für das jeweilige Kind charakteristischen Qualifikationsprofils erstellt. Hinweise auf die Zuweisung individueller Fördermaßnahmen ergeben sich auf Grund der Bearbeitung der Kriterien durch das Kind.

Dezidierter Bezug zu Mehrsprachigkeit. Die untersuchten Kriterien sind hoch relevant für den Zweitspracherwerb. Einige Bereiche (u. a. Genus, Kasus, unregelmäßige Formen), die für den Zweitspracherwerb relevant sind, werden nicht erfasst.

Die Anwendung der Profilanalyse muss geübt werden. Der Aufwand ist durch den Ertrag gerechtfertigt.

Abschnitt IV: Grießhaber

Autoren / Erscheinungsjahr

Alter

Beschreibung

Durchführung und Auswertung

Untertests / Überprüfte Bereiche

Hinweise auf Förderung

Bezug zu Mehrsprachigkeit

Bemerkungen

Darstellung in diesem Band

Diagnostik & Förderung leicht gemacht.

Sprachdiagnostik im Primar- und Sekundarbereich

177

Jeuk 2011

5 mögliche Testzeitpunkte: Anfang, Mitte, Ende 1. Schuljahr, Mitte und Ende 2. Schuljahr.

Das Verfahren wurde im Kontext der Sprach- und Lesebuchreihe der-die-das (Jeuk, Sinemus & Strozyk 2011–2013) für heterogene Klassen an der Grundschule entwickelt. Die Vorgehensweise orientiert sich am HAVAS 5, allerdings gibt es fünf aufeinander aufbauende Bildergeschichten, so dass zu mehreren Beobachtungszeitpunkten im Laufe der Klassen 1 und 2 verschiedene Geschichten zum Einsatz kommen können. Darüber hinaus gibt es zur Erfassung des Wortschatzes Wimmelbilder.

Durchführungsdauer 10 bis 15 Minuten, Auswertung (mit Transkription) mit etwas Routine ca. 45 bis 60 Minuten, Auswertung und Einordnung auf Grund von Einschätzungen, hierzu gibt es genaue Anweisungen.

Neben dem Erfassen der Sprachbiographie werden das Gesprächsverhalten, die Satzbildung in Anlehnung an die Profilanalyse nach Grießhaber (2005), die Formenbildung des Verbs, die Nominalgruppe, Präpositionen, semantische Strategien sowie der Wortschatz (anhand der Wimmelbilder) erfasst.

Der Förderbedarf wird auf der Grundlage des für das jeweilige Kind und die jeweilige Mehrsprachigkeitskonstellation charakteristischen Qualifikationsprofils erstellt. Hinweise auf Zuweisung individueller Fördermaßnahmen ergeben sich auf Grund der Bearbeitung der Kriterien durch das Kind. Auf der Grundlage der Analyse kann ein Förderplan erstellt werden. An die Auswertung schließen sich konkrete Vorschläge für die Förderung an, die an das Lehrwerk der-die-das angelehnt sind.

Dezidierter Bezug zu Mehrsprachigkeit. Die untersuchten Kriterien in der Zweitsprache sind hoch relevant für den Zweitspracherwerb.

Ähnlich wie beim HAVAS 5 und bei der Profilanalyse ist die Erhebung und Auswertung von Tonaufnahmen gewöhnungsbedürftig. Der Aufwand ist durch den Ertrag und die dezidierten Hinweise zur Förderung gerechtfertigt. Das Verfahren kann auch ohne einen Bezug zum Lehrwerk eingesetzt werden.

Autoren / Erscheinungsjahr

Alter

Beschreibung

Durchführung und Auswertung

Untertests / Überprüfte Bereiche

Hinweise auf Förderung

Bezug zu Mehrsprachigkeit

Bemerkungen

Der-die-das Sprachstandsbeobachtung 1/2.

178 Stefan Jeuk und Beate Lütke

Gehring, Schäfer & Jeuk 2013

3. und 4. Schuljahr.

Das Verfahren wurde im Kontext der Sprach- und Lesebuchreihe der-die-das (Jeuk, Sinemus & Strozyk 2011–2013) für heterogene Klassen an der Grundschule entwickelt. Hier stehen die Arbeitsbereiche Schreiben und Lesen im Zentrum. Grundlage der Beobachtung des Schreibens ist ein Schreibimpuls, Grundlage der Beobachtung des Lesens ein Beobachtungsbogen sowie eine Leseprobe.

Durchführungsdauer Schreiben: Als Gruppentest eine Schulstunde. Auswertung: Je nach gewähltem Schwerpunkt ca. 1 Stunde pro Kind. Durchführungsdauer Lesen: Für die Beobachtungsbögen nicht anzugeben. Auswertung und Einordnung auf Grund von Einschätzungen. Hierzu gibt es genaue Anweisungen.

Schreiben: Die Kinder können aus mehreren Bildern einen Schreibimpuls wählen. Der auf dieser Grundlage entstandene Text wird in einem ersten Schritt im Hinblick auf die Textqualität eingeschätzt. Von dieser ersten Einschätzung ausgehend können, je nach Bedarf, die Erzählkompetenz, die Teststruktur (Kohäsion), die Satzstellung und Morphologie (Profilanalyse) sowie der Wortschatz analysiert werden. Lesen: Neben Bögen zur Selbsteinschätzung der Kinder können, je nach Bedarf, die Lesefertigkeit und die Lesestrategien auf der Wort-, Satz- und Textebene ausgewertet werden.

Der Förderbedarf wird auf der Grundlage des für das jeweilige Kind und die jeweilige Mehrsprachigkeitskonstellation charakteristischen Qualifikationsprofils erstellt. Hinweise auf Zuweisung individueller Fördermaßnahmen ergeben sich auf Grund der Bearbeitung der Kriterien durch das Kind. Auf der Grundlage der Analyse kann ein Förderplan erstellt werden. An die Auswertung schließen sich konkrete Vorschläge für die Förderung an, die an das Lehrwerk der-die-das angelehnt sind.

Dezidierter Bezug zu Mehrsprachigkeit. Die untersuchten Kriterien in der Zweitsprache sind hoch relevant für den Zweitspracherwerb.

Die Anwendung differenzierter Analyseraster muss geübt werden. Der Aufwand ist durch den Ertrag gerechtfertigt. Das Verfahren kann auch ohne einen Bezug zum Lehrwerk eingesetzt werden.

Autoren / Erscheinungsjahr

Alter

Beschreibung

Durchführung und Auswertung

Untertests/ Überprüfte Bereiche

Hinweise auf Förderung

Bezug zu Mehrsprachigkeit

Bemerkungen

Der-die-das Sprachstandsbeobachtung 3/4.

Sprachdiagnostik im Primar- und Sekundarbereich

179

Hobusch, Lutz & Wiest 2016 (basierend auf Hobusch, Lutz & Wiest 2002)

1. bis 4. Schuljahr

Verfahren, das explizit für mehrsprachige Kinder konzipiert ist und den Vergleich zu einsprachigen Kindern ermöglichen soll. Es kann als Individual- und partiell als Gruppentest durchgeführt werden. Dabei werden rezeptive und produktive Bereiche der Sprachaneignung in der Morphosyntax und der Semantik erfasst.

Durchführungsdauer 30 bis 50 Minuten, Auswertung mit etwas Routine ca. 45 Minuten, Auswertung mit Hilfe von Punktezuteilungen. Es liegt eine Normierung vor, ein Förderbedarf wird bei einem Prozentrang von 60 festgestellt. Eine qualitative Auswertung ist möglich und sinnvoll.

Wortschatz (unter vier Bildern das passende zu einem vorgegebenen Wort identifizieren), Farbenkenntnisse, Hörverständnis – Sätze, Hörverständnis – Text, Singular/Plural, Präpositionen (Hören und Ausführen), Präpositionen (Sprechen), Artikel, Bildergeschichte (Freies Sprechen). Die Wortschatztests liegen als Hörtexte in verschiedenen Sprachen vor.

Anhand einer Stichprobe werden die Leistungen der mehrsprachigen Kinder mit denen einsprachiger Kinder mit der L1 Deutsch verglichen. Dann werden die Kinder in Leistungsstufen eingeteilt. Auf Grundlage der individuellen Aufgabenlösungen können Förderprofile erstellt und zu fördernde Bereiche differenziert werden.

Expliziter Bezug zur Mehrsprachigkeit in der theoretischen Grundlegung, das Verfahren ist nur für mehrsprachige Kinder ausgelegt. Orientierung an Kriterien, die für mehrsprachige Kinder relevant sind. Im Subtest zum Wortschatz wird im SFD 1 auch Bezug zu Herkunftssprachen genommen.

Verfahren, das die meisten Bereiche in der Grammatik abdeckt, die für mehrsprachige Kinder relevant sind. Im Detail nicht unproblematisch (Wortschatz fast nur Nomen, Erwartungen in Bezug auf Aufgabenlösungen auf die schriftliche Sprachnorm fixiert). Eine Erfassung individueller Aneignungsdifferenzen ist möglich, wenn die Untertests differenziert und individuell qualitativ analysiert werden. Die quantitative Auswertung (bei einem Prozentrang unter 60 wird ein Förderbedarf festgestellt) entspricht nicht der üblichen Normierung.

Autoren / Erscheinungsjahr

Alter

Beschreibung

Durchführung und Auswertung

Untertests / Überprüfte Bereiche

Hinweise auf Förderung

Bezug zu Mehrsprachigkeit

Bemerkungen

SFD: Sprachstandsüberprüfung und Förderdiagnostik.

180 Stefan Jeuk und Beate Lütke

Knapp 2001

1. bis 4. Schuljahr.

Fragebogen auf der Grundlage von Unterrichtsbeobachtungen. Die Fragen lassen sich ohne schriftliche Dokumente beantworten, es können aber auch teilweise schriftliche Äußerungen von Kindern hinzugezogen werden.

Fragenkatalog, der von der Lehrkraft informell abgearbeitet werden kann. Keine Normbezüge, keine Auswertungsvorgaben, Angaben auf Grund von Einschätzungen und intensiven Beobachtungen.

Sprachbiographie, Erfassung von Spracherfahrungen, sprachliches Verhalten im Unterricht (Verstehen und Sprechen), kommunikatives Verhalten gegenüber den Mitschülerinnen und -schülern, Sprechweise, Verbkomplex, Nominalphrasen, Reflexivpronomen, Präpositionen, Syntax. Lexik, Semantik, Schrifterfahrung.

Hinweise auf die Förderung müssen selbst hergeleitet werden. Der Fragebogen ist so detailliert und umfangreich, dass nahezu alle Kriterien sprachlichen Lernens abgearbeitet werden. Zu fördernde Bereiche werden detailliert herausgearbeitet.

Alle Kriterien, die für den Zweitspracherwerb relevant sind, werden abgedeckt. Expliziter Bezug zu Lernschwierigkeiten mehrsprachiger Kinder.

Anhand der Erfüllung der Kriterien kann ermittelt werden, welche sprachlichen Kompetenzen ein Kind hat. Der Fragebogen erfordert eine prozessorientierte Beobachtung. Eine Einbindung des Verfahrens in das Unterrichtsgeschehen ist möglich.

Abschnitt IV: Döll

Autoren / Erscheinungsjahr

Alter

Beschreibung

Durchführung und Auswertung

Untertests / Überprüfte Bereiche

Hinweise auf Förderung

Bezug zu Mehrsprachigkeit

Bemerkungen

Darstellung in diesem Band

Diagnostische Leitfragen.

Sprachdiagnostik im Primar- und Sekundarbereich

181

3. und 4. Schuljahr.

Die Niveaubeschreibungen wurden in Anlehnung an die Bildungsstandards Deutsch der Kultusministerkonferenz und den sächsischen Lehrplan Deutsch als Zweitsprache entwickelt. Mit diesem Diagnoseinstrument soll es möglich sein, systematisch und kriterienorientiert Informationen über den individuellen Sprachbildungsprozess der Schülerinnen und Schüler zu erhalten. Gezielte Maßnahmen zu Unterricht und Förderung können abgeleitet werden. Die Maßnahmen sind am Konzept der durchgängigen Sprachbildung orientiert.

Formatives Beobachtungsverfahren (Einschätzungen) mit dem Ziel, den Prozess der (Zweit-)Sprachaneignung zu begleiten. Es werden Niveaubeschreibungen benannt, an denen sich ablesen lässt, wie weit die betreffende Schülerin/der betreffende Schüler vom jeweiligen Standardniveau entfernt ist. Die Beschreibungen sind Formulierungsangebote für den Stand der Sprachaneignung der L2 Deutsch. Die Daten werden durch teilnehmende Beobachtung während des Unterrichts erhoben.

Weite der sprachlichen Handlungs- und Verstehensfähigkeit, Wortschatz, Aussprache, Lesen, Schreiben, Grammatik und Persönlichkeitsmerkmale der Schülerin bzw. des Schülers. Jedem Bereich liegen Stufenmodelle der Zweitsprachaneignung zu Grunde, die eine kriterienorientierte, deskriptive Beschreibung des Stands der Sprachaneignung ermöglichen.

Die Beschreibungen sind auf die Bildungsstandards bezogen und somit unmittelbar mit dem Unterricht und der Förderung zu verbinden.

Die Niveaubeschreibungen beziehen sich auf Modelle des Zweitspracherwerbs, sie sind teilweise auch für einsprachige Schülerinnen und Schüler anwendbar.

Es handelt sich um ein qualitatives Beobachtungsverfahren auf der Grundlage der Spracherwerbsforschung und der Bildungsstandards. Sowohl die Validität als auch die Reliabilität des Verfahrens konnten belegt werden (Döll 2013). Die Anwendung des Verfahrens erfordert linguistisches und spracherwerbsbezogenes Wissen der Lehrkräfte und sollte nicht ohne Fortbildung eingesetzt werden.

Abschnitt Abschnitt Abschnitt Abschnitt

Alter

Beschreibung

Durchführung und Auswertung

Untertests / Überprüfte Bereiche

Hinweise auf Förderung

Bezug zu Mehrsprachigkeit

Bemerkungen

Darstellung in diesem Band

III: Grimm & Müller III: Heller III: Schäfer IV: Döll

Döll & Reich 2013a

Autoren / Erscheinungsjahr

Niveaubeschreibungen Deutsch als Zweitsprache für die Primarstufe.

182 Stefan Jeuk und Beate Lütke

Motsch & Rietz 2016

4;0 bis 8;11 Jahre.

Der Grammatiktest ESGRAF 4–8 ist ein Individualverfahren, das Normdaten zu grammatischen Strukturen liefert. Es wurde für die Diagnostik bei SSES entwickelt.

Die Erhebung erfolgt auf der Grundlage von spielerisch in das Rahmenthema „Zirkus“ eingebetteten Subtests. Die Erhebungsdauer ist ca. 45 bis 60 Minuten. Während der Testung erfolgt die Aufzeichnung der evozierten Kindesäußerungen. Die Auswertung beträgt zwischen 30 und 45 Minuten. Jeder Subtest kann auch einzeln durchgeführt werden.

Überprüft werden die Verbzweitstellungsregel im Hauptsatz, die Subjekt-Verb-Kontrollregel, die Verbendstellungsregel im subordinierten Nebensatz, die Genussicherheit, der Akkusativ in Nominal- und Präpositionalphrasen, der Dativ in Nominal- und Präpositionalphrasen sowie die Pluralmarkierung der neun Pluralformen des Deutschen. Außerdem können weitere grammatische Fähigkeiten (Passiv- und Konjunktivkonstruktionen, Genitiv) erfasst werden.

Auf der Grundlage der Auswertung wird für jedes Kind ein sprachliches Profil erstellt, insofern können mit den Daten auch Profilanalysen angefertigt werden. Auf der Grundlage der Profile können zu fördernde Aspekte differenziert erfasst werden. Die Profile sollen der Grundlegung einer Sprachtherapie dienen.

An der Sprachaneignung einsprachiger Kinder orientiert, wichtige Bereiche sind auch für mehrsprachige Kinder relevant, die Normen können aber nicht übertragen werden.

Es handelt sich um eine normierte Variante eines qualitativen und kriterienorientierten spieldiagnostischen Verfahrens. Eine beiliegende CD zeigt in 16 Filmclips die Durchführung aller Subtests. Ohne linguistisches Wissen nicht durchführbar.

Autoren / Erscheinungsjahr

Alter

Beschreibung

Durchführung und Auswertung

Untertests/ Überprüfte Bereiche

Hinweise auf Förderung

Bezug zu Mehrsprachigkeit

Bemerkungen

ESGRAF 4–8: Evozierte Sprachdiagnose grammatischer Fähigkeiten für 4 bis 8-jährige Kinder.

Sprachdiagnostik im Primar- und Sekundarbereich

183

Motsch 2011

4;0 bis 10;11 Jahre.

Kriterienorientiertes Verfahren, mit dem differentialdiagnostisch zwischen folgenden Gruppen unterschieden werden kann: mehrsprachige Kinder mit mangelnden Sprachkenntnissen in beiden Sprachen, mehrsprachige Kinder mit unzureichenden Kenntnissen in der L2 Deutsch sowie mehrsprachige Kinder mit SSES, die sich in beiden Sprachen widerspiegelt. Es liegen Materialien für Türkisch, Russisch, Polnisch, Italienisch und Griechisch vor. Das Kind muss auf der Grundlage von Bildvorlagen Fragen beantworten.

Durchführung und Auswertung erfolgen auf Grundlage einer CD. Das Verfahren kann auch von Personen durchgeführt werden, welche die L1 der Kinder nicht kennen. Durchführungsdauer ca. 15 Minuten, die Auswertung wird automatisch ausgegeben.

Bis zu 20 Testitems zu den Bereichen: Genus, Numerus, Subjekt-Verb-Kongruenz, Kasus, Syntax des Hauptsatzes, Syntax des Nebensatzes.

Das Screening dient der oben genannten Differentialdiagnostik. Wegen der wenigen Items können nur erste Hinweise gegeben werden. Auf Grund der Items entstehen Hinweise auf zu fördernde Bereiche.

Ein Bezug zur Aneignung der jeweiligen Sprache ist gegeben, außerdem liegen kontrastive Sprachvergleiche vor.

Es handelt sich um eines der wenigen Verfahren, in denen auch die L1 erfasst wird. Die Diagnostik von Schwierigkeiten in der L1 muss mit der gebotenen Vorsicht vorgenommen werden. Wenn die Testleiterin die jeweilige L1 nicht spricht, können nur erste Hinweise auf Schwierigkeiten in der L1 gewonnen werden.

Autoren / Erscheinungsjahr

Alter

Beschreibung

Durchführung und Auswertung

Untertests/ Überprüfte Bereiche

Hinweise auf Förderung

Bezug zu Mehrsprachigkeit

Bemerkungen

ESGRAF-MK: Evozierte Sprachdiagnose grammatischer Fähigkeiten für mehrsprachige Kinder.

184 Stefan Jeuk und Beate Lütke

Zwei Versionen: Sekundarstufe I (Bildungsstandards für das 9. Schuljahr) Sekundarstufe II (Bildungsstandards für die Allgemeine Hochschulreife im Fach Deutsch)

Die Niveaubeschreibungen wurden in Anlehnung an die Bildungsstandards Deutsch der Kultusministerkonferenz und den sächsischen Lehrplan Deutsch als Zweitsprache entwickelt. Mit diesem Diagnoseinstrument soll es möglich sein, systematisch und kriterienorientiert Informationen über den individuellen Sprachbildungsprozess der Schülerinnen und Schüler zu erhalten. Gezielte Maßnahmen zu Unterricht und Förderung können abgeleitet werden. Die Maßnahmen sind am Konzept der durchgängigen Sprachbildung orientiert.

Formatives Beobachtungsverfahren (Einschätzungen) mit dem Ziel, den Prozess der (Zweit-)Sprachaneignung zu begleiten. Es werden Niveaubeschreibungen benannt, an denen sich ablesen lässt, wie weit die betreffende Schülerin/der betreffende Schüler vom jeweiligen Standardniveau entfernt ist. Die Beschreibungen sind Formulierungsangebote für den Stand der Sprachaneignung der L2 Deutsch. Die Daten werden durch teilnehmende Beobachtung während des Unterrichts erhoben.

Weite der sprachlichen Handlungs- und Verstehensfähigkeit, Wortschatz, Aussprache, Lesen, Schreiben, Grammatik mündlich und schriftlich sowie Persönlichkeitsmerkmale der Schülerin bzw. des Schülers. Jedem Bereich liegen Stufenmodelle der Zweitsprachaneignung zu Grunde, die eine kriterienorientierte, deskriptive Beschreibung des Stands der Sprachaneignung ermöglichen.

Die Beschreibungen sind auf die Bildungsstandards bezogen und somit unmittelbar mit dem Unterricht und der Förderung zu verbinden.

Die Niveaubeschreibungen beziehen sich auf Modelle des Zweitspracherwerbs. Sie sind auch für einsprachige Schülerinnen und Schüler anwendbar.

Es handelt sich um ein qualitatives Beobachtungsverfahren auf der Grundlage der Spracherwerbsforschung und der Bildungsstandards. Sowohl die Validität als auch die Reliabilität des Verfahrens konnten belegt werden (Döll 2013). Die Anwendung des Verfahrens erfordert linguistisches und spracherwerbsbezogenes Wissen der Lehrkräfte und sollte nicht ohne Fortbildung eingesetzt werden.

Abschnitt Abschnitt Abschnitt Abschnitt Abschnitt Abschnitt

Alter

Beschreibung

Durchführung und Auswertung

Untertests / Überprüfte Bereiche

Hinweise auf Förderung

Bezug zu Mehrsprachigkeit

Bemerkungen

Darstellung in diesem Band

III: Grimm & Müller III: Heller III: Schäfer III: Kalkavan-Aydın & Winter III: Hövelbrinks & Fornol IV: Döll

Döll & Reich 2013b (Sekundarstufe I)Döll & Reich 2015 (Sekundarstufe II)

Autoren / Erscheinungsjahr

Niveaubeschreibungen Deutsch als Zweitsprache für die Sekundarstufe I und die Sekundarstufe II.

5.3 Nicht normierte Verfahren für die Sekundarstufe

Sprachdiagnostik im Primar- und Sekundarbereich

185

Reich, Roth & Gantefort 2008

4. bis 6. Schuljahr.

Es soll der individuelle Sprachstand erfasst werden mit einem Schwerpunkt auf Text- und Erzählkompetenz (narrative Bildungssprache). Das Verfahren liegt in Deutsch, Russisch und Türkisch vor. Auf der Grundlage einer Bildergeschichte als Schreibimpuls werden anhand von Kriterien lexikalische, grammatische und textuelle Fähigkeiten erfasst.

Durchführungsdauer (auch in Gruppen möglich) ca. 30 Minuten, Auswertung ca. 30 Minuten pro Schülerin und Schüler.

Die Analyse liefert Aussagen zu Textkompetenz, Syntax, Fachwortschatz und Elementen der Bildungssprache.

Auf Grund der Analyse kann festgestellt werden, in welchen Kompetenzbereichen der Unterricht und die weitere Förderung am Übergang der Primarstufe zur Sekundarstufe I sowie zu Beginn der Sekundarstufe I erfolgen soll.

Der Bezug zur Mehrsprachigkeit ist gegeben. Das Verfahren kann auch bei einsprachigen Schülerinnen und Schülern angewendet werden.

Eine Standardisierung ist geplant, liegt aber noch nicht vor. Das Verfassen einer schriftlichen Erzählung auf der Grundlage einer Bildergeschichte wird in der Schreibdidaktik kritisch gesehen (vgl. Schäfer in diesem Band). Die Auswertung ist differenziert und erfolgt auf mehreren Ebenen, die Anwendung ohne Weiterbildung oder spezifisches fachliches Wissen erscheint problematisch. Interpretationen hinsichtlich Kompetenzen in der L1 sind mit der gebotenen Vorsicht vorzunehmen.

Abschnitt III: Heller Abschnitt III: Schäfer Abschnitt III: Hövelbrinks & Fornol

Autoren / Erscheinungsjahr

Alter

Beschreibung

Durchführung und Auswertung

Untertests / Überprüfte Bereiche

Hinweise auf Förderung

Bezug zu Mehrsprachigkeit

Bemerkungen

Darstellung in diesem Band

Tulpenbeet.

186 Stefan Jeuk und Beate Lütke

Reich, Roth & Döll 2009

Jugendliche am Übergang von der Sekundarstufe I zum Beruf (9. und 10. Schuljahr).

Es soll der individuelle Sprachstand bezogen auf die bildungs- und fachsprachliche Kompetenz erfasst werden. Das Verfahren liegt in Deutsch, Russisch und Türkisch vor. Die Schreibaufgabe (Fast Catch Bumerang) besteht aus einem Bewerbungsschreiben und einer Bauanleitung für einen Bumerang. Die Schülertexte werden anhand eines Auswertungsbogens (Profilanalyse) analysiert.

Durchführungsdauer (auch in Gruppen möglich) ca. 45 Minuten, Auswertung ca. 30 Minuten pro Schülerin und Schüler.

Die Analyse liefert Aussagen zu Textkompetenz, Syntax, Fachwortschatz und Elementen der Bildungssprache.

Auf Grund der Analyse kann festgestellt werden, in welchen Kompetenzbereichen der Unterricht und die weitere Förderung am Übergang zum Beruf aufbauen soll.

Der Bezug zur Mehrsprachigkeit ist gegeben, das Verfahren kann auch bei einsprachigen Schülerinnen und Schülern angewendet werden.

Eine Standardisierung ist geplant, liegt aber noch nicht vor. Der Schreibimpuls ist komplex. Die Anleitung kann besser gelingen, wenn die Schülerinnen und Schüler selbst einen Bumerang nach der Anleitung hergestellt haben. Die Auswertung ist differenziert und erfolgt auf mehreren Ebenen, die Anwendung ohne Weiterbildung oder spezifisches fachliches Wissen erscheint problematisch. Interpretationen hinsichtlich Kompetenzen in der L1 sind mit der gebotenen Vorsicht vorzunehmen.

Abschnitt III: Heller Abschnitt III: Schäfer Abschnitt III: Hövelbrinks & Fornol

Autoren / Erscheinungsjahr

Alter

Beschreibung

Durchführung und Auswertung

Untertests / Überprüfte Bereiche

Hinweise auf Förderung

Bezug zu Mehrsprachigkeit

Bemerkungen

Darstellung in diesem Band

Bumerang.

Sprachdiagnostik im Primar- und Sekundarbereich

187

Junk-Deppenmeier & Jeuk 2015

5. bis 6. Schuljahr, ggf. auch ältere Schülerinnen und Schüler.

Werkzeugkoffer mit verschiedenen förderdiagnostischen Verfahren. Je nach Fragestellung und Einzelfall können verschiedene Verfahren gewählt werden. Die einzelnen Verfahren können in unterschiedlicher Tiefe ausgewertet werden. 1. Beobachtung der Sprachbiographie 2. C-Test als Screening (normiert für das 5. Schuljahr) 3. Werkzeug zum Hörverstehen (Fragen zu einem Hörtext) 4. Werkzeug zum Leseverstehen (Fragen zu einem Lesetext) 5. Werkzeug zum mündlichen Erzählen 6. Werkzeug zum schriftlichen Erzählen

Der C-Test, das Werkzeug zum Hörverstehen und das Werkzeug zum Leseverstehen sind Gruppenverfahren. Die Durchführungszeit beträgt jeweils zwischen 30 und 45 Minuten, die Auswertung der individuellen Bearbeitungen zwischen 30 und 60 Minuten, je nach Tiefe der Auswertung. Das Werkzeug zum mündlichen Erzählen ist ein Individualverfahren (Durchführung ca. 10 Minuten, Auswertung ca. 60 Minuten inkl. Transkription) und das Werkzeug zum schriftlichen Erzählen kann als Gruppenverfahren durchgeführt werden. Die Auswertung erfolgt auf der Grundlage individueller Profilbögen (je nach Auswertungstiefe 30 bis 90 Minuten).

1. Sprachbiographie: Es kann die Sprachbiographie, der Sprachgebrauch, der emotionale Zugang zu Sprachen, der mündliche Sprachgebrauch, Hören, Schreiben, Lesen und Mediennutzung sowie Wortschatz und Grammatik erfasst werden (analog Diagnostische Leitfragen). 2. C-Test: vgl. Grotjahn in diesem Band. Eine qualitative Auswertung der Einzelfälle ermöglicht vertiefende Analysen. 3. Hörverstehen: Die Antworten werden auf den Ebenen Wiedererkennen und Zuhören sowie Analytisches Verstehen und Interpretieren ausgewertet. 4. Leseverstehen: Die Antworten werden auf den Ebenen Informationen ermitteln, Textbezogenes Interpretieren und Reflektieren und Bewerten ausgewertet. 5. Mündliches Erzählen: Die Transkripte können auf den Ebenen Erzählen, Syntax, Nominalphrase, Verbalphrase, Präpositionalphrase, Wortschatz und Semantische Strategien ausgewertet werden. 6. Schriftliches Erzählen: Die Texte können auf den Ebenen Erzählen, Kohäsion, Morphosyntax, Wortschatz und Rechtschreibung ausgewertet werden. Ein zusätzliches Verfahren (Schreibgespräch) kann z. B. im Kontext einer Schreibberatung individuelle Strategien und Verhaltensweisen im Schreibprozess erfassen.

Autoren / Erscheinungsjahr

Alter

Beschreibung

Durchführung und Auswertung

Untertests / Überprüfte Bereiche

Praxismaterial Förderdiagnostik.

188 Stefan Jeuk und Beate Lütke

Der Bezug zur Mehrsprachigkeit ist gegeben. Das Verfahren kann auch bei einsprachigen Schülerinnen und Schülern angewendet werden.

Es handelt sich um ein sehr umfangreiches Verfahren, bei dem es vielfältige Möglichkeiten gibt, einzelne Teile auszuwählen und mit einer gezielten Fragestellung einzusetzen. Der C-Test ermöglicht als erstes Screening Auskünfte über die weitere Vorgehensweise.

Abschnitt Abschnitt Abschnitt Abschnitt Abschnitt

Bezug zu Mehrsprachigkeit

Bemerkungen

Darstellung in diesem Band

I: Jeuk & Settinieri III: Heller III: Webersik III: Kalkavan-Aydın & Winter III: Schäfer

Auf Grund der Analysen kann festgestellt werden, in welchen Kompetenzbereichen der Unterricht und die weitere Förderung aufbauen soll. Je nach Tiefe der Analyse sind die Förderhinweise differenzierter und vielfältiger.

Hinweise auf Förderung

Sprachdiagnostik im Primar- und Sekundarbereich

189

190

Stefan Jeuk und Beate Lütke

5.4 Aktuelle bildungspolitische Entwicklungen Vor dem Hintergrund der vielen neu nach Deutschland gekommenen Jugendlichen werden Verfahren gefordert, die bei Jugendlichen eine frühe Einstufung möglich machen. Dies erfolgt auch vor dem Hintergrund, dass in zunehmend mehr Bundesländern Vorbereitungsklassen oder Sprachlernklassen auch an Realschulen oder Gymnasien eingerichtet werden. Auch von Seiten der beruflichen Schulen wird gefordert, dass es die Möglichkeit gibt, Jugendliche mit geringen oder wenigen Deutschkenntnissen einzustufen, um sie im Hinblick auf die weitere schulische oder berufliche Bildung möglichst frühzeitig zu beraten. Hierfür wird am Kultusministerium Baden-Württemberg im Auftrag des Bundesministeriums für Bildung und Forschung die Potenzialanalyse 2P entwickelt. Da bisher nur Schulen bzw. Schulleitungen die Zugangsdaten zu dem Onlinetest erhalten, ist dieser nicht einsehbar und überprüfbar. Bis Juni 2017 sollen ca. 14.000 Testungen in der Pilotphase durchgeführt worden sein. Die folgenden Informationen beziehen sich auf die Darstellung auf der Internetseite des Landes Baden-Württemberg sowie eine dort verfügbare Computer-Präsentation.

Saleh 2017 (in Entwicklung)

10;0 bis 20;11 Jahre.

Es soll ein spracharmes und kulturfaires Verfahren zur diagnosebasierten Wahl im Berufs- und Bildungswesen entwickelt werden. Neben biographischen Informationen werden die kognitive Basiskompetenz, die berufliche Kompetenz, die methodische Kompetenz sowie der Lernstand in Deutsch, Mathematik und Englisch erfasst. Die Lehrkraft entscheidet, welcher Baustein bei wem zum Einsatz kommt.

Jeder Baustein dauert in der Durchführung ca. 45 Minuten (online) und ist wiederholbar (randomisierter Aufgabenpool). Instruktion durch erklärende Bilder, Beispiele und Übungen. Die Auswertung ist automatisiert. Als Ergebnis des Sprachtests wird eine Niveaustufe für Fertigkeiten vergeben (z. B. Deutsch: Hören A2, Sprachen B1, usw.).

Kognitive Basiskompetenz: Konzentrationsfähigkeit, Merkfähigkeit, räumliches Vorstellungsvermögen, schlussfolgerndes Denken, usw., analog zu klassischem Intelligenztest. Formate z. B. visuelle Analogien und logische Folgen. Lernstand Deutsch: Hören, Wortschatz, Lesen, Schreiben auf den Niveaustufen A1 bis C1 nach dem GER, Formate sind aus DaFLehrwerken und Testformaten aus dem GER entnommen, Bilder aus DaF-Lehrwerken.

Es geht um die Einschätzung von kognitiven, sprachlichen und mathematischen Kompetenzen im Hinblick auf Bildungs- und Berufsberatung. Die Testformate sind in der Regel nicht oder wenig förderrelevant.

Kein Bezug zur Mehrsprachigkeitsforschung. Grundlage sind „Kriterien der Bildungserwartung im Hinblick auf berufliche Qualifikationen“ (Saleh 2017).

Das Verfahren kann auf Grund des nicht vorhandenen Zugriffs nur ansatzweise beurteilt werden. Der Anspruch der Kulturfreiheit ist nicht einzuhalten (z. B. Aufgaben von links nach rechts). Sprachliche Items sind, soweit dies beurteilt werden kann, stark an Formate des DaF-Testens nach dem GER angelehnt, dadurch ist das Verfahren nur zum Teil auf schulisches Lernen bezogen. Zugriff auf Informationen unter: www.2p-bw.de

Autoren / Erscheinungsjahr

Alter

Beschreibung

Durchführung und Auswertung

Untertests / Überprüfte Bereiche

Hinweise auf Förderung

Bezug zu Mehrsprachigkeit

Bemerkungen

2P: Potenzial & Perspektive.

Sprachdiagnostik im Primar- und Sekundarbereich

191

192

Stefan Jeuk und Beate Lütke

6 Schlussbemerkungen Wenn Bredel (2005) die Sprachstandsmessung als „verlassene Landschaft“ bezeichnet hat, so kann heute, zwölf Jahre später, auf einige Fortschritte verwiesen werden. Es sind eine Reihe neuer Verfahren entstanden und es findet eine rege Diskussion in der Sprachwissenschaft, der Sprachdidaktik, der Zweitspracherwerbsforschung und der Sprachpsychologie statt. Nach wie vor ist jedoch die Kluft zwischen einem quantitativ-normierenden und einem qualitativ-förderdiagnostischen Vorgehen nur in Ansätzen überbrückt. Mit den hier vorgestellten Verfahren werden unterschiedliche Ziele verfolgt. Teilweise steht im Vordergrund, Grundlagen für Entscheidungen des weiteren Bildungsgangs zu finden, also auszuwählen, ob eine Schülerin oder ein Schüler zusätzliche Förderung bekommt, an welche Schulart sie/er kommen soll usw. Diese Verfahren müssen den psychometrischen/testtheoretischen Gütekriterien genügen, wobei allerdings bis heute nicht als geklärt gelten kann, ob es eine zuverlässige Normierungsgrundlage (wie etwas das Lebensalter bei einsprachigen Lernern) überhaupt geben kann, um die Sprachentwicklung mehrsprachiger Kinder und Jugendlicher einzuschätzen. Bisher gibt es nur ein Verfahren (LiSe-DaZ), das hier mit der Kontaktdauer arbeitet. Verfahren, die für einsprachig deutsche Kinder und Jugendliche konzipiert und normiert wurden, werden oft unreflektiert zu Auswahlzwecken eingesetzt. Dies impliziert jedoch, dass mehrsprachige Entwicklungen nicht berücksichtigt werden, was den Lernchancen mehrsprachiger Kinder und Jugendlicher nicht gerecht wird. Daneben gibt es eine Fülle nicht psychometrisch normierter Verfahren. Einige davon sind kriterienorientiert und arbeiten profilanalytisch. Für diese Verfahren gilt, dass sie ohne linguistisches und sprachdidaktisches Wissen nicht eingesetzt werden können. Mit ihrem Einsatz ist eher die Frage verbunden, wo eine Förderung genau ansetzen kann. Um auf der Grundlage solcher Verfahren eine Förderung anzugehen, bieten sich z. B. die Leitfragen von Dehn (2006: 395) an: Was kann das Kind schon? Was muss es noch lernen? Was kann es als Nächstes lernen?

Die Beantwortung dieser Fragen ist nicht nur mit Hilfe der genannten Verfahren möglich, vielmehr fließen vielfältige Beobachtungen und Erfahrungen in die Gestaltung der Förderung und des Unterrichts mit ein. Die Diagnostik ist so gesehen ein impliziter Bestandteil der Förderung und kann durch den Einsatz bestimmter Verfahren punktuell unterstützt werden. Für den Einsatz von sprachdiagnostischen Verfahren in der Schule muss beachtet werden, dass es kaum möglich ist, mit wenig Aufwand schnell und zielführend an differenzierte und umfangreiche Informationen bezüglich der Entwicklung der Sprachaneignung eines Kindes oder Jugendlichen zu gelangen. Es gilt die Faustformel, dass man mit wenig Aufwand wenige Informationen erhält und um viele Informationen zu erhalten, ein relativ höherer Aufwand betrieben werden muss. Diese Überlegungen sind vor allem vor dem Hintergrund relevant, dass von Lehrkräften

Sprachdiagnostik im Primar- und Sekundarbereich

193

zunehmend genaue und differenzierte Diagnosen, z. B. im Kontext des Erstellens von Förderplänen, verlangt werden. Dies kann letztlich nur gefordert werden, wenn auch zusätzliche Ressourcen, u. a. für Fortbildungen, zur Verfügung gestellt werden.

Literatur Autorengruppe Bildungsberichterstattung (Hrsg.) (2012): Bildung in Deutschland 2012. Ein indikatorengestützter Bericht mit einer Analyse zur kulturellen Bildung im Lebenslauf. Bielefeld: W. Bertelsmann. http://www.bildungsbericht.de/de/bildungsberichte-seit-2006/ bildungsbericht-2012 (08. 09. 2017). Berendes, Karin; Wolfgang Wagner, Dettmar Meurers & Ulrich Trautwein (2015): Grammatikverständnis von Kindern unterschiedlicher sozioökonomischer Herkunft. Frühe Bildung 4 (3), 126–134. Berliner Senatsverwaltung für Bildung, Jugend und Sport (2004): Das Sprachstandsinstrument DEUTSCH PLUS 4. Berlin: Senatsverwaltung für Bildung, Jugend und Sport. http:// bildungsserver.berlin-brandenburg.de/unterricht/lernstandsanalysen-vergleichsarb/ sprachstandsfestellung-deutsch (15. 05. 2017). BMBF = Bundesministerium für Bildung und Forschung (Hrsg.) (2005): Anforderungen an Verfahren der regelmäßigen Sprachstandsfeststellung als Grundlage für die frühe und individuelle Förderung von Kindern mit und ohne Migrationshintergrund. Berlin: Bundesministerium für Bildung und Forschung. Bredel, Ursula (2005): Sprachstandsmessung – eine verlassene Landschaft. In BMBF (Hrsg.): Anforderungen an Verfahren der regelmäßigen Sprachstandsfeststellung als Grundlage für die frühe und individuelle Förderung von Kindern mit und ohne Migrationshintergrund, 77–120. Berlin: Bundesministerium für Bildung und Forschung. Bundschuh, Konrad (2014): Einführung in die sonderpädagogische Diagnostik. 8. Aufl. München: Reinhardt. Busch, Brigitta (2015): Über das Kategorisieren von Sprachen und Sprecher_innen. Zur Dekonstruktion von Sprachstatistiken. In Nadja Thoma & Magdalena Knappik (Hrsg.): Sprache und Bildung in Migrationsgesellschaften. Machtkritische Perspektiven auf ein prekarisiertes Verhältnis, 45–68. Bielefeld: transcript. Chilla, Solveig (2008): Störungen im Erwerb des Deutschen als Zweitsprache im Kindesalter − eine Herausforderung an die sprachpädagogische Diagnostik. In Diskurs Kindheits- und Jugendforschung 3 (3), 277–290. Dehn, Mechthild (2006): Lernbeobachtung und Leistungsmessung beim Erstlesen/Erstschreiben. In Heinz-Jürgen Kliewer & Inge Pohl (Hrsg.): Lexikon Deutschdidaktik. Band 1: A–L, 392–395. Baltmannsweiler: Schneider Hohengehren. Dietz, Sandra & Andrea Lisker (2008): Sprachstandsfeststellung und Sprachförderung im Kindergarten. Expertise im Auftrag des Deutschen Jugendinstituts. München: Deutsches Jugendinstitut e.V. https://www.dji.de/fileadmin/user_upload/bibs/Sprachstands feststellung_Dietz_Lisker.pdf (08. 09. 2017). Döll, Marion (2013): Sprachdiagnostik und Durchgängige Sprachbildung – Möglichkeiten der Feststellung sprachlicher Fähigkeiten mehrsprachiger Jugendlicher in der Sekundarstufe. In Ingrid Gogolin, Imke Lange, Imke; Ute Michel & Hans H. Reich (Hrsg.): Herausforderung Bildungssprache − und wie man sie meistert, 170–180. Münster u. a.: Waxmann. Döll, Marion & Hans H Reich (2013a): Niveaubeschreibungen Deutsch als Zweitsprache für die Primarstufe. Radebeul: Sächsisches Bildungsinstitut.

194

Stefan Jeuk und Beate Lütke

Online verfügbar: https://publikationen.sachsen.de/bdb/artikel/14490/documents/26560 (08. 09. 2017). Döll, Marion & Hans H. Reich (2013b): Niveaubeschreibungen Deutsch als Zweitsprache für die Sekundarstufe I. Radebeul: Sächsisches Bildungsinstitut. Online verfügbar: https://publikationen.sachsen.de/bdb/artikel/14477/documents/26554 (08. 09. 2017). Döll, Marion & Hans H Reich (2015): Niveaubeschreibungen Deutsch als Zweitsprache für die Sekundarstufe II. Radebeul: Sächsisches Bildungsinstitut. https://publikationen.sachsen.de/bdb/artikel/25525/documents/35554 (08. 09. 2017). Ermonies-Jargielo, Joanna; Hana Klages & Erika Kaltenbacher (2014): Deutsch für den Schulstart. Verfahren zur Sprachstandsfeststellung. Heidelberg: Institut für Deutsch als Fremdsprachenphilologie, Universität Heidelberg. Fried, Lilian (2009): Sprachkompetenzmodell Delfin 4. Dortmund: Technische Universität Dortmund. Teil 1: www.fk12.tu-dortmund.de/cms/ISEP/Medienpool/Mitarbeiter/Fried_Lilian/ Testma-nual_Delfin4_Teil1.pdf (08. 09. 2017), Teil 2: https://www.fk12.tu-dortmund.de/cms/ ISEP/Me-dienpool/Mitarbeiter/Fried_Lilian/Testmanual_Delfin4_Teil2_Anhang.pdf (08. 09. 2017). Gogolin, Ingrid (2010): Sprachstandsdiagnosen. In Hans-Jürgen Krumm, Christian Fandrych, Britta Hufeisen, Britta & Claudia Riemer (Hrsg.): Deutsch als Fremd- und Zweitsprache. Ein internationales Handbuch. 2. Halbband, 1305–1314. Berlin, New York: De Gruyter Mouton. Grießhaber, Wilhem (2005): Sprachstandsdiagnose im kindlichen Zweitspracherwerb. Funktionalpragmatische Fundierung der Profilanalyse. Münster: Westfälische Wilhelms-Universität Münster. https://spzwww.uni-muenster.de/griesha/pub/tprofilanalyse-azm-05.pdf (08. 09. 2017). Heilmann, Beatrix (2012): Diagnostik & Förderung – leicht gemacht. Hrsg.: Wilhelm Grießhaber. Stuttgart: Klett. Hesse, Ingrid & Brigitte Latzko (2009): Diagnostik für Lehrkräfte. Opladen et al.: Barbara Budrich. Hobusch, Anna, Nevin Lutz & Uwe Wiest (2002): Sprachstandsüberprüfung und Förderdiagnostik für Ausländer- und Aussiedlerkinder (SFD). Horneburg: Persen. Hobusch, Anna, Nevin Lutz & Uwe Wiest (2016): Sprachstandsüberprüfung und Förderdiagnostik (SFD). Testverfahren für Grundschulkinder mit Deutsch als Erst- und Zweitsprache. Hamburg: Persen. Holler-Zittlau, Inge, Winfried Dux & Roswitha Berger (2017): Marburger Sprach-Screening für 4- bis 6-jährige Kinder (MSS). Ein Sprachprüfungsverfahren für Kindergarten und Schule. Horneburg: Persen. Jeuk, Stefan (2009): Probleme der Sprachstandserhebung bei mehrsprachigen Kindern. In: ZSE – Zeitschrift für Soziologie der Erziehung und Sozialisation 29 (2), 141–155. Jeuk, Stefan (2011): der-die-das. Sprachstandsbeobachtung Sprache und Lesen 1/2. Berlin: Cornelsen. Jeuk, Stefan (2013): der-die-das. Sprachstandsbeobachtung Sprache und Lesen 3/4. Berlin: Cornelsen. Jeuk, Stefan (2018): Deutsch als Zweitsprache in der Schule. Grundlagen – Diagnose – Förderung. 2. Aufl. Stuttgart: W. Kohlhammer. Jeuk, Stefan, Antje Sinemus & Krystyna Strozyk (Hrsg.) (2011–2013): der-die-das. Basisbuch Sprache und Lesen 1 bis 4. Berlin: Cornelsen. Junk-Deppenmeier, Alexandra & Stefan Jeuk (Hrsg.) (2015): Praxismaterial Förderdiagnostik. Werkzeuge für den Sprachunterricht in der Sekundarstufe I. Stuttgart: Fillibach bei Klett. Knapp, Werner (2001): Diagnostische Leitfragen. In: Praxis Grundschule 3/2001, 4–7. Maak, Diana (2010): Sprachstandsdiagnose. In Hans Barkowski & Hans-Jürgen Krumm (Hrsg.): Fachlexikon Deutsch als Fremd- und Zweitsprache, 309–310. Tübingen, Basel: A. Francke.

Sprachdiagnostik im Primar- und Sekundarbereich

195

Motsch, Hans-Joachim (2011): ESGRAF-MK. Evozierte Diagnostik grammatischer Fähigkeiten für mehrsprachige Kinder. München: Ernst Reinhardt. Motsch, Hans-Joachim & Christian Rietz (2016): ESGRAF 4–8. Grammatiktest für 4- bis 8-jährige Kinder – Manual. München: Ernst Reinhardt. Oomen-Welke, Ingelore (2017): Durchgängige Sprachbildung: Sprachregister, Schulsprache, Bildungs- und Fachsprachen. In Bernt Ahrenholz & Ingelore Oomen-Welke (Hrsg.): Deutsch als Zweitsprache, 4. Aufl., 398–414. Baltmannsweiler: Schneider Hohengehren. Petermann, Franz (2012): SET 5–10. Sprachstandserhebungstest für Kinder im Alter zwischen 5 und 10 Jahren. 2. Aufl. Göttingen: Hogrefe. Redder, Angelika et al. (2011): Bilanz und Konzeptualisierung von strukturierter Forschung zu „Sprachdiagnostik und Sprachförderung“. Hamburg: Hamburger Zentrum zur Unterstützung der wissenschaftlichen Begleitung und Erforschung schulischer Entwicklungsprozesse (ZUSE). www.dabil.de/zuse/501publikation/zuse_berichte_02.pdf (08. 09. 2017). Reich, Hans H. (2005): Forschungsstand und Desideratenaufweis zu Migrationslinguistik und Migrationspädagogik für die Zwecke des „Anforderungsrahmens“. In BMBF (Hrsg.): Anforderungen an Verfahren der regelmäßigen Sprachstandsfeststellung als Grundlage für die frühe und individuelle Förderung von Kindern mit und ohne Migrationshintergrund, 121– 170. Berlin: Bundesministerium für Bildung und Forschung. Reich, Hans H. & Stefan Jeuk (2017): Sprachstandserhebungen, ein- und mehrsprachig. In Bernt Ahrenholz & Ingelore Oomen-Welke (Hrsg.): Deutsch als Zweitsprache, 4. Aufl, 548–559. Baltmannsweiler: Schneider Hohengehren. Reich, Hans H. & Hans-Joachim Roth (2004): Hamburger Verfahren zur Analyse des Sprachstands Fünfjähriger (HAVAS 5). Hamburg: Landesinstitut für Lehrerbildung und Schulentwicklung. Reich, Hans H., Hans-Joachim Roth & Marion Döll (2009): Fast Catch Bumerang – Auswertungshinweise, Schreibimpuls und Auswertungsbogen. In Drorit Lengyel, Hans H Reich, Hans-Joachim Roth & Marion Döll (Hrsg.): Von der Sprachdiagnose zur Sprachförderung, 207–241. Münster et al.: Waxmann. Reich, Hans H., Hans-Joachim Roth & Christoph Gantefort (2008): Der Sturz ins Tulpenbeet. Deutsche Sprachversion. Auswertungsbogen und Auswertungshinweise. In Thorsten Klinger, Knut Schwippert & Birgit Leiblein (Hrsg.): Evaluation im Modellprogramm FörMig. Planung und Realisierung eines Evaluationskonzepts, 209–237. Münster et al.: Waxmann. Saleh, Sien-Lie (2017): 2P. Potenzial & Perspektive. Ein Analyseverfahren für neu Zugewanderte. Tübingen: MTO. www.2p-bw.de/site/pbs-bw-new/get/documents/KULTUS.Dachman-dant/ KULTUS/Projekte/Projekt-2P/2P-Info_LK_allgemein.pdf (last access?). Schulz, Petra & Rosemarie Tracy (2011): LiSe-DaZ. Linguistische Sprachstandserhebung – Deutsch als Zweitsprache. Göttingen: Hogrefe. Ulich, Michaela & Toni Mayr (2003): sismik. Sprachverhalten und Interesse an Sprache bei Migrantenkindern in Kindertageseinrichtungen. Freiburg: Herder.

Alexandra Eberhardt

9 Sprachdiagnostik für den Beruf 1 2 3 4

Sprachstandsdiagnose und Sprachförderung in der beruflichen Bildung Anforderungen an Instrumente in der beruflichen Bildung Diagnoseinstrumente Desiderata

1 Sprachstandsdiagnose und Sprachförderung in der beruflichen Bildung Die Ermittlung sprachlicher Kompetenzen von Erst- und Zweitsprachlerner*innen in beruflichen Kontexten ist von großer Bedeutung. Auf einer zeitlich fortgeschrittenen Bildungsetappe besteht noch einmal die Möglichkeit, durch zielgerichtete Maßnahmen die erforderlichen sprachlichen Kompetenzen für einen beruflichen Bereich anzubahnen bzw. auszubauen. Zudem ermöglichen passgenaue Programme Zweitsprachlerner*innen, sprachliche Hürden zu überwinden und sich möglichst zügig in den Arbeitsmarkt zu integrieren. Dazu müssen nicht nur die sprachlichen Bedarfe in den jeweiligen beruflichen Kontexten bekannt sein, sondern auch die Sprachkompetenzen der Lerner*innen möglichst genau ermittelt werden. Trotz der hohen Relevanz dieses Bereiches handelt es sich bei der Sprachstandsdiagnostik in der beruflichen Bildung jedoch um ein lange vernachlässigtes Gebiet. Während vom Elementar- und Primarbereich bis in die Sekundarstufe I in den letzten eineinhalb Jahrzehnten zahlreiche Materialien zur Feststellung des Sprachstandes entwickelt wurden, sind die Sekundarstufe II und hier insbesondere das Berufskolleg nur punktuell bedacht worden. Dies liegt keineswegs an mangelnder Nachfrage an diagnostischen Instrumenten. Es ist vielmehr die Heterogenität der Zielgruppe quer zu anderen Schulformen, die dafür verantwortlich ist. Doch gerade in der beruflichen Bildung besteht ein großer Bedarf an verlässlicher sprachlicher Einstufung und sich anschließenden Förderangeboten. Schließlich gilt sprachliche Bildung als Zugangsvoraussetzung für einen Ausbildungs- bzw. Arbeitsplatz und einen gelungenen beruflichen Werdegang. Als ein wichtiges Zeichen kann man in diesem Zusammenhang die Förderung berufsbezogener Sprachkurse durch den Bund, beispielsweise im Rahmen der sogenannten ESF-BAMF-Kurse, werten (vgl. Bundesministerium für Migration und Flüchtlinge 2008: 20). Auch andere Angebote, die auf den Arbeitsmarkt mit seinen konkreten Erfordernissen vorbereiten, berücksichtigen in Kursen berufsorientiertes Deutsch oder die (Berufs-)Fachsprache Deutsch. Ein zentrales Anliegen ist es, den Anteil der jungen Menschen mit Migrationshintergrund an einer qualifizierenden Ausbildung und einem Berufsabschluss zu erhöhen, um ihnen eine Beteiligung am Arbeitsmarkt zu ermöglichen. Noch ist diese Gruppe aber beispielshttps://doi.org/10.1515/9783110418712-009

198

Alexandra Eberhardt

weise in der dualen Ausbildung stark unterrepräsentiert; auch bleiben Personen mit Migrationshintergrund überdurchschnittlich häufig ohne Berufsabschluss (vgl. Bundesministerium für Bildung und Forschung 2016: 47–50; Bundesministerium für Migration und Flüchtlinge 2008: 10, 17, 20). Zu berücksichtigen ist, dass die entsprechende Zielgruppe einige Besonderheiten aufweist: In der beruflichen Bildung sind Lerner*innen von der Berufsvorbereitung bis hin zur gymnasialen Oberstufe vertreten. Auch die Vielzahl an Bildungsgängen in kaufmännischen sowie gewerblichen Berufsfeldern ist verantwortlich für die unterschiedlichen Kenntnisse und Voraussetzungen innerhalb der Zielgruppe. Der Bereich der beruflichen Fort- und Weiterbildung stellt ein weiteres Betätigungsfeld dar, in dem Sprachstandsdiagnostik für ganz unterschiedliche Zielgruppen von großer Bedeutung ist. Mehrsprachigkeit ist ein weiterer Faktor für sprachliche Heterogenität in der beruflichen Bildung, welcher in jüngster Zeit immer mehr in den Blick gerät. Als zentraler Faktor für den schulischen Erfolg und das Erreichen beruflicher Abschlüsse rückt das Beherrschen der schriftnahen Standardsprache in den Fokus; mit dem Aufbau fachlicher Kompetenzen geht der Ausbau der schriftsprachlich geprägten Sprache einher (vgl. z. B. Siebert-Ott 2006: 164; Schmölzer-Eibinger 2013: 26). Dies betrifft sowohl die ein- als auch die mehrsprachigen Lerner*innen, welche an die konzeptionell schriftsprachlichen Merkmale herangeführt werden müssen.

2 Anforderungen an Instrumente in der beruflichen Bildung Eine Differentialdiagnostik beim Übergang in die Berufsausbildung ist von immens wichtiger Bedeutung. Die Lerner*innen befinden sich in der letzten Etappe ihrer Schullaufbahn, so dass im Hinblick auf sprachliche Fördermaßnahmen nicht mehr viel Zeit zur Verfügung steht. Zudem ist der Zeitpunkt des Einstiegs in die Berufsausbildung günstig, sprachliche Maßnahmen auf die Lerner*innen und den Kontext ihrer beruflichen Ausbildung abzustimmen, um sie für ihre spätere berufliche Tätigkeit (in sprachlicher Hinsicht) so handlungsfähig wie möglich zu machen. Verlässliche Instrumente zur Sprachstandsdiagnose sind der Schlüssel dazu, Sprachfördermaßnahmen gezielt einzusetzen und mit den fachlichen bzw. beruflichen Anforderungen zu verknüpfen. Verfahren, die in der beruflichen Bildung für Erst- und Zweitsprachlerner*innen Anwendung finden sollen, müssen einigen Kriterien standhalten. Zunächst ist es erforderlich, dass die Diagnoseinstrumente für den Schulalltag tauglich sind. Wenn bei ihrem Einsatz ein gewisser zeitlicher Rahmen überschritten wird oder Lehrkräfte bei der Handhabung über Kenntnisse verfügen müssen, die sie nicht in ihrer Ausbildung erworben haben, stellt sich das Instrument als nicht praktikabel dar (vgl. Reich 2006: 915).

Sprachdiagnostik für den Beruf

199

Die Schwierigkeit bei der Entwicklung diagnostischer Instrumente für den Beruf liegt in der Natur der Sache: Wenn kein allgemeinsprachlich ausgerichtetes Verfahren zum Einsatz kommen soll, muss dem entsprechenden beruflichen Bereich Rechnung getragen werden. Bei der Vielzahl an Berufsfeldern ist die Konstruktion eines Diagnoseinstrumentes problematisch, das für unterschiedlichste Berufe verwendet werden kann. Lediglich eine Bündelung bietet sich an, wenn Spezifika einzelner Berufe noch hinreichend erfasst werden sollen. Lässt sich ein Verfahren gleichermaßen für eine Fachkraft für Schutz und Sicherheit wie für Fachinformatiker oder IT-Kaufleute einsetzen? Welche Kompetenzen sollen überhaupt erfasst werden, um dem Anspruch gerecht zu werden, eine berufliche Relevanz zu haben? Soll eine umfassende Testung sprachlicher Kompetenzen erfolgen oder sollen einzelne Teilkompetenzen erhoben werden, die sich als relevant für einen beruflichen Bereich darstellen? Wenn ein Bezug zur beruflichen Bildung gegeben sein soll, muss das diagnostische Verfahren Erfordernisse beruflicher Zusammenhänge berücksichtigen, die in allgemeinsprachlichen Verfahren nicht abgebildet werden (sollen). Die konsequente Berücksichtigung berufsbezogener Inhalte in einem diagnostischen Instrument ist nur bedingt möglich, wenn ein großer Adressatenkreis erreicht werden soll. Berufsübergreifende Aspekte sind hingegen ein Ansatzpunkt für Sprachstandserhebungen, die relevante Kompetenzen in beruflichen Kontexten erheben möchten, ohne sich speziell an einen konkreten Ausbildungsgang zu richten. Diagnoseinstrumente in der beruflichen Bildung können den spezifischen Anforderungen dort Rechnung tragen, indem sie sich zum einen an berufsbezogenen Sprachhandlungen und -situationen mit ihren besonderen Eigenschaften und Anforderungen orientieren. Zum anderen können sie Textsorten sowie Formate berücksichtigen, die in beruflichen Zusammenhängen eine wichtige Rolle spielen. Hier sind vor allem diskontinuierliche Formate1 zu erwähnen, die Abbildungen, Diagramme, Tabellen, Schaubilder und Ähnliches enthalten. In beruflichen Zusammenhängen treten diese Formate häufig in gemischter Form auf und müssen genutzt werden, um Informationen zu entnehmen und bestimmte Tätigkeiten auszuführen. In Anlehnung an die sprachlichen Teilfertigkeiten bietet sich eine Differenzierung nach mündlichen und schriftlichen sowie produktiven und rezeptiven Kompetenzbereichen an. Eine Verortung in beruflichen Handlungsfeldern kann den erforderlichen Bezug zum angestrebten Tätigkeitsfeld herstellen. Wenn beispielsweise in einem beruflichen Zusammenhang regelmäßig dieselben Textsorten wie Bedienungsanleitungen oder Funktionsbeschreibungen rezipiert werden müssen oder als häufige Sprachhandlung Gespräche mit Behörden geführt werden, können diese Kompetenzbereiche für eine Diagnostik und anschließende Förderbausteine in Betracht gezogen werden (vgl. Eberhardt 2016: 252). Sprachliche Kompetenzen, die in

1 Diskontinuierliche, nicht-kontinuierliche bzw. nicht-lineare Texte bezeichnen solche Formate, die keine Fließtexte darstellen, sondern mit anderen Darstellungsformen unterbrochen werden. Zur Diskussion des Textbegriffs vgl. Brinker, Cölfen & Pappert (2014: 11–23).

200

Alexandra Eberhardt

einem beruflichen Bereich häufig eine wichtige Rolle spielen, bilden Ansatzpunkte für eine Sprachstandsermittlung. Darüber hinaus ist es wünschenswert, möglichst genaue Angaben über den konkreten Förderbedarf zu erhalten, der sich dann fächerübergreifend umsetzen lässt. Das korrekte Lesen von Diagrammen kann beispielsweise im Fachunterricht geübt werden, um das Fach Deutsch/Kommunikation zu entlasten und die fachbezogene Relevanz aufzuzeigen. Auch mit Blick auf den Bereich der beruflichen Fort- und Weiterbildung ergibt sich die Notwendigkeit einer möglichst genauen Ermittlung sprachlicher Kompetenzen. Nur mit Kenntnis der vorhandenen sprachlichen Fähigkeiten sowie Anforderungen und Bedarfe lassen sich nachhaltige Angebote für die betreffende Zielgruppe gestalten.

3 Diagnoseinstrumente Der vorherrschende Mangel an Instrumenten zur Sprachstandsdiagnose für die berufliche Bildung hat zur Folge, dass in Berufskollegs punktuell Verfahren eingesetzt werden, die nicht für diese Zielgruppe konzipiert worden sind, aber dennoch in einigen Lernergruppen den Zweck erfüllen, bestimmte Kompetenzbereiche zu erheben. Dies kann ein sinnvolles Vorgehen sein, gerade im Hinblick auf die immer größer werdende Gruppe an Mehrsprachigen. In diesem Beitrag sollen Materialien und Verfahren zur Sprachstandsermittlung behandelt werden, die für die berufliche Bildung entwickelt wurden oder die in diesem Kontext einsetzbar sind. Sie werden präsentiert nach Verfahrenstypen der Sprachstandsdiagnostik sowie nach den Kompetenzbereichen, die sie abprüfen möchten. Auf Verfahren, die Zweitsprachlerner*innen besonders in den Blick nehmen, wird an gegebener Stelle hingewiesen. In diesem Zusammenhang sei auch auf die Synopse von Rauch, Schastak & Richter (2016) verwiesen, die Diagnoseverfahren für sprachliche Kompetenzen von Personen mit Migrationshintergrund aller Altersgruppen vorstellen.

3.1 Das profilanalytische Verfahren Fast Catch Bumerang Im Rahmen des Modellversuchsprogramms FörMig (Förderung von Kindern und Jugendlichen mit Migrationshintergrund) wurde das sprachstandsdiagnostische Verfahren Bumerang erarbeitet; es ist förderdiagnostisch und mehrsprachig angelegt. Hervorzuheben ist, dass diejenigen sprachlichen Kompetenzen berücksichtigt werden, die zentral für eine Berufsausbildung sind (vgl. Dirim & Döll 2009: 139). Es sollen sich Aussagen über mehrere unterschiedliche sprachliche Bereiche treffen lassen – vergleichbar mit den von Ehlich (2005) formulierten „Basisqualifikationen“ (vgl. Reich 2009: 29).

Sprachdiagnostik für den Beruf

201

Bei Bumerang handelt es sich um ein profilanalytisches Instrument, welches für den Übergang vom Sekundarbereich in den Beruf konzipiert ist. Es „erfasst Schreibfähigkeiten mit allgemeinem Berufsbezug am Ende der Sekundarstufe I bzw. am Anfang der beruflichen Bildung“ (Gogolin et al. 2011: 80). Es liegt in den Sprachen Deutsch, Türkisch und Russisch vor und dient der Erfassung des individuellen Sprachstandes im Hinblick auf bildungs- und fachsprachliche Kompetenz. Die Schreibaufgabe Fast Catch Bumerang besteht aus zwei Teilen: einem Bewerbungsschreiben und einer (Bau-)Anleitung für einen Bumerang, zu der es eine neunteilige Bilderfolge gibt. Die Verschriftlichung soll anhand der Bilderreihe erfolgen. Mit Hilfe eines Auswertungsbogens können Aussagen über die Schülertexte getroffen werden im Hinblick auf Wortschatz und bildungssprachliche Elemente, Syntax und Textkompetenz. Als Hilfestellung zur Analyse gibt es Auswertungshinweise mit sprachlichen Beispielen und Orientierungsrastern (vgl. Reich, Roth & Döll 2009: 209–241). Mit der Schreibaufgabe, eine Bewerbung um einen Praktikumsplatz zu verfassen, wird eine Textsorte elizitiert, die in beruflichen Kontexten Relevanz besitzt. Hier spielen fachsprachliche Elemente jedoch noch nicht so eine zentrale Rolle wie in der zweiten Schreibaufgabe (vgl. auch Dirim & Döll 2009: 140), in der die Herstellung eines Bumerangs so beschrieben werden soll, dass er allein aufgrund der Bauanleitung nachgebaut werden kann.2 Mit der Aufgabenstellung, einen Arbeitsablauf zu beschreiben, ist eine typische Sprachhandlung im Kontext der beruflichen Bildung gewählt worden. Komplexe Handlungen in einzelne Teilschritte zu zerlegen und diese zu verbalisieren, entspricht dem berufsschulischen Alltag in besonderer Weise, wenn dort auch eher mündlich. Bumerang ermöglicht eine Analyse von bedeutenden sprachlichen Teilkompetenzen im Hinblick auf die Produktion von (textsortengebundenen) Texten. Erfasste sprachliche Kompetenzbereiche umfassen Wortschatz, Syntax und Textpragmatik; auch bildungssprachliche Kompetenzen werden in diesem Verfahren berücksichtigt (vgl. Rauch, Schastak & Richter 2016: 118, 121). Zu Gütekriterien oder Normierungsstichproben finden sich hingegen keine Angaben (vgl. auch Rauch, Schastak & Richter 2016: 121). Mit einer anvisierten Durchführungszeit von 45 Minuten und einer Auswertungszeit von etwa 30 Minuten pro Schüler*in und Sprache ist der Aufwand, wie bei profilanalytischen Instrumenten üblich, personell und zeitlich recht intensiv. Zur Analyse der Lernertexte bedarf es zum Teil fundierter Kenntnisse. Das Instrument ermöglicht Aussagen über das Verhältnis der schriftsprachlichen Entwicklung in der Familiensprache und im Deutschen, sofern man in der Lage ist, erstere zu beurteilen. Reich (2009: 28–29) weist darauf hin, dass der erreichte Stand in Deutsch und der Erstsprache im Hinblick auf Förderentscheidungen wichtige Infor-

2 Die Bildvorlage zur Herstellung eines Bumerangs veranschaulicht, dass es sich um eine äußerst komplexe Schreibaufgabe handelt, insbesondere dann, wenn man bislang nicht mit dem Bau von Bumerangs vertraut gewesen ist, um die Teilschritte auf den Bildern wiederzuerkennen.

202

Alexandra Eberhardt

mationen liefern kann, beispielsweise ob eine Förderung breit angelegt sein sollte oder ob nur einzelne Schritte in der Zielsprache Deutsch nachzuholen sind.

3.2 Beobachtungsverfahren Niveaubeschreibungen Deutsch als Zweitsprache für die Sekundarstufe II Die Niveaubeschreibungen Deutsch als Zweitsprache für die Sekundarstufe II wurden auf Initiative des Sächsischen Staatsministeriums für Kultus entwickelt (vgl. Sächsisches Bildungsinstitut 2015: 3–5). Dieses Instrument zur prozessbegleitenden Diagnose ist ebenfalls im Rahmen von FörMig entstanden. Es richtet sich wie die Niveaubeschreibungen Deutsch als Zweitsprache für die Primarstufe und die Niveaubeschreibungen Deutsch als Zweitsprache für die Sekundarstufe I nach den Bildungsstandards Deutsch der Kultusministerkonferenz und dem sächsischen Lehrplan für Deutsch als Zweitsprache (vgl. Sächsisches Bildungsinstitut 2015: 3–5). Es handelt sich um ein Verfahren der teilnehmenden Beobachtung im (Fach-)Unterricht. Sprachliche Fähigkeiten der Schüler*innen im schulischen Alltag werden in verschiedenen Teilbereichen auf vier bis fünf Stufen beschrieben. Die sprachliche Handlungsfähigkeit in der Zweitsprache Deutsch wird in unterschiedliche Kompetenzbereiche differenziert: Umfang der sprachlichen Handlungs- und Verstehensfähigkeit, Wortschatz, Aussprache, Lesen, Schreiben und Grammatik. Für die Sekundarstufe II sind einige höher entwickelte Kompetenzen erforderlich als in den unteren Jahrgangsstufen, weshalb für diese Zielgruppe weitere Niveaustufen beschrieben worden sind. Bei den Beobachtungsbereichen handelt es sich um „Unterrichtsgespräche und Präsentationen“, „Formelle Gespräche“, „Verstehens-“, „Mitteilungs-“ und „Fachwortschatz“, „Leseverstehen“, „Textproduktion“, „Verbstellung und komplexere Syntax“, „Präpositionen“ und „Formen des Verbs“. Auf der fünften Niveaustufe finden sich unter anderem solche Kompetenzen, deren Aneignung für das Erreichen der Zielvorgaben der Bildungsstandards für das Fach Deutsch im Rahmen von berufsqualifizierenden Bildungsgängen (Berufsschule, Berufsfachschule, Fachschule) erforderlich ist. Eine gesonderte Berücksichtigung der beruflichen Bildung findet sich beispielsweise für die Textproduktion: „Der Schüler kann normierte und standardisierte Texte (z. B. Bewerbung, Kündigung) sowie fach- und berufsspezifische Texte (z. B. Beleg- und Facharbeit) adressatengerecht realisieren.“ (Sächsisches Bildungsinstitut 2015: 29) In den Beobachtungsbereichen, in denen keine Differenzierung zwischen berufsqualifizierenden Bildungsgängen und solchen erforderlich ist, die zum Hochschulzugang berechtigen, wird eine gemeinsame fünfte Niveaustufe beschrieben (vgl. Sächsisches Bildungsinstitut 2015: 13). Durch die Beobachtung lässt sich für die Schüler*innen ein individuelles Profil der Kompetenzen im Deutschen als Zweitsprache erstellen. Hier werden Stärken sichtbar, aber auch, „welche Bereiche im Rahmen der individuellen Sprachbildung besonderer Aufmerksamkeit bedürfen“ (Sächsisches Bildungsinstitut 2015: 19). Im

Sprachdiagnostik für den Beruf

203

Anschluss lassen sich auf der Grundlage der ermittelten Kompetenzen sprachdidaktische Entscheidungen treffen. Für den Einsatz der Niveaubeschreibungen ist einiges an Fachwissen vonnöten. Damit Lehrkräfte verschiedenster Fachrichtungen die Beobachtungen durchführen können, verweisen die Entwickler auf ein Glossar, in dem linguistische Termini nachgeschlagen werden können, sowie auf entsprechende Internetseiten (vgl. Sächsisches Bildungsinstitut 2015: 14). Um belastbare Ergebnisse erzielen zu können, sind grundlegende Sprachkenntnisse im Deutschen seitens der Probanden notwendig. Sinnvoll einsetzbar erscheint dieses Diagnoseinstrument frühestens nach einem halben Jahr Deutschunterricht zu sein. Für Einzelbeobachtungen ist es sehr praktikabel, für die durchführende Lehrkraft im Unterricht hingegen ohne Unterstützung einer zweiten Person nur bedingt durchführbar. Eine umfassende und systematische Beobachtung einzelner Schüler*innen parallel zum Unterrichtsgeschehen ist für eine Lehrkraft schwer zu leisten. Der zeitliche Aufwand muss insgesamt als relativ hoch eingeordnet werden. Die Niveaubeschreibungen DaZ sind dafür konzipiert, sich im kollegialen Gespräch (sowie mit Eltern und Schüler*innen) systematisch und strukturiert über die Kompetenzen der Schüler*innen auszutauschen. Zu diesem Zweck sollen Lehrkräfte ihre Beobachtungen knapp, aber genau beschreiben können. Von Vorteil ist, dass auch der Zuwachs an Kompetenzen im Sprachbildungsprozess in Teiletappen beobachtet und thematisiert werden kann (vgl. dazu auch Döll 2009: 110). Wobei stets zu beachten gilt, dass eine Beobachtung als Verfahren tendenziell subjektiver ist als beispielsweise Tests (vgl. dazu auch Sächsisches Bildungsinstitut 2015: 8).

Prozessbegleitende Diagnose der Schreibentwicklung Das kompetenzorientierte Beobachtungsinstrument Prozessbegleitende Diagnose der Schreibentwicklung für den Sekundarbereich ist in einer länderübergreifenden Arbeitsgruppe ebenfalls im Modellprogramm FörMig entwickelt worden. Es handelt sich um ein Beobachtungsinstrument, welches schriftliche Sprachhandlungen im Fachunterricht der Sekundarstufe I im Verlauf des Lernprozesses begleitet. Die sprachlichen Fähigkeiten, die für die Anforderungen im Unterricht erforderlich sind, werden erhoben, um daraus Schlüsse für eine mögliche Förderung sprachlicher Bildung zu ziehen. Die Schreibfähigkeiten im Deutschen sollen sich mit Hilfe dieses Instrumentes genauerer einschätzen lassen, indem die Schülertexte mit Hilfe von Auswertungsrastern eingestuft werden. Aus den Bildungsstandards und Lehrplänen wurden geforderte Operatoren wie beispielsweise Berichten, Beschreiben oder Erklären zusammenstellt und Kompetenzraster entwickelt, welche die Entwicklung der Sprachhandlung stufenförmig für die Ebenen Lexik/Semantik, Syntax und Text beschreiben (vgl. Lengyel et al. 2009: 129–131). Damit kann beispielsweise der Wortschatz im Hinblick auf Angemessenheit oder Differenziertheit beschrieben werden. Die Morphologie findet am Rande der Syntax Beachtung, wenn es um Unsicherheiten bei den Flexionsformen geht. Es

204

Alexandra Eberhardt

soll, so Lengyel et al. (2009: 132), allerdings nicht um die Analyse von Verstößen im Bereich der Morphologie, Syntax oder Orthographie im Sinne einer Fehleranalyse gehen, sondern um fachlich angemessene Texte. Obwohl das Instrument für die Sekundarstufe I entwickelt wurde, ist es unter bestimmten Voraussetzungen auch für die berufliche Bildung einsetzbar, zumal am Übergang von der Schule in den Beruf. Die Schreibdiagnose auf der Grundlage von unterschiedlichen Diskurstypen kann beispielsweise anhand beruflich relevanter Sprachhandlungen erfolgen, da die Entwicklung bildungssprachlicher Kompetenzen auch im berufsschulischen Zusammenhang von großer Bedeutung ist. Sprachhandlungen wie Berichten oder Erklären spielen auch hier eine wichtige Rolle. Das standardisierte Verfahren ermöglicht, Entwicklungen in den Lernertexten zu beobachten. Die Schreibaufgaben lassen sich auf ein berufliches Thema ausrichten. Die Matrix zum Auswerten stellt dabei ein hilfreiches Instrument dar, auch wenn Zuordnungen nicht immer eindeutig zu treffen sind. Da die Durchführung der prozessbegleitenden Diagnose verhältnismäßig aufwändig ist, ist es ratsam, dieses Verfahren nicht mit einer gesamten Klasse durchzuführen, sondern mit einigen ausgewählten Lerner*innen, die es besonders zu beobachten gilt. Bei ihnen lässt sich der bildungssprachliche Entwicklungsstand mit diesem Instrument näher beschreiben; dies kann auch als Grundlage für eine Abstimmung zwischen Deutsch- und Fachlehrkräften dienen. Vorläufige Versionen ausgewählter Sprachhandlungen (Erklären, Beschreiben, Berichten und Argumentieren) sind zeitweise im Internet verfügbar gewesen, wurden jedoch zum gegenwärtigen Zeitpunkt noch nicht abschließend in überarbeiteter Version veröffentlicht.

3.2 Testverfahren 3.2.1 Kompetenzbereich Lesen Die Lesekompetenz stellt eine zentrale Qualifikation in der beruflichen Bildung dar. Die Leseanforderungen gewinnen nun einen praktischen Bezug: Es geht darum, relevante Informationen aus Fachberichten, Fachbüchern oder Produktinformationen zu erschließen und sich im Lernort Betrieb und der Berufsschule mit den aus der Lektüre gewonnenen Kenntnissen einzubringen und diese anzuwenden. Nicht nur bei der Bewältigung des beruflichen Alltags sind Lesekompetenzen von hoher Bedeutung, sondern auch im Hinblick auf Abschlussprüfungen, wie beispielsweise der Gesellenprüfung, die ohne die erforderlichen literalen Kompetenzen eine große Hürde darstellen (vgl. dazu auch Kusch 2006: 14–16). VOLI − Vocational Literacy Das Modellprojekt „Vocational Literacy (VOLI) – Methodische und sprachliche Kompetenzen in der beruflichen Bildung“ wurde in Hessen von Ende 2003 bis Ende

Sprachdiagnostik für den Beruf

205

2006 im Auftrag des Instituts für Qualitätsentwicklung (IQB) im Bundesland Hessen durchgeführt. Die Technische Universität Darmstadt übernahm die wissenschaftliche Begleitung. In diesem Modellversuch wurde ein Verfahren zur Ermittlung der Lesekompetenz explizit für die berufsbildenden Schulen entwickelt, der sog. „Baukasten Lesediagnose“. Im VOLI-Modellprojekt wurde das Ziel verfolgt, die sprachliche Kompetenz der Berufsschüler*innen zu ermitteln und im Anschluss daran zu fördern (vgl. Efing 2008: 6). Vor dem Hintergrund hoher Durchfallquoten in den Abschlussprüfungen und einer erheblichen Anzahl an Ausbildungsabbrüchen in verschiedensten Ausbildungsberufen sollten geeignete Fördermaßnahmen zur Reduzierung dieser Quote entwickelt werden (vgl. Efing & Janich 2006: 7). Im Rahmen dieses Sprachförderprojektes wurde Material zur Diagnose und Förderung in berufsspezifischen Zusammenhängen entwickelt und erprobt. Im Zentrum stehen grundlegende sprachliche Fertigkeiten für den Berufsabschluss, vor allem das Leseverstehen. Dieses Verfahren ist kein vorgefertigter Lesetest, der nach einem standardisierten Schema durchgeführt werden kann, sondern bietet Lehrkräften die Möglichkeit, aus einem vorgegliederten Materialpool eigene Lesetests zu erstellen. Hierzu bedarf es einer gewissen Einarbeitungszeit, bis das Verfahren zielsicher genutzt werden kann. Bei der Zusammenstellung eines Lesetests können die einzelnen Aufgaben entweder nach ihrem Schwierigkeitsgrad oder nach den Verstehensebenen angeordnet werden. Um der Lehrperson das Zusammenstellen und Auswerten des individuell konzipierten Tests zu erleichtern, sind zu jeder Aufgabe die Verstehensebene und das Kompetenzniveau angegeben. Die jeweils erforderliche Leseteilfertigkeit zum Lösen der Aufgabe, wie das Wortverstehen, das globale, gezielte oder detaillierte Leseverstehen, ist farblich gekennzeichnet. Nach der Durchführung des Lesetests kann die Lehrperson die Leseleistung eines Schülers/einer Schülerin in Anlehnung an den Gemeinsamen Europäischen Referenzrahmen für Sprachen (GER) einordnen (vgl. Efing 2008: 1). Mit dem „Baukasten Lesediagnose“ soll es Lehrkräften möglich sein, den individuellen Stand der Lesekompetenz ihrer Schüler*innen zu ermitteln. Die Zielgruppe bilden Berufsschüler*innen aus der Grundstufe unterschiedlicher Ausbildungsberufe. Das Testmaterial besteht aus kontinuierlichen und diskontinuierlichen Texten, wie Tabellen und Diagrammen, sowie Aufgaben. Mit diesen Formaten wird der beruflich relevante Kontext berücksichtigt. Ein wichtiges Merkmal des Baukastens ist, dass die Texte unabhängig von einem speziellen Ausbildungsberuf einsetzbar sind; sie behandeln übergreifende Themen, welche alle Schüler*innen betreffen, wie z. B. arbeitsrechtliche Zusammenhänge. Der Baukasten enthält sowohl standardsprachliche als auch fachsprachliche Texte (aus den Gebieten Biologie und Arbeitsrecht), welche die Lehrkraft gezielt für eine bestimmte Gruppe auswählen und zu einem Test zusammenstellen kann. Der „Baukasten Lesediagnose“ eignet sich sowohl einmalig zur Durchführung als Sprachstandstest als auch zur kontinuierlichen Diagnose, wofür er im Grunde konzipiert worden ist (vgl. Efing 2008: 5–6).

206

Alexandra Eberhardt

Lehrkräfte können bei der Nutzung des Baukastens entscheiden, welche Teilkompetenzen des Leseverstehens geprüft werden und auf welchem Niveau diese liegen sollen. Die Texte sind in ihren Schwierigkeitsniveaus an den Gemeinsamen Europäischen Referenzrahmen für Sprachen (GER) angelehnt (vgl. http://www.euro paeischer-referenzrahmen.de). Bei der Konzeption des Baukastens wurden vorwiegend Aufgaben zwischen den Kompetenzniveaus A2 und B2 berücksichtigt, da Berufsschüler*innen im Laufe ihrer Ausbildung dahin gelangen sollten, über sprachliche Fertigkeiten auf der Ebene B2 zu verfügen (vgl. Efing 2008: 6–7). Die sprachlichen Anforderungen bei beruflichen Kommunikationssituationen sowie bei Lehrabschlussprüfungen liegen etwa auf dem Niveau B2 (vgl. Biedebach 2006: 25), weshalb der Baukasten im Hinblick auf diese Erfordernisse gestaltet wurde. Neben der Orientierung an dem GER enthält der „Baukasten Lesediagnose“ jedoch zudem auch Aufgabentypen, die Teilkompetenzen in den Bereichen „Informationen ermitteln“, „Textbezogenes Interpretieren“ und „Reflektieren und bewerten“ feststellen. Damit lehnt sich VOLI an die Lesekompetenzdefinition von PISA an (vgl. Hessisches Kultusministerium, Institut für Qualitätsentwicklung 2006: 4). Wenn keine Klassifizierung nach GER möglich ist, wird nicht das Niveau, sondern nur die Leseteilfertigkeit angegeben. Der Baukasten ist in fünf Einzelbausteine gegliedert, und die sprachlichen und fachlichen Anforderungen steigen mit der jeweiligen Ziffer an. Während der erste Baukasten standardsprachliche Elemente in mehreren kleineren Einheiten enthält und „das Leseverstehen auf der Satzebene (Satzlogik), das Verstehen nicht-kontinuierlicher Texte und das globale Textverstehen“ testet (Hessisches Kultusministerium, IQB 2006: 7), besteht der fünfte Baukasten aus einem anspruchsvollen Text aus dem Bereich des Arbeitsrechts. Hierfür sind detailliertes Leseverstehen seitens der Schüler*innen erforderlich sowie fachsprachliche Kenntnisse. Der Bereich des Arbeitsrechtes, der auch im vierten Baustein aufgegriffen wird, ist ein Beispiel für die berufsübergreifende Themenwahl des Verfahrens, weil jeder Ausbildungsberuf mit arbeitsrechtlichen Belangen zu tun hat. So wird eine größere Einsetzbarkeit derjenigen Bausteine ermöglicht, die sich nicht nur auf allgemeinsprachliche Kompetenzen beschränken. Die progressive Anordnung der Bausteine ermöglicht ein differenziertes Einschätzen sprachlicher Teilkompetenzen auf der Wortebene, auf der Satz- und Abschnittsebene (gezieltes Leseverstehen) sowie auf der Textebene (globales Leseverstehen). Das detaillierte Leseverstehen macht es erforderlich, einen Text nach gründlicher Lektüre in allen Einzelheiten zu verstehen (vgl. Efing 2008: 7). Es ist darauf hinzuweisen, dass die Zuweisung zu einer der Kompetenzstufen bei diesem Verfahren kritisch zu betrachten ist, weil in einigen Fällen keine eindeutige Zuordnung der einzelnen Aufgabenteile zu einem Kompetenzniveau möglich ist.3 Aus diesem Grund liegen einige der Aufgaben des Baukastens Lesediagnose 3 Auch Efing (2008:7) weist auf die Problematik hin, den Schwierigkeitsgrad einer Aufgabe nach dem GER genau zu bestimmen. Er führt hier vor allem die fehlende Unterdifferenzierung in Teilkompetenzen im Hinblick auf die Lesekompetenz an.

Sprachdiagnostik für den Beruf

207

zwischen zwei Kompetenzstufen, so dass es im Ermessen der Lehrkraft liegt, einzuschätzen, ob die Aufgabe für eine Klasse schwierig oder leicht zu lösen sein kann. Dies ist sicher auch der Tatsache geschuldet, dass die Beschreibungen des GER recht allgemein formuliert sind, um daraus Kriterien für eine Diagnose abzuleiten. Der Einsatz eines Diagnoseinstrumentes, das eine eingehende Beschäftigung mit der Lesekompetenz und der Testdurchführung erfordert, ist personell und zeitlich erst dann vertretbar, wenn im Anschluss eine zielgerichtete Sprachförderung stattfinden kann. Im Rahmen des Projektes VOLI sind Fördermaterialien in Weiterbildungsseminaren entwickelt worden.4 Des Weiteren haben die Weiterbildungsseminare Fachlehrer*innen in die Sprachförderung eingebunden und den Weg für eine fächerübergreifende Sprachförderung gewiesen. Lesetest für Berufsschüler*innen LTB-3 In einer Zusammenarbeit zwischen der Universität Köln und dem Mercator-Institut für Sprachförderung und Deutsch als Zweitsprache ist ein Lesetest speziell für Berufsschüler*innen entwickelt worden, der LTB-3 (vgl. Drommler et al. 2006; 2007). Dieser Test richtet sich somit an eine Zielgruppe, deren Lesekompetenz bereits hinreichend entwickelt sein sollte. Hervorzuheben ist bei diesem Instrument, dass neben nicht-fiktionalen Texten aus der Lebenswelt von Berufsschüler*innen auch Darstellungsarten wie Tabellen und Diagramme berücksichtigt werden. Damit werden relevante Darstellungsformen aus der beruflichen Bildung einbezogen und der Kompetenzerhebung zugrunde gelegt. Das Verfahren LTB-3 wurde an über 500 Berufsschüler*innen normiert (vgl. Drommler et al. 2006: 13–17). Dieses Instrument bietet sich an Berufsschulen als Spracheingangstest im Bereich Lesen an (vgl. auch Efing 2008: 6). Es handelt sich um einen Niveautest, der allen Schüler*innen ausreichend Zeit zur Verfügung stellt. Mit einer Durchführungsdauer von etwa 45 Minuten nimmt er einige Zeit in Anspruch; die Auswertung mittels Schablone ist zeitökonomisch angelegt. Die erreichten Punkte können sowohl kriteriumsorientiert (mit einem feststehenden Punktwert für eine Kompetenzstufe) als auch normorientiert interpretiert werden (vgl. Drommler et al. 2006: 23, 31). Normwerte, die alle mit Werten von Berufsschüler*innen ermittelt wurden, existieren für L1- und L2Lerner*innen sowie für verschiedene Schulabschlüsse: für den Hauptschulabschluss, die mittlere Reife, den Fachhochschulabschluss sowie das Abitur (vgl. Drommler et al. 2006: 31–38). Der zugrunde liegende Lesekompetenzbegriff orientiert sich wie bei PISA an dem angelsächsischen Literacy-Konzept. Damit geht das Verständnis von „Lesen können“ sowohl in der PISA-Studie als auch beim Lesetest LTB-3 über die reine Entschlüsselungstechnik hinaus und begreift Lesen als eine Kulturtechnik. Aller-

4 Die Beteiligten des Modellprojektes verweisen auf folgende Internetseite: http://s1.teamlearn.de/ b-1-mv_voli (16. 07. 2016).

208

Alexandra Eberhardt

dings wird die Lesekompetenz im LTB-3 nur auf einer Skala und nicht wie bei PISA auf drei Subskalen abgebildet. Die Lesefähigkeit wird dabei im LTB-3 in drei hierarchisch aufeinander aufbauenden Kompetenzstufen erhoben. Die Fähigkeit, Texten einzelne Informationen zu entnehmen, steht auf der ersten Stufe. Mehrere Informationen miteinander zu verknüpfen und auf eine konkrete Aufgabenstellung hin zu beziehen, ist auf der zweiten Kompetenzstufe angesiedelt. Transferleistungen zu erbringen im Hinblick auf das Verknüpfen relevanter Informationen eines Textes mit dem Weltwissen ist auf der höchsten Stufe angesiedelt; erst auf dieser Kompetenzstufe gelingt ein Bewerten von Inhalten eines Textes sowie ein kritisches Hinterfragen der eigenen Position und ein Transfer zur Lösung einer konkreten Aufgabe. Der Fokus liegt bei diesem Verfahren auf dem Ermitteln von Informationen (vgl. Drommler et al. 2006: 13–17). Diese funktionale Ausrichtung des Kompetenzmodells zielt auf die Bewältigung von relevanten Problemsituationen ab (vgl. BeckerMrotzek & Drommler 2006: 35) und spiegelt die Erfordernisse in der beruflichen Bildung wider. Dieses Testverfahren nimmt die anvisierte Zielgruppe in der Berufsschule als angehende Fachkräfte in den Blick, die „fachliche Inhalte aus Fachbüchern, Fachberichten und Produktinformationen erschließen“ (Drommler et al. 2006: 12) müssen. Insbesondere die dualen Ausbildungsgänge mit ihren spezifischen Anforderungen sind im Fokus (vgl. Stevens & Wahlers 2006: 73, 75). Die Autoren nennen auch die Prüfungsformen wie die Gesellenprüfungen als Meilensteine, die bewältigt werden müssen (vgl. Drommler et al. 2006: 12). Damit orientieren sie sich an relevanten beruflichen Zusammenhängen. Die besondere Rolle diskontinuierlicher Texte für den beruflichen Kontext wird herausgestellt, was in der Konstruktion des Lesetests konsequenterweise berücksichtigt wird. Die Ergebnisse, die bei der Lesediagnose ermittelt werden, bieten für jeden Schüler/jede Schülerin eine Information zur Lesekompetenz in den berufsrelevanten Textsorten und Hilfestellungen, wie die individuelle Lesekompetenz fächerübergreifend gefördert werden kann (vgl. Stevens & Wahlers 2006: 75). Das für Berufsschulen wichtige Kriterium, die Sprachförderung fächerübergreifend für einen Bildungsgang zu verknüpfen und nicht auf das Fach Deutsch/Kommunikation zu beschränken, wird damit berücksichtigt. Gerade wenn in einem Ausbildungsgang nur noch ein geringer Umfang an Deutschunterricht stattfindet, wird es für die berufsspezifischen Lernbereiche zu einer dringlichen Aufgabe, im Fachunterricht sprachliche Kompetenzen wie die Lesefähigkeit zu fördern. Im Bereich geringer Lesekompetenzen stößt man mit diesem Verfahren an Grenzen. Wenn bei getesteten Lerner*innen eine minimale Lesefähigkeit erhoben wird, die unterhalb der ersten Kompetenzstufe liegt, ist keine weiterführende genauere Analyse möglich; den Probanden wird in diesem Fall eine basale Lesekompetenz abgesprochen. Kritikpunkte an der Messqualität einiger Items werden auch in einer empirischen Analyse von Jordan (2011) aufgezeigt: Er führt beispielsweise an, dass einige

Sprachdiagnostik für den Beruf

209

Items auch ohne Textkenntnis gelöst werden können, weil die Distraktoren sich teilweise ausschließen und damit nicht mehr die Lesekompetenz im eigentlichen Sinne erhoben wird.5 Ein anderer Diskussionspunkt betrifft die Auswertung, bei der nur wenige Proband*innen (selbst in der Gruppe der Abiturient*innen) eine hohe Kompetenzstufe erreichen. Dies gilt es methodisch zu hinterfragen, wenn die tatsächlich vorhandenen Kompetenzen in den statistisch konstruierten Kompetenzstufen zu niedrig eingeordnet werden (vgl. Jordan 2011: 175–176).

Adaptive Erfassung der Lesekompetenz von Berufsschüler*innen Ein weiterer Test zur Lesekompetenzdiagnostik in der beruflichen Bildung wird aktuell im Rahmen des Projektes Mak-adapt – adaptive Messung allgemeiner Kompetenzen – der ASCOT-Forschungsinitiative entwickelt (Technology-based Assessment of Skills and Competencies in VET/Technologie-orientierte Kompetenzmessung in der beruflichen Bildung). Es handelt sich um ein Kooperationsprojekt zwischen den Universitäten Göttingen, Darmstadt und Jena. Aufbauend auf theoretischen Kompetenzmodellen werden Messinstrumente entwickelt, beispielsweise zur Erfassung mathematischer und naturwissenschaftlicher Kompetenz sowie zur Lesekompetenz. Das Kompetenzmodell, das der Lesefähigkeit zugrunde liegt, verfügt über drei kognitive Klassen zur Leseanforderung (Informationen identifizieren, integrieren und generieren) und drei Kategorien von Repräsentationsformaten (sprachlich kontinuierliche Texte, Mischformen aus Text und Bild und rein bildliche Dokumente) (vgl. Ziegler & Balkenhol 2016: 259–261). Das Diagnoseinstrument zur Lesekompetenz soll dazu dienen, die Merkmale des Lesens in beruflichen Handlungskontexten unter funktionalen Aspekten verstärkt zu berücksichtigen. Bei einem Item soll beispielsweise ein Unfallbericht einer von vier Skizzen zugeordnet werden; hier ist es erforderlich, den genauen Hergang in der sprachlichen Version zu erfassen, um die korrekte bildliche Darstellung auszuwählen (vgl. Ziegler & Balkenhol 2016: 260). Eine Besonderheit im Vergleich zu anderen Lesetests ist, dass es sich bei diesem computerbasierten Verfahren um einen adaptiven Test handelt, bei dem in Abhängigkeit von der Antwort eines Probanden/einer Probandin die nächste Testaufgabe ausgewählt wird (vgl. Ziegler & Balkenhol 2016: 259). In einem begrenzten Zeitrahmen soll so das Kompetenzniveau von Gruppen erfasst werden können (vgl. Ziegler & Balkenhol 2016: 261).

5 Jordan illustriert seinen Kritikpunkt exemplarisch anhand eines Items mit einer hohen Lösungsquote, das sich leicht ohne den Originaltext lösen lässt: Wenn die Frage lautet, welche Aspekte das Jugendarbeitsschutzgesetz regelt, lässt sich dies problemlos mit den Beschäftigungsbedingungen von Jugendlichen beantworten. Die Antwortmöglichkeiten, dass damit der Urlaub von jungen Arbeitern und Angestellten oder der Schutz Jugendlicher beim Besuch von Gaststätten geregelt werden soll, lassen sich hingegen als Distraktoren erkennen und als falsche Antworten ausschließen (vgl. Jordan 2011: 170).

210

Alexandra Eberhardt

Die Items wurden nicht speziell für einen Beruf oder eine Berufsgruppe konzipiert, was bedeutet, dass keine speziellen fachlichen Inhalte berücksichtigt werden. Es wurden vielmehr die spezifischen Anforderungen beim Lesen in beruflichen Handlungskontexten abgebildet und die jeweiligen Leseanlässe und Textformate berücksichtigt. Berufsbezogene Lesesituationen wurden durch die unterschiedlichen Textgattungen und Repräsentationsformate sowie die in beruflichen Handlungskontexten häufig auftretenden gemischten Textformate vorgegeben (vgl. Balkenhol 2016: 148, 226). So werden Instruktionstexte wie Betriebsanleitungen, gesetzliche Texte, aber auch nicht-lineare oder depiktionale Textformen wie Hypertexte, Tabellen oder Diagramme in den Blick genommen. Eine zentrale Funktion des Lesens in beruflichen Handlungskontexten ist das Nutzen von Informationen, um bestimmte Aufgaben erledigen zu können (vgl. Balkenhol 2016: 28–30, 143, 146). Das diagnostische Verfahren zur Erfassung der Lesekompetenz für Auszubildende in gewerblich-technischen, medizinisch pflegenden und kaufmännisch-verwaltenden Berufsfeldern soll in einem kurzen Zeitrahmen ein Kompetenzniveau abbilden und vergleichbar machen. Mehrsprachigkeit wird bei diesem Verfahren nicht explizit berücksichtigt, durch die adaptive Konstruktion erfährt lediglich das sprachliche Niveau des Probanden/der Probandin eine Berücksichtigung. Vorzüge und ggf. Nachteile des Verfahrens werden jedoch erst nach seinem Einsatz genauer beschreibbar sein.

3.2.2 Weitere Sprachtests Teilfertigkeitstests auf Grundlage des C-Test-Formates Ein gut erforschtes Testinstrument zur Sprachstandsmessung ist der C-Test; er wird zur Ermittlung der allgemeinen sprachlichen Kompetenz eingesetzt (vgl. z. B. Grotjahn 2006 oder Baur, Grotjahn & Spettmann 2006: 389, vgl. auch Grotjahn in diesem Band). In kurzen authentischen Texten werden Wortbestandteile getilgt, die von den Probanden ergänzt werden müssen, um den jeweiligen Text zu rekonstruieren. Je höher dabei die sprachliche Kompetenz ist, desto besser kann der Test gelöst werden. Der C-Test ist ein schriftlicher Test, der Lese- und Schreibfähigkeiten der getesteten Personen voraussetzt. Er besitzt laut Autoren eine hohe Objektivität, Reliabilität und Validität und lässt sich ökonomisch durchführen und auswerten, was gerade bei großen Kohorten zum Tragen kommt. Er stellt somit ein praktikables Instrument zur Sprachstandsmessung dar (vgl. Baur, Grotjahn & Spettmann 2006: 389–390). Dies ist gerade mit Blick auf den schulischen Kontext von Bedeutung. Es ist jedoch zu beachten, dass das Ergebnis eines C-Tests keine direkten Rückschlüsse auf Schwierigkeiten in einzelnen Fertigkeitsbereichen zulässt. In der beruflichen Bildung bieten sich unterschiedliche Einsatzmöglichkeiten auf der Grundlage des C-Test-Formats an. Neben der Überprüfung allgemeinsprachlicher Kompetenz nach

Sprachdiagnostik für den Beruf

211

dem klassischen C-Test-Prinzip können teilfertigkeitsorientierte Tests eingesetzt werden. Baur & Spettmann (2010: 438) weisen auf verschiedene Verfahren hin: Teilfertigkeits-Tests (TF-Tests) ermöglichen es, entsprechend ihrer Tilgungsart, sprachliche Fähigkeiten gezielter zu überprüfen. Um den allgemeinsprachlichen Wortschatz zu testen, wird bei jedem dritten Wort die vordere Hälfte getilgt, welche die lexikalisch-semantischen Informationen enthält. Die morphologischen und grammatischen Informationen bleiben damit bewusst unangetastet. Es können alternativ auch Texte aus einem ausgewählten fachsprachlichen Kontext eingesetzt werden, was die Überprüfung des bildungs- und fachsprachlichen Wortschatzes der Lerner*innen ermöglicht. Im Falle eines Teilfertigkeitstests zum Fachwortschatz kann es erforderlich sein, vom herkömmlichen Tilgungsprinzip abzuweichen, um die Wortstämme des jeweiligen fachbezogenen Wortschatzes zu tilgen. Diese Art der Manipulation von Fachtexten kann unter Umständen zu längeren Textpassagen führen als im herkömmlichen C-Testformat (vgl. Baur, Grotjahn & Spettmann 2006: 397). Hier lässt sich einwenden, dass damit im Grunde das C-Test-Prinzip der reduzierten Redundanz unterlaufen wird. Es handelt sich bei den Tests zwar noch immer um Lückentexte, aber um keine C-Tests im eigentlichen Sinne mehr. In grammatischen Teilfertigkeitstests lassen sich gezielt ausgewählte grammatische Phänomene wie beispielsweise die Verbalmorphologie oder Nominalphrasen überprüfen, indem ihre Indikatoren getilgt werden. Baur, Grotjahn und Spettmann (2006: 398) weisen darauf hin, dass die Teiltests zum Überprüfen grammatischer Kompetenzen von Zweitsprachlerner*innen stets nur ein grammatisches Phänomen behandeln sollten. Je nach Konstruktionsart der Lückentexte können die allgemeine Lesekompetenz, das Textverständnis zu bestimmten Themen, der Fachwortschatz oder grammatische Kompetenzen in Morphologie und Syntax erhoben werden (vgl. Baur, Grotjahn & Spettmann 2006: 392). Baur, Mashkovskaya und Spettmann (2010) haben im Rahmen einer Studie einen C-Test für das Berufskolleg entwickelt und in einem Pilottest zur Sprachdiagnose erprobt. Dieser spezielle C-Test setzt sich aus allgemeinsprachlichen sowie berufsspezifischen und damit fachsprachlichen Teiltests zusammen. Sie kommen zu dem Schluss, „dass der C-Test adressatenspezifisch konstruiert auch als Sprachdiagnoseinstrument im Berufskolleg einsetzbar ist.“ (Baur, Mashkovskaya & Spettmann 2010: 35) Die Autor*innen weisen darauf hin, dass sowohl das jeweilige Ausbildungsjahr als auch die unterschiedlichen Berufsgruppen in den fachsprachlich ausgerichteten Teiltests berücksichtigt werden sollten (vgl. Baur, Mashkovskaya & Spettmann 2010: 36). Der Einsatz von Materialien auf der Grundlage des C-Test-Formats ermöglicht auch die Förderung von Lese- und Texterschließungsstrategien (vgl. Baur, Grotjahn & Spettmann 2006: 391) und kann somit in beruflichen Kontexten zum Einsatz kommen. Ein großer Vorteil beim Einsatz des TF-Tests ist, dass die Texte selbständig ausgewählt und somit thematisch und vom Niveau her genau für die Zielgruppe angepasst werden können. Es lassen sich damit Texte aus beruflich relevanten

212

Alexandra Eberhardt

Handlungszusammenhängen in das Testformat einbringen. Eine Testvariante, die gezielt sprachliche Teilfertigkeiten überprüft, stellt sich somit als eine sinnvolle Möglichkeit für die berufliche Bildung dar. Andere Tests zur Sprachstandsdiagnose nehmen mehrere Kompetenzbereiche in den Blick. So finden mündliche und schriftliche sowie produktive und rezeptive Fertigkeiten ihre Berücksichtigung, zum Teil mit unterschiedlich starker Gewichtung. Es gibt Bausteine mit einem Schwerpunkt auf dem Wortschatz oder morphosyntaktischen Kompetenzen; berufliche Zusammenhänge werden beispielsweise anhand ausgewählter Themen sowie relevanter Textsorten oder Diskursarten berücksichtigt.

Texteasy 5.0 Für den Kontext der beruflichen Bildung ist weiterhin der standardisierte Test Texteasy 5.0 zur Feststellung der Sprachkompetenz im Deutschen zu nennen. Er wurde im Modellprojekt „Integrierte Sprachförderung in Berufsvorbereitung und Ausbildung – SPAS“ erarbeitet. Das Modellprojekt begann 2006 und wurde von der Gesellschaft für Berufsbildende Maßnahmen e.V. (GFBM) durchgeführt. Die wissenschaftliche Begleitung erfolgte durch das Institut für berufliche Bildung und Weiterbildung e.V. (IBBW); gefördert wurde es durch die Berliner Senatsverwaltung für Bildung, Wissenschaft und Forschung sowie den Europäischen Sozialfonds (vgl. Fachbriefe Nr. 4 und Nr. 6 Durchgängige Sprachbildung/Deutsch als Zweitsprache des Bildungsservers von Berlin-Brandenburg). Inzwischen wird das Berliner Sprachförderkonzept SPAS auch in anderen Bundesländern eingesetzt. Das Verfahren Texteasy dient der Sprachstandsfeststellung für Jugendliche und junge Erwachsene in der Übergangphase zwischen Schule und Berufsausbildung. Die Hauptzielgruppe stellen Personen mit Migrationshintergrund dar. Das Vorhaben des Modellprojektes, berufsfeldbezogene Sprachförderprojekte durchzuführen, setzt die Kenntnis des individuellen Sprachstandes der Probanden voraus, weshalb dieses Instrument entwickelt wurde. Es handelt sich um einen standardisierten Test, der sowohl in Gruppen als auch mit Einzelpersonen durchgeführt werden kann. Die Testdauer wird mit etwa einer Stunde für den schriftlichen Teil angegeben, ungefähr zehn Minuten für den mündlichen Teil und für die Auswertung weitere zehn Minuten pro Prüfungsbogen (vgl. Gesellschaft für berufsbildende Maßnahmen o. J. a: 6, 28–29). Der Test besteht aus einem schriftlichen und einem mündlichen Teil. Im schriftlichen Teil werden das Hör- und Leseverständnis sowie die Schreibkompetenzen abgeprüft; dies erfolgt in der Gruppe. Im mündlichen Teil geht es um die Narration einer Bildergeschichte und einen Dialog; dieser Testteil ist dazu vorgesehen, im Einzelgespräch durchgeführt zu werden (vgl. Gesellschaft für berufsbildende Maßnahmen o. J. a: 29–30). Die vier sprachlichen Teilfertigkeiten Sprechen, Hörverstehen, Lesen und Schreiben werden in diesem Verfahren berücksichtigt. Mit der thema-

Sprachdiagnostik für den Beruf

213

tischen Wahl einer Suche nach einem Praktikumsplatz in der Hör- und Leseverstehensaufgabe sowie in der Schreibaufgabe ist der berufliche Zusammenhang gewährleistet. Bei den Themen „Picknick am See“, „Discoverabredung“ oder der Wortschatzaufgabe zum Thema „Reisen“ hingegen spielt der Kontext der beruflichen Bildung keine Rolle. Hinzu kommt, dass die Wahl der abgeprüften Textsorten ebenfalls nicht durchgängig in beruflich relevanten Zusammenhängen begründbar ist. Die Auswertung orientiert sich an linguistischen Kriterien wie Kohärenz, Kohäsion, Wortwahl sowie Morphosyntax (vgl. Gesellschaft für berufsbildende Maßnahmen o. J. b: Texteasy 5.0, Testheft für Schüler*innen). Die Testergebnisse werden für jeden Aufgabenteil in eine Ergebnistabelle eingetragen, welche die Einzelergebnisse im Verhältnis zu einer maximal erreichbaren Punktzahl abbildet sowie eine Gesamtpunktzahl für den gesamten Test. Am Ende des Tests erfolgt eine Zuordnung in die Kategorien „kein Förderbedarf“, „Beobachtungsbedarf“ bzw. „dringender Förderbedarf“. Die sich daran anschließenden Sprachförderprojekte beziehen sich auf konkrete Qualifizierungsbausteine in der Berufsvorbereitung sowie auf Lernfelder in Berufsfeldern wie beispielsweise Handwerk, Gastronomie oder Gesundheit. Diese Projekte sollen im Fachunterricht im Sinne einer integrierten Sprachförderung umgesetzt werden. Ausgewählt wurden vor allem Berufsfelder, in denen Personen mit Migrationshintergrund stark vertreten sind (vgl. Gesellschaft für berufsbildende Maßnahmen o. J. a: 5–6, 9). Ein Zugang zu den Sprachförderprojekten soll auf einer Onlineplattform möglich werden. Zum gegenwärtigen Zeitpunkt findet man vereinzelte Sprachförderbausteine im Internet 6 sowie Projektbeispiele am Ende der Broschüre, in der das Modellprojekt vorgestellt wird.

VERA-8 Wenn Sprachkompetenzen eingeschätzt werden sollen, kommen unter Umständen auch Materialien dafür in Betracht, die für andere Schulformen und Jahrgangsstufen entwickelt worden sind. Im Kontext der beruflichen Bildung kann es bei der heterogenen Zielgruppe angebracht sein, (Teil-) Kompetenzen mit Hilfe von Verfahren zu überprüfen, welche für andere Schulformen konzipiert sind. Hier ist VERA-8 zu nennen, welches in schriftlichen Tests beispielsweise Kompetenzen im Fach Deutsch erhebt. Dieses Instrument findet an einigen Berufskollegs Verwendung, weshalb es hier aufgrund seiner Möglichkeiten exemplarisch behandelt wird. Es handelt sich um Vergleichsarbeiten oder Lernstandserhebungen für die 8. Jahrgangsstufe. Diese sind vom Institut zur Qualitätsentwicklung im Bildungswesen in

6 Exemplarisch sei hier auf einen Sprachförderbaustein zur Produktherstellung im Textilbereich verwiesen: http://gfbm.de/wp-content/uploads/SPAS_Sprache_alles_dreht_sich_um_Sprache_GFBM_ SWI_Extrakt.pdf (31. 08. 2016).

214

Alexandra Eberhardt

Berlin entwickelt worden und werden bundesweit durchgeführt. Die Aufgaben im Fach Deutsch orientieren sich an den allgemeinen Bildungsstandards und enthalten Bausteine in den Kompetenzbereichen Leseverstehen, Zuhören, Schreiben und Sprache und Sprachgebrauch untersuchen und Rechtschreibung. Für jeden neuen Testdurchgang werden neue Aufgaben von Lehrkräften entwickelt, erprobt und in Testheften zusammengestellt. In der Regel führen die Lehrkräfte das Verfahren durch (vgl. Institut zur Qualitätsentwicklung im Bildungswesen). Im Kontext der beruflichen Bildung lassen sich einzelne Bausteine oder auch nur Teile daraus gut einsetzen, die dem jeweiligen Bedarf entsprechen. Man kann beispielsweise im dualen System mit der Version A für die Hauptschule beginnen, je nach Leistungsstärke der Gruppe auch mit Testaufgaben aus VERA-8 RS für Realschulen. Es lassen sich aus dem jeweiligen Übungsbuch einzelne Bausteine auswählen, die man gezielt einsetzen möchte. In dem Kompetenzbereich Leseverstehen findet man sowohl Sachtexte als auch nicht-lineare Texte wie unterschiedliche Diagramme und Tabellen, was die berufsschulische Praxis gut abbildet. Im Bereich Schreiben eignen sich die Textsorten Bericht sowie die Stellungnahme. In den einzelnen Kompetenzbereichen finden sich ganz unterschiedliche Aufgabentypen, wie Zuordnungsaufgaben, Multiple-Choice, Formulieren eigener Sätze oder das Bestimmen von Wortarten oder Satzteilen und dergleichen mehr. Im Anhang findet man Lösungsvorschläge und hilfreiche Hinweise (vgl. VERA-8 2016). Die geschlossenen, offenen und halboffenen Aufgabenformate erfassen die Schülerleistungen unterschiedlicher sprachlicher Modalitäten. Dieses Verfahren ermöglicht es, eine Momentaufnahme der sprachlichen Kompetenzen auf der Grundlage der Bildungsstandards zu erheben. Es ist ebenfalls möglich, durch ein wiederholtes Durchführen des Testverfahrens (oder einzelner Aufgaben daraus) eine individuelle Entwicklung des Lernfortschrittes abzubilden. Das Instrument VERA-8 ist inzwischen erprobt und validiert und berücksichtigt bundesweite Qualitäts- und Bildungsstandards (vgl. auch: Bayerisches Staatsministerium für Unterricht und Kultus und Staatsinstitut für Schulqualität und Bildungsforschung München 2012: 44).

3.2.3 Sprachtests kommerzieller Anbieter Die folgenden beiden Verfahren, die telc-language tests sowie BULATS Deutsch-Test für den Beruf, sind kommerzielle Tests, die nicht ohne weiteres an Schulen durchführbar sind, sondern für die man meist spezielle Prüfungszentren aufsuchen muss. Beide Anbieter bieten jedoch deutsche Sprachprüfungen für den beruflichen Bereich an. Sprachprüfungen der telc GmbH Die telc GmbH bietet eine Reihe von Sprachtests an. Es handelt sich um eine Tochtergesellschaft des Deutschen Volkshochschulverbandes, welche Europäische Spra-

Sprachdiagnostik für den Beruf

215

chenzertifikate anbietet, die sich am GER orientieren. Die telc und ihre Vorläuferorganisationen bieten seit einigen Jahrzehnten Sprachtests und Nachweise über Sprachkenntnisse an. Einige der Sprachprüfungen berücksichtigen sprachliche Kompetenzen für den beruflichen Bereich. Es handelt sich um standardisierte Sprachtests, zu denen man Übungstests auf den verschiedenen Niveaustufen einsehen kann (vgl. www.telc.net). Die Sprachprüfungen von telc liegen in zehn Sprachen auf allen Kompetenzstufen des GER vor. Es existieren bereits über 80 standardisierte Sprachprüfungen in allgemein- sowie in berufssprachlichen Testformaten. Die Fertigkeiten Lesen, Hören, Schreiben und Sprechen werden getestet in Anlehnung an den handlungsorientierten Ansatz des GER. Die Sprachprüfungen müssen in einem Prüfungszentrum abgelegt werden; das jeweils nächstgelegene lässt sich unter www.telc.net in Erfahrung bringen (vgl. telc gGmbH 2015:3 sowie http://www.telc.net). Die Kosten für die Teilnahme an einem Sprachtest variieren je nach Einstufungsniveau und können zwischen 40 und 140 Euro liegen (vgl. http://www.europaeischer-referenzrahmen.de/ telc.php). Für den beruflichen Bereich gibt es Prüfungen auf den Niveaus A2, B1, B2 und C1. Ab dem 31. August 2016 gibt es neue Prüfungen für telc Deutsch B1-B2 Beruf. Das Testformat telc Deutsch B2+ Beruf besteht beispielsweise aus einem schriftlichen und einem mündlichen Teil. Die Untertests des schriftlichen Teils behandeln das Leseverstehen, Schreiben, Hörverstehen und ein weiterer widmet sich Sprachbausteinen aus dem Bereich Wortschatz und Morpho-Syntax. Der Prüfungsteil zum Schreiben erfährt bei der berufsorientierten Sprachprüfung eine stärkere Gewichtung als die anderen Prüfungsteile (vgl. telc gGmbH 2015: 40). Der mündliche Teil gliedert sich in vier Teile: eine Einleitung, in der der Prüfling über sich selbst spricht (dieser Teil fällt nicht unter die Bewertung), sowie die Teile Präsentieren, Diskutieren und Verhandeln (vgl. telc gGmbH 2015: 5, 24). Die Themen der schriftlichen Prüfungsteile stammen aus beruflichen Zusammenhängen. In dem Test telc Deutsch B2+ Beruf kommen die Themen der Prüfungsmaterialien beispielsweise aus dem Kontext des Handwerks, aus kaufmännischen Zusammenhängen oder dem Gesundheitswesen. In dem Test werden beruflich relevante Textsorten wie E-Mails, kurze Mitteilungen und Geschäftsbriefe herangezogen. Die Testdauer liegt für den telc Deutsch B2+ Beruf-Test bei insgesamt etwa dreieinhalb Stunden. Der schriftliche Teil ist ein Gruppentest, der mündliche Teil erfolgt mit einem anderen Prüfling zusammen (vgl. telc gGmbH 2015: 43). Ein Lösungsschlüssel für die Prüfer*innen ermöglicht eine objektive Auswertung der Tests. Die Bewertungskriterien für die Sprachprüfungen werden im Anhang an die Übungstests illustriert, was für eine gute Transparenz sorgt. BULATS Deutsch-Test für den Beruf Das Goethe-Institut bietet ebenfalls ein berufsbezogenes Testverfahren an: Mit BULATS (Business Language Testing Service) werden sprachliche Fertigkeiten im

216

Alexandra Eberhardt

Bereich Hören, Lesen, Wortschatz und Grammatik getestet, die am Arbeitsplatz benötigt werden. Der Test basiert auf den Niveaustufen des GER. BULATS ist ein computerbasiertes Verfahren, welches den individuellen Sprachstand feststellt. Es handelt sich zudem um ein adaptives Verfahren, das auf der Grundlage der vorherigen Antwort die folgende Aufgabe auswählt und sich somit an das Sprachniveau des Probanden anpasst. Die Testdauer wird mit 60–90 Minuten angegeben. Im Anschluss an den Test liegen das Ergebnis und eine Beschreibung des Sprachniveaus vor. Informationen zu Preisen und Prüfungsorten finden sich auf den Internetseiten des Goethe-Instituts (https://www.goethe.de/de/spr/kup/prf.html). Es wird die berufsorientierte Kommunikation getestet, ohne auf Fachkenntnisse eines speziellen Berufes zurückzugreifen. An Aufgabentypen gibt es beispielsweise Multiple-Choice-Aufgaben, Lückentexte sowie Sätze, die es zu vervollständigen gilt. Es werden unterschiedliche Textsorten berücksichtigt wie Berichte, Diagramme, Briefe, E-Mails, Notizen, Zeitungsausschnitte (vgl.: https://www.goethe.de/de/spr/ kup/prf/prf/bulats.html). Dieses Verfahren bietet sich beispielsweise für Unternehmen an, die die Sprachkenntnisse ihrer Bewerber oder Mitarbeiter erheben möchten. Ein weiteres Verfahren eines kommerziellen Anbieters ist das Diagnoseverfahren gutschrift – Diagnostik der Schriftkompetenz vom Löffler Institut (gutschrift | Referenzzentrum für Diagnostik der Schriftkompetenz) (vgl. Löffler, Adlung & Poelke 2008 und Poelke 2015). Es nimmt schriftsprachliche Kompetenzen vor allem im Bereich der Orthographie in den Blick. Nach einer Diagnose über einen internetbasierten Test erhalten die Lehrkräfte Informationen über den Leistungsstand und individuellen Förderbedarf ihrer Schüler*innen. Den Lehrkräften werden im Anschluss in Form von Handreichungen Übungsbögen für ihre Schüler*innen zur Verfügung gestellt. Bei diesem Verfahren liegt eine Fokussierung auf die Orthographie vor, welche sich gut erheben lässt, jedoch für Kompetenzen im beruflichen Bereich auch nur eine bedingte Aussagekraft besitzt. Es zeichnet sich keine besondere Berücksichtigung beruflicher Zusammenhänge ab, daher wird dieses Verfahren hier nicht weiter behandelt. Außerdem ist die Informationslage zu seiner Fundierung dürftig und lässt sich schwer einschätzen, zumal der internetbasierte Test nicht eingesehen werden kann.

4 Desiderata Die aktuelle Verfahrenslage für den beruflichen Bereich zeigt sich in diesem Beitrag mit ganz unterschiedlichen Instrumenten: Es wurde eine Profilanalyse, zwei Beobachtungen, drei Lesekompetenztests, der C-Test, zwei weitere allgemeinsprachliche Tests (teilweise mit beruflicher Orientierung) sowie kommerzielle Testangebote vorgestellt. Der Bezug zu einem Beruf kann ganz konkret sein (ein C-Test für Tischler, Köche etc.) bzw. übergreifend, wie einige Verfahren mit der Wahl arbeitsrechtli-

Sprachdiagnostik für den Beruf

217

cher Texte zeigen. Nicht immer werden überhaupt Themen oder Textsorten aus dem beruflichen Bereich herangezogen. Die Berücksichtigung beruflich relevanter Sprachhandlungen sowie der Umgang mit bestimmten Textsorten und Formaten haben sich als wichtige Merkmale für eine Sprachstandsdiagnose in beruflichen Kontexten herausgestellt. Ein Instrument muss in erster Linie jedoch praktikabel für den schulischen Kontext, für die zeitliche und organisatorische Aufteilung in die Lernorte Schule und Betrieb sein, um angenommen zu werden. Auch das Erfordernis testtheoretischer oder fundierter linguistischer Kenntnisse seitens der Lehrkräfte kann hinderlich für die Akzeptanz eines Instrumentes sein. Die äußerst heterogene Zielgruppe in der beruflichen Bildung stellt besondere Anforderungen an Instrumente zur Sprachstandsermittlung. So sind Testverfahren, die sprachliche Kompetenzen in ihrer ganzen Breite abprüfen und zusätzlich noch einen Bezug zu beruflich relevanten Sprachhandlungen aufweisen, vermutlich auch in Zukunft schwer zu erstellen. Es ist eher angebracht, für eine Sprachstandsdiagnostik einzelne Module zu den sprachlichen Kompetenzen Leseverstehen, Schreiben, Sprechen und Hörverstehen flexibel einzusetzen und gegebenenfalls miteinander zu kombinieren. So können Erfordernisse aus konkreten beruflichen Handlungsfeldern berücksichtigt und einzelne sprachliche Teilkompetenzen gezielt überprüft werden. Dieses Vorgehen entspricht eher dem Bedarf eines praxisorientierten Bereiches, der mit wenig Zeit und Ressourcen für eine zielgerichtete sprachliche Erhebung und Förderung auskommen muss. Ein weiteres Desiderat stellen möglichst konkrete Handlungsanweisungen für die Lehrkräfte dar. Ohne anschließende Förderbausteine ist die Annahme eines Diagnoseinstrumentes fraglich. Hier ist eine Einbindung in Qualifizierungsbausteine oder Lernfelder denkbar, um fächerübergreifend Sprachkompetenzen auf- und auszubauen. Einige adaptive Verfahren berücksichtigen den Sprachstand der Probanden, was jedoch der Gruppe der Zweitsprachlerner*innen nicht immer gerecht wird. Die in diesem Beitrag behandelten Verfahren zur Sprachstandsdiagnose für den Beruf berücksichtigen die Gruppe der Mehrsprachigen in unterschiedlichem Ausmaß. Die FörMig-Instrumente Bumerang, die Niveaubeschreibungen sowie die Prozessbegleitende Diagnose der Schreibentwicklung sind explizit für diese Zielgruppe erstellt worden. Die Tests von telc und BULATS richten sich an die Gruppe der Mehrsprachigen; der Lesetest LTB-3 bietet Normwerte für Mehrsprachige. Auch das Verfahren Texteasy 5.0 gibt junge Erwachsene mit Migrationshintergrund als Hauptzielgruppe an; entscheidend ist jedoch im Hinblick auf die Testgütekriterien, dass es eine eigene Norm für Mehrsprachige gibt. Dieser Aspekt ist im Hinblick auf diese Gruppe ein zentrales Kriterium für ein Diagnoseverfahren. Der hier aufgezeigte Weg, bedarfsgerecht einzelne Kompetenzbereiche aus beruflichen Zusammenhängen zu kombinieren und abzuprüfen, soll die Belange der beruflichen Bildung stärker berücksichtigen. Instrumente, die eine verlässliche Auskunft über den ermittelten Sprachstand von Testpersonen in der beruflichen Bildung geben sollen, setzen nichtsdestotrotz eine angemessene sprachwissenschaftli-

218

Alexandra Eberhardt

che und testtheoretische Fundierung voraus. Erst auf der Grundlage zuverlässiger Sprachstandserhebungen sind zielführende Maßnahmen zur Gestaltung von Sprachförderung und Sprachbildung möglich.

Literatur Balkenhol, Aileen (2016): Lesen in beruflichen Handlungskontexten. Anforderungen, Prozesse und Diagnostik. Darmstadt. Baur, Rupprecht S., Rüdiger Grotjahn & Melanie Spettmann (2006): Der C-Test als Instrument zur Sprachstandserhebung und Sprachförderung. In Johannes-Peter Timm (Hrsg.), Fremdsprachenlernen und Fremdsprachenforschung: Kompetenzen, Standards, Lernformen, Evaluation, 389–406. Tübingen: Narr. Baur, Rupprecht S. & Melanie Spettmann (2010): Sprachstandsmessung und Sprachförderung mit dem C-Test. In Bernt Ahrenholz & Ingelore Oomen-Welke (Hrsg.), Deutsch als Zweitsprache. Deutschunterricht in Theorie und Praxis, Band 9, 430–44. Baltmannsweiler: Schneider Verlag Hohengehren. Baur, Rupprecht S., Anna Mashkovskaya & Melanie Spettmann (2010): Der C-Test als Instrument zur Ermittlung allgemeinsprachlicher und fachsprachlicher Fähigkeiten im Berufskolleg. In Annette Berndt & Karin Kleppin (Hrsg.), Sprachlehrforschung: Theorie und Empirie, 23–38. Festschrift für Rüdiger Grotjahn. Frankfurt a. M.: Peter Lang. Brinker, Klaus, Hermann Cölfen & Steffen Pappert (2014): Linguistische Textanalyse. Eine Einführung in Grundbegriffe und Methoden. 8., neu bearbeitete und erweiterte Auflage. Berlin: Erich Schmidt. Bayerisches Staatsministerium für Unterricht und Kultus und Staatsinstitut für Schulqualität und Bildungsforschung München (Hrsg.) (2012): Berufssprache Deutsch. Handreichung zur Förderung der beruflichen Sprachkompetenz von Jugendlichen in der Ausbildung. München. Becker-Mrotzek, Michael & Rebecca Drommler (2006): Texte lesen. In Michael Becker-Mrotzek, Erhard Kusch & Bernd Wehnert, Leseförderung in der Berufsbildung. Kölner Beiträge zur Sprachdidaktik, 17–44. Reihe A, Duisburg: Gilles und Francke, herausgegeben von Günther, Hartmut, Ursula Bredel & Michael Becker-Mrotzek. Biedebach, Wyrola (2006): Der Modellversuch „Vocational Literacy (VOLI) – Methodische und sprachliche Kompetenzen in der beruflichen Bildung“. Konzeption – Erfahrungen – bisherige Ergebnisse. In Christian Efing & Nina Janich (Hrsg.), Förderung der berufsbezogenen Sprachkompetenzen. Befunde und Perspektiven, 15–31. Paderborn: Eusl-Verlagsgesellschaft. Brinker, Klaus, Hermann Cölfen & Steffen Pappert (2014): Linguistische Textanalyse. Eine Einführung in Grundbegriffe und Methoden. Berlin: Schmidt. Bundesministerium für Bildung und Forschung (Hrsg.) (2016): Berufsbildungsbericht 2016. Bonn, Berlin. https://www.bmbf.de/pub/Berufsbildungsbericht_2016.pdf (29. 07. 2016). Bundesministerium für Migration und Flüchtlinge (Hrsg.) (2008): Ergebnisbericht: Sprachliche Bildung für Menschen mit Migrationshintergrund in Deutschland. Ergebnisbericht der Arbeitsgruppen des Bundesweiten Integrationsprogramms nach § 45 Aufenthaltsgesetz im Handlungsfeld sprachliche Bildung. http://www.bamf.de/SharedDocs/Anlagen/DE/ Publikationen/Broschueren/ErgebnBericht_SprachBildung.pdf?__blob=publicationFile (29. 07. 2016). Dirim, Inci & Marion Döll (2009): ‚Bumerang‘ – Erfassung der Sprachkompetenzen im Übergang von der Schule in den Beruf – vergleichende Beobachtungen zum Türkischen und Deutschen am Beispiel einer Schülerin. In Drorit Lengyel, Hans H. Reich, Hans-Joachim Roth & Marion

Sprachdiagnostik für den Beruf

219

Döll (Hrsg.), Von der Sprachdiagnose zur Sprachförderung, 139–146. Münster u. a.: Waxmann. Döll, Marion (2009): Beobachtungen und Dokumentation von Kompetenz und Kompetenzzuwachs im Deutschen als Zweitsprache mit den Niveaubeschreibungen DaZ. In Drorit Lengyel, Hans H. Reich, Hans-Joachim Roth & Marion Döll (Hrsg.), Von der Sprachdiagnose zur Sprachförderung. (= FörMig Edition Band 5.), 110–114. Münster u. a.: Waxmann. Drommler, Rebecca, Markus Linnemann, Michael Becker-Mrotzek, Hilde Haider, Tobias Stevens & Judith Wahlers (2006): Lesetest für Berufsschüler/innen LTB-3 Handbuch. In Michael BeckerMrotzek, Ursula Bredel & Hartmut Günther (Hrsg.), KÖBES Kölner Beiträge zur Sprachdidaktik, Reihe A, Duisburg: Gilles & Francke. Drommler, Rebecca, Markus Linnemann, Michael Becker-Mrotzek, Hilde Haider, Tobias Stevens & Judith Wahlers (2007): Lesetest für Berufsschüler/innen. Testheft, In Michael BeckerMrotzek, Ursula Bredel & Hartmut Günther (Hrsg.), KÖBES Kölner Beiträge zur Sprachdidaktik, Reihe A, Duisburg: Gilles & Francke. Eberhardt, Alexandra (2016): Sprachlich heterogene Gruppen in der beruflichen Bildung: Eine gemeinsame Sprachförderung durch Fach- und Deutschlehrkräfte am Berufskolleg. Die berufsbildende Schule (BbSch) 68 7/8, 248–254. Efing, Christian (2008): Kontinuierliche und individuelle Diagnose der Lesekompetenz von BerufsschülerInnen mit dem „Baukasten Lesediagnose“. bwp@ Berufs- und Wirtschaftspädagogik – online, Spezial 4, 1–19. http://www.bwpat.de/ht2008/ft17/efing_ ft17-ht2008_spezial4.pdf (14. 07. 2016). Efing, Christian & Nina Janich (Hrsg.) (2006): Förderung der berufsbezogenen Sprachkompetenzen. Befunde und Perspektiven. Paderborn: Eusl-Verlagsgesellschaft. Ehlich, Konrad (2005): Sprachaneignung und deren Feststellung bei Kindern mit und ohne Migrationshintergrund: Was man weiß, was man braucht, was man erwarten kann. In Konrad Ehlich in Zusammenarbeit mit Ursula Bredel, Brigitta Garme, Anna Komor, HansJürgen Krumm, Tim McNamara, Hans H. Reich, Guido Schnieders, Jan D. ten Thije, Huub van den Bergh: Anforderungen an Verfahren der regelmäßigen Sprachstandsfeststellung als Grundlage für die frühe und individuelle Förderung von Kindern mit und ohne Migrationshintergrund, 11–63. Bonn, Berlin. Gesellschaft für berufsbildende Maßnahmen e.V. (GFBM) (Hrsg.) (o. J. a): Integrierte Sprachförderung in Berufsvorbereitung und Berufsausbildung an berufsbildenden Schulen (SPAS). Berlin. Gesellschaft für berufsbildende Maßnahmen e.V. (GFBM) (Hrsg.) (o. J. b): Texteasy 5.0. Verfahren zur Sprachstandsfeststellung. Testheft für Schüler/-innen. Berlin. Gogolin, Ingrid, İnci Dirim, Thorsten Klinger, Imke Lange, Drorit Lengyel, Ute Michel, Ursula Neumann, Hans H. Reich, Hans-Joachim Roth & Knut Schwippert (2011): Förderung von Kindern und Jugendlichen mit Migrationshintergrund FörMig. Bilanz und Perspektiven eines Modellprogramms, 68–81. FörMig-Edition Bd. 7. Münster u. a.: Waxmann. Grotjahn, Rüdiger (Hrsg.) (2006): Der C-Test: Theorie, Empirie, Anwendungen. Frankfurt a. M. u. a.: Lang. Hessisches Kultusministerium, Institut für Qualitätsentwicklung (Hrsg.) (2006): Baukasten Lesediagnose. Wiesbaden. www.iq.hessen.de (03. 06. 2016). QB (Institut zur Qualitätsentwicklung im Bildungswesen): VERA / Lernstandserhebungen. http://www.iqb.huberlin.de/vera (02. 08. 2016). Jordan, Roland (2011): Entwicklung und Validierung eines Testverfahrens zur Ermittlung der Lesekompetenz und des mathematischen Textverständnisses mit empirischer Untersuchung an allgemeinbildenden und berufsbildenden Schulen. Münster: WTM-Verlag für wissenschaftliche Texte und Medien. Kusch, Erhard (2006): Problembeschreibung. In Michael Becker-Mrotzek Erhard Kusch & Bernd Wehnert: Leseförderung in der Berufsbildung. Kölner Beiträge zur Sprachdidaktik, 14–16.

220

Alexandra Eberhardt

Reihe A, Duisburg: Gilles und Francke, herausgegeben von Hartmut Günther Ursula Bredel & Michael Becker-Mrotzek. Lengyel, Drorit, Andreas Heintze, Hans H. Reich, Hans-Joachim Roth & Heidi Scheinhardt-Stettner (2009): Prozessbegleitende Diagnose zur Schreibentwicklung. Beobachtung schriftlicher Sprachhandlungen in der Sekundarstufe I. In Drorit Lengyel, Hans H. Reich, Hans-Joachim Roth & Marion Döll (Hrsg.), Von der Sprachdiagnose zur Sprachförderung. (= FörMig Edition Band 5), 131–138. Münster u. a.: Waxmann. Löffler, Ilona, Gerd Adlung & Klaus-Dieter Poelke (2008): Entwicklung der Schriftsprachkompetenz von Schülerinnen und Schülern an Berufskollegs. Implementierung eines individuellen Diagnose- und Fördersystems. die kaufmännische Schule, 3–9. Poelke, Klaus-Dieter (2015): Fünf Jahre Förderung der Schriftsprachkompetenz im Berufskolleg. Das individuelle Online-Diagnose- und Fördersystem hilft. Schule NRW 03/15. http:// www.zukunftsschulen-nrw.de/cms/upload/pdf/Frderung_Schriftsprachkompetenz.pdf (28. 07. 2016). Rauch, Dominique P., Martin Schastak & Katja Richter (2016): Diagnostik sprachlicher Kompetenzen bei Personen mit Migrationshintergrund. In Débora B. Maehler & Heinz Ulrich Brinkmann (Hrsg.), Methoden der Migrationsforschung, 97–133. Wiesbaden: Springer VS. Reich, Hans (2006): Sprachstandsmessungen bei Schülern und Schülerinnen, die Deutsch nicht als Muttersprache haben. In Ursula Bredel, Hartmut Günther, Peter Klotz, Jakob Ossner & Gesa Siebert-Ott (Hrsg.), Didaktik der deutschen Sprache. Ein Handbuch. 2. Teilband, 2. durchges. Aufl., 914–923. Paderborn (u. a.): Schöningh. Reich, Hans (2009): Aufbauende Sprachförderung unter Nutzung der FörMig-Instrumente. In Drorit Lengyel, Hans H. Reich, Hans-Joachim Roth & Marion Döll (Hrsg.), Von der Sprachdiagnose zur Sprachförderung. (= FörMig Edition Band 5), 25–33. Münster u. a.: Waxmann. Reich, Hans H., Hans-Joachim Roth & Marion Döll (2009): Fast Catch Bumerang – Auswertungshinweise, Schreibimpuls und Auswertungsbogen. In Drorit Lengyel, Hans H. Reich, Hans-Joachim Roth & Marion Döll (Hrsg.), Von der Sprachdiagnose zur Sprachförderung. (= FörMig Edition Band 5.), 207–241. Münster u. a.: Waxmann. Sächsisches Bildungsinstitut (Hrsg.) (2015): Niveaubeschreibungen Deutsch als Zweitsprache für die Sekundarstufe II. Radebeul. https://publikationen.sachsen.de/bdb/artikel/25525 (18. 04. 2016). Schmölzer-Eibinger, Sabine (2013): Sprache als Medium des Lernens im Fach. In Michael BeckerMrotzek, Karen Schramm, Eike Thürmann & Helmut Johannes Vollmer (Hrsg.), Sprache im Fach. Sprachlichkeit und fachliches Lernen, 25–40. Münster u. a.: Waxmann. Siebert-Ott, Gesa (2006): Mehrsprachigkeit und Bildungserfolg. In Georg Auernheimer (Hrsg.), Schieflagen im Bildungssystem. Die Benachteiligung der Migrantenkinder, 161–176. Wiesbaden: VS Verlag für Sozialwissenschaften. Stevens, Tobias & Judith Wahlers (2006): Entwicklung des Diagnose-Instruments zur Lesekompetenz. In Michael Becker-Mrotzek, Erhard Kusch & Bernd Wehnert: Leseförderung in der Berufsbildung. Kölner Beiträge zur Sprachdidaktik, Reihe A, 72–75. Duisburg: Gilles und Francke, herausgegeben von Günther, Hartmut, Ursula Bredel & Michael Becker-Mrotzek. telc gGmbH (Hrsg.) (2015): telc language tests. Übungstest 1. Deutsch Beruf. Prüfungsvorbereitung, 4. Auflage, Frankfurt am Main. www.telc.net, (25. 07. 2016). VERA-8 2016. Basiswissen und Übungsaufgaben mit Lösungen. Version A: Hauptschule. Stark Verlagsgesellschaft 2015. Ziegler, Birgit & Aileen Balkenhol (2016): Lesekompetenzdiagnostik – Anforderungen und Ansätze in der beruflichen Bildung. Die berufsbildende Schule (BbSch) 68 7/8, 255–261.

Raphaela Porsch und Heike Wendt

10 High-Stakes-Tests im Kontext von Migration 1 2 3 4 5

Einleitung Low- und High-Stakes-Tests Schritte der Entwicklung, Durchführung und Auswertung formeller Tests Beispiele von High-Stakes-Tests in Deutschland im Kontext von Migration Fazit

1 Einleitung Das Thema Migration steht nicht erst durch die verstärkte Zuwanderungsbewegung nach Deutschland der letzten Jahre im Fokus der Bildungspolitik und -forschung. Im Rahmen der Auswertung zu nationalen und internationalen Schulleistungsstudien werden beispielsweise regelmäßig Ergebnisse sprachlicher, aber auch mathematischer oder naturwissenschaftlicher Leistungen von Schülerinnen und Schülern mit Deutsch als Erstsprache im Vergleich zu denen, für die Deutsch die Zweit- oder Drittsprache darstellt, berichtet. Auch im Zusammenhang mit den sprachlichen Voraussetzungen von Jugendlichen und Erwachsenen ist für den Nachzug von Ehepartnerinnen bzw. -partnern, die Einbürgerung und den Zugang zum Studium das Thema, insbesondere mit Blick auf geeignete Testverfahren, von besonderer Bedeutung. Für den Kontext Schule lässt sich feststellen, dass vermehrt seit einigen Jahren im Rahmen zahlreicher Modellprojekte Konzeptionen und Materialien zur Förderung der Sprachkompetenzen von Kindern und Jugendlichen mit Migrationshintergrund sowie zur Professionalisierung von Lehrkräften und pädagogischen Fachkräften entwickelt und Projekte wissenschaftlich begleitet werden (vgl. z. B. Gogolin et al. 2011; Koch-Priewe & Krüger-Potratz 2016). Der folgende Beitrag legt seinen Schwerpunkt auf High-Stakes-Tests im Kontext von Migration. Dazu wird im ersten Schritt die Unterscheidung von Low- und HighStakes-Tests erläutert (Abschnitt 2). Anschließend wird die Entwicklung von Messinstrumenten nachvollzogen und auf besondere Anforderungen, die sich an HighStakes-Test im Kontext von Migration ergeben, hingewiesen (Abschnitt 3). Abschließend werden drei Beispiele für die Anwendung von High-Stakes Tests in Deutschland gegeben, die sich im Besonderen auf den Kontext von Migration beziehen (Abschnitt 4). Der Beitrag endet mit einem Fazit.

https://doi.org/10.1515/9783110418712-010

222

Raphaela Porsch und Heike Wendt

2 Low- und High-Stakes-Tests1 Tests sind „theoretisch und empirisch fundierte Verfahren zur kontrollierten Auslösung von diagnostisch relevantem Verhalten durch standardisierte Reize – mit dem Ziel eines Rückschlusses auf lernerseitige Kompetenzen und Wissensbestände“ (Grotjahn 2007: 8). Sie bestehen aus einer Sammlung von Items. Als Items „bezeichnet man die Bestandteile eines Tests, die eine Reaktion oder Antwort herrufen sollen, also die Fragen, Aufgaben, Bilder etc.“ (Rost 2004: 18). Diese Definition bezieht sich vor allem auf formelle bzw. standardisierte Tests im Sinne der pädagogischpsychologischen Diagnostik. Standardisiert meint in diesem Zusammenhang die Vereinheitlichung der Durchführung und Bewertung (vgl. Grotjahn 2007: 9), so dass man von einem objektiven Verfahren sprechen kann. Standardisiert wird regelmäßig auch synonym mit formell verwendet (vgl. Studer 2010: 1308). Solche Tests müssen zahlreiche Qualitätsmerkmale erfüllen wie die Einhaltung von Testgütekriterien, insbesondere die Hauptgütekriterien Objektivität, Reliabilität und Validität. Zu den Nebengütekriterien zählen Normierung, Vergleichbarkeit, Ökonomie und Nützlichkeit (vgl. z. B. Bühner 2006: 43–44). Informelle bzw. nicht standardisierte Testverfahren werden auch teacher made tests genannt. Zu ihnen werden Klassenarbeiten und andere von Lehrkräften entwickelte Aufgabensammlungen gezählt, welche der Überprüfung des Leistungsstandes oder/und -entwicklung ihrer Lernenden dienen. Für informelle Tests liegt keine Erprobung oder Normierung an einer Grundgesamtheit bzw. repräsentativen Stichprobe vor. Gütekriterien werden häufig nicht oder lediglich eingeschränkt erfüllt. Informelle Tests stellen jedoch einen wichtigen Bestandteil der schulischen Evaluation dar, da sie im Sinne eines formativen Assessment den Lernfortschritt erfassen und Informationen zur individuellen Förderung liefern. Leistungstests lassen sich nach dem Konstrukt klassifizieren bzw. nach dem, was mit dem Test gemessen werden soll. Danach unterscheidet man Intelligenztests bzw. Tests zur Überprüfung der allgemeinen Leistungsfähigkeit, Tests zur Erfassung der Kapazität des Arbeitsgedächtnisses wie Gedächtnistests und Verfahren zur Messung von Leistungen. Leistungstests sind für die Überprüfung von Wissen und Kompetenzen in verschiedenen Fachgebieten und Bereichen wie Naturwissenschaften, Sprachen oder Mathematik entwickelt worden. So können beispielsweise Sprachtests das allgemeine Sprachniveau erfassen, eine oder mehrere Teilkompetenzen (z. B. Hörverstehen) oder die Verfügbarkeit von spezifischen Sprachphänomenen (z. B. Verständnis der Pluralbildung im Deutschen). Formelle Tests sind „das Ergebnis eines sehr aufwändigen Testentwicklungsprozesses, zu dem verschiedene Erprobungsverfahren (u. a. Normierung an repräsentativen Stichproben) mit testmethodischer Auswertung zählen“ (Kniffka & Siebert-Ott 2012: 118). Sie sollten die verschiedenen Testgütekriterien zur Qualitätssicherung er-

1 Dieses Teilkapitel und Kapitel 3 basieren in Teilen auf Porsch (2014).

High-Stakes-Tests im Kontext von Migration

223

füllen, die sich auf die Inhalte und das Format der Items, die Durchführung des Tests und Auswertung der Antworten (vgl. Abschnitt 3 in diesem Beitrag) beziehen. Diese Anforderungen an Testverfahren sind von besonderer Bedeutung, wenn belastbare Aussagen über Lernende im Rahmen von Zertifizierungstests, Lernstandserhebungen, Schulleistungsuntersuchungen oder Forschungsarbeiten gewonnen werden sollen. Die gewonnenen Ergebnisse können für die einzelne Testperson von hoher oder eher geringer Bedeutung sein. Im Hinblick auf die Funktion von Tests kann danach zwischen Low- und High-Stakes-Tests unterschieden werden. Tests, die vorrangig Informationen zum Leistungsstand zum Zwecke der Diagnostik bzw. individuellen Förderung seitens von Lehrkräften oder der Qualitätssicherung/-entwicklung auf Systemebene von Akteuren der Bildungspolitik liefern und deren Ergebnisse keine Konsequenzen für das schulische, berufliche oder weitere lebensweltliche Fortkommen der einzelnen Teilnehmerinnen und Teilnehmer besitzen, werden als LowStakes-Tests bezeichnet. Diese Funktion erfüllen eindeutig Tests, die in internationalen Schulleistungsuntersuchungen wie dem Programme for International Student Assessment (PISA) oder der Trends in International Mathematics and Science Study (TIMSS), an denen auch Schülerinnen und Schüler in Deutschland regelmäßig teilnehmen (vgl. Köller & Schöps 2013 für einen Überblick). Diese Untersuchungen werden mit dem Ziel durchgeführt, international vergleichend zu ermitteln, inwieweit Schülerinnen und Schüler in der Lage sind, Aufgaben zu alltagsnahen Herausforderungen zu lösen. Sowohl in den Berichtsbänden internationaler, aber auch nationaler Studien wie den ausschließlich in Deutschland durchgeführten Ländervergleichen (z. B. Stanat et al. 2016) wird zusätzlich regelmäßig festgestellt, welchen Einfluss der Migrationshintergrund oder die Sprachsituation (Art und Anzahl der Gebrauchssprachen) der getesteten Schülerinnen und Schüler auf deren Leistungsniveau haben. High-Stakes-Tests sind dagegen solche, bei denen das Testergebnis in der Regel bedeutsame Konsequenzen für die einzelne Testperson hat. Beispiele sind der erfolgreiche Schulabschluss wie das Abitur als Voraussetzung für den Hochschulzugang oder für Schulen die Erhöhung der finanziellen Mittel im Folgejahr bei Leistungssteigerungen der Schülerinnen und Schülerinnen. Maßnahmen wie die Auszahlung von Boni für Lehrkräfte oder Sonderzahlungen für Schulen aufgrund der Ergebnisse aus Schulleistungstests werden jedoch in Deutschland bislang nicht angewandt. High-Stakes-Tests sind, begleitend von Diskussionen über deren Folgen, beispielsweise in den USA (z. B. Nichols & Berliner 2007; Madaus, Russell & Higgins 2009) und Japan (vgl. z. B. Bjork 2015) seit langer Zeit im schulischen Kontext verbreitet. High-Stakes-Tests müssen den Anforderungen an standardisierte bzw. formelle Tests genügen. Allerdings gilt das gleichermaßen für die aufgeführten Schulleistungstests, da sie die Grundlage für die Entscheidung über systemische Veränderungen darstellen. Schließlich ist die dargestellte Dichotomie – Low- vs. High-Stakes-

224

Raphaela Porsch und Heike Wendt

Tests – bei Betrachtung der Wirkung von Klassenarbeiten oder Klausuren diskutabel. Zum einen lässt sich dafür plädieren, dass auch bei der Verwendung von Verfahren zum summativen Assessment im schulischen Kontext die Einhaltung von Gütekriterien grundlegend anzustreben ist. Zum anderen lässt sich annehmen, dass beim Einsatz von Abschlussarbeiten (nach einer Unterrichtseinheit bzw. einem Kurs) die Funktion der Leistungsdokumentation und nicht die Lernförderung im Vordergrund steht. Vor diesem Hintergrund können mittel- und langfristig Ergebnisse aus solchen – in der Regel als Low-Stakes-Tests bezeichnete – Verfahren durch die Vergabe von Noten individuell zu Konsequenzen für die schulische Laufbahn führen. Ein Beispiel stellt die Vergabe der Schullaufbahnempfehlung in Deutschland dar. So erklären die Noten in den Fächern Deutsch, Mathematik, Sachunterricht und Englisch 77 Prozent der Unterschiede der Schullaufbahnpräferenzen von Grundschullehrkräften (Stubbe et al. 2016: 358). Noten aus informellen Tests wie Klassenarbeiten fließen zu einem hohen Anteil bei der Entscheidung über die Zeugnisnoten ein. Diese sind wiederum Grundlage für die Empfehlung der Lehrkräfte, in welcher Schulform Kinder nach der Grundschule lernen, was entscheidend ihre Bildungskarriere bzw. ihr berufliches Fortkommen beeinflusst. Eine Alternative für die begriffliche Einordnung bietet die – allerdings wenig verbreitete – Unterscheidung von Testfahren nach „dem Grad der stakes“ (Kühn 2010: 72) in low, middle und high stakes. Abschließend sei darauf hingewiesen, dass High-Stakes-Tests eine Vielzahl von unerwünschten Folgen, aber auch Vorteile haben können (vgl. Maag Merki 2016: 163–164). Mit der Durchführung von Schulleistungsstudien werden jedoch eine Vielzahl von erwünschten Wirkungen vermutlich nicht erreicht. Katharina Maag Merki (2016) vermutet, dass im deutschen Kontext vor allem der Wirkmechanismus Qualitäts-/Schulentwicklung über Einsicht bedeutsam ist, aber nicht Qualitäts-/Schulentwicklung über Wettbewerb oder Qualitäts-/Schulentwicklung über Konsequenzen, und „wenn überhaupt, low-stakes Konsequenzen mit starker Förderorientierung“ (Maag Merki 2016: 160).

3 Schritte der Entwicklung, Durchführung und Auswertung formeller Tests2 Low-Stakes-Tests können wie beschrieben informelle aber auch formelle Tests darstellen. Hingegen kann man davon ausgehen, dass an High-Stakes-Tests aufgrund ihrer Funktion hohe Anforderungen im Hinblick auf eine Standardisierung bzw. Vergleichbarkeit vorliegen, so dass vornehmlich formelle bzw. standardisierte Tests eingesetzt werden. Die optimale Nutzung neuerer, aber auch zur Beurteilung bereits

2 Dieses Teilkapitel basiert in Teilen auf Bos, Wendt & van Holt (2010).

High-Stakes-Tests im Kontext von Migration

225

genutzter Testverfahren ist nach Messick (1995) und Arnold (2001) mithilfe sechs zentraler Aspekte der Konstruktvalidität zu bewerten: – Relevanz und Repräsentativität der Testinhalte – Theoretische und empirische Entwicklung von Kompetenzmodellen – Bewertungsmodelle – Generalisierbarkeit – Abgrenzung zu anderen relevanten Konstrukten – Berücksichtigung von Testkonsequenzen Diese Validitätsmerkmale werden in Tabelle 1 kurz erläutert. Zudem wurden zu den sechs Qualitätskriterien Fragen ergänzt, die für den Kontext Migration eine besondere Relevanz besitzen. In den Abschnitten 3.1 bis 3.4 werden diese Aspekte noch einmal aufgegriffen und diskutiert. Die Bewertung von Validität wird damit zu einer, alle anderen Gütekriterien und Validitätsdefinitionen (Messick 1989) umfassenden, Bewertung darüber, inwieweit alle der Messung zugrunde gelegten theoretischen Annahmen und empirischen Belege möglichen Testwertinterpretationen angemessen sind und damit verbundene Nutzungsansprüche unterstützen (Messick 1995). Für die Testentwicklung sind dabei insbesondere jene Aspekte verstärkt zu berücksichtigen, die zu Einschränkungen der Konstruktvalidität führen könnten. Im Wesentlichen könnte sich der Prozess der Entwicklung von Messinstrumenten anhand der folgenden Arbeitsschritte vollziehen: (1.) Klärung von Messintention und Kompetenzdefinition; (2.) Klärung der theoretischen Struktur von Kompetenzen; (3.) Konstruktion von Messinstrumenten; (4.) Auswertung und Interpretation von Ergebnissen. Nachfolgend werden daher Schritte der Entwicklung, Durchführung und Auswertung formeller Tests skizziert. Neben allgemeingültigen Abläufen einer Testkonstruktion sollen Aspekte, die sich auf das Thema Migration beziehen, einbezogen werden. Dazu wird sich auf Sprachtests bezogen, aber auch auf andere Leistungstests, zum Beispiel für die Testung mathematischer Leistungen, da auch hier in der Testentwicklung Aspekte zur Thematik wie kulturelle Hintergründe von Bedeutung sind. Da insbesondere High-Stakes-Tests im Kontext Migration Sprachtests darstellen (vgl. Abschnitt 4 in diesem Beitrag) und sich diese am GER (Europarat 2001) orientieren, wird zudem der Bezug von Tests zum Referenzrahmen in den Blick genommen. Ergänzend wird auf die Standards for Educational and Psychological Testing (AERA et al. 2014), Kunnans „Test Fairness Framework“ (Kunnan 2000, 2004) sowie den Code of Ethics der International Language Testing Association (ILTA 2000) verwiesen.

Allgemeine Beschreibung des Kriteriums

Dieser Aspekt bezieht sich auf die inhaltliche Relevanz und die Repräsentativität der Testinhalte, die durch Bezugnahme zu allgemeinen Theorien zum Untersuchungsbereich, zu fachlichen Ordnungen und zu normativen Vorgaben (Curricula oder Standards) sicherzustellen sind. Dieser Aspekt bezieht sich substanzieller auf kognitive Informationsverarbeitungen und Denkprozesse, die a) zu explizieren sind, b) in Form von Prozessmodellen der Testkonstruktion zugrunde liegen sollten und sich c) auf der Grundlage von empirischen Analysen als auch theoretischen Fundierungen sowie für den Bearbeitungsprozess von konkreten Aufgaben relevant und repräsentativ bestimmen lassen. Dieser Aspekt bezieht sich konkreter auf das dem Test zugrundeliegende Bewertungsmodell, mittels dessen schließlich für Lösungen Punkte vergeben werden. Dieses sollte sowohl das dynamische Zusammenspiel der kognitiven Teilprozesse als auch die inhaltlichen Gliederungen des zu messenden Konstrukts abbilden. Dieser Aspekt bezieht sich auf eine Abschätzung des Ausmaßes der Generalisierbarkeit der Testwerte über untersuchte Samples oder Populationen, Aufgabenformate und ihre kontextualisierte Einbettung, Untersuchungsumstände, Testzeitpunkte und Auswerter hinweg.

Kriterium

Relevanz und Repräsentativität der Testinhalte

Theoretische und empirische Entwicklung von Kompetenzmodellen

Bewertungsmodell

Generalisierbarkeit

Ist eine Generalisierung für spezifische Personengruppen reflektiert? Wird die Heterogenität innerhalb von Personengruppen angemessen berücksichtigt?

Sind auswertende Personen hinsichtlich sprachlicher und kultureller Aspekte geschult? Wurden Interkodereffekte empirisch überprüft und ausgeschlossen?

Wurden mögliche Effekte sprachlicher und kultureller Herkunft in der Entwicklung von Kompetenzmodellen und Testaufgaben berücksichtigt? Wurden Testverfahren pilotiert und unerwünschte Einflüsse sprachlicher oder kontextbezogener schwierigkeitsgenerierender Merkmale von Testaufgaben überprüft?

Ist die Relevanz hinsichtlich verschiedener Aspekte von Zuwanderung und gesellschaftlicher Konsequenzen reflektiert und begründet?

Prüffrage/n für das Qualitätskriterium zum Kontext Migration

Tab. 1: Zentrale Validitätsmerkmale von Kompetenzmessverfahren nach Messick (1995: 741–749) und Arnold (2001: 121), erweitert um Prüffragen zu migrationsbezogenen Qualitätskriterien.

226 Raphaela Porsch und Heike Wendt

Dieser Aspekt bezieht sich zentral auf Fragen der Übereinstimmungsvalidität. Mittels konvergenter und diskriminativer Zusammenhangsanalysen mit testnahen und testfernen Merkmalen ist die Konsistenz empirischer Daten mit den Konstruktbestimmungen und Operationalisierungen abzuschätzen. Mittels diskriminativer Korrelationen lassen sich mitunter Interaktionsbeziehungen bzw. Moderatorvariablen identifizieren. Dieser Aspekt bezieht sich auf die, mit der Interpretation der Ergebnisse mitunter verbundenen, positiven und negativen Konsequenzen, denen unitendiert, beispielsweise durch geringe Konstruktrepräsentation, Beeinflussung der Testwerte durch andere Merkmale, Verzerrungstendenzen der Auswertungspraxis, zu geringe Berücksichtigung von Nutzungsansprüchen (wie Testnutzung für Selektionsentscheidungen) und missverständliche oder verkürzte Darlegung von Verfahren und Ergebnissen Vorschub geleistet werden könnte.

Abgrenzung zu anderen relevanten Konstrukten

Berücksichtigung von Testkonsequenzen

Sind alle Aspekte des Verfahrens für alle Probanden transparent und verständlich? Wird auf Einschränkungen der Aussagekraft hingewiesen und diese systematisch überprüft?

Wurden entsprechende Analysen für sprachliche, kulturelle und ggf. bildungsniveaubezogene Faktoren vorgenommen?

High-Stakes-Tests im Kontext von Migration

227

228

Raphaela Porsch und Heike Wendt

3.1 Klärung der Zwecksetzungen und Messintention Die beabsichtigte Nutzung bzw. die Zielsetzung von Testverfahren entscheidet maßgeblich über den Einsatz von Methoden und Messinstrumenten. Je nachdem, welche Ziele verfolgt werden, entscheidet sich auch die Auswahl geeigneter Messinstrumente, da diese an die entsprechenden Zielsetzungen angepasst werden müssen, um die Aussagekraft der Ergebnisse zu gewährleisten. An High-Stakes-Tests werden besonders hohe Anforderungen bezüglich der Validität und Messgenauigkeit gestellt, schließlich sollen hier im Sinne eine Individualdiagnostik interindividuelle Unterschiede eindeutig erfasst werden. Hierfür ist es wichtig, zunächst nicht nur den untersuchten Kompetenzbereich (vgl. Abschnitt 3.2) eindeutig zu definieren, sondern vorab festzulegen, zu welchen Zwecken welche Personen in Bezug auf den interessierenden Kompetenzbereich unterschieden werden sollen. Darüber hinaus sollten auch erhebungspraktische und ökonomische Aspekte, insbesondere unter Berücksichtigung der personellen und zeitlichen Ressourcen auf Seiten der Durchführenden, vorab in der Planung berücksichtigt werden. Auf Seiten der Testteilnehmerinnen und -teilnehmer ist nach Messick (1995) über Testvorausetzungen und mögliche Konsequenzen nachzudenken. Neben zeitlichen Ressourcen und Fragen von Freiwilligkeit, Transparenz und Rückmeldungen ist im Kontext von Migration darüber hinaus zu beachten, dass Personen aus unterschiedlichen Kontexten mitunter über sehr unterschiedliche Erfahrungen mit Institutionen und Prüfungen verfügen, die sich in unterschiedlichem Handlungswissen und -strategien sowie unterschiedlichen Einstellungen und motivationalen Aspekten zu Prüfungssituationen äußern können. Entsprechend können Testverfahren unterschiedlich wahrgenommen werden und auch unterschiedliche (gesellschaftliche) Auswirkungen haben (für einen Überblick zur Diskussion um Testfairness siehe z. B. Möbus 1983; Arnold 1999).

3.2 Klärung der Definition Je nach Fokus und spezifischer Fragestellung ist eine explizite Arbeitsdefinition des zu messenden Konstrukts zu entwickeln, die klärt, was konkret unter diesem Begriff verstanden werden soll und was nicht. Im Kontext von Migration ist zudem zu klären, inwieweit unterschiedliches kulturelles oder sprachliches Wissen für den Erwerb oder eine standardisierte Erfassung des zu messenden Personenmerkmals relevant sein kann und sein soll. Dies setzt eine kritische Auseinandersetzung mit theoretischen und empirischen wissenschaftlichen Arbeiten voraus. Aus messtheoretischer Sicht ist hierbei zu berücksichtigen, dass mit zunehmender Komplexität der inhaltlichen Definition die Schwierigkeit steigt, das zu erfassende Konstrukt messbar zu machen. Es sollte beachtet werden, dass eine empirische Untersuchung eine Formulierung präziser Hypothesen darüber voraussetzt, welches Verhalten in einer konkreten Testsituation bei der Auseinandersetzung mit einer spezifischen Aufgabe als Hinweis für das Vorhandensein einer spezifischen Kompetenz oder Ein-

High-Stakes-Tests im Kontext von Migration

229

stellung zu werten ist. Um eine inhaltlich aussagekräftige Messung vornehmen zu können, erscheint es daher günstiger, statt einer umfassenden Definition von Kompetenzen oder Einstellungen zu folgen, mehrere präzise definierte Konstrukte zu unterscheiden. Dies ermöglicht dann, z. B. wenn es um Kompetenzen geht, kognitive Fähigkeiten und motivationale Dispositionen separat zu messen und als unterschiedliche Aspekte in einem breiten Konstrukt unter einem breiten Konstruktbegriff zu fassen. Es bedarf folglich aus testtheoretischer Sicht einer Definition des zu untersuchenden Konstrukts, die eine „hinreichende begriffliche Abgrenzung von anderen inhaltlich nahen Konstrukten“ bietet und zudem „hinreichend eng“ ist, „um daraus konkrete Messmethoden für die empirische Erfassung ableiten zu können“ (Hartig & Klieme 2007: 25). Sollen mehrere Einstellungen oder Kompetenzen gemessen werden, sind daher entweder entsprechend viele Tests zu entwickeln oder ein Testverfahren, das eine übergeordnete Kompetenz misst. Bei der empirischen Erfassung von Konstrukten stellt sich zudem die Frage, welche Modelle die Grundlage für die Entwicklung von Messinstrumenten und für die Beschreibung von Messergebnissen bilden. Entsprechend müssen im Rahmen der Operationalisierung sowohl die theoretischen Aspekte (Struktur), als auch die unterschiedlichen Niveaus und Entwicklungen der untersuchten Personengruppen angemessen repräsentiert werden. Modelle stellen systematische, theoretisch und empirisch fundierte Ordnungen der entsprechenden Konstrukte dar und erlauben es, Profile von Individuen detailliert, sowohl mehrdimensional in Bezug auf Subdimension, als auch hierarchisch differenziert in Beziehung zu anforderungsrelevanten Entwicklungsstufen, zu betrachten. Perspektivisch lassen sich zwei Formen von Modellen unterscheiden: Niveaumodelle und Strukturmodelle (Hartig & Klieme 2007). Beide Formen der Modellierung beziehen sich auf unterschiedliche Aspekte von Konstrukten, die sich gegenseitig keineswegs ausschließen, sondern sich in idealer Weise ergänzen können. Strukturmodelle fokussieren, wie die Bewältigung unterschiedlicher Anforderungen miteinander zusammenhängt und auf welchen und wie vielen Dimensionen interindividuelle Unterschiede angemessen beschrieben werden können. Hierbei handelt es sich jedoch nicht um traditionelle systematische Gliederungen des (Fach-)Inhalts, sondern vielmehr um eine modellhafte Beschreibung komplexer Gefüge der Anforderungen als Subdimensionen, deren Bewältigung erwartet wird. Der GER (Europarat 2001) unterscheidet beispielweise neben einer Globalskala zahlreiche Teilfertigkeiten und Kompetenzen in einer Sprache. Niveaumodelle hingegen stellen eher in den Mittelpunkt, welche spezifischen Anforderungen unterschiedliche Personen bewältigen können. Eine Klärung der theoretischen Struktur ist notwendig, denn fehlen diese Ausdifferenzierungen, so lassen sich die entsprechenden Einstellungen oder Kompetenzen kaum valide erfassen. Für die Klärung der inhaltlichen Dimensionen und Niveauausprägungen des Konstruktes sollten relevante Kontexte einerseits hinreichend konkret sein, andererseits auch nicht zu eng gefasst werden, um der Komplexität eines zu untersuchenden Konstruktes gerecht zu werden (Rost 2004). Die „Natur“ des zu messenden Konstrukts definiert letztendlich die Auswahl der Testinhalte.

230

Raphaela Porsch und Heike Wendt

3.3 Konstruktion von Messinstrumenten Die Generierung und geeignete Auswahl von Test- und Aufgabeninhalten stellt die Königsdisziplin der Messung dar. Bei der Testkonstruktion liegt der Fokus jedoch nicht auf einzelnen Aufgaben, sondern auf dem Test bzw. der Skala und dem Testskalenwert, der Personen zugeordnet werden soll. Die einzelnen Testaufgaben interessieren nur insofern, als sie – im Rahmen eines spezifischen Testmodells – einen relevanten eigenen Beitrag zur Erfassung des zu messenden Konstruktes leisten. Diese Herangehensweise mag für Personen aus der Praxis (z. B. Fachdidaktiker und Lehrkräfte) zunächst kontraintuitiv erscheinen, liegt doch der Fokus in Vermittlungssituationen oft auf einzelnen Aufgaben, die fachlich interessant und herausfordernd sein sollten. Die im Rahmen der Testentwicklung an Expertengruppen gestellte Aufgabe ist es nicht, möglichst viele Testaufgaben zu produzieren, sondern unter Beachtung der wissenschaftlichen Erkenntnis Skalen zu konstruieren, die den zuvor definierten theoretischen Modellen entsprechen. Ein guter Test besteht dann aus eher wenigen, aber komplexen und eindeutigen Aufgabenstellungen, die zugrundeliegende Modellvorstellungen in ihren Dimensionen und Niveaustufen optimal abbilden. Hierbei ist darauf zu achten, dass Aufgaben tatsächlich die ganze Breite der möglichen Ausprägungen an Einstellungen oder Kompetenzen abbilden. Vor dem Hintergrund der hohen Ansprüche an High-Stakes-Tests gehört es zur guten wissenschaftlichen Praxis, mehrere sogenannte Pilotierungszirkel, das heißt Erprobungsphasen, zu durchlaufen. So können Aufgaben nach ersten Pilotierungen von Expertinnen und Experten geprüft und modifiziert werden. Für die Konstruktion von Testaufgaben sind zwei wichtige Fragen zu klären: 1. Wie sollen Inhalte definiert und ausgewählt, also letztendlich der Stimulus präsentiert werden? Sowohl eine deduktive Aufgabenentwicklung als auch ein Kriteriumssampling stellen vielversprechende Testentwicklungsmethoden im Bereich der Kompetenzdiagnostik dar. Bei der deduktiven Aufgabenentwicklung wird theoretisch ein Kompetenzmodell entwickelt, das sowohl Personen- als auch Situationsmerkmale einbezieht und mit Blick auf alle möglichen Aufgaben, die für einen Test in Frage kämen, bestmögliche Indikatoren definiert und entwickelt (vgl. Rost 2004: 55–56). Beim Kriteriumssampling wird zunächst der für eine Kompetenz relevante Situations- und Verhaltensbereich beschrieben. Der Fokus der Begründung für einen Aufgabeninhalt basiert darauf, dass die Aufgabe eine inhaltliche Entsprechung zu realen Situationen im interessierenden Bereich darstellt. Idealtypisch reflektieren sie unterschiedliche Sichtweisen auf die Beziehung zwischen den verfügbaren Testaufgaben und Tests (Arnold 1999). Bei der Gestaltung des Stimulus eines Sprachtests ist es besonders wichtig, auf die Aspekte der Authentizität zu achten (vgl. ALTE 2012: 14) und entsprechend das Material an das jeweilige Sprachniveau anzupassen und Kontexte authentisch darzustellen. Gleichzeitig ist jedoch sicherzustellen, dass nicht kulturelles Wissen, sondern ausschließlich die im Fokus stehende Sprachkompetenz zu einer korrekten Bearbeitung einer Aufgabe führt. Im Rahmen von Pilotierungsverfahren ist es hier sinnvoll, beispielsweise durch Nutzung von Methoden des

High-Stakes-Tests im Kontext von Migration

231

Lauten Denkens (vgl. z. B. Walzebug 2015) mit Personen unterschiedlicher sozialer und kultureller Herkunft, Stimuli und Kontexte dahingehend zu überprüfen, inwiefern sie eindeutig interpretiert werden. Stehen sprachliche Kompetenzen nicht im Fokus des Testes, ist insbesondere im Kontext von Migration und damit verbundener unterschiedlicher Sprachkompetenzen von Probanden anders herum sicherzustellen, dass sprachliches Wissen wiederum keinen Einfluss auf das Testergebnis hat. Walzebug (2015) schlägt vor, einen Aufgabenentwicklungsprozess neben Phasen der fachlichen Aufgabenentwicklung um Phasen der sprachlichen Überprüfung von Aufgaben zu ergänzen, um systematisch sprachliche Aspekte, die die Schwierigkeit einer Aufgabe bestimmen, zu minimieren. Hier ist es empfehlenswert, in einen solchen Begutachtungsprozess Expertinnen und Experten aus Fachdidaktik, Linguistik, Bildungsforschung und Schulpraxis einzubeziehen. Zur Überprüfung und Identifikation von möglichen unerwünschten sprachlichen schwierigkeitsgenerierenden Merkmalen von Testaufgaben wird für ein erstes Screening das Rechnen von Differential-Item-Functioning-Analysen (DIF; Angoff 1993) vorgeschlagen (z. B. Camilli 2006), die triangulativ um Methoden des Lauten Denkens mit Probanden ergänzt werden (Walzebug 2015). 2. Welche Vorgaben sollen für die Beantwortung der Fragen gemacht werden? Hier lassen sich ebenfalls zwei idealtypische Möglichkeiten unterscheiden: geschlossene und offene Antwortformate (zu Vor- und Nachteilen beider Optionen sowie Mischformen vgl. z. B. Hartig & Jude 2007). Geschlossene Antwortformate (sogenannte Multiple-Choice-Items) zeichnen sich dadurch aus, dass mehrere mögliche Lösungen vorgegeben werden, aus denen die getestete Person die richtige(n) auszuwählen hat. Spielen bei einem Kompetenzkonstrukt kreative Produktionen (wie z. B. Ideen, Lösungsmöglichkeiten etc.) eine Rolle, so ist es jedoch schwierig, eindeutige Antworten bzw. Lösungswege vorzugeben. Entsprechend benötigt man Aufgaben, die mehrere korrekte Lösungen zulassen. Hieraus ergibt sich, dass sich für viele Testaufgaben ein offenes Antwortformat anbietet. Im Kontext von Migration ist hier zu beachten, dass Personen entsprechend ihres Bildungsniveaus und unterschiedlichen Kontexten, in denen sie ihre Bildung erworben haben, womöglich über unterschiedliches Handlungswissen bezüglich des Lösens von Testaufgaben verfügen. So könnten beispielsweise bestimmte Personengruppen aufgrund ihrer Herkunft mit spezifischen Antwortformaten vertrauter sein als mit anderen. Entsprechende Vorannahmen oder Beobachtungen sollten bei der Entscheidung über Antwortformate als auch bei der Gestaltung von Instruktionstexten berücksichtigt werden.

3.4 Auswertung und Interpretation Ziel der Auswertung ist es, die Testergebnisse in einen genauen und aussagekräftigen Testwert zu überführen. Bei Testverfahren mit geschlossenen Antwortformaten kann die Auswertung in Teilen auch maschinell erfolgen. Bei offenen Antwortformaten, die insbesondere in der Testung produktiver Kompetenzen eine bedeutsame

232

Raphaela Porsch und Heike Wendt

Rolle spielen, bedarf es geschulter Expertinnen und Experten, die selbst über hohe Expertise (z. B. ausgeprägte Sprachkompetenz) verfügen. In beiden Fällen bedarf es eindeutiger Auswertungsvorgaben (sog. Kodieranweisungen) sowie einer Überprüfung der Qualität der Kodierungen, z. B. durch Doppel- bzw. Mehrfachkodierung eines Teils der Produkte bzw. Antworten. Als Nachweis der Auswertungsobjektivität wird in der Regel die Interkoderreliabilität berechnet (Bortz & Döring 2016: 558). Generell ist davon auszugehen, dass die Auswertungsreliabilität bei Verfahren mit einem offenen Antwortformat, welches die Kodierung durch geschulte Experten notwendig macht, deutlich geringer ausfällt. Nach Sacher (2004: 38–53) ist davon auszugehen, dass Einstellungen der auswertenden Personen gegenüber den Getesteten sowie Persönlichkeitsmerkmale und Wissen um die Konsequenzen von HighStakes-Tests die Objektivität der Beurteilung beeinflussen können. In der Literatur werden diese als Milde-/Strenge-Fehler, Zentraltendenz, Halo- oder Hofeffekt, Reihungsfehler, Kontrast- bzw. Ähnlichkeitsfehler, Wissen-um-die-Folgen-Fehler (vgl. Kahnert 2014: 94–95) diskutiert. Als Reduktionsstrategien werden hier Anonymisierung der Identität der Getesteten, Schulungen und Begleitung der mit der Auswertung betrauten Personen, umfassende Kodieranweisungen mit Beispielen zu Konfliktfällen sowie Doppelauswertungen empfohlen (vgl. z. B. ALTE 2012). Bei HighStakes-Tests im Kontext von Migration kann es neben der Anonymisierung der Identität der Getesteten sinnvoll sein, die Einstellungen der Auswerterinnen und Auswerter gegenüber Migration sowie getesteten Personengruppen zu testen. Sollten sich hier systematische Unterschiede, beispielsweise in der Strenge/Milde, feststellen lassen, wird eine (nachträgliche) Korrektur der Bewertung durch Hinzuziehung von Expertinnen und Experten, die eine weitere Begutachtung vornehmen, empfohlen. Eine nachträgliche statistische Korrektur um durchschnittliche Bewertungsunterschiede ist im Kontext von High-Stakes-Tests kaum zu rechtfertigen. Für die Darstellung und Interpretation von Ergebnissen sind ebenfalls unterschiedliche Ansprüche zu berücksichtigen, die sich aus den in Abschnitt 3.1 dargestellten Erkenntnisinteressen ergeben. Hier lassen sich unterschiedliche Bezugsnormen unterscheiden: Beim Vergleich eines Testergebnisses mit den Ergebnissen anderer Personen bzw. Personengruppen spricht man von einer sozialen, beim Vergleich mehrerer Testergebnisse einer Person hingegen von einer individuellen Bezugsnorm (vgl. Rheinberg 2001). Wird dieser Ansatz verfolgt und werden entsprechend konkrete Ergebnisse zurückgemeldet, ist es für einen fairen Vergleich notwendig, dass insbesondere konstruktrelevante Rahmenbedingungen in der Darstellung berücksichtigt werden (Arnold 1999). Mit High-Stakes-Test sollen in der Regel auch inhaltlich begründete Aussagen darüber getroffen werden können, inwieweit bestimmte gestellte Anforderungen erreicht wurden. Hier wird von einer sachbezogenen Bezugsnorm gesprochen. Im Fokus der Ergebnisrückmeldung steht die Frage, ob eine bestimmte Person ein zuvor definiertes Lernziel beherrscht oder erreicht bzw. über eine bestimmte Einstellung verfügt. Beispielsweise wird an viele Sprachtests die Anforderung herangetragen, die Ergebnisse dem GER und seinen Niveau-

High-Stakes-Tests im Kontext von Migration

233

stufen (A1 bis C2) zuordnen zu können. Aus einer stärker didaktischen und auch psychologischen Perspektive, aber auch in Bezug auf die Akzeptanz von Testverfahren ist gerade diese Interpretation von Testwerten erheblich aufschlussreicher. Um eine derartige Bestimmung von sogenannten Kompetenzstufen zu ermöglichen, wird ebenfalls auf ein zentrales Charakteristikum von Modellen zurückgegriffen, die sich der Item-Response-Theorie (IRT) zuordnen lassen, nämlich den Umstand, dass Aufgabenschwierigkeiten und Personenfähigkeiten, bei Gültigkeit des Modells, auf einer gemeinsamen Metrik abgebildet werden können. Dieses Vorgehen lässt sich am Beispiel eines der einfachsten IRT-Modelle, dem Raschmodell (Rasch 1960/1980), besonders gut nachvollziehen. Die Schwierigkeit einer Aufgabe wird in diesem Modell dort verortet, wo Personen mit einer entsprechend hohen Kompetenz die Aufgabe zu 50 Prozent lösen. Durch die so konstruierte Kompetenzskala können die Ausprägungen der zu messenden Kompetenz zu den Lösungswahrscheinlichkeiten der verwendeten Aufgaben in Beziehung gesetzt werden. Der angenommene funktionale Zusammenhang zwischen Kompetenz und Lösungswahrscheinlichkeit erlaubt es hierbei, Punkte auf der Kompetenzskala zu bestimmen, an denen die Lösungswahrscheinlichkeit einen höheren Wert als 50 Prozent annimmt (vgl. Hartig & Jude 2007: 34). Um nun Niveaus unterscheiden zu können, stellt sich die zentrale Frage, wie sich die Skala unterteilen lässt, das heißt, wo Grenzen zwischen den Niveaus gezogen werden können (Hartig 2007). Die Schwellen zwischen den Niveaus lassen sich sowohl stärker modellgeleitet als auch stärker theoriegeleitet definieren. Bei einem modellgeleiteten Vorgehen wird die Skala in unterschiedliche, oft gleich große Abschnitte unterteilt. Es handelt sich also um eine empirische Identifikation von Kompetenzstufen auf der zugrundeliegenden Bewertungsskala, wobei diese jedoch anschließend inhaltlich in Bezug auf ihre konkreten Anforderungen beschrieben werden. Die inhaltliche Beschreibung der Niveaustufen erfolgt dann post hoc anhand charakteristischer Aufgaben auf der jeweiligen Stufe. Die Aufgaben an den Grenzen zwischen den Stufen besitzen dabei besondere Relevanz, um die Stufen voneinander abzugrenzen, da genau sie es sind, die indizieren, welche Kompetenzanforderungen auf einem Niveau noch mit einer hinreichenden Wahrscheinlichkeit gelöst werden können und welche nicht. Bei einem stärker theoriegeleiteten Vorgehen werden die Niveaustufen einer Kompetenz bei der Erarbeitung eines theoretischen Kompetenzmodells bereits vorab definiert und entsprechend Testaufgaben hinsichtlich unterschiedlicher Anforderungen konstruiert. Im Rahmen der „Testskalierung“ gilt es dann, genau diese theoretisch gemachten Vorannahmen mittels eines geeigneten IRT-Modells empirisch zu überprüfen (für einen Überblick verschiedener Standard-Setting-Verfahren vgl. z. B. North 2000; Cizek & Bunch 2007; Eckes 2010: 145–148; Kaftandjeva 2010; Kecker 2011).

234

Raphaela Porsch und Heike Wendt

4 Beispiele von High-Stakes-Tests in Deutschland im Kontext von Migration Die Abiturprüfung sowie Zentrale Abschlussarbeiten stellen bedeutsame High-StakesTests für alle Schülerinnen und Schüler dar. Hinweise in den bundeslandspezifischen Vorgaben zur Aufgabenerstellung, Durchführung oder Auswertung liegen jedoch nicht in der Weise vor, dass sie Schülerinnen und Schüler mit Migrationshintergrund bzw. Jugendliche, die Deutsch nicht als Erstsprache erworben haben, näher berücksichtigen. Es kann davon ausgegangen werden, dass zum Zeitpunkt der Prüfungen Kenntnisse der deutschen Sprache auf dem Niveau C1 bzw. C2 (Europarat 2001) zum Bestehen vorausgesetzt werden. Im Folgenden soll es um High-Stakes-Tests gehen, die sich auf den Kontext Migration im außerschulischen Bereich beziehen. Die sprachlichen Anforderungen für den Ehegattennachzug, Tests zum Abschluss eines Integrationskurses als Voraussetzung für den Antrag auf die deutsche Staatsbürgerschaft sowie Sprachtests als Zugangstests zum Studium als Beispiele von High-Stakes-Tests sollen dazu näher erläutert werden.

4.1 Ehegattennachzug Sofern Ehepartnerinnen und -partner nach Deutschland ziehen möchten, sind verschiedene Bedingungen zu erfüllen, die im Gesetz über den Aufenthalt, die Erwerbstätigkeit und die Integration von Ausländern im Bundesgebiet (kurz: Aufenthaltsgesetz) geregelt sind. Eine Anforderung seit 2007 lautet, dass „der Ehegatte sich zumindest auf einfache Art in deutscher Sprache verständigen kann“ (§ 30, Abs. 1, Satz 1). Ausnahmen wie körperliche, geistige oder seelische Krankheiten oder Behinderungen, die den Erwerb bis zur Antragsstellung nicht ermöglichen, werden im Gesetzestext aufgelistet (§ 30, Abs. 1, Satz 2 und 3; vgl. auch Büttner & Stichs 2013). Das Bundesamt für Migration und Flüchtlinge (BAMF) (2015) gibt zudem folgenden Hinweis: „Wenn bei Ihrer persönlichen Vorsprache in der Botschaft oder im Generalkonsulat erkennbar ist, dass Sie die geforderten einfachen Deutschkenntnisse ohne jeden Zweifel haben, ist kein besonderer Nachweis nötig“ (Bundesamt für Migration und Flüchtlinge 2015). Erforderlich sind Deutschkenntnisse mindestens auf der Kompetenzstufe A1 des GER (Europarat 2001). Ein Nachweis ist durch ein Sprachzeugnis zu leisten, das man erhält, wenn man eine standardisierte Sprachprüfung gemäß den „Standards der Association of Language Testers in Europe“ (ALTE) erfolgreich abschließt. Genannt werden vom BAMF „Start Deutsch 1“ (Goethe-Institut oder der telc GmbH), „Grundstufe Deutsch 1“ (Österreichisches Sprachdiplom, ÖSD) und „TestDaF“ (TestDaF-Institut e. V.). Der Nachweis entsprechend höherer GER-Niveaus gilt gleichfalls als Anerkennung der Grundlagen der deutschen Sprache.

High-Stakes-Tests im Kontext von Migration

235

„Start Deutsch 1“ (Goethe-Institut 2011) besteht aus insgesamt zwei Testteilen, aus einer schriftlichen und mündlichen Gruppenprüfung mit einer Gesamtdauer von 65 Minuten, wobei alle vier Fertigkeiten, Sprechen, Lesen, Hören und Schreiben, berücksichtigt werden. 60 der möglichen 100 Punkte führen zum Bestehen der Prüfung. Eine ausführliche Beschreibung des Tests wird vom Goethe-Institut (2011) zur Verfügung gestellt. Hinweise auf das Verfahren der Testentwicklung wie die Anbindung an den GER liegen in öffentlicher Form nicht vor. Die Anforderungen zum Ehegattennachzug, zu denen auch der Nachweis der deutschen Sprache zählt, sind nicht unumstritten. In der Kritik stehen insbesondere die sprachlichen Anforderungen bzw. Sprachtests, aber auch der Geltungsbereich des Gesetzes, da die Regelungen ausschließlich Nicht-EU-Bürger betreffen, wobei auch hier zahlreiche Ausnahmen gelten. Der Verband binationaler Familien und Partnerschaften (2008) kritisiert beispielsweise, dass – auf Grundlage der Aussagen zahlreicher Prüfungsteilnehmerinnen und -teilnehmer – die Prüfungsaufgaben zu schwer seien bzw. über dem geforderten Niveau A1 lägen. Berichtet wird von mündlichen Prüfungen aus dem Ausland, die Fragen enthielten, die sich nicht auf dem geforderten Niveau beantworten lassen, aber auch von organisatorischen Schwierigkeiten der Bewerberinnen und Bewerber, etwa beim Ablegen von Prüfungen in dem gewünschten Zeitraum. Im Rahmen der BAMF-Heiratsmigrationsstudie von Büttner und Stichs (2014), wurden 2013 fast 2500 Personen mündlich befragt, deren Ehepartner zwischen 2005 und 2012 nach Deutschland kamen. Die Ergebnisse zu „Aspekten der kulturellen Integration“ berücksichtigen auch Fragen zu den Sprachkenntnissen und dem Sprachtest. Etwa 82 Prozent der nach 2007 eingereisten Ehegatten haben Sprachkenntnisse bereits nachweisen können, da ein Sprachkurs an ihrem früheren Wohnort verfügbar war (Büttner & Stichs 2014: 267). Allerdings sagte etwa ein Drittel der Befragten, dass sie den Sprachnachweis „als stark oder sehr stark belastend empfunden“ haben (Büttner & Stichs 2016: 268). Trotzdem sagten mehr als 80 Prozent, dass ein obligatorischer Sprachnachweis sinnvoll ist, wobei die Zustimmung höher war, wenn ein Sprachtest absolviert worden war (Büttner & Stichs 2016).

4.2 Tests zum Abschluss eines Integrationskurses Das Aufenthaltsgesetz stellt die Rechtsgrundlage – zusammen mit der sogenannten Integrationskursverordnung – für den Besuch eines Integrationskurses dar. Das Bestehen des abschließenden Tests ist eine Voraussetzung für den Antrag auf die deutsche Staatsbürgerschaft. Die Kursteilnahme ist verpflichtend für alle Neuzuwanderer in den ersten zwei Jahren sowie für alle arbeitslosen Zugewanderten. Die Kurse werden durch das Bundesamt für Migration und Flüchtlinge (BAMF) gefördert und durch Volkshochschulen, zugelassene Sprachschulen oder Wohlfahrtsverbände durchgeführt. Ein Integrationskurs besteht aus einem Sprach- und einem Orientierungskurs. Der Sprachkurs „dauert im allgemeinen Integrationskurs insgesamt

236

Raphaela Porsch und Heike Wendt

600 Unterrichtseinheiten (UE), in den speziellen Kursen bis zu 900 UE, im Intensivkurs 400 UE“ (BAMF o. J.). Der Orientierungskurs besteht aus insgesamt 100 UE bzw. im Intensivkurs aus 30 UE. Inhalte sind „die deutsche Rechtsordnung, Geschichte und Kultur, Rechte und Pflichten in Deutschland, Formen des Zusammenlebens in der Gesellschaft, Werte, die in Deutschland wichtig sind, zum Beispiel Religionsfreiheit, Toleranz und Gleichberechtigung von Frauen und Männern“ (BAMF o. J.). Der Kurs endet mit dem Abschlusstest „Leben in Deutschland“. Der Sprachkurs schließt mit der Prüfung „Deutsch-Test für Zuwanderer“ (DTZ) ab und wurde vom Goethe-Institut und der telc GmbH im Auftrag des Bundesministeriums des Innern entwickelt. Zertifiziert werden sollen mit seiner Hilfe die Sprachkompetenz in Deutsch auf dem Niveau A2 und B1 (Beschreibung der Anbindung an den GER in Perlmann-Balme, Plassmann & Zeidler 2009). Gefordert wird vom BAMF das Erreichen der Stufe B1 sowie das Bestehen des Tests „Leben in Deutschland“, um den Integrationskurs erfolgreich abzuschließen. Eine einmalige Wiederholungsprüfung des DTZ ist nach dem Besuch von weiteren Unterrichtsstunden möglich. Der Test „Leben in Deutschland“ (auch als „Einbürgerungstest“ bezeichnet) besteht aus insgesamt 33 Fragen im Single-Choice-Format mit jeweils vier Antwortoptionen. Für das Bestehen müssen innerhalb von sechzig Minuten mindestens 17 richtige Antworten gegeben werden. Rechtlich werden diese Vorgaben durch die „Verordnung zu Einbürgerungstest und Einbürgerungskurs (Einbürgerungstestverordnung – EinbTestV)“ geregelt. Diese benennt u. a., dass insgesamt 310 Fragen zur Verfügung stehen, 300 allgemeine Fragen und zehn landesbezogene Fragen für das jeweilige Bundesland. Alle allgemeinen Fragen sowie die zehn Fragen für jedes Bundesland werden in der Anlage der Verordnung aufgeführt und stehen somit für die Testvorbereitung zur Verfügung.

4.3 Sprachtests als Zugangstests zum Studium Standardisierte Tests zur Erfassung der Sprachkenntnisse von Studienbewerbern mit Deutsch als Fremdsprache werden seit 2001 vom TestDaF-Institut entwickelt und durchgeführt. Mittlerweile werden sie auch als Online-Test (onDaf) angeboten (vgl. Eckes 2010). Ausländische Studienbewerberinnen und -bewerber legen i. d. R. den TestDaF oder die Deutsche Sprachprüfung für den Hochschulzugang (DSH) ab, wenn sie in Deutschland ein Studium aufnehmen wollen (Casper-Hehne & Koreik 2004). In beiden Tests werden das Leseverstehen, das Hörverstehen, das Schreiben und das Sprechen auf Deutsch überprüft, wobei alle Themen und Aufgaben einen Bezug zum Kontext Hochschule aufweisen. Das TestDaF-Institut entwickelt die Aufgaben, wertet sie aus und führt zudem umfangreiche Begleitforschung durch (Informationen zu den Projekten und Publikationen unter www.testdaf.de). Die sprachliche Zulassungsprüfung für Hochschulen, die DSH, wurde von einzelnen Hochschulen entwickelt und wird direkt an den Universitäten durchgeführt. Die Rahmenordnung für die DSH (HRK/KMK 2015) erlaubt, dass sich die Aufgaben un-

High-Stakes-Tests im Kontext von Migration

237

ter Berücksichtigung der vier Kompetenzbereiche an den einzelnen Universitäten unterscheiden (vgl. für Beispielaufgaben und Beispielbewertungen zur DSH die Arbeitsgruppe FaDaF 2007). Koreik (2010: 335) grenzt die beiden Tests, die die gleiche Funktion erfüllen sollen, im Hinblick auf ihre Qualität voneinander ab: „Im Unterschied zur Deutschen Sprachprüfung Hochschule (DSH) handelt es sich bei TestDaF um einen Test, der testtheoretisch höchsten Ansprüchen gerecht wird, dessen Aufgabenstellungen systematisch erprobt und kalibriert werden und dessen Bewertung mit ausgefeilten psychometrischen Verfahren validiert wird.“ Die TestDaF-Niveaustufen 3, 4 und 5 entsprechen den Stufen B2 und C1. Die Aufgaben bzw. Testergebnisse sind in einem aufwändigen Verfahren mit dem GER verlinkt worden (vgl. Kecker 2011). Die DSH verwendet für die Bewertung die Beschreibungen aus dem GER, jedoch ist das Verfahren der Verlinkung beschränkt auf eine Auswahl an Deskriptoren der Niveaus B1 bis C1. Ein Versuch, die Testergebnisse des TestDaF und der DSH aufeinander zu beziehen, – und damit eine genauere Zuordnung der GER-Niveaustufen für den DSH zu ermöglichen – gelang lediglich in Ansätzen (vgl. Koreik 2005).

5 Fazit High-Stakes-Tests sind formelle Verfahren, bei denen das Testergebnis in der Regel weitreichende Konsequenzen für die einzelne Testperson hat. Hierzu zählen beispielsweise schulische Prüfungen wie zentrale Abschlussarbeiten. Migrantinnen und Migranten in Deutschland begegnen High-Stakes-Tests darüber hinaus in Form von Sprachtests, die für den Ehegattennachzug relevant sind, dem Deutsch-Test für Zuwanderer, dem Einbürgerungstest, dem TestDaF oder der Deutschen Sprachprüfung für den Hochschulzugang. An High-Stakes-Tests, die Konsequenzen für die einzelnen Testpersonen haben, sind besonders hohe Anforderungen an die Validität und Messgenauigkeit gestellt. Im vorliegenden Beitrag wurde der Prozess der Entwicklung von Messinstrumenten nachvollzogen und auf Besonderheiten, die sich im Kontext von Migration ergeben, hingewiesen. Hervorgehoben werden neben allgemeinen Qualitätskriterien Aspekte, die sich aus Anforderungen der Testfairness ergeben. Betont werden soll, dass eine faire Messung von Einstellungen oder Kompetenzen von Personen im Kontext von migrationsbedingter Vielfalt in Bezug auf Sprachkompetenzen, Bildungsstand und kulturelle Vertrautheit voraussetzt, dass Testverfahren, ein wissenschaftlich fundiertes und empirisch überprüfbares Modell über Entwicklung und Facetten des zu messenden Konstrukts zu Grunde liegt, welches auch den Einfluss möglicher migrationsbedingter Faktoren berücksichtigt. Für die meisten der hier vorgestellten High-Stakes-Tests gilt, dass Fragen der Validität in der Test-(Weiter-)Entwicklung eine zentrale Rolle spielen. In einer pluralistischen Gesellschaft wäre es wünschenswert, wenn diese Fragen zunehmend systematisch

238

Raphaela Porsch und Heike Wendt

differentiell für spezifische Personengruppen geprüft und auch Ergebnisse für eine wissenschaftliche Diskussion der Öffentlichkeit zugänglich gemacht würden. Die Entwicklung von validen Kompetenzmodellen, die auch diese differentiellen Effekte berücksichtigen, wird sich wohl vor diesem Hintergrund als ein langwieriger Forschungsprozess gestalten, in dem sich Modelle immer wieder in der Praxis beweisen und von verschiedenen Akteuren und Disziplinen kritisch hinterfragen lassen müssen. Genau an dieser Stelle ist nicht nur eine interdisziplinäre Zusammenarbeit von Fachdidaktikern, Sprachforschern, Soziologen, Psychologen, Psychometrikern und Bildungsforschern gefordert, vielmehr bedarf es auch kritischer Diskurse, an denen sich alle Teildisziplinen der Erziehungswissenschaft, der empirischen Bildungsforschung und die einzelnen Fachdisziplinen in einer interdisziplinären Zusammenarbeit als „kritische Freunde“ begegnen.

Literatur AERA et al. (2014) = American Educational Research Association, American Psychological Association, & National Council on Measurement in Education, & Joint Committee on Standards for Educational and Psychological Testing: Standards for educational and psychological testing. Washington, DC: AERA. ALTE (2012): Handbuch zur Entwicklung und Durchführung von Sprachtests. Zur Verwendung mit dem GER. www.telc.net/fileadmin/user_upload/handbuch_zur_entwicklung_und_ durchfuehr-ung_von_sprachtests.pdf (31. 07. 2017). Angoff, William. H. (1993): Perspectives on differential item functioning methodology. In Paul W. Holland & Howard Wainer (Hrsg.), Differential item functioning, 3–24. Hillsdale, NJ: Lawrence Erlbaum Associates. Arbeitsgruppe FaDaF (Hrsg.) (2007): Deutsche Sprachprüfung für den Hochschulzugang. DSH. Handbuch für Prüferinnen und Prüfer (2. unveränd. Aufl.). Göttingen: Fachverband Deutsch als Fremdsprache. Arnold, Karl-Heinz (1999): Fairneß bei Schulsystemvergleichen. Diagnostische Konsequenzen von Schulleistungsstudien für die unterrichtliche Leistungsbewertung und binnenschulische Evaluation. Münster: Waxmann. Arnold, Karl-Heinz (2001): Qualitätskriterien für die standardisierte Messung von Schulleistungen. Kann eine (vergleichende) Messung von Schulleistungen objektiv, repräsentativ und fair sein? In Franz. E. Weinert (Hrsg.), Leistungsmessungen in Schulen, 117–130, Weinheim: Beltz. Bjork, Christopher (2015): High stakes schooling. What we can learn from Japan’s experiences with testing, accountability, and education reform. Chicago: The University of Chicago Press. Bos, Wilfried, Wendt, Heike & van Holt, Nils (2010): Kompetenzmessung im Fach Kunst: Herausforderungen und Perspektiven. In Kunibert Bering, Clemens Höxter & Rolf Niehoff (Hrsg.), Orientierung: Kunstpädagogik, 407–429. Oberhausen: Athena-Verlag. Bortz, Jürgen & Döring, Nicole (2016): Forschungsmethoden und Evaluation in den Sozialwissenschaften (5. vollst. überarb., akt. u. erweit. Aufl.). Wiesbaden: Springer. Bühner, Markus (2006): Einführung in die Test- und Fragebogenkonstruktion (2. aktual. Aufl.). München: Pearson Studium. Bundesamt für Migration und Flüchtlinge ( BAMF) (o. J.): Integrationskurse. Inhalt und Ablauf. www.bamf.de/DE/Willkommen/DeutschLernen/Integrationskurse/InhaltAblauf/inhaltablaufnode.html (31. 07. 2017).

High-Stakes-Tests im Kontext von Migration

239

Bundesamt für Migration und Flüchtlinge (BAMF) (2015): Nachweis einfacher Deutschkenntnisse beim Nachzug von Ehegatten aus dem Ausland Informationen für nachziehende Ehegatten und ihre Ehepartner in Deutschland. www.bamf.de/SharedDocs/Anlagen/DE/Publikationen/ Flyer/Ehegattennachzug/ehegattennachzug.pdf?__blob=publicationFile (31. 07. 2017). Büttner, Tobias & Anja Stichs (2014): Die Integration von zugewanderten Ehegattinnen und Ehegatten in Deutschland. BAMF-Heiratsmigrationsstudie 2013. Forschungsbericht 22. www.bamf.de/SharedDocs/Anlagen/DE/Publikationen/Forschungsberichte/ fb22heiratsmigration.pdf?__blob=publicationFile (31. 07. 2017). Camilli, Gregory (2006): Test fairness. In Robert Brennan (Hrsg.), Educational measurement, 221–256. New York, NY: American Council on Education & Praeger series on higher education. Casper-Hehne, Hiltraud & Uwe Koreik (Hrsg.) (2004): DSH und TestDaF als hochschulbezogene Prüfungssysteme für Deutsch als Fremdsprache. Baltmannsweiler: Schneider Hohengehren. Cizek, Gregory J. & Michael B. Bunch (2007): Standard setting. A guide to establishing and evaluating performance standards on tests. Thousand Oaks/London/New Delhi: Sage. Eckes, Thomas (2010): Der Online-Einstufungstest Deutsch als Fremdsprache (onDaF): Theoretische Grundlagen, Konstruktion und Validierung. In Rüdiger Grotjahn (Hrsg.), Der C-Test: Beiträge aus der aktuellen Forschung, 125–192. Frankfurt/Main: Peter Lang. Europarat (Hrsg.) (2001): Gemeinsamer europäischer Referenzrahmen für Sprachen: lernen, lehren, beurteilen. Berlin, München, Wien, Zürich, NY: Langenscheidt. Goethe-Institut (2011): Goethe-Zertifikat A1. Start Deutsch 1. Prüfungsziele und Testbeschreibung. www.goethe.de/pro/relaunch/prf/de/Pruefungsziele_Testbeschreibung_A1_SD1.pdf (31. 07. 2017). Gogolin, Ingrid, İnci Dirim, Thorsten Klinger, Imke Lange, Drorit Lengyel, Ute Michel, Ursula Neumann, Hans H. Reich, Hans-Joachim Roth & Knut Schwippert (2011): Förderung von Kindern und Jugendlichen mit Migrationshintergrund FörMig. Bilanz und Perspektiven eines Modellprogramms. Münster: Waxmann. Grotjahn, Rüdiger (2007): Tests im schulischen Fremdsprachenunterricht: Qualitätsentwicklung und Qualitätssicherung [Plenarvortrag]. In Kroatischer Deutschlehrerverband (Hrsg.), XV. Internationale Tagung des Kroatischen Deutschlehrerverbandes. 12.–14. Oktober 2007. Šibenik, Kroatien. Testen und Bewerten – Selbstevaluation im lernerorientierten Deutschunterricht (KDinfo, Jg. 16, Nr. 30/3), 7–16. http://homepage.ruhr-uni-bochum.de/ Ruediger.Grotjahn/Grot-jahn_2007_Tests%20im%20schulischen%20FU.pdf (31. 07. 2017). Hartig, Johannes & Jude, Nina (2007): Empirische Erfassung von Kompetenzen und psychometrische Kompetenzmodelle. In Johannes Hartig & Eckhard Klieme (Hrsg.), Möglichkeiten und Voraussetzungen technologiebasierter Kompetenzdiagnostik 17–36, Bonn, Berlin: BMBF. Hartig, Johannes & Klieme, Eckhard (Hrsg.) (2007): Möglichkeiten und Voraussetzungen technologiebasierter Kompetenzdiagnostik. Bonn, Berlin: BMBF. Hartig, Johannes (2007): Skalierung und Definition. Eine Definition von Kompetenzniveaus. In Bärbel Beck & Eckhard Klieme (Hrsg.): Sprachliche Kompetenzen. Konzepte und Messungen, 83–99. Weinheim: Beltz. HRK/KMK (Hrsg.) (2015): Rahmenordnung über Deutsche Sprachprüfungen für das Studium an deutschen Hochschulen (RO-DT). Beschluss der HRK vom 08. 06. 2004 und der KMK vom 25. 06. 2004 i.d.F. der HRK vom 10. 11. 2015 und der KMK vom 12. 11. 2015. https://www.hrk.de/fileadmin/redaktion/hrk/02-Dokumente/02-07-Internationales/RO-DT_ korr_final_ub.pdf (31. 07. 2017). ILTA (2000): ILTA Code of Ethics. http://c.ymcdn.com/sites/www.iltaonline.com/resource/resmgr/ docs/ilta_code_english.pdf (31. 07. 2017). ILTA (2007): ILTA Guidelines for Practice in English. http://c.ymcdn.com/sites/www.iltaonline.com/ resource/resmgr/docs/ilta_guidelines.pdf (31. 07. 2017).

240

Raphaela Porsch und Heike Wendt

Kaftandjeva, Felianka (2010): Methods for setting cut scores. Methods for setting cut scores in criterion-referenced achievement tests. A comparative analysis of six recent methods with an application to tests of reading in EFL. Arnhem: Cito. www.ealta.eu.org/documents/resources/ FK_second_doctorate.pdf (31. 07. 2017). Kahnert, Julia (2014): Das Zentralabitur im Fach Mathematik. Eine empirische Analyse von Abiturund TIMSS-Daten im Vergleich. Münster: Waxmann. Kecker, Gabriele (2011): Validierung von Sprachprüfungen. Die Zuordnung des TestDaF zum Gemeinsamen europäischen Referenzrahmen für Sprachen. Frankfurt/Main: Peter Lang. Kecker, Gabriele (2016): Der GeR als Referenzsystem für kompetenzorientiertes Testen: Was bedeutet der Bezug zum GeR für eine Sprachprüfung? Zeitschrift für Fremdsprachenforschung, Band 27, Heft 1, 13–38. Kniffka, Gabriele & Gesa Siebert-Ott (2012): Deutsch als Zweitsprache. Lehren und Lernen (3. Aufl.). Paderborn: Schöningh. Koch-Priewe, Barbara & Marianne Krüger-Potratz (Hrsg.) (2016): Qualifizierung für sprachliche Bildung. Programme und Projekte zur Professionalisierung von Lehrkräften und pädagogischen Fachkräften. 13. Beiheft. Die Deutsche Schule (DDS). Münster: Waxmann. Köller, Olaf & Katrin Schöps (2013): Die deutsche Schule im Lichte internationaler Schulleistungsuntersuchungen (TIMSS, PISA, PIRLS, DESI und TEDS-M). In Ludwig Haag, Sibylle Rahm, Hans Jürgen Apel & Werner Sacher (Hrsg.), Studienbuch Schulpädagogik (5. vollständ. überarb. Aufl.), 72–93. Bad Heilbrunn: Klinkhardt UTB. Koreik, Uwe (2010): TestDaF. In Hans Barkowski & Hans-Jürgen Krumm (Hrsg.), Fachlexikon Deutsch als Fremd- und Zweitsprache, 334–335.Tübingen: Narr/Francke/Attempto (UTB). Koreik, Uwe (Hrsg.) (2005): DSH Test DaF – eine Vergleichsstudie. Hohengehren: Schneider. Kühn, Svenja Mareike (2010): Steuerung und Innovation durch Abschlussprüfungen? Wiesbaden: VS Verlag für Sozialwissenschaften. Kunnan, Anthony J. (2000): Fairness and justice for all. In Anthony J. Kunnan (Hrsg.), Fairness and validation in language assessment, 1–13. Cambridge: Cambridge University Press. Kunnan, Anthony J. (2004). Test fairness. In Michael Milanovic & Cyril J. Weir (Hrsg.), European language testing in a global context. 27–48. Cambridge: Cambridge University Press. Maag Merki, Katharina (2016): Theoretische und empirische Analysen der Effektivität von Bildungsstandards, standardbezogenen Lernstandserhebungen und zentralen Abschlussprüfungen. In Herbert Altrichter & Katharina Maag Merki (Hrsg.), Handbuch Neue Steuerung im Schulsystem (2. Aufl.), 151–182. Wiesbaden: Springer. Madaus, George, Russell, Michael & Higgins, Jennifer (2009): The paradoxes of high stakes testing. How they affect students, their parents, teachers, principals, schools, and society. Charlotte, NC: Information Age Publishing. Messick, Samuel (1989): Validity. In Robert L. Linn (Hrsg.), Educational measurement, 12–103. New York: American Council on Education. Messick, Samuel (1995): Validity of psychological assessment: Validation of inferences from person’s responses and performance as a scientific inquiry into score meaning. American Psychologist, 50, 741–749. Möbus, Claus (1983): Die praktische Bedeutung der Testfairness als zusätzliches Kriterium zu Reliabilität und Validität. In Tests und Trends. Jahrbuch der Pädagogischen Diagnostik, 3, 155–203. Weinheim: Beltz. Nichols, Sharon L. & David C. Berliner (2007): Collateral damage: how high-stakes testing corrupts America’s schools. Cambridge: Harvard Education Press. North, Brian (2000): Linking language assessments: An example in a low stakes context. System, 28, 4, 555–577. Perlmann-Balme, Michaela, Sybille Plassmann & Beate Zeidler (2009): Deutsch-Test für Zuwanderer A2-B1. Prüfungsziele. Testbeschreibung. München: Goethe-Institut/telc GmbH.

High-Stakes-Tests im Kontext von Migration

241

Porsch, Raphaela (2014): Test. In Julia Settinieri, Sevilen Demirkaya, Alexis Feldmeier, Nazan Gültekin-Karakoç & Claudia Riemer (Hrsg.), Empirische Forschungsmethoden für Deutsch als Fremd- und Zweitsprache. Eine Einführung, 87–102. Paderborn: Schöningh. Rasch, Georg (1960/1980). Probabilistic models for some intelligence and attainment tests. Kopenhagen: Danmarks Paedagogiske Institut. Rheinberg, Falko (2001): Bezugsnormen und schulische Leistungsbeurteilung. In Franz. E. Weinert (Hrsg.), Leistungsmessungen in Schulen, 59–71. Weinheim: Beltz. Rost, Jürgen (2004): Lehrbuch Testtheorie – Testkonstruktion (2. überarb. u. erweit. Aufl.). Bern: Hans Huber. Sacher, Werner (2004): Leistung entwickeln, überprüfen und beurteilen. Bewährte und neue Wege für die Primar- und Sekundarstufe (4., überarb. und erw. Aufl.). Bad Heilbrunn: Klinkhardt. Stanat, Petra, Kathrin Böhme, Stefan Schipolowski & Nicole Haag (Hrsg.) (2016): IQBBildungstrend 2015. Sprachliche Kompetenzen am Ende der 9. Jahrgangsstufe im zweiten Ländervergleich. Münster: Waxmann. Stubbe, Tobias C., Jennifer Lorenz, Wilfried Bos & Daniel Kasper (2016): Der Übergang von der Primar- in die Sekundarstufe. In Heike Wendt, Wilfried Bos, Christoph Selter, Olaf Köller, Knut Schwippert & Daniel Kasper (Hrsg.), TIMSS 2015. Mathematische und naturwissenschaftliche Kompetenzen von Grundschulkindern in Deutschland, 351–365. Münster: Waxmann. Studer, Thomas (2010): Kompetenzmodelle und Bildungsstandards für Deutsch als Fremd- und Deutsch als Zweitsprache. In Hans-Jürgen Krumm, Christian Fandrych, Britta Hufeisen & Claudia Riemer (Hrsg.), Deutsch als Zweit- und Fremdsprache. Ein internationales Handbuch. Band 2, 1264–1271. Berlin/NY: de Gruyter. Verband binationaler Familien und Partnerschaften (iaf e. V.) (2008): »Haben Sie noch eine Idee?« Erfahrungen mit der Verschärfung beim Ehegattennachzug. http://www.verbandbinationaler.de/fileadmin/user_upload/Stellungnahmen/broschuere_ehegattennachzug.pdf (31. 07. 2017). Walzebug, Anke (2015): Sprachlich bedingte soziale Ungleichheit. Theoretische und empirische Betrachtungen am Beispiel mathematischer Testaufgaben und ihrer Bearbeitung. Münster: Waxmann.

III Teilkompetenzdiagnostik

Grit Mehlhorn

11 Phonetik 1 2 3 4 5 6 7 8 9 10

Einleitung Phonetische Grundlagen Besonderheiten des Ausspracheerwerbs im Deutschen als Zweitsprache Bedeutung von Aussprache Aussprachediagnose und Diagnosekriterien Ziele der Aussprachediagnose Aussprachediagnose bei mündlichen Sprachprüfungen Diagnose für Zwecke der Ausspracheschulung Diagnose des phonetischen und phonematischen Hörens Selbsteinschätzung und Aussprachelernstrategien

1 Einleitung Das Erkennen und Korrigieren von Ausspracheproblemen sowie die Bewertung von Ausspracheleistungen und -fortschritten stellt sehr hohe Anforderungen an Lehrende (vgl. Hirschfeld 2016: 125). Aussprachefähigkeiten von DaZ-Lernenden werden im Unterricht meist intuitiv eingeschätzt. Es fehlen konkrete Kriterien für das Testen und Prüfen der Aussprache in einer L2 (Settinieri 2010: 1002). Viele Lehrkräfte unterrichten zudem ungern Aussprache, weil sie sich in diesem Bereich nur unzureichend ausgebildet fühlen (vgl. u. a. Abel 2017, Hirschfeld und Reinke 2016, Macdonald 2002). Das vorliegende Kapitel ist diagnostischen Verfahren auf der Ebene der Phonetik/Phonologie gewidmet. Nach einer Einführung in die linguistischen Grundlagen und die Besonderheiten des Ausspracheerwerbs für DaZ-Lernende unterschiedlichen Alters sowie einem Exkurs zur Bedeutung der Aussprache für den Spracherwerb und die soziale Einschätzung von Sprechern wird detailliert auf die integrierte und separate Diagnose von Aussprache, die Rolle der Aussprache in standardisierten Testverfahren, auf Diagnosekriterien und -ziele eingegangen. Es folgen Ausführungen zur Aussprachediagnose bei mündlichen Sprachprüfungen, zur Diagnose der Sprachproduktion sowie des phonetischen und phonematischen Hörens und schließlich zur Selbsteinschätzung der Aussprache durch die Lernenden selbst.

2 Phonetische Grundlagen Im Kontext des DaZ-/DaF-Unterrichts steht der Begriff Phonetik für ‚Aussprache‘ bzw. ‚Aussprachetraining‘ und umfasst die Perzeption und Produktion gesprochener Sprache sowie die phonologisch-phonetischen und methodisch-didaktischen Grundhttps://doi.org/10.1515/9783110418712-011

246

Grit Mehlhorn

lagen (vgl. Hirschfeld 2016: 121). Die Aussprachekomponenten kann man in Suprasegmentalia und Segmentalia einteilen. Daneben gehören Koartikulation und die Phonem-Graphem-Beziehungen (bzw. Laut-Buchstaben-Beziehungen) zu den phonologisch-phonetischen Grundlagen. Unter Suprasegmentalia versteht man Merkmale wie Sprechmelodie (Intonation), Satzakzent, Wortakzent, Sprechspannung und Dauer, die sich über mehrere Segmente erstrecken. Als Prosodie wird die Gesamtheit der suprasegmentalen Eigenschaften bezeichnet. Segmentalia beziehen sich hingegen auf einzelne Laute bzw. Phoneme und umfassen die Vokale und Konsonanten. Das Deutsche gilt durch das Vorhandensein gerundeter Vokale und das distinktive Merkmal der Vokalquantität als vokalreich. Abweichungen in diesem Merkmal können zu Missverständnissen in der verbalen Kommunikation führen (z. B. eine gefụ̈llte oder gefühlte Pause, ein stạttliches oder staatliches Zertifikat). Den Forschungsergebnissen von Fried (2009) zufolge werden die Konsonanten (insbesondere sog. Zischlaute und Konsonantenverbindungen [s] / [z], [ʃt], [ʃ], [pf], [bl], [bʁ], [pfl], [tsv], [ʃl], [ʃm], [ʃʁ] und [ʃv]) im Erstspracherwerb des Deutschen etwas später von Kindern erworben und gelten als „schwieriger“ zu erwerben als andere Konsonanten und Vokale. Oft werden schwer zu artikulierende Laute durch einfachere, bereits beherrschte Laute ersetzt oder an Laute innerhalb eines Wortes angeglichen. Kinder im Alter von vier bis fünf Jahren sollten jedoch nicht mehr auf solche Strategien angewiesen sein, sodass phonologische Vereinfachungsprozesse dieser Art bei Kindern über vier Jahren als Abweichung im phonetisch-phonologischen Spracherwerb gewertet werden (Fried 2009: 75–76). Suprasegmentalia sollten bei der Ausspracheschulung Vorrang haben, „weil sie regulierend auf die Segmentalia einwirken, z. B. was die Spannung und Quantität der Segmente betrifft“ (Hirschfeld 2016: 124). Aus koartikulatorischer Sicht relevant sind Assimilationen und Reduktionen. Reduktionen betreffen die Vokale in unbetonten Silben (für Sprecher einer silbenzählenden Erstsprache meist ein neues Phänomen), aber auch Konsonantenvereinfachungen (vgl. Richter 2008). Lernende, deren Erstsprache eine eher einfache Silbenstruktur (sog. CV-Sprache für die Struktur consonant – vowel) aufweist, haben oft Schwierigkeiten mit Konsonantenverbindungen im Deutschen oder Konsonanten im Wortauslaut und neigen dazu, entweder Konsonanten wegzulassen oder sog. „Sprossvokale“ einzufügen (z. B. bereit statt breit, sagte statt sagt). Unter Assimilation versteht man die Angleichung der phonetischen Merkmale aufeinanderfolgender Laute während der Artikulation. Im Deutschen verläuft die Assimilation – im Unterschied zu vielen anderen Sprachen – meist progressiv, das heißt, dass ein vorangehender Konsonant den nachfolgenden beeinflusst, z. B. in Bezug auf die Stimmbeteiligung. So ist in der Nominalphrase das Buch, die gleichzeitig ein phonologisches Wort darstellt, der Konsonant [s] (orthografisch dargestellt durch den Buchstaben ) am Wortauslaut des ersten Wortes stimmlos und beeinflusst den folgen-

Phonetik

247

den – ursprünglich stimmhaften Konsonanten [b] dahingehend, dass er ebenfalls seine Stimmhaftigkeit zumindest teilweise einbüßt (dargestellt durch den kleinen Kreis unter dem [b̥]): [das'b̥u:x]. Deutschlernende, deren L1 regressive Assimilation aufweist, neigen dazu, diese Wortgruppe so auszusprechen, dass der vor dem stimmhaften [b] stehende Konsonant auch stimmhaft wird: [daz'bu:x]. Die Laut-Buchstaben-Beziehungen fokussieren das Verhältnis von Aussprache und Schreibung. Im Deutschen ist dieses Verhältnis recht komplex. So kann z. B. der Langvokal [i:] orthografisch durch , , oder wiedergegeben werden. Je nach verwendetem Schriftsystem und phonetischen Gegebenheiten der Ausgangssprache/n kann es zu unterschiedlichen Schriftbildinterferenzen kommen. Beispielsweise wird im Deutschen der Vokalneueinsatz (Glottisverschluss) nicht in der Schrift gekennzeichnet und dadurch von Lernenden, die dieses Phänomen nicht aus ihren zuvor gelernten Sprachen kennen, oft überbunden. Eine häufige Schriftbildinterferenz, die z. B. bei ungarischen, türkischen, anglophonen und slawischen Muttersprachlern beobachtet wird, betrifft das . Im Deutschen steht es für [ts], eigentlich zwei Laute; in den genannten Sprachen für ein stimmhaftes [z]. Settinieri (2010: 999) verweist darauf, dass Laut-Buchstaben-Interferenzen relativ leicht zu beheben sind. Sie sollten daher bereits im Anfangsunterricht vermittelt werden. Reinke (2011: 73–74) zufolge entsteht der „fremde Akzent“ beim Sprechen […] auf der Basis artikulatorischer und prosodischer Interferenzen sowie einer insgesamt abweichenden Artikulationsbasis zwischen Mutter- und Zielsprache […]. Hinzu kommen Unterschiede in Gliederungs- und Rhythmisierungsgewohnheiten sowie im Stimmgebrauch.

Merkmale eines fremdsprachigen Akzents in der Lernersprache sind hartnäckiger als Fehler anderer linguistischer Ebenen. In der Phonetik kommt es, vor allem bei ausbleibendem korrektiven Feedback, eher als in anderen sprachlichen Bereichen zu Fossilisierungen – Abweichungen, die sich trotz andauernden Kontakts mit der Zielsprache verfestigen. Eine Herausforderung der Aussprachediagnose besteht darin, dass es im Bereich der Phonetik – anders als in der Morphologie, Syntax und Orthografie – meist kein „Richtig“ oder „Falsch“ gibt; vielmehr befinden sich Segmentalia und Suprasegmentalia in der Lernersprache auf einem Kontinuum zwischen stark abweichender und zielsprachennaher Realisierung (vgl. Marx & Mehlhorn 2016: 301). Eindeutige Aussprachefehler, z. B. die Betonung einer falschen Silbe, treten seltener auf als graduelle Abweichungen (z. B. ein Langvokal, der nicht gespannt genug realisiert wurde, oder ein stimmloser Plosiv, der nicht zweifelsfrei als Fortislaut erkennbar ist). Für die Ausspracheschulung und -diagnose ist es empfehlenswert, sich an einer normierten Standardaussprache (Standardvarietät) zu orientieren, für die eindeutige Ausspracheregeln formuliert wurden (Hirschfeld 2016: 121) und die in Aussprachewörterbüchern (z. B. Krech et al. 2010; Dudenredaktion 2015) kodifiziert ist.

248

Grit Mehlhorn

3 Besonderheiten des Ausspracheerwerbs im Deutschen als Zweitsprache DaZ-Lernende erwerben das Deutsche sukzessiv, d. h. zeitlich versetzt zu ihrer L1. Individuelle Unterschiede, aber auch Faktoren wie das Alter zu Beginn des Erlernens der Zweitsprache führen zu unterschiedlichen Verläufen im Ausspracheerwerb. Während jüngere Kinder in der Regel über eine bessere Imitationsfähigkeit als Jugendliche und Erwachsene verfügen, haben letztere mit zunehmendem Alter und steigenden Sprachlernerfahrungen weiter entwickelte kognitive Fähigkeiten, die ihnen beim Erlernen der Aussprache nutzen. In Bezug auf das Immersionsalter (d. h. das Alter bei Ankunft im Zielsprachenland) lassen sich früher L2-Erwerb mit Erwerbsbeginn vor dem Schuleintritt vom L2-Erwerb von Kindern mit einem Erwerbsbeginn zwischen sechs und zwölf Jahren und dem Zweitspracherwerb von Jugendlichen und Erwachsenen mit dem Erwerbsbeginn nach der Pubertät abgrenzen (Geist & Krafft 2017: 17). Während Kinder mit Deutsch als Erst- und Zweitsprache das Deutsche weitgehend ohne direkte Steuerung erwerben, ist für ältere DaZLernende auch das Instruktionsalter relevant: das Alter, ab dem jemand Unterricht in der Zielsprache erhält. In natürlichen Erwerbskontexten ist die Kontaktzeit der Lernenden mit dem Deutschen jedoch um ein Vielfaches höher als im Unterricht. Dem Immersionsalter wird daher der größere Einfluss auf das erreichbare Ausspracheniveau (ultimate attainment) zugeschrieben: Bis zu einem Immersionsalter von ca. sechs Jahren kann die L2 in der Regel akzentfrei erlernt werden, während dies ab einem Immersionsalter von ca. zwölf Jahren sehr unwahrscheinlich wird (Settinieri 2010: 1000). Grund für den offenbar problemlosen frühen Erwerb der Aussprache und Grammatik in der L2 ist Meisel (2009) zufolge, dass Kindern mit Erwerbsbeginn vor dem fünften Lebensjahr noch Spracherwerbsmechanismen zur Verfügung stehen. Je später der Erwerbsbeginn liegt, umso mehr gleicht der Zweitspracherwerb dem Zweitspracherwerb Erwachsener (Rothweiler 2007: 122). Ältere Kinder und Jugendliche verfügen nicht mehr über die sprachenübergreifende Fähigkeit zur intuitiven Lautdifferenzierung, mit der Säuglinge ausgestattet sind (Geist & Krafft 2017: 26). Konkrete, im vorliegenden Kapitel beschriebene Ausspracheschwierigkeiten können zwar jüngere und ältere DaZ-Lernende gleichermaßen betreffen, aber von Kindern werden sie oft relativ schnell überwunden, während sie vor allem bei erwachsenen Lernenden hartnäckiger sind und auch stärker zur Fossilisierung neigen. Zu den altersbedingten Erwerbsunterschieden (zu einem Überblick über die critical age hypothesis vgl. Molnár & Schlak 2005) kommen unterschiedliche Erwerbsmodi beim institutionellen Sprachenlernen und beim ungesteuerten Zweitsprachenerwerb. Ältere DaZ-Lernende können die für eine alltagstaugliche Zweitsprachenkompetenz notwendige Automatisierung der rezeptiven und produktiven Abläufe ohne gezielte Übungen kaum erreichen. Vor allem zu Erwerbsbeginn steht ihnen zu wenig kognitive Kapazität zur Verfügung, um beim freien Sprechen be-

Phonetik

249

wusst auf Aussprache und Intonation zu achten (zu einem Überblick zum sog. Monitoring vgl. Aguado 2003).

4 Bedeutung von Aussprache Hör- und Leseverstehen, Sprechen und Schreiben sind über die Lautsprache mit dem Denken verbunden. Keine dieser Fertigkeiten läuft ohne Beteiligung des „äußeren“ oder „inneren“ Sprechens ab. Demzufolge kann Aussprache auf die Ausbildung der sprachlich-kommunikativen Kompetenzen leistungsfördernd oder auch leistungshemmend wirken. Eine Vernachlässigung der Ausspracheschulung bei älteren Lernenden führt oft dazu, dass produktiv zu beherrschende Sprachmittel weniger dauerhaft und flexibel angeeignet werden, was sich z. B. in einer geringen Sprechgeschwindigkeit oder abweichenden Artikulation manifestieren kann.

4.1 Bedeutung der Aussprache für den Spracherwerb Eine weitgehend normgerechte Aussprache ist grundlegend für einen effektiven Wortschatzerwerb (vgl. Montanari in diesem Band). Die gelernten Wörter müssen im Redefluss wiedererkannt und verständlich ausgesprochen werden. In Verbindung mit Syntax und Morphologie (vgl. Grimm & Müller in diesem Band) spielt die Aussprache eine wichtige Rolle, z. B. bei der Realisierung grammatischer Endungen und der syntagmatischen Gliederung von Äußerungen. Abweichende Intonation oder ein fehlerhafter Satzakzent können auf Hörerseite zu Interpretationsschwierigkeiten hinsichtlich des Satzmodus oder der Informationsstruktur einer Äußerung führen. Die Orthografie (vgl. Becker in diesem Band) ist eng mit der Phonologie und Phonetik verflochten, vor allem bei den Phonem-Graphem-Beziehungen im segmentalen Bereich und der Interpunktion bei den Suprasegmentalia (Hirschfeld & Reinke 2016: 9). Auch die Ebene der Pragmatik (vgl. Heller in diesem Band) kann durch ungewohnte Intonationsmuster oder eine abweichende Artikulation beeinflusst werden. So ist es z. B. im Deutschen üblich, höfliche Aufforderungen und Bitten durch einen Tonhöhenanstieg am Äußerungsende zu markieren (vgl. Gibbon 1998: 88). Sprecher/innen, die in Kontexten, in denen man Höflichkeit erwartet, stets einen Tonhöhenfall produzieren, können als unhöflich und grob empfunden werden. Von den Gesprächspartnern wird diese Sprechwirkung meist nicht auf die zugrundeliegenden Interferenzen zurückgeführt, sondern dem Sprecher bzw. der Sprecherin persönlich angelastet. Die Fertigkeit Hörverstehen ist über das phonematische und phonetische Hören mit der Aussprache verbunden. Generell kann nur das sprachlich normgerecht (re)produziert werden, was zuvor beim Hören lautsprachlich exakt rezipiert, identifiziert und differenziert worden ist. Je besser also bei den Lernenden das lautdiffe-

250

Grit Mehlhorn

renzierende Hören entwickelt ist, desto besser können sie auch Laute, Lautverbindungen und Wörter artikulieren (vgl. Adamczak-Krysztofowicz & Limbach in diesem Band). Auditive Prozesse wie das Wahrnehmen akustischer Signale und das Herausfiltern von Phonemen, Morphemen, Wörtern und Sätzen einschließlich Betonung, Rhythmus und Intonation stellen somit auch Teilprozesse des Hörverstehens dar. Die phonetisch-phonologischen Kompetenzen beeinflussen die Fertigkeit Sprechen (vgl. Webersik in diesem Band) insbesondere in Bezug auf die Sprechgeschwindigkeit und Flüssigkeit. Beim Leseverstehen (vgl. Kalkavan-Aydın in diesem Band) wird die Bedeutung gewöhnlich über die innersprachige Umsetzung der Schreibform in die Lautform erfasst, sodass die Aussprache auch die Lese- bzw. Verarbeitungsgeschwindigkeit der zu rezipierenden Informationen beeinflusst. Die „phonologische Schleife“ (für einen Überblick vgl. Schlak 2008: 11–12) ist ein Zwischenspeicher für verbales Material, das dort für eine gewisse Zeitspanne durch subvokales Wiederholen „frisch“ gehalten werden kann. Die Schreibkompetenz (vgl. Schäfer in diesem Band) steht über das innere Sprechen bei der Planung von Äußerungen, die Rechtschreibung und die Laut-Buchstaben-Beziehungen mit der Aussprache in Verbindung.

4.2 Bedeutung der Aussprache für die (soziale) Einschätzung von Sprecher/innen Die Aussprache ist ein wichtiger Teil der Persönlichkeit eines Menschen. Der Akzent trägt dazu bei, wie jemand durch andere Sprecher/innen eingeschätzt wird. Nichtmuttersprachler/innen mit einem starken ausländischen Akzent werden häufig als weniger intelligent und sozial niedriger eingestuft (vgl. Dretzke 2006: 133). Untersuchungen zur Sprechwirkungsforschung zeigen, dass insbesondere prosodische Abweichungen nicht-intendierte Wirkungen nach sich ziehen, die auch mit dem Prestige der Ausgangssprache im Zusammenhang stehen können. So klingt ein französischer Akzent in den Ohren vieler Deutscher angenehm und wird mit positiven Attributen belegt, was auf einen russischen oder türkischen Akzent eher nicht zutrifft. Settinieri (2011) weist nach, dass ein russischer Akzent im Deutschen als L2 von deutschen Studierenden signifikant negativer bewertet wird als ein französischer und plädiert dafür, dass der Aspekt der sozialen Akzeptanz in die Progression einer Ausspracheschulung einbezogen werden sollte. Russische Sprecher/innen schöpfen den oberen Sprechtonbereich beim Sprechen durch Akzentsetzungen mittels starken Tonhöhenanstiegs stärker aus als deutsche Sprecher/innen (vgl. Reinke 2008), was vermutlich Einfluss auf Persönlichkeitsbewertungen durch muttersprachliche Hörer/innen hat. So wird der Eindruck von (zu viel) Emphase vermittelt, was von manchen deutschen Hörern in Perzeptionstests als „sehr emotional“, „übertrieben“ oder „theatralisch“ beschrieben wird. Reinke (2011: 77) verweist darauf, dass diese Thematik besonders „beim Testen und Prüfen von Sprachfertigkeiten“ relevant ist, „wo die Wirkung der Persönlichkeit

Phonetik

251

durch Ausspracheprobleme oft eine weitreichende Rolle spielt“. Wie der fremde Akzent die Einschätzung einer Sprecherpersönlichkeit beeinflusst, hängt also von der Ausgangssprache und dem Ausprägungsgrad des Akzents ab: Jede Ausgangssprache verursacht auf der Basis der phonologischen und phonetischen Kontraste (besonders auch im suprasegmentalen Bereich) spezifische Interferenzen und führt so zu typischen Ausspracheabweichungen (…), die z. T. sogar Stereotypen prägen. (Reinke 2011: 77)

Die durch den fremdsprachigen Akzent hervorgerufene Persönlichkeitsbewertung kann zur Stigmatisierung des Sprechers bzw. der Sprecherin führen. Lehrende sollten Kenntnisse darüber besitzen, welche typischen Merkmale des fremden Akzents die Persönlichkeitsbewertung positiv oder negativ beeinflussen (Reinke 2011: 78), auch um sich der Herausforderung einer fairen Bewertung der mündlichen Kompetenzen von DaZ-Lernenden zu stellen. Arras (2011: 83) verweist in diesem Zusammenhang auf eine besondere Art der déformation professionnelle von Lehrkräften, „die sich langsam an den Akzent von SprecherInnen bestimmter Zielkulturen gewöhnen, vor allem, wenn sie selbst die Ausgangssprache der Lernenden beherrschen“. Wenn Lehrpersonen als Prüfer/innen ihrer eigenen Lernenden fungieren, was die Subjektivität der Bewertung erhöhen kann, ist also eine besondere Aufmerksamkeit auf das Kriterium der Verständlichkeit zu richten. Hilfreich dabei wären die Einnahme einer Haltung der kritischen Distanz und die bewusste Hinterfragung des eigenen Sprecheindrucks.

5 Aussprachediagnose und Diagnosekriterien Kommunikative Verständlichkeit ist ein wichtiges Ziel des kommunikativen Zweitund Fremdsprachenunterrichts. Hirschfeld (1994) konnte empirisch nachweisen, dass insbesondere suprasegmentale Abweichungen, wie der Wort- und Phrasenakzent und die Quantität der Akzentvokale, in der Perzeption von Lerneräußerungen durch deutsche Muttersprachler/innen die Verständlichkeit beeinträchtigen. Nicht erworbene Kategorien der L2 können zu Informationsverlust und Missverständnissen führen (vgl. Europarat 2001: 132). In mündlichen Prüfungssituationen werden anhand der konkreten Äußerungen (Performanz) Hypothesen darüber entwickelt, wie ein Prüfling in einer ähnlichen realen Situation agieren würde. Daraus wird dann abgeschätzt, inwieweit die Leistung den Anforderungen in Bezug auf das Testkonstrukt standhält. Bei Performanztests stehen also direkt beobachtbare Leistungen zur Verfügung, während aus Kompetenztests nur indirekt die Fähigkeit der Prüflinge abgeleitet werden kann. So lässt sich mit geschlossenen Items wie Multiple-Choice-Aufgaben zur Überprüfung der Hörwahrnehmung nur indirekt anhand der richtig oder falsch angekreuzten Lösung feststellen, ob die Lernenden über die angestrebte Kompetenz verfügen. Arras (2011: 80) spricht in diesem Zusammenhang von direktem vs. indirektem Testen.

252

Grit Mehlhorn

5.1 Integrierte Diagnose Häufig sind Aussprache und Intonation bzw. Verständlichkeit im Rahmen mündlicher Prüfungen nur ein Kriterium unter mehreren. Aber selbst wenn kein separates Bewertungssystem für die Ausspracheleistung vorliegt, wird die Aussprache von Lernenden oft unbewusst in die Bewertung anderer Leistungen einbezogen (vgl. Hirschfeld & Reinke 2016: 153). Die Kann-Beschreibungen des Gemeinsamen europäischen Referenzrahmens für Sprachen (GER) der dort so bezeichneten „phonologischen Kompetenz“ 1 sollen es ermöglichen zu ermitteln, in welchem Maße bestimmte Kompetenzen von einzelnen Lernenden ausgeprägt sind. Diese Niveaustufen gehen allerdings nicht unbedingt konform mit denen anderer sprachlicher Kompetenzen. So gibt es Lernende, die sich bereits sehr früh eine klare und natürliche Aussprache aneignen, obwohl sie auf anderen sprachlichen Ebenen noch größere Defizite aufweisen. Dies ist vor allem bei sprachlernerfahrenen und aussprachebewussten Lernenden beobachtbar. Häufiger jedoch tritt der Fall auf, dass fortgeschrittene Lernende fließend und dennoch mit auffälligen Ausspracheabweichungen kommunizieren. Der interferenzbedingte „fremde Akzent“ wird unterschiedlich schnell abgebaut und korrespondiert nicht mit dem allgemeinen Sprachstand: „Es gibt Anfänger, die schnell sehr gut hören und aussprechen lernen, und Fortgeschrittene, die sehr flüssig sprechen, aber mit einem starken muttersprachigen Akzent.“ (Hirschfeld 2016: 122) Die Kann-Beschreibungen der „phonologischen Kompetenz“ und insbesondere die Kopplung von Aussprachekompetenzen mit lexikalischen und idiomatischen Redemitteln wurden daher mehrfach kritisiert (u. a. Fandrych 2008: 20). Im GER selbst wurde eingeräumt, […] dass es nicht immer möglich ist, die Lernziele für einen bestimmten Lernenden in einem bestimmten Lernstadium oder für einen bestimmten Typ von Lernenden in einem bestimmten Alter unmittelbar aus den für jeden Parameter vorgeschlagenen Skalen abzuleiten. (Europarat 2001: 132)

Bei einer holistischen Beurteilung mündlicher Kompetenzen wird – auch in Ermangelung von Alternativen – die Aussprache von Deutschlernenden mit Hilfe dieser Skalen „mitbewertet“. Die „recht grob strukturierte“ Skala zum Bereich der phonologischen Kompetenz des GER (Arras 2011: 83) lieferte jedoch nur bedingt eine Orientierung, inwieweit phonetische Besonderheiten wie Aussprache, Intonation, Satzund Wortakzent sowie der Redefluss bewertet werden sollen. Im Companion to the CEFR (Europarat 2018: 136) wurde diese stark kritisierte Skala durch völlig neu entwickelte Deskriptoren ersetzt, wobei der Fokus nun auf der Verständlichkeit als

1 Hirschfeld (2016: 123) verweist zu Recht darauf, dass es sich bei den Kenntnissen und Fertigkeiten in Bezug auf die Aussprache auch um „phonetische“ Kompetenz handelt.

Phonetik

253

primärem Konstrukt liegt und die sprachlichen Vorkenntnisse der Lernenden in die Beschreibung einbezogen werden. Die allgemeine Skala Overall phonological control wird zudem durch die Kategorien Sound articulation und Prosodic features (intonation, stress and rhythm) mit Deskriptoren für alle Niveaustufen ergänzt (vgl. Tabelle 1). Da der GER in seiner Originalfassung von 2001 in erster Linie für erwachsene Fremdsprachenlernende konzipiert worden war und die besonderen Erwerbsbedingungen vor allem jüngerer DaZ-Lernender nicht in den Blick nahm (vgl. auch Ehlich 2007: 52), wurden die Niveaubeschreibungen des GER für den schulischen Kontext und konkrete Altersgruppen modifiziert. So wurden beispielsweise auf Initiative des Sächsischen Staatsministeriums für Kultus in Anlehnung an die Bildungsstandards Deutsch der Kultusministerkonferenz und den sächsischen DaZ-Lehrplan „Niveaubeschreibungen Deutsch als Zweitsprache für die Primarstufe“ SBI (2013) entwickelt. Dieses Diagnoseinstrument soll es Lehrkräften ermöglichen, systematisch und kriteriengeleitet spezifische Informationen über den individuellen Sprachbildungsprozess aller Schüler/innen zu erhalten. Als ausspracherelevante Kriterien dienen hier Deutlichkeit und Sprechflüssigkeit (vgl. SBI 2013: 20): Deutlichkeit In diesem Abschnitt, Deutlichkeit der Aussprache, beurteilen Sie bitte die Klarheit der Artikulation von Lauten und Worten. Bitte berücksichtigen Sie bei der Bewertung, dass die Verstehbarkeit der Äußerungen des Schülers im Vordergrund steht – bitte bewerten Sie nicht die Akzentfreiheit der Aussprache, sondern ob und inwiefern die Artikulation verstehbar ist. I

II

III

IV

Die Aussprache des Schülers ist sehr undeutlich.

Die Aussprache des Schülers ist undeutlich.

Die Aussprache des Schülers ist insgesamt hinreichend deutlich. Es kommt gelegentlich zu Verstehensproblemen.

Die Aussprache des Schülers ist deutlich. Es kommt nur selten zu Verstehensproblemen.

Sprechflüssigkeit Die Flüssigkeit des Sprechens ist unabhängig von in anderen sprachlichen Bereichen erreichten Erwerbsständen als Indikator für die (Selbst-)Sicherheit, die der DaZ-Lernende beim Sprechen erreicht hat, zu sehen. Beurteilt werden soll hier, inwieweit Sätze und Satzteile zusammenhängend intoniert werden. I

II

III

IV

Der Schüler spricht stockend. Er verwendet überwiegend einzelne Wörter und macht längere Pausen. Begonnene Äußerungen werden häufig nicht beendet.

Der Schüler spricht überwiegend stockend. Er verwendet einzelne Satzteile und kurze Sätze im Zusammenhang und legt häufig Pausen ein.

Der Schüler spricht überwiegend flüssig. Er kann Sätze und Satzfolgen zusammenhängend artikulieren. Gelegentlich kommt es zu Abbrüchen und Pausen.

Der Schüler spricht flüssig. Satzfolgen und Texte werden zusammenhängend artikuliert, Abbrüche und Pausen kommen nur selten vor.

Can employ the full range of phonological features in the target language with sufficient control to ensure intelligibility throughout. Can articulate virtually all the sounds of the target language; some features of accent retained from other language(s) may be noticeable, but they do not affect intelligibility.

Can generally use appropriate intonation, place stress correctly and articulate individual sounds clearly; accent tends to be influenced by other language(s) he/she speaks, but has little or no effect on intelligibility.

C1

B2

Can articulate a high proportion of the sounds in the target language clearly in extended stretches of production; is intelligible throughout, despite a few systematic mispronunciations. Can generalise from his/her repertoire to predict the phonological features of most unfamiliar words (e.g. word stress) with reasonable accuracy (e.g. whilst reading).

Can articulate virtually all of the sounds of the target language with a high degree of control. He/she can usually self-correct if he/she noticeably mispronounces a sound.

Can employ the full range of phonological fea- Can articulate virtually all the sounds of tures in the target language with a high level the target language with clarity and of control – including prosodic features such precision. as word and sentence stress, rhythm and intonation – so that the finer points of his/her message are clear and precise. Intelligibility and effective conveyance of and enhancement of meaning are not affected in any way by features of accent that may be retained from other language(s).

Sound Articulation

C2

Overall Phonological Control

Tab. 1: Deskriptoren für „Phonological Control“ (Europarat 2018: 136).

Can employ prosodic features (e.g. stress, intonation, rhythm) to support the message he/she intends to convey, though with some influence from other languages he/she speaks.

Can produce smooth, intelligible spoken discourse with only occasional lapses in control of stress, rhythm and/or intonation, which do not affect intelligibility or effectiveness. Can vary intonation and place stress correctly in order to express precisely what he/she means to say.

Can exploit prosodic features (e.g. stress, rhythm and intonation) appropriately and effectively in order to convey finer shades of meaning (e.g. to differentiate and emphasise).

Prosodic Features

254 Grit Mehlhorn

Pronunciation is generally intelligible; can approximate intonation and stress at both utterance and word levels. However, accent is usually influenced by other language(s) he/she speaks.

Pronunciation is generally clear enough to be understood, but conversational partners will need to ask for repetition from time to time. A strong influence from other language(s) he/ she speaks on stress, rhythm and intonation may affect intelligibility, requiring collaboration from interlocutors. Nevertheless, pronunciation of familiar words is clear.

Pronunciation of a very limited repertoire of learnt words and phrases can be understood with some effort by interlocutors used to dealing with speakers of the language group concerned. Can reproduce connectedly a limited range of sounds as well as the stress on simple, familiar words and phrases.

B1

A2

A1

Can reproduce sounds in the target language if carefully guided. Can articulate a limited number of sounds, so that speech is only intelligible if the interlocutor provides support (e.g. by repeating correctly and by eliciting repetition of new sounds).

Pronunciation is generally intelligible when communicating in simple everyday situations, provided the interlocutor makes an effort to understand specific sounds. Systematic mispronunciation of phonemes does not hinder intelligibility, provided the interlocutor makes an effort to recognise and adjust to the influence of the speaker’s language background on pronunciation.

Is generally intelligible throughout, despite regular mispronunciation of individual sounds and words he/she is less familiar with.

Can use the prosodic features of a limited repertoire of simple words and phrases intelligibly, in spite of a very strong influence on stress, rhythm, and/or intonation from other language(s) he/she speaks; his/her interlocutor needs to be collaborative.

Can use the prosodic features of everyday words and phrases intelligibly, in spite of a strong influence on stress, intonation and/or rhythm from other language(s) he/she speaks. Prosodic features (e.g. word stress) are adequate for familiar, everyday words and simple utterances.

Can convey his/her message in an intelligible way in spite of a strong influence on stress, intonation and/or rhythm form other language(s) he/she speaks.

Phonetik

255

256

Grit Mehlhorn

Die Einstufung der Schüler/innen – hier der 3. und 4. Klasse – auf diesen vierstufigen Skalen stellt ein Schätzverfahren (Rating) durch die beobachtende Lehrkraft dar, wobei ein gewisser Grad an Subjektivität nicht ausgeschlossen werden kann (SBI 2013: 12). Die Verständlichkeit ist zweifellos ein wichtiges Kriterium für die Einschätzung der kommunikativen Kompetenz von Sprechenden. Die Untersuchung von HellwigFábián (2007) konnte zeigen, dass Lernende aufgrund ihrer schlechteren Aussprache auch hinsichtlich ihrer grammatischen Leistungen schlechter beurteilt wurden. Leistungseinschätzungen sollten daher generell unter dem Aspekt der Wirkung des fremden Akzents auf die Einschätzung der Person und Persönlichkeit hinterfragt und ggf. modifiziert werden, „anstatt diese unterschwelligen Einflüsse zu ignorieren“ (Reinke 2011: 79). Während bei Face-to-face-Prüfungssituationen (z. B. telc-Prüfungen) die Aussprache eines Testteilnehmers bzw. einer Testteilnehmerin während der Prüfung mit eingeschätzt wird, werden beim semidirekten Testen (z. B. im Simulated Oral Proficiency Interview (SOPI)) Äußerungen der Prüflinge auf einem Tonträger gespeichert, um zu einem späteren Zeitpunkt abgehört und bewertet zu werden (vgl. Arras 2011: 81). Ein Beispiel für diesen Testtyp ist der Prüfungsteil „Mündlicher Ausdruck“ des TestDaF. Dabei ist (zumindest theoretisch) ein mehrfaches Anhören und die Hinzuziehung weiterer Hörerurteile möglich. Beurteilungsmaßstäbe zur Messung kommunikativer Kompetenz dürfen nicht auf Akzentfreiheit ausgerichtet sein und müssen testsatzübergreifend konzipiert sein (Arras 2011: 81–82). Beim Testen sollte man sich bewusst machen, dass der Akzent eines Prüflings und seine Stimme die Wahrnehmung und somit die Bewertung beeinflussen können. Dennoch gibt es auch gewisse Toleranzgrenzen für Korrektheit und Angemessenheit (vgl. Reinke 2011: 78). Auf jeden Fall sollte eine verständliche Aussprache bei mündlichen Präsentationen im Deutschunterricht auch stets eines der Bewertungskriterien darstellen.

5.2 Separate Diagnose Bei linguistischem Interesse an der phonetischen Performanz von Lernenden wird Aussprache auch separat getestet. So stand z. B. bei den Studien zur critical period (vgl. Molnár & Schlak 2005) die Aussprache von Lernenden im Fokus. Aber auch in der Bilingualismus- und Herkunftssprachenforschung kommen Sprachstandserhebungsinstrumente zum Einsatz, bei denen u. a. Aussprache analysiert wird bzw. die gezielt zur Aussprachediagnose verwendet werden. Neben den bereits erwähnten Schätzverfahren (Ratings) mit mehrstufigen Skalen (vgl. auch Abschnitt 5.2.2) lassen sich dabei die folgenden Verfahrensgruppen unterscheiden: 1. Elizitierung von (Quasi-)Spontansprache, 2. Vorlesen, 3. Benenntests, 4. Imitationstests: 1. Spontan produzierte Äußerungen mit wenigen Vorgaben werden z. B. anhand einer Bildergeschichte elizitiert. Solche mündlichen Narrationen können nicht

Phonetik

2.

3.

257

nur auf Wortschatz, Morphosyntax und Textstruktur hin untersucht werden, sondern z. B. auch im Hinblick auf die Sprechgeschwindigkeit (Wörter pro Minute), Hesitationsphänomene oder Intonation. Um eine Elizitierungstechnik, bei der zwei Probanden mündlich miteinander interagieren, handelt es sich bei Map Tasks. Eine Route, die auf der Landkarte (map) des einen Teilnehmers eingezeichnet ist, muss auf die Karte des anderen Teilnehmers übertragen werden, ohne dass beide die Karte des Anderen einsehen können (vgl. Richter 2008: 157–158). Mit Map Tasks wird quasinatürliche Sprache erhoben, die in Bezug auf bestimmte Phänomene kontrolliert werden kann. So werden die zu versprachlichenden Bilder der Landmarken gezielt so ausgewählt, dass konkrete Laute, die Deutschlernenden Schwierigkeiten bereiten, darin vorkommen, z. B. der lange gerundete Vorderzungenvokal [y:] und der palatale stimmlose Frikativ [ç] in dem Wort Bücher. Neben Lautrealisierungen und -verbindungen, Reduktion, Assimiliation und Wortakzenten lassen sich mit Map Tasks auch informationsstrukturelle Phänomene wie Topikalisierung und Fokussierung sowie die Intonation, z. B. in Bezug auf den Satzmodus, Rückfragen, Phrasenakzente, Nachfragen und Reparaturen (vgl. Belz 2013) untersuchen. Beim lauten Lesen wird das Textmaterial genau vorgegeben, sodass die Realisierungen von verschiedenen Probanden direkt miteinander verglichen werden können. Neben Lesegeschwindigkeit, Textabweichungen und Selbstkorrekturen können auch konkrete segmentale und suprasegmentale Phänomene der Lernenden analysiert und in einem Diagnosebogen (vgl. Abschnitt 8) dokumentiert werden. Um segmentale Phonetik geht es bei Benenntests: In der Zielsprache müssen Bilder benannt werden, wobei auch hier die Performanz verschiedener Probanden miteinander verglichen wird.2 So kann z. B. bei Wörtern, die mit einem Plosiv beginnen, die voice onset time (VOT) – die Zeit zwischen oraler Verschlusslösung bei der Artikulation des Plosivs und dem nachfolgenden Einsetzen der Stimme – untersucht und analysiert werden, inwieweit dabei Transfer von der Ausgangssprache in das Deutsche stattfindet. Das Benennen von Bildern ist auch ein beliebtes Verfahren zur Erfassung von Lautbildungsstörungen bei Vorschulkindern. Bewertet wird, ob der jeweilige Ziellaut richtig gebildet wird, welche Laute fehlen (Inventarbeschränkung) bzw. nur an bestimmten Stellen im Wort (Positionsbeschränkung) auftreten. Die Benennung mehrsilbiger Wörter (z. B. Pinguin, Krokodil) erlaubt darüber hinaus Aussagen zur suprasegmentalen

2 Interventionsstudien mit Test- und Kontrollgruppen wie die von Rymarczyk (2016) zum Schriftspracherwerb mit TING-Stiften und Bildwörterbüchern lassen konkrete Vergleiche zu. So waren die getesteten Grundschüler/innen in der Lage, die Lautform der Wörter mit dem TING-Stift in Erfahrung zu bringen, anstatt sich auf ihre eigenen Hypothesen bezüglich der Aussprache verlassen zu müssen, und konnten sie auch nach einem längeren Zeitraum (12 Wochen) noch abrufen.

258

Grit Mehlhorn

Phonologie (z. B. Wortbetonung und Silbenstruktur). Aus den Analyseergebnissen werden therapeutische Schwerpunkte abgeleitet. 4. Bei Imitationsaufgaben werden die Probanden gebeten, einzelne Wörter, Wortgruppen oder kurze Sätze nachzusprechen. Alle diese Verfahren weisen gewisse Beschränkungen in ihrer Aussagekraft auf. So ist es möglich, dass bestimmte Phänomene oder Wörter zielsprachennah nachgeahmt werden können, aber beim freien Sprechen abweichend produziert werden. Manche Lernende haben beim Vorlesen einen stärkeren Akzent als bei spontaner Sprachproduktion und umgekehrt. Es wäre nicht zulässig, allein aus den Ergebnissen eines vorgelesenen Textes oder der Artikulation isolierter Einzelwörter auf die mündlichen Kompetenzen eines Sprechers zu schließen. Ein umfassendes Bild von den phonetisch-phonologischen Kompetenzen eines Lerners liefert daher nur die Kombination verschiedener Testverfahren.

5.2.1 Analyse im akustischen Sprachsignal Um Lerneräußerungen akustisch analysieren zu können, fertigt man hochwertige Sprachaufnahmen an, z. B. mit einem Diktiergerät, dem Computer oder per Video. Die zu untersuchenden Äußerungselemente und Strukturen können dann im Datenmaterial identifiziert und isoliert und im Anschluss mit Hilfe eines entsprechenden Notationssystems (vgl. IPA 2007) transkribiert werden; erst auf dieser Basis werden die Daten analysiert. Phonetische Lernersprachenanalysen werden mit Hilfe spezieller Software, z. B. dem OpenSource-Programm Praat, durchgeführt. In Praat lassen sich z. B. die Dauer von Segmenten, die Sprechgeschwindigkeit und Tonhöhen sehr genau bestimmen (für ausführliche Erläuterungen zur Datenaufbereitung mit Praat vgl. Mempel & Mehlhorn 2014). Bei der sprachspezifischen VOT kommt es auf Zeitunterschiede von Millisekunden an, die im akustischen Sprachsignal messbar sind, aber auditiv kaum wahrgenommen werden können.3 Praat bietet darüber hinaus die Möglichkeit, Intonationskonturen zu visualisieren und die Konturen von Muttersprachler/innen und Lernenden miteinander zu vergleichen (vgl. Mehlhorn & Trouvain 2007).

5.2.2 Auditive Analyse Für die auditive Einschätzung phonetischer Merkmale bietet sich ein Rating an – ein Verfahren, das Experteneinschätzungen heranzieht. Dabei werden mindestens

3 VOT ist nur bedingt relevant für die Beurteilung von Verständlichkeit und kann nicht allein auditiv analysiert werden.

Phonetik

259

zwei Experten (in der Regel geschulte Muttersprachler mit phonetischem Hintergrundwissen) darum gebeten, Äußerungen auf einer bestimmten Skala nach ihrer Korrektheit, Verständlichkeit und Angemessenheit einzuschätzen. Bei einer Analyse der phonetischen Ebene von Lernersprache ist somit neben akustischen Analysen im digitalen Sprachsignal auch eine perzeptive Bewertung durch trainierte Expertenhörer, die Abweichungen einschätzen, möglich. In Praat kann eine Rating-Skala hinzugefügt werden, um die akustischen Stimuli auch auditiv zu bewerten. Die Triangulierung beider Methoden schafft eine Balance zwischen der inhärenten Subjektivität perzeptiver Bewertung und der Einseitigkeit von akustischen Analysen als einzigem Auswertungsinstrument (vgl. Mehlhorn 2012: 206). Für eine gezielte Diagnose von Ausspracheleistungen für Forschungszwecke werden die transkribierten Aufnahmen von mehreren „Ohrenphonetikern“ abgehört, die unabhängig voneinander ihre Bewertungen vornehmen. Wird dieselbe Aufnahme von unterschiedlichen Personen oder von derselben Person zu verschiedenen Zeitpunkten unterschiedlich bewertet, liegt eine schwache Interrater- bzw. Intrarater-Reliabilität vor (Arras 2011: 82). Je höher die Interrater-Reliabilität, desto zuverlässiger ist die auditive Analyse. Die sichere Diagnose von Ausspracheschwierigkeiten bedarf einiger Übung. Hilfreich dafür ist das mehrfache Abhören von Aufnahmen von Deutschlernenden verschiedener Ausgangssprachen. Dennoch hängt die konkrete Bewertung bis zu einem gewissen Grad von den Personen ab, die sie vornehmen, denn bezüglich der Verständlichkeit gibt es keine absolute Übereinstimmung zwischen verschiedenen Beurteilenden (Hirschfeld & Reinke 2016: 151). Korpusanalysen bieten die Möglichkeit der quantitativen Analyse von Lernersprache, z. B. durch den statistischen Vergleich von Lernerdaten mit muttersprachlichen Vergleichsdaten (Marx & Mehlhorn 2016: 304). Um Lernfortschritte und Fossilisierungen zu diagnostizieren, sind grundsätzlich mehrere Erhebungszeitpunkte mit längeren zeitlichen Abständen notwendig.

5.3 Zur Rolle der Aussprache in standardisierten Testverfahren Ehlich (2007: 12) spricht im Kontext von Verfahren zur Sprachstandsfeststellung als Grundlage für die frühe Förderung von Kindern mit und ohne Migrationshintergrund von Aussprache als einer von sieben „Basisqualifikationen“. Die sog. „phonische Qualifikation“ umfasst „Lautunterscheidung und -produktion, Erfassung und zielsprachliche Produktion von suprasegmentalen-prosodischen Strukturen, sonstige paralinguistische Diskriminierung und Produktion“ (Ehlich 2007: 12). Der Überblick weist einige Forschungen zur Erstsprachaneignung des Deutschen für die Bereiche Phonologie und Prosodie aus, aber für die Zweit- und Mehrsprachenaneignung nur die frühen Arbeiten von Oksaar (zusammenfassend Oksaar 1989). Darüber hinaus zeigt Ehlich (2007: 39), dass sich kognitive Forschungen zur Phonologie und zu sensumotorischen Fähigkeiten häufig mit sprachentwicklungsverzögerten Kindern beschäftigen. So konnten Hasselhorn & Werner (2000) bei der experimentellen

260

Grit Mehlhorn

Überprüfung des phonologischen Arbeitsspeichers von 3- bis 6-jährigen Kindern anhand des Nachsprechens von Kunstwörtern zeigen, dass Störungen im phonologischen Arbeitsgedächtnis die Hauptursache für Sprachauffälligkeiten dysgrammatisch sprachgestörter Kinder darstellen. Die Probleme im phonologischen Arbeitsspeicher bewirken eine Entwicklungsverzögerung beim Aufbau eines phonologischen Korpus linguistischer Muster, was sich auch „auf den Erwerb syntaktischer und grammatikalischer Konventionen der Sprache auswirkt“ (Hasselhorn & Werner 2000: 370). Ähnliche Effekte zeigten sich bei der phonologischen Bewusstheit von LRS-Kindern. Ein Blick auf die Übersicht standardisierter Sprachstandserhebungen (Ehlich 2007: 47) zeigt eine Reihe von Verfahren, in denen Aussprache integriert, d. h. zusammen mit anderen Basisqualifikationen getestet wird. Auf drei Tests mit einem Fokus auf der „phonischen Qualifikation“ soll hier kurz eingegangen werden: – Die Differenzierungsprobe nach Breuer & Weuffen (u. a. 2005) erfasst die optische, phonematische, artikulatorische, melodische und rhythmische Wahrnehmung von Kindern. Fünf Differenzierungsfertigkeiten fließen den Autoren zufolge in das Sprechen-, Lesen- und Schreibenlernen ein, wovon vier – die phonematisch-akustische, die kinästhetisch-artikulatorische, die melodischintonatorische und die rhythmisch-strukturierende Differenzierungsfähigkeit für die Aussprache relevant sind. Die Differenzierungsprobe kann in unterschiedlichen Versionen mit 4- bis 7-jährigen Kindern in fünf bis sieben Minuten pro Kind von Erzieher/innen durchgeführt werden. In Baden-Württemberg wird sie im Rahmen der Schuleintrittsuntersuchung mit dem Ziel der möglichst frühen Erkennung von lautsprachlichem Förderbedarf eingesetzt. – Bei HASE (Heidelberger Auditives Screening in der Einschulungsuntersuchung) handelt es sich um ein standardisiertes und zeitökonomisches Screeningverfahren (Zeitbedarf ca. 10 min) für die Früherkennung von Spracherwerbsoder LRS-Problemen (Brunner & Schöler 2008). Dabei müssen die 4- bis 7-Jährigen Zahlenfolgen wiedergeben (Prüfung der Hörmerkspanne), Wortfamilien erkennen (Prüfung der semantischen Strukturerfassung von Sprache) und Kunstwörter nachsprechen (Prüfung der Funktionstüchtigkeit des phonetischen Speichers). – Der zweistufige Sprachtest Delfin 4 (Diagnostik, Elternarbeit, Förderung der Sprachkompetenz in Nordrhein-Westfalen bei Vierjährigen) ist ein kombiniertes Instrumentarium zur Diagnose und Förderung allgemeiner akademischer Sprachkompetenz von Kindergartenkindern, der neben einem Basismodul zur Phonembewusstheit (Kunstwörter wie Sumapp, Talugo, Golasimu nachsprechen) auch ein Zusatzmodul zur Artikulation enthält (vgl. Fried et al. 2009). Im Protokollbogen wird festgehalten, was an den Sprachäußerungen des Kindes auffällt, ob beispielsweise einzelne Laute oder Lautverbindungen fehlen oder komisch klingen (z. B. Subkarre; „fei“ statt „zwei“). Ehlich (2007: 49) verweist auf eine Gefahr der sprachdiagnostischen Modellierung von Zweisprachigkeit: Wird die Zweisprachigkeit des Kindes nicht beachtet, bestehe

Phonetik

261

die Gefahr, dass sprachliche Auffälligkeiten des Kindes auf Sprachaneignungsstörungen zurückgeführt werden. Habe ein Kind beispielsweise Ausspracheprobleme, könne das ebenso daran liegen, dass das Kind das Lautsystem seiner Herkunftssprache noch nicht vollständig erworben hat, wie daran, dass das Kind tatsächlich einen Sprachfehler habe. Um Fehlinterpretationen dieser Art zu vermeiden, fordert er, bei zweisprachigen Kindern beide Sprachen in die regelmäßigen Sprachstandsuntersuchungen einzubeziehen und „durch parallele Anlage der Feststellungsverfahren Vergleiche zwischen den jeweiligen Kompetenzniveaus in jeder der beiden Sprachen anzuzielen“ (Ehlich 2007: 50). Der Beobachungsbogen zu sismik (Sprachverhalten und Interesse an Sprache bei Migrantenkindern in Kindertageseinrichtungen) (IFP 2006) enthält auch Fragen dazu, ob die Kinder sich Fantasiewörter wie mó-na-lú-ra und gá-bu-dí-la oder kurze Abzählreime merken und sie aufsagen können, inwieweit sie sich aktiv an Reimen und Sprachspielen beteiligen und Spaß an neuen, fremden Sprachen (außer Deutsch und der Herkunftssprache) haben.

6 Ziele der Aussprachediagnose Grundsätzlich bestimmen die Ziele bzw. Erkenntnisinteressen der Aussprachediagnose die zu wählende Diagnosemethode. Personen, die sich in Deutschland integrieren wollen, werden mehr Energie auf den Erwerb einer normgerechten Standardaussprache des Deutschen verwenden als jene, die sich vielleicht nur einmal oder gelegentlich als Touristen in Deutschland aufhalten wollen. (Reinke 2011: 78)

Die verschiedenen Ausbildungsziele z. B. von Erasmus-Studierenden und künftigen Deutschlehrenden oder Dolmetscher/innen sind auch mit unterschiedlichen Erwartungen in Bezug auf die zu erreichende phonetische Korrektheit verbunden. Für viele Lernende ist es nicht erforderlich, die Standardaussprache vollkommen zu beherrschen. Wichtiges Teilziel ist hier eine sog. „komfortable Verständlichkeit“ (Hirschfeld 2016: 124). Dazu gehören eine korrekte Gliederung, Rhythmisierung, Melodisierung und Akzentuierung sowie das Umsetzen wesentlicher phonologischer Korrelationen. Bei der Diagnose sollte eine Unterscheidung von kommunikationsrelevanten Abweichungen und „Schönheitsfehlern“ vorgenommen werden. Zu letzteren könnte man beispielsweise die Artikulation des deutschen konsonantischen RLautes als einschlägig gerolltes Zungenspitzen-[ɾ] zählen. Dieses Allophon stellt eine in süddeutschen Dialekten anzutreffende Variante dar, die die Verständlichkeit nicht beeinträchtigt. Wird der R-Laut also nicht auffällig (mehrschlägig gerollt) artikuliert, muss er in der Aussprachevermittlung nicht zu den obersten Prioritäten gehören, solange die Lernenden eine verständliche konsonantische R-Variante beherrschen. Diese Nuance kann auch später noch von denjenigen Lernenden angegangen

262

Grit Mehlhorn

werden, die weiterhin motiviert sind, ihre deutsche Aussprache zu vervollkommnen und aufgrund insgesamt gut ausgeprägter Sprachkompetenzen freie kognitive Ressourcen haben, um auf solche Details ihrer Lernersprache zu achten. Aber auch individuelle Ansprüche können eine Rolle für die Zielsetzung bei der Ausspracheschulung spielen, z. B. die Vermeidung der Identifizierung der Herkunft durch Muttersprachler/innen, wenn sich Sprecher/innen durch ihren fremdsprachlichen Akzent stigmatisiert fühlen. In diesem Fall wäre eine umfassende Diagnose angezeigt, die vor allem auch Suprasegmentalia einschließt, da diese in der Regel in höherem Maße zur Wahrnehmung eines fremden Akzents beitragen. Darüber hinaus sind informative und konstruktive Rückmeldungen an die Lernenden nötig, damit diese gezielt an ihrer Aussprache arbeiten können. Ziel der Lernersprachenanalyse ist es, die Performanz von Lernenden zu untersuchen, um Aufschlüsse über den jeweiligen individuellen Lernstand zu gewinnen. Bei longitudinalen Erhebungen sind so Aussagen zur Entwicklung der Sprachkompetenzen von Lernenden (Fortschritte, Lernplateaus, Fossilisierungen) möglich. Mit der Analyse von Lernersprache nehmen die meisten Forschenden eine produktionsorientierte Sicht ein: Von Interesse ist, was die Lernenden in der Zielsprache produzieren (Marx & Mehlhorn 2016: 298). Im Zusammenhang mit Aussprachekompetenzen ist jedoch auch die Perzeption bzw. Hörwahrnehmung relevant.

7 Aussprachediagnose bei mündlichen Sprachprüfungen Die Diagnose von Ausspracheschwierigkeiten ist aufgrund der oben erwähnten Abstufungen im Ausmaß der Abweichungen und aufgrund verschiedener individueller Toleranzgrenzen recht komplex. In ähnlichem Maße, wie Menschen sich in ihrer Musikalität unterscheiden, tun sie dies auch in ihrer Fähigkeit, die Aussprache von Sprecher/innen einschätzen zu können. Für eine erfolgreiche Aussprachediagnose ist phonetisches Wissen unerlässlich. Es hilft, bestimmte Aussprachephänomene zu identifizieren bzw. herauszuhören, zu benennen und die Art der Abweichung zu beschreiben. So wie Musikalität bis zu einem gewissen Grad durch die intensive Beschäftigung mit Musik(theorie) sowie das häufige, bewusste und zielgerichtete Hören von Musik erhöht werden kann, besteht auch die Möglichkeit, das phonetische und phonematische Hörvermögen von Menschen zu entwickeln, bei denen ein generelles Interesse an Phonetik vorhanden ist und die bereit sind, dieses zu vertiefen. Aussprachediagnose muss also geübt werden. Durch ein entsprechendes Training bzw. eine Prüferschulung können Lehrkräfte zu Hörexperten ausgebildet werden. Arras (2011: 82–83) zufolge ist es ratsam, das Kollegium bzw. Prüfungsteam in den Abgleich der Analyseergebnisse einzubinden, denn der Austausch untereinan-

Phonetik

263

der führt zu größerer Sensibilisierung für individuell entwickelte Beurteilungsstrategien und die Subjektivität bestimmter Sprechwirkungen, zu mehr Sicherheit und zu einem gewissen Konsens. So sollte man sich in einem solchen Bewerterteam auch darüber verständigen, ob Abweichungen, die das gleiche phonetische bzw. phonologische Merkmal betreffen, nur einmal als eine Kategorie erfasst werden oder ob jeder Fehler einzeln gezählt wird (vgl. Hirschfeld & Reinke 2016: 152), um zu einer einheitlichen Beurteilung zu gelangen. Eine heterogene Zusammensetzung der Arbeitsgruppe z. B. in Bezug auf Muttersprachler und Nichtmuttersprachler ist zudem hilfreich für die Kalibrierung. Ein Fehlerprotokoll in Form eines Diagnoserasters stellt ein hilfreiches Instrument für die Beurteilung dar, da es die Aufmerksamkeit gezielt auf abweichungsanfällige Bereiche lenkt. Bei integrierter Aussprachediagnose empfiehlt sich eine Konzentration auf wenige Parameter (z. B. Wortakzent, Vokalquantität, Intonation und sinnentstellende artikulatorische Abweichungen). Für die Beurteilung der Verständlichkeit bei der mündlichen Sprachproduktion spielt zudem die Flüssigkeit von Äußerungen in Form von typischen Hesitationsphänomenen wie gefüllten und ungefüllten Pausen und Reduktionen eine wichtige Rolle (vgl. Marx & Mehlhorn 2016: 299).

8 Diagnose für Zwecke der Ausspracheschulung Grundsätzlich sollten Prüfungssituationen, in denen möglichst objektiv zu bewerten ist, von alltäglichen Unterrichtssituationen unterschieden werden, in denen Korrektur und Bewertung von Aussprache auch eine didaktische, z. B. auch motivierende Funktion haben können (vgl. Hirschfeld & Reinke 2016: 153). Aussprachediagnose mit dem Ziel der Verbesserung der phonetisch-phonologischen Kompetenzen der Lernenden findet vor allem im Kontext von DaZ-Unterricht und individueller Aussprachelernberatung statt. Die Lehrenden nehmen bei der Entwicklung der Aussprachefertigkeiten ihrer Lernenden eine Schlüsselrolle ein. Zu ihren Aufgaben gehören Dieling & Hirschfeld (2000: 16) zufolge auch das Erkennen und Korrigieren von Ausspracheproblemen der Lernenden und die Bewertung von Ausspracheleistungen und -fortschritten. Da viele jugendliche und erwachsene Deutschlernende bereits über fremdsprachige Englischkenntnisse verfügen, kann sowohl positiver Transfer (beispielsweise in Bezug auf die Aspiration stimmloser Plosive oder das Wissen um die Relevanz der Vokalquantität, z. B. engl. ship vs. sheep, dt. bitten vs. bieten) als auch negativer Transfer ins Deutsche stattfinden (z. B. die stimmhafte Realisierung von Konsonanten im Wortauslaut oder die retroflexe Artikulation des R-Lautes). Ähnliches gilt für weitere zuvor gelernte Sprachen mehrsprachiger Individuen, deren Lernersprache zu nicht prognostizierbaren Anteilen neben Merkmalen der Zielsprache auch Eigenschaften der Erst- und weiterer Fremdsprachen enthält (Marx & Mehlhorn 2010).

264

Grit Mehlhorn

Ein informatives Feedback zu den Ausspracheleistungen der Lernenden ist vor allem dann möglich, wenn die Sprechleistungen aufgezeichnet wurden. Der Tradition der kontrastiven Analyse folgend wird das Zusammenwirken von Erstsprache, Lernersprache und Zielsprache anhand von Fehleranalysen untersucht. Hierbei werden häufig Ausgangs- und Zielsprache verglichen, obwohl bei mehrsprachigen Individuen ebenso Einflüsse aus weiteren gelernten Sprachen hinzukommen können. Auch zur Erläuterung von Informationen zur Lernprogression, möglichen Fossilisierungen, interindividuellen Unterschieden u.v.m. werden Lernersprachenanalysen durchgeführt. Da Ausspracheabweichungen sehr häufig auf Phänomene in der L1 zurückzuführen sind, helfen ausgangssprachenspezifische Fehlerkataloge, die als Ergebnis einer Kontrastierung von Merkmalen der Ausgangs- und Zielsprache erstellt werden können, bei der Diagnose. Für sprachlich homogene Gruppen sind interferenzbedingte Aspekte wesentlich; dafür können kontrastive Analysen herangezogen werden (vgl. beispielsweise die Darstellung zu neun verschiedenen Ausgangssprachen kontrastiv zum Deutschen in Hirschfeld & Reinke 2016: Kap. 5). Phonetisches Wissen über Gemeinsamkeiten und Unterschiede zwischen verschiedenen Sprachen stellt eine unverzichtbare Voraussetzung für eine belastbare Diagnose von Ausspracheabweichungen dar. Dennoch sind die tatsächlichen Abweichungen auch bei Lernenden mit derselben L1 individuell sehr unterschiedlich ausgeprägt. Empfehlenswert ist die Diagnose anhand eines Lesetextes. Tabelle 2 enthält ausgewählte Ausspracheschwierigkeiten einer chinesischen Deutschlernerin in Bezug auf ihre Prosodie im Deutschen. Der Diagnosebogen ist an Dieling und Hirschfeld (2000: 198) angelehnt. Für Zwecke der individuellen Aussprachelernberatung wurde u. a. die Bewertungsskala auf sieben Stufen zwischen einer zielsprachennahen und einer stark abweichenden Aussprache erweitert, um feinere Abstufungen zu ermöglichen und dadurch auch kleinere Aussprachelernfortschritte sichtbar zu machen. Durch das Ankreuzen der jeweiligen Stufe soll der Lernerin ihr gegenwärtiger Stand in Bezug auf die konkreten Phänomene deutlich werden. In den Aussprachediagnosebogen können konkrete abweichende Wörter aus dem Diagnosetext geschrieben werden, damit das Feedback für die Lernerin besser nachvollziehbar wird. Es ist empfehlenswert, dass die Lernenden nach dem Feedback zu einem konkreten Text weiter mit dem Diagnosetext arbeiten und nach einer gewissen Zeit eine weitere Aufnahme dieses Textes anfertigen. Anhand desselben Textes können Lernfortschritte besser sichtbar gemacht werden, da hier ein Vergleich der Ausspracheabweichungen zu verschiedenen Zeitpunkten möglich ist. Für die Lehrperson soll durch den Bogen die Längsschnittdiagnose der Aussprache individueller Lernender und entsprechendes Feedback erleichtert werden. Eine solche Übersicht ermöglicht Lehrenden eine erste Orientierung zu aneignungsschwierigen Aussprachekomponenten und für die Festlegung der nächsten inhaltlichen Schwerpunkte der Ausspracheschulung, auch im Sinne einer interaktionistischen dynamischen Evaluation (vgl. Grotjahn & Kleppin 2015: 129–139).

Phonetik

265

Tab. 2: Auszug aus dem Diagnosebogen einer chinesischen Deutschlernerin (vgl. Mehlhorn 2007: 217–218). stark abweichend ← … → zielsprachennah 1 2 3 4 5 6 7 Sprachrhythmus – Segmentierung (z. B. Zahl der Pausen innerhalb phonologischer Phrasen) – Reduktion unbetonter Silben – Silbenstruktur (z. B. Abweichung durch Tilgung oder Einschub von Vokalen) Intonation – Intonation der Gesamtäußerung – Intonation an Satzgrenzen (an Interpunktionszeichen) Akzentuierung – Position der Wortbetonung – Position der Phrasen- und Satzakzente Akzentuierungsmittel – Dauer betonter Silben – Lautheit betonter Silben – Tonhöhenveränderung betonter Silben

X X X

X X

X X

X X X

Durch die Ausgangssprachenspezifik des Diagnosebogens können Ausspracheabweichungen schneller identifiziert und benannt werden. Wichtig ist, dass der Diagnosetext alle relevanten Aussprache- und Intonationsphänomene des Deutschen umfasst und den Lernenden inhaltlich bekannt ist, damit sie beim Lesen nicht über neue Wörter oder Strukturen „stolpern“. Dabei kann es sich auch um einen Lehrbuchtext handeln. Die Lernenden sollten vor der Aufnahme die Möglichkeit erhalten, den Text still zu lesen und evtl. unbekanntes Vokabular zu klären. Beim unvorbereiteten Lesen machen auch viele Muttersprachler/innen sinnentstellende Fehler.

9 Diagnose des phonetischen und phonematischen Hörens Wenn sich ein bestimmtes Aussprachephänomen beim Sprechen als problematisch herausstellt, ist es zunächst angezeigt zu überprüfen, ob es von den jeweiligen Deutschlernenden auditiv überhaupt wahrgenommen bzw. unterschieden werden kann, denn „[r]ichtiges Hören ist Voraussetzung für richtiges (Aus-)Sprechen“ (Hirschfeld 2016: 124). Eine sinnvolle Diagnose zum Zwecke der Ausspracheschulung bedeutet daher auch immer eine Diagnose der Hörwahrnehmung. Generell

266

Grit Mehlhorn

können alle kontrollierbaren Hörübungen auch als Tests zur Hörwahrnehmung eingesetzt werden. Das phonematische Hören kann mit Minimalpaaren überprüft werden – Wortpaaren, die sich in einem Laut(merkmal) unterscheiden, z. B. die Wortpaare in (1.a–b) in der Länge bzw. Gespanntheit des Vokals, die Wortpaare in (1.c– d) durch den Grad der Zungenhebung bzw. die Kieferöffnung (mittlere vs. hohe Vokale). (1) Hören Sie und unterstreichen Sie in jedem Wortpaar das gehörte Wort. a. [o:] – [ɔ] Ofen – ọffen / Sohlen – sọllen b. [u:] – [ʊ] Ruhm – Rụ m / (Herr) Kruhl – (Herr) Krụ ll c. [o:] – [u:] Chor – Kur / groß – Gruß / Ohr – Uhr / Zoo – zu d. [ɔ] – [ʊ] Bọss – Bụ s / Schlọss – Schlụ ss (Reinke 2012: 37) Das phonetische Hören bezieht sich auf die Unterschiede zwischen Allophonen, die nicht bedeutungsunterscheidend sind, z. B. ob ein Plosiv /p, t, k/ aspiriert [pʰ, tʰ, kʰ] oder nicht aspiriert ist [p, t, k]. Die Wahrnehmung der Behauchung ermöglicht, dass die Lernenden selbst aspirierte Plosive artikulieren können und somit insgesamt verständlicher werden. Bei Diskriminationstests müssen Lautmerkmale bzw. ähnliche Laute voneinander unterschieden werden. So könnte mit dem Wortmaterial aus (1) auch eine Übung entwickelt werden, bei der den Lernenden zum Teil Minimalpaare (z. B. Ofen – offen) und zum Teil dieselben Wörter zweimal präsentiert werden (z. B. Ofen – Ofen) und sie heraushören müssen, welche Wortpaare gleich bzw. unterschiedlich sind. Um einen Identifizierungstest zum Erkennen reduzierter bzw. elidierter Vokale handelt es sich in (2): (2) Hören Sie die Wörter. Welches e in -en hören Sie nicht? Streichen Sie durch. anfangen / aufpassen / zuhören / lernen / üben / nachdenken / fragen / verstehen / zeigen / buchstabieren / markieren / schreiben / spielen / arbeiten / wiederholen / aufhören (Reinke 2012: 55) Mit einfachen Hörtests kann auch herausgefunden werden, ob Lernende bestimmte Phänomene wie Wortakzent im Deutschen überhaupt wahrnehmen – keine Selbstverständlichkeit für Muttersprachler einer silbenzählenden Sprache wie dem Chinesischen (vgl. Kijak 2009). In experimentellen Studien, denen es beispielsweise um den Nachweis von „Wortakzenttaubheit“ geht (vgl. u. a. Dupoux, Peperkamp & Núria 2001), können – neben synthetisierter Sprache – statt echter Lexeme auch Nonsenswörter verwendet werden, um zu verhindern, dass die Probanden bei der Durchführung des Tests auf deklaratives Wissen über die Position der betonten Silbe in ihnen bekannten Wörtern zurückgreifen. Solche Pseudowörter sind Lautketten, die zwar den phonotaktischen Gegebenheiten der zu testenden Sprache entsprechen, aber (zufälligerweise) keine bekannten Lexeme der Zielsprache darstellen (vgl. Beispiel 3).

Phonetik

267

(3) Hören Sie und kreuzen Sie an, welche Silbe betont wird.

• a. an-tri-lüm b. fa-rol-nin c. la-be-mo

• • 1. Silbe betont X

•

• • 2. Silbe betont

•

• • 3. Silbe betont

Zur Überprüfung der Hörwahrnehmung können Lernende auch einzelne Laute in gehörten Wörtern transkribieren. Mit Hilfe der Zeichen des Internationalen Phonetischen Alphabets (IPA 2007) werden die Phonem-Graphem-Beziehungen eindeutig wiedergegeben, z. B. bitte vs. bitter – bitt[ə] vs. bitt[ɐ]. Kontrollierbare Ergebnisse von Hörtests können auch als Übungen zum Selbstlernen genutzt werden (vgl. Abschnitt 10).

10 Selbsteinschätzung und Aussprachelernstrategien Hahn (2006: 142) zufolge soll die kognitive Selbstverantwortung der Lernenden in die Analyse der Ausspracheprobleme mit einbezogen werden, um so systematisch „self-monitoring skills and awareness strategies“ zu entwickeln. Für fortgeschrittenere Lernende ist daher die Dokumentation der individuellen Aussprachefortschritte zur Selbstanalyse auf einem Tonträger empfehlenswert. Solche Tondokumente können auch in ein „Aussprache-Dossier“ integriert und mit strategischen Hinweisen für das weitere Vorgehen durch die Lehrkraft versehen werden (vgl. Aßbeck & Hilgart 2011: 14). Eine regelmäßige Selbstevaluation soll das bewusste Erkennen der eigenen Unzulänglichkeiten im Hören und Aussprechen jugendlicher und erwachsener L2-Lernender ermöglichen (vgl. auch Grotjahn & Kleppin 2015: 140–144). Seit Mitte der 1990er Jahre wird vor allem die Bedeutung der phonologischen Bewusstheit für den Erwerb weiterer Sprachen hervorgehoben (vgl. u. a. Osburne 2003, Mehlhorn 2012). Hardison (2004) konnte in einer Studie mit erwachsenen englischsprachigen Französischlernenden zeigen, dass die Visualisierung von Lerneräußerungen als Intonationskontur in Echtzeit und der Vergleich mit muttersprachlichen Konturen, zusammen mit dem auditiven Feedback, zu einer signifikanten Verbesserung der Sprechmelodie, der Sprechgeschwindigkeit, aber auch der segmentalen Artikulationsgenauigkeit der Probanden führte, wobei zusätzlich eine erhöhte Sprachbewusstheit und eine Übertragung auf nicht geübte Strukturen zu beobachten waren. Elemente von visible speech können sowohl in Aussprachelernsoftware als auch bei der individuellen Aussprachelernberatung zur Sensibilisierung für abweichende Intonationsmuster, falsch positionierte Wort(gruppen)akzente oder für den Vergleich des genutzten Sprechstimmumfangs von Lernenden im Vergleich zu Muttersprachlern genutzt werden.

268

Grit Mehlhorn

Beschreibungen von Strategien und Techniken zum Aussprachelernen (vgl. Tab. 3)4 können Deutschlernenden Möglichkeiten zur Arbeit an ihrer Aussprache aufzeigen. Entsprechende Checklisten können in ausgefüllter Form in das Sprachenportfolio der Lernenden integriert werden (vgl. Ricart Brede in diesem Band). Darüber hinaus können sie als Ideengeber für die Vermittlung eines Strategienrepertoires durch DaZ-Lehrende fungieren. Einige aufgeführte Strategien wie die Konsultation eines speziellen Aussprachewörterbuchs sind eher für Erwachsene und Personen geeignet, denen eine gute Aussprache sehr wichtig ist. Dass es sich um eine offene Checkliste handelt, deuten die leeren Zeilen an, in denen die Lernenden persönliche Strategien und Techniken ergänzen können. Bei der Strategienvermittlung geht es nicht darum, dass die Lernenden alle in der Checkliste genannten Strategien für sich übernehmen. Wichtiger als die Anzahl der angewendeten Aussprachelernstrategien ist, dass die Lernenden erfahren, welche Strategien überhaupt möglich sind, einen Teil davon ausprobieren und reflektieren, welche der Strategien ihnen beim Aussprachelernen helfen. Wenn ein Lerner für sich feststellt, dass eine bestimmte Strategie zu abstrakt ist oder für ihn – aufgrund seines Lernstils – nicht in Frage kommt, ist das auch eine wichtige Erkenntnis für ihn und ein Ergebnis, das man als Lehrkraft akzeptieren sollte. Daher enthält die Checkliste neben den ankreuzbaren Kategorien „habe ich gemacht“, „habe ich nicht gemacht“ auch die Möglichkeiten „ist für mich nicht relevant“ und „werde ich ausprobieren“ (diese Spalten werden hier aus Platzgründen nicht bei allen Strategien abgedruckt). Strategien, die für den einzelnen Lerner geeignet sind, können beim weiteren Lernen ausgebaut und verfeinert werden. Die Aussprachelernstrategien werden vor allem dann erfolgreich angewendet, wenn die Lernenden im DaZ-Unterricht die Möglichkeit haben, diese auszuprobieren. So könnten sie beispielsweise dazu angehalten werden, eine kurze Liste mit „Problemwörtern“ zu erstellen, in denen ihnen die Realisierung der langen und kurzen Vokale schwerfällt und in der nächsten Zeit versuchen, bei diesen Wörtern bewusst auf die Vokalquantität zu achten. Wenn die Lehrkraft diese Liste kennt, kann sie individuelles Feedback zu den Ausspracheversuchen der Lernenden geben. Das Erkennen und Wertschätzen auch kleiner Fortschritte durch die Lehrkraft kann die Lernenden in ihrer Selbstwirksamkeit bestätigen und zur weiteren Arbeit an ihrer Aussprache motivieren. Generell ist es empfehlenswert, die Strategien, die die Lernenden ausprobiert haben, nach einer bestimmten Zeit wieder im Unterricht aufzugreifen, damit die Lernenden ihre Ergebnisse reflektieren können, in der Anwendung hilfreicher Strategien bestärkt werden und die Möglichkeit erhalten, bereits erfolgreich verwendete Strategien weiter zu verfeinern. Auf diese Weise sollen die Lernenden sukzessiv in die Lage versetzt werden, selbstständig an ihrer Aussprache zu arbeiten, beim Deutschsprechen mehr Sicherheit zu gewinnen und somit auch in Bezug auf ihr Lernen unabhängiger von der Lehrkraft werden. 4 Die vorliegende Checkliste beruht auf Erfahrungen mit individueller Aussprachelernberatung zu slawischen Sprachen und zum Deutschen als Zweitsprache (vgl. Mehlhorn 2016).

habe ich gemacht

habe ich nicht gemacht

ist für mich nicht relevant

Um das phonetische Hören vorzubereiten, – setze ich mir ein bestimmtes Hörziel für den konkreten Hörtext (z. B. auf die richtige Betonung zu achten) – wähle ich Texte aus, deren Inhalt mir bereits vertraut ist – arbeite ich mit Übungen, in denen mir die Bedeutung der Wörter bekannt ist (um mich nur auf die Aussprache konzentrieren zu können) – versuche ich mit Hörtexten zu arbeiten, zu denen eine schriftliche Vorlage existiert –…

–…

– vergleiche ich mit der älteren Version und halte meine Fortschritte fest (z. B. im Sprachenportfolio oder meinem Lernertagebuch)

– nehme ich nach einiger Zeit (z. B. nach 3 Wochen) den Text erneut auf

– konzentriere ich mich beim Üben auf die angestrichenen Laute

– bitte ich meine Lehrerin/einen Muttersprachler, Aussprachefehler im Text zu markieren

– nehme ich mich selbst auf und vergleiche meine Aufnahme mit dem Originalsprecher

– beginne ich mit Hörübungen, danach mache ich Ausspracheübungen

– nehme ich mir die Bearbeitung eines bestimmten Aussprachephänomens vor

– arbeite ich mit Sprachlernsoftware

– höre ich die zu den Lehrwerken verfügbaren CDs (Lektionstexte, Hör- und Sprechübungen)

– überlege ich mir vor dem Üben, welche Ausspracheschwierigkeiten ich habe und welche ich zuerst bearbeiten möchte (z. B. anhand eines Diagnosebogens)

Um mein Lernen zu planen, zu organisieren und zu kontrollieren,

Tab. 3: Checkliste mit Aussprachelernstrategien zur Selbstevaluation. werde ich ausprobieren

Phonetik

269

Um meine Aussprache durch Imitation zu verbessern, – höre ich mir Wörter, die schwierig auszusprechen sind, mehrmals an und spreche sie nach, bis ich das Gefühl habe, dass meine Aussprache der des Originals ähnelt – höre ich mir Sätze mit einer für mich schwierigen Intonation mehrmals an, „brumme“ oder „summe“ die Sprechmelodie mit und spreche die Sätze nach, bis ich das Gefühl habe, dass meine Intonation dem Original ähnelt – höre ich einen Audiotext stückchenweise, lese gleichzeitig in der schriftlichen Vorlage mit, halte die Aufnahme an und spreche bestimmte Sätze nach – gehe ich im Text noch einmal zurück, höre mir den Abschnitt wieder an und spreche abermals nach, bis ich mit dem Ergebnis zufrieden bin – nehme ich mir das nächste Stückchen Text vor, wenn ich das Gefühl habe, dem Original nahe zu sein

Um meine Aussprache durch Aufmerksamkeitslenkung zu verbessern, – achte ich während des Hörens auf Wortakzente, Satzakzente, Pausen, Melodieführung u. ä. und markiere diese im Text – singe oder spreche ich den Text mit dem Original mit – nehme ich mich selbst auf und bitte einen Muttersprachler den aufgenommenen Text zu korrigieren – markiere ich im Übungstext (z. B. Gedicht, Liedtext) diejenigen Laute, bei deren Aussprache ich noch Schwierigkeiten habe bzw. bitte einen Muttersprachler darum – mache ich mir eine Liste mit meinen persönlichen Ausspracheproblemen (ggf. mit Hilfe eines Muttersprachlers, vgl. Diagnosebogen) – höre ich genau hin, wie meine „Problemlaute“ im Originaltext ausgesprochen werden – konzentriere ich mich beim Sprechen bzw. Singen gezielt auf die Aussprache der schwierigen Laute – versuche ich beim Sprechen bewusst auf die Artikulation dieser „Problemlaute“ zu achten, wenn sie mir im Übungstext keine Schwierigkeiten mehr bereiten – mache ich mir eine kleine Liste mit Wörtern zu einer Ausspracheschwierigkeit und versuche in den nächsten Wochen, diese Wörter korrekt auszusprechen/zu betonen –…

Um das Hören zu trainieren, – höre ich zunächst den ganzen Text ohne schriftliche Vorlage unter einer bestimmten Aufgabenstellung – wiederhole ich das Hören so oft, bis ich alle Aufgaben gelöst habe – höre ich den Text noch einmal und lese nun in der schriftlichen Vorlage mit – markiere ich Laute, die mir Schwierigkeiten bereiten – höre ich den Text anschließend noch einmal und lese gleichzeitig in der Vorlage mit – höre ich den Text öfter nebenbei, wenn ich ihn inhaltlich schon gut kenne – arbeite ich gezielt mit Diskriminations- (etwas unterscheiden) und Identifikationsübungen (etwas heraushören) bei Lauten, die mir Schwierigkeiten bereiten – überprüfe ich meine Hörergebnisse (mit Hilfe der schriftlichen Vorlage, im Lösungsschlüssel, im Aussprachewörterbuch, durch nochmaliges Hören, …) –…

Tab. 3 (fortgesetzt)

270 Grit Mehlhorn

Um mir die deutsche Aussprache bewusst zu machen, – achte ich beim Mitlesen in der schriftlichen Vorlage besonders auf meine „Problemlaute“ bzw. Besonderheiten in der Intonation – achte ich beim Mitlesen und Mithören auf die Wortbetonung – versuche ich beim Hören Assoziationen zu ähnlich klingenden Lauten in meiner Muttersprache oder einer anderen Fremdsprache zu finden – schaue ich mir (z. B. in einem Phonetikbuch, auf einer CD-ROM, im Internet) an, wie bestimmte Laute gebildet werden und probiere es selbst aus – versuche ich, für mich schwierige Laute mit bestimmten Gesten zu unterstützen, die mir bei der Artikulation helfen – wiederhole ich die Aussprache eines Lautes, der mir gelungen ist, möglichst oft, um mir einzuprägen, wie sich der Laut / die Lautverbindung „anfühlt“ – verwende ich bestimmte Hilfsmittel oder „Eselsbrücken“, um die richtige Artikulationsstelle später wieder zu „finden“ – versuche ich, mir bei neuen Vokabeln Lautbild und Schriftbild gemeinsam einzuprägen – markiere ich beim Hören von Texten bestimmte Stellen in der Textvorlage (z. B. Pausen, Intonationspfeile), auf die ich beim Nachsprechen achten will – versuche ich, die Aussprache- und Intonationsregeln zu verstehen – suche ich nach eigenen Wortbeispielen für die Ausspracheregeln (und überprüfe meine Hypothesen ggf. mit einem Aussprachewörterbuch) –…

Um mir zu neuen Vokabeln das Lautbild einzuprägen, – notiere ich mir bei neuen Wörtern, die ich höre oder lese, ob der akzentuierte Vokal lang oder kurz ist – höre ich Vokabeln und Sätze zu Beginn immer ohne Textvorlage, versuche die Wörter zu identifizieren und mir ihr Schriftbild vorzustellen – schlage ich im Wörterbuch nach, wenn ich mir bei der Betonung eines Wortes unsicher bin – schlage ich die Aussprache einer neuen Vokabel in einem Aussprachewörterbuch nach – höre ich mir die Aussprache einer neuen Vokabel im Online-Wörterbuch an – markiere ich wichtige Informationen zur Aussprache (z. B. lange/kurze Vokale, nicht ausgesprochene Laute) – notiere ich mir die Transkription des Wortes, wenn man von der Rechtschreibung nicht auf die Aussprache schließen kann (z. B. bei Assimilation) – höre ich mir die neuen Vokabeln mehrmals an (z. B. auf der CD zum Lehrwerk, im CD-ROM-Vokabeltrainer) – spreche ich die neuen Wörter mehrmals laut – spreche ich die neuen Wörter im Kontext (Wortgruppen, Sätze, Texte) – merke ich mir den Kontext (z. B. den Satz), in dem das neue Wort vorkam – versuche ich die gelernten Vokabeln häufig zu gebrauchen –…

– lese ich zum Abschluss den ganzen Text laut vor und versuche dabei die Sprecher/innen nachzuahmen – nehme ich einen kurzen Text von einem Muttersprachler auf, höre mir diesen Text an und versuche einzelne Sätze nachzusprechen – schaue ich meinem Lernpartner genau auf den Mund, wenn er einen bestimmten „Problemlaut“ ausspricht und versuche das nachzuahmen (→ diese „Mundraub-Strategie“ funktioniert aber nur bei einigen Lauten!) – spreche ich Texte, die ich schon oft von der CD gehört habe, synchron mit – spreche ich einfache Dialogteile während des Hörens der CD nach (Shadowing) und versuche die Intonation nachzuahmen (für Fortgeschrittene ohne Anhalten der CD) –…

Phonetik

271

Um dauerhafte Erfolge in meiner Aussprache zu erreichen, – wiederhole ich schwierige Laute und Intonationsmuster regelmäßig – lese ich viel laut vor – singe ich deutsche Lieder und achte dabei auf meine Aussprache – versuche ich, bestimmte Wörter und Sätze auf unterschiedliche Weise (z. B. fröhlich, ärgerlich, neutral, verwundert) auszusprechen – frage ich Muttersprachler oder meine Lehrerin, ob ich bestimmte Wörter richtig ausspreche – nutze ich jede Gelegenheit zur Kommunikation auf Deutsch und achte dabei nach Möglichkeit auf meine Aussprache –…

Tab. 3 (fortgesetzt)

272 Grit Mehlhorn

Phonetik

273

Literatur Abel, Clementine (2017): Erfassung und Förderung aussprachebezogener Kompetenzfacetten, Überzeugungen und Praktiken von Französischlehrkräften. Dissertationsschrift, Pädagogische Hochschule Freiburg. Aguado, Karin (2003): Kognitive Konstituenten mündlicher Produktion in der Fremdsprache: Aufmerksamkeit, Monitoring und Automatisierung. Fremdsprachen Lehren und Lernen 32, 11–26. Arras, Ulrike (2011): Mündliche Kompetenzen in der Fremdsprache fair messen. Babylonia 2/2011, 80–85. Aßbeck, Johann & Markus Hilgart (2011): Ausspracheschulung durch bewusstes Hören? PRAXIS Fremdsprachenunterricht 6/2011: 12–14. Belz, Malte (2013): Disfluencies und Reparaturen bei Muttersprachlern und Lernern – eine kontrastive Analyse. Masterarbeit, Humboldt-Universität zu Berlin (online). Breuer, Helmut & Maria Weuffen (2005): Lernschwierigkeiten am Schulanfang: Lautsprachliche Lernvoraussetzungen und Schulerfolg. Eine Anleitung zur Einschätzung und Förderung lautsprachlicher Lernvoraussetzungen. Weinheim: Beltz. Brunner, Monika & Hermann Schöler (2008): H A S E. Heidelberger Auditives Screening in der Einschulungsuntersuchung. 2. überarb. und erw. Aufl. www.westra.de/schule-hoeren/haseheidelberger-auditive-screening-in-der-einschulungsuntersuchung (30. 12. 2017). Dieling, Helga & Ursula Hirschfeld (2000): Phonetik lehren und lernen. München: Langenscheidt. Dretzke, Burkhard (2006): Ausspracheschulung im Fremdsprachenunterricht. In Udo O. H. Jung (Hrsg.): Praktische Handreichung für Fremdsprachenlehrer, 132–140. Frankfurt a. M.: Peter Lang. Dudenredaktion (2015): Duden 6. Das Aussprachewörterbuch (7., komplett überarb. und aktualis. Aufl.). Berlin: Dudenverlag. Dupoux, Emmanuel, Sharon Peperkamp & Sebastián-Gallés Núria (2001): A robust method to study stress „deafness“. Journal of Acoustic Society of America 110(3), 1606–1618. Ehlich, Konrad (2007): Sprachaneignung und deren Feststellung bei Kindern mit und ohne Migrationshintergrund: Was man weiß, was man braucht, was man erwarten kann. In BMBF, Referat Öffentlichkeitsarbeit (Hrsg.): Bildungsforschung Band 11. Anforderungen an Verfahren der regelmäßigen Sprachstandsfeststellung als Grundlage für die frühe und individuelle Förderung von Kindern mit und ohne Migrationshintergrund, 11–64. BMBF: Bonn, Berlin. Europarat (Hrsg.) (2001): Gemeinsamer europäischer Referenzrahmen für Sprachen: lernen, lehren, beurteilen. Berlin: Langenscheidt. Fandrych, Christian (2008): Sprachliche Kompetenz im „Referenzrahmen“. In Christian Fandrych & Ingo Thonhauser (Hrsg.): Fertigkeiten integriert oder separiert? Zur Neubewertung der Fertigkeiten und Kompetenzen im Fremdsprachenunterricht, 11–33. Wien: Praesens. Fried, Lilian (2009): Sprachkompetenzmodell Delfin 4. Testmanual (1. Teil). Unveröffentlichtes Manuskript, TU Dortmund, 78 Seiten. Fried, Lilian, Eva Briedigkeit, Patrick Isele & Rabea Schunder (2009): Delfin 4 – Sprachkompetenzmodell und Messgüte eines Instrumentariums zur Diagnose, Förderung und Elternarbeit in Bezug auf die Sprachkompetenz vierjähriger Kinder. Zeitschrift für Grundschulforschung. Bildung im Elementar- und Primarbereich 2/2009, H. 2, 13–26. Geist, Barbara & Andreas Krafft (2017): Deutsch als Zweitsprache. Sprachdidaktik für mehrsprachige Klassen. Tübingen: Narr Francke Attempto. Gibbon, Dafydd (1998): Intonation in German. In Daniel Hirst & Albert di Christo (Hrsg.): Intonation Systems. A Survey of Twenty Languages, 78–95. Cambridge: Cambridge University Press.

274

Grit Mehlhorn

Grotjahn, Rüdiger & Karin Kleppin (2015): Prüfen, Testen, Evaluieren (DLL 7), München: KlettLangenscheidt. Hahn, Angela (2006): Korrektive Phonetik: Ausspracheunterricht „revisited“. In Udo O. H. Jung (Hrsg.): Praktische Handreichung für Fremdsprachenlehrer, 140–145. 4. Aufl. Frankfurt a. M. u. a.: Peter Lang. Hardison, Debra M. (2004): Generalization of Computer-Assisted Prosody Training: Quantitative and Qualitative Findings. Language Learning & Technology 8(1), 34–52. Hasselhorn, Marcus & Ines Werner (2000): Zur Bedeutung des phonologischen Arbeitsgedächtnisses für die Sprachentwicklung. In Hannelore Grimm (Hrsg.): Sprachentwicklung (Enzyklopädie der Psychologie, Themenbereich C: Theorie und Forschung, Serie III Sprache, Bd. 3), 363–378. Göttingen: Hogrefe. Hellwig-Fábián, Inessa (2007): Deutsch mit ausländischem Akzent. Eine empirische Studie zu Einstellungen junger Deutscher gegenüber Sprechern mit ostslavischer Muttersprache. Frankfurt a. M. u. a.: Peter Lang. Hirschfeld, Ursula (1994): Untersuchungen zur phonetischen Verständlichkeit Deutschlernender. Frankfurt a. M.: Hector. Hirschfeld, Ursula (2016): Verfügen über sprachliche Mittel: Phonetik. In Eva Burwitz-Melzer, Grit Mehlhorn, Claudia Riemer, Karl-Richard Bausch & Hans-Jürgen Krumm (Hrsg.): Handbuch Fremdsprachenunterricht. 6., völlig überarbeitete und erweiterte Auflage, 121–126. Tübingen: A. Francke. Hirschfeld, Ursula & Kerstin Reinke (2016): Phonetik im Fach Deutsch als Fremd- und Zweitsprache. Berlin: Erich Schmidt. IFP – Bayrisches Staatsinstitut für Frühpädagogik (Hrsg.) (2006): Sismik – Sprachverhalten und Interesse an Sprache bei Migrantenkindern in Kindertageseinrichtungen. 10 Beobachtungsbögen mit Begleitheft. Freiburg i. Br.: Herder. IPA – The International Phonetic Association (2007): Handbook of the International Phonetic Association. A Guide to the Use of the International Phonetic Alphabet. Cambridge: University Press. Kijak, Anna (2009): How stressful is L2 stress? A cross-linguistic study of L2 perception and production of metrical systems. Utrecht: LOT. Krech, Eva-Maria, Eberhard Stock, Ursula Hirschfeld & Lutz Christian Anders (2010): Deutsches Aussprachewörterbuch. Berlin, New York: Walter de Gruyter. Macdonald, Shem (2002): Pronunciation – views and practices of reluctant teachers. Prospect 17, 3–18. Marx, Nicole & Grit Mehlhorn (2010): Pushing the Positive: Encouraging Phonological Transfer from L2 to L3. International Journal of Multilingualism, Vol. 7, No. 1, Febr. 2010, 4–18. Marx, Nicole & Grit Mehlhorn (2016): Analyse von Lernersprache. In Daniela Caspari, Friederike Klippel, Michael K. Legutke, & Karen Schramm (Hrsg.): Forschungsmethoden in der Fremdsprachendidaktik. Ein Handbuch, 297–306. Tübingen: Narr Francke Attempto. Mehlhorn, Grit (2007): Individual Pronunciation Coaching and Prosody. In Jürgen Trouvain & Ulrike Gut (eds.): Non-native prosody: phonetic description and teaching practice, 211–236. Berlin, New York: Mouton de Gruyter. Mehlhorn, Grit (2012): Phonetik/Phonologie in der L3 – Neuere Erkenntnisse aus der Psycholinguistik. Deutsch als Fremdsprache 4/2012, 201–207. Mehlhorn, Grit (2016): Der Ton macht die Musik! Anregungen zur Aussprachevermittlung im Russischunterricht. In Anka Bergmann (Hrsg.): Kompetenzorientierung und Schüleraktivierung im Russischunterricht, 113–148. Frankfurt a. M.: Peter Lang. Mehlhorn, Grit & Jürgen Trouvain (2007): Sensibilisierung von Fremdsprachenlernenden für Prosodie. Zeitschrift für Interkulturellen Fremdsprachenunterricht [Online], 12(2), 2007, 25 Seiten.

Phonetik

275

Meisel, Jürgen M. (2009): Second language acquisition in early childhood. Zeitschrift für Sprachwissenschaft 28(1), 5–34. Mempel, Caterina & Grit Mehlhorn (2014): Datenaufbereitung: Transkription und Annotation. In Julia Settinieri, Sevilen Demirkaya, Alexis Feldmeier, Nazan Gültekin-Karakoç & Claudia Riemer (Hrsg.): Empirische Forschungsmethoden für Deutsch als Fremd- und Zweitsprache. Eine Einführung, 147–166. Schöningh: Paderborn. Molnár, Heike & Torsten Schlak (2005): Zum Zusammenhang zwischen Alter und Aussprachekompetenz. Die kritische Periode des Ausspracheerwerbs im Lichte neuer Forschungsergebnisse. Fremdsprachen und Hochschule 73, 70–99. Oksaar, Els (1989): Mehrsprachigkeit im Vorschulalter. Die Neueren Sprachen 88, 310–327. Osburne, Andrea G. (2003): Pronunciation strategies of advanced ESOL learners. IRAL 41, 131–143. Reinke, Kerstin (2008): Zur Wirkung phonetischer Mittel in sachlich intendierter Sprechweise bei Deutsch sprechenden Russen. Frankfurt a. M.: Peter Lang. Reinke, Kerstin (2011): Fremder Akzent – von der auditiven Wahrnehmung zur Deutung der Persönlichkeit. Babylonia 2/2011, 73–79. Reinke, Kerstin (2012): Phonetiktrainer A1-B1. Kurs- und Selbstlernmaterial mit 2 Audio-CDs. Stuttgart: Klett. Richter, Julia (2008): Phonetische Reduktion im Deutschen als L2. Eine empirische Querschnittsstudie. Baltmannsweiler: Schneider Verlag Hohengehren. Rothweiler, Monika (2007): Bilingualer Spracherwerb und Zweitspracherwerb. In Markus Steinbach (Hrsg.): Schnittstellen der germanistischen Linguistik, 103–136. Stuttgart: Metzler. Rymarczyk, Jutta (2016): Aussprachekompetenz im Schriftspracherwerb mit TING-Stiften und Bildwörterbüchern. In Heiner Böttger & Norbert Schlüter (Hrsg.): Fortschritte im Frühen Fremdsprachenlernen, 152–161. Braunschweig: Westermann. SBI – Sächsisches Bildungsinstitut (2013): Niveaubeschreibungen Deutsch als Zweitsprache für die Primarstufe. Dresden. Schlak, Torsten (2008): Fremdsprachenlerneignung: Tabuthema oder Forschungslücke? Zum Zusammenhang von Fremdsprachenlerneignung, Fremdsprachenlernen und Fremdsprachenvermittlung. Zeitschrift für Fremdsprachenforschung 19: 1, 3–30. Settinieri, Julia (2010): Ausspracheerwerb und Aussprachevermittlung. In Hans-Jürgen Krumm, Christian Fandrych, Britta Hufeisen & Claudia Riemer (Hrsg.): Deutsch als Fremd- und Zweitsprache. Ein internationales Handbuch, 999–1008. Bd. 1, Berlin, New York: de Gruyter Mouton. Settinieri, Julia (2011): Soziale Akzeptanz unterschiedlicher Normabweichungen in der L2-Aussprache Deutsch. Zeitschrift für Interkulturellen Fremdsprachenunterricht 16: 2, 66–80. http://tujournals.ulb.tu-darmstadt.de/index.php/zif/article/view/119/114 (13. 10. 2016).

Tabea Becker

12 Orthographie 1 2 3 4 5 6 7

Einleitung Was ist orthographische Kompetenz? Welche Ziele werden mit Orthographie-Diagnostik verfolgt? Herausforderungen der Diagnose bei DaZ Verfahren zur Diagnose von Rechtschreibfähigkeiten Alternative Diagnoseformate Fazit

1 Einleitung Unter den sprachlichen Kompetenzen, welche es in unserem Bildungssystem zu erwerben gilt, kommt der Orthographiekompetenz eine besondere Rolle zu, und zwar aus mehreren Gründen. Zunächst wird sie als Selektionskriterium herangezogen (vgl. Hasselhorn, Marx & Schneider 2008), wohlmöglich sogar als entscheidendes (womit natürlich nicht gesagt ist, dass dies auch wünschenswert ist). In einer umfangreichen diachronen Studie haben Steinig et al. (2009) nachgewiesen, dass die Rechtschreibfähigkeiten Ende Klasse vier ausschlaggebend sind für die Empfehlung zur weiterführenden Schule, d. h. die Rechtschreibleistung korreliert mit der Schulempfehlung. Im Vergleich zu der Situation in den 70er Jahren hat diese Selektionsfunktion sogar noch zugenommen. Auch bei der Bewertung und Einschätzung von Texten wird die Orthographie oft dominant wahrgenommen (Birkel 2003). Es besteht die Gefahr, dass einer Schülerin mit schwachen Rechtschreibleistungen weniger zugetraut wird als einer Schülerin, die stark in Rechtschreibung ist. Diesem hohen Stellenwert der Orthographie bei der Bewertung und Beurteilung sprachlicher Kompetenzen allgemein steht andererseits gegenüber, dass Orthographie meist ein eher ungeliebter Lerngegenstand ist. Dabei ist er nicht nur bei den Schülerinnen und Schülern ungeliebt, die Orthographie oft als etwas Willkürliches, Unangenehmes wahrnehmen, bei dem viele schon resigniert haben. Auch die Lehrpersonen sehen in der Vermittlung der Orthographie nicht selten nur eine lästige Pflichtübung (vgl. hierzu Thomé 2011). Zudem wird auch die fachdidaktische Diskussion um die Orthographievermittlung sehr kontrovers geführt und ist seit Jahrzehnten geprägt von schon beinahe ideologischen Debatten (aktuell Kruse & Reichardt 2016). Vor diesem Hintergrund müssen Fragen der Diagnostik gesehen werden, auch wenn es um Kinder mit Deutsch als Zweitsprache (DaZ) gehen soll.

https://doi.org/10.1515/9783110418712-012

278

Tabea Becker

2 Was ist orthographische Kompetenz? Bevor verschiedene Möglichkeiten und Formen der Diagnose vorgestellt werden, soll zunächst geklärt werden, was unter orthographischer Kompetenz1 verstanden werden kann. Lange Zeit dominierte ein Verständnis, bei dem Rechtschreibfähigkeit mit dem Korrektheitsgrad beim Diktatschreiben gleichgesetzt wurde. Diesem Verständnis entspricht auch das Konzept der meisten Diagnoseverfahren, welche Rechtschreibkompetenz mittels eines diktierten Textes überprüfen (sogenannte testabhängige Verfahren). Geprägt wurde dieser Zugang von der Pädagogischen Psychologie, die lange Jahre das Feld der Rechtschreibforschung dominierte. Für sie „ist Rechtschreibkompetenz das, was der standardisierte Rechtschreibtest misst“ (Hinney 2011: 192). Die curricularen Vorgaben erwarten dagegen unter dem Stichwort „richtig schreiben“ eher Anwendungsbezogenes. So heißt es im Kerncurriculum Gymnasium von Baden-Württemberg für das Ende von Schuljahrgang 6, die Schülerinnen und Schüler „[…] üben und festigen ihre grundlegende Rechtschreibkompetenz. Sie verwenden Strategien zum normgerechten Schreiben und entwickeln Fehlersensibilität“ (Ministerium für Kultus, Jugend und Sport 2016: 27). Die einzelnen Teilkompetenzen sind „Regeln der Schärfung und Dehnung sowie der Schreibung der s-Laute nennen und korrekt anwenden“, „Groß- und Kleinschreibung unterscheiden; Großschreibung von Namen, Höflichkeitsformen, Satzanfängen und Nomen (auch Nominalisierung) normgerecht anwenden; dabei auch grammatisches Wissen anwenden“, „Rechtschreibstrategien (Silbierung, Wortverlängerung, Ableitungen) und grundlegende Rechtschreibregeln (Lautprinzip, morphematisches Prinzip, silbisches Prinzip, grammatisches Prinzip) beim Schreiben und Überarbeiten von Texten anwenden“, und „die Rechtschreibhilfe am Computer bei der Erstellung eigener Texte anwenden“ (Ministerium für Kultus, Jugend und Sport 2016: 29). Im Kerncurriculum Gymnasium Niedersachsen sollen am Ende der Schuljahrgänge 6, 8 und 10 Schülerinnen und Schüler „die eingeführten Regeln der Rechtschreibung und Zeichensetzung sicher [beherrschen] und […] häufig vorkommende Wörter, Fachbegriffe und Fremdwörter richtig schreiben“ (Niedersächsisches Kultusministerium 2006: 18). Zudem „erkennen und berichtigen [sie] regelgeleitet Verstöße gegen die Sprachrichtigkeit unter Verwendung eines Nachschlagewerks“ (Niedersächsisches Kultusministerium 2006: 18). Diese Formulierungen implizieren ein Verständnis, nachdem Kompetenz die Kenntnis und Anwendung von Regeln umfasst, aber auch von Schreib- und Überarbeitungsstrategien, und zwar in erster Linie im integrierten Schreiben. Zudem wird ein Bezug zu grammatischem Wissen hergestellt, welcher sich auch in den Curricula anderer Bundesländer und Schulformen wiederfindet.

1 Die Begriffe Orthographie und Rechtschreibung werden im Folgenden synonym verwendet.

Orthographie

279

Offen bleibt dabei allerdings, in welchem Verhältnis orthographisches Wissen und orthographisches Können zueinander stehen sollten; zumal der Zusammenhang zwischen Wissen und Können oder auch prozeduralem Wissen in der Sprachdidaktik bewusst hergestellt wird. So formuliert etwa Ossner in seinem Kompetenzmodell (2008), zur orthographischen Kompetenz gehöre prozedurales Wissen. Hierunter versteht er automatisiertes Handeln im Sinne von Können. Diesem hinzuzufügen sei Problemlösungswissen und Regelwissen, auf welches in Zweifelsfällen zurückgegriffen werden kann (Ossner 2008: 164). Auch Hinney definiert: „Rechtschreiben ist eine sprachliche Handlung, ein Können, das als kognitive Fertigkeit auf ‚prozeduralem Wissen‘ (‚implizites Wissen‘, ‚tacit knowledge‘, ‚knowing how‘) beruht“ (2011: 197). Diese Positionen richten sich gegen ein Verständnis, nach dem kompetent wird, wer Regeln paukt und auswendig lernt (kritisch hier z. B. auch Thomé (2011)). Im Übrigen tun sich selbst erfahrene Rechtschreiber mit der Nennung von Rechtschreibregeln schwer. Eckert & Stein (2006) stellen aufgrund einer Interviewstudie mit Fünftklässlern einer Hauptschule folgende Vermutungen auf: Die Kinder verfügen über ein eher implizites orthographisches Wissen, „das sie befähigt, die Strukturen zu entdecken, die schriftrelevant sind, und sie regelmäßig zu verschriften“ (Eckert & Stein 2006: 157). Dieses Wissen ist jedoch weder ein gesichertes Wissen noch ist es explizierbar und steht den Kindern auch nicht als Kontrollwissen zur Verfügung. Erschwerend kommt hinzu, dass sich dieses implizite Wissen, selbst wenn es rechtschreibförderlich ist, oftmals nicht mit dem im Unterricht vermittelten Wissen deckt und wohl auch gerade dadurch implizit bleibt. Eine stärkere Verbindung expliziten und impliziten Wissens im Schrifterwerbsprozess erscheint sicherlich wünschenswert, jedoch wird dieser Zusammenhang gegenwärtig noch beforscht, da sich noch viele offene Fragen ergeben (allgemein: Funke 2005, bezogen auf Schrift: Becker & Peschel 2013). Ebenfalls noch Klärungsbedarf besteht bezüglich der Frage, wie sich diese Wissensformen zur allgemeinen Sprachbewusstheit verhalten. Nicht selten ist zu beobachten, dass eine gewisse Bewusstheit über die schriftsprachlichen Zusammenhänge erst Folge des Schrifterwerbs ist, so z. B. Aspekte der phonologischen Bewusstheit (Schnitzler 2008). Auch bezüglich der morphologischen Bewusstheit ist zwar unstrittig, dass sie einen wichtigen Bestandteil von Lese- und Rechtschreibfähigkeiten ausmacht (vgl. z. B. Bredel, Noack & Plag 2013), aber noch weitgehend ungeklärt ist auch hier, inwiefern sie Voraussetzung oder Folge des fortgeschrittenen Rechtschreiblernens ist und in welchem Zusammenhang sie wiederum zu deklarativem und prozeduralem Wissen steht. Bezogen auf Schreiblernerinnen und Schreiblerner mit DaZ muss wohl davon ausgegangen werden, dass sich derartige Zusammenhänge noch komplexer gestalten. Denn es ist bislang noch nicht erwiesen, ob sich die in einzelnen Studien dokumentierte Überlegenheit von Mehrsprachigen gegenüber Einsprachigen im Bereich metasprachlicher Bewusstheit (vgl. z. B. die Arbeiten von Bialystok 2001; 2009) auch auf Bereiche wie die phonologische und morphologische Bewusstheit erstreckt

280

Tabea Becker

(phonologische Bewusstheit scheint eher sprachunabhängig zu sein, morphologische und lexikalische jedoch nicht (Bialystok & Luk 2007)) oder ob der später einsetzende oder verzögerte Erwerbsprozess in der Zweitsprache mit Einschränkungen verbunden ist (z. B. Krafft 2014). Neuere Studien deuten jedoch auch bei mehrsprachigen Kindern darauf hin, dass metasprachliche Bewusstheit nicht so sehr Voraussetzung von Alphabetisierung in der Zweit-, aber vor allem auch in der Erstsprache ist, sondern viel mehr die Folge davon (aktuell Krafft 2014). Erwerbsmodelle bleiben oft sehr vage bezüglich der Frage, wie sich dieses Verhältnis im Erwerbsprozess ausgestaltet. Für die orthographische und damit höchste Erwerbsstufe wird lediglich von zunehmender Einsicht und „zunehmender Automatisierung“ gesprochen (Scheerer-Neumann 2017: 76). Dies mag darin begründet sein, dass mit der Perspektive des Lernenden und der Perspektive des versierten Schreibers zwei unterschiedliche Sichtweisen auf die Rechtschreibkompetenz vorliegen. So fasst Hinney zusammen: Rechtschreibkompetenz zeigt sich im Können, das zwar im Tun ausgebildet wird, aber keineswegs durch ein ‚learning by doing‘ allein entsteht. Entfaltung der Rechtschreibkompetenz setzt Motivation, Einsicht in die Funktion und Aufbau der Schrift für die schriftsprachliche Kommunikation, rechtschriftliches Problembewusstsein und bewusste meta-kognitive Kontrolle voraus (Hinney 2011: 204)

Scheerer-Neumann gibt bezüglich des Zusammenhangs von Regelwissen und prozeduralem Wissen im Verlaufe des Schrifterwerbs Folgendes zu bedenken: Die Beobachtung, dass eine versierte Schreiberin oder ein versierter Schreiber über kein oder wenig Regelwissen verfügt, muss nicht unbedingt so interpretiert werden, dass nie Regelwissen vorlag. „Möglicherweise hat der Schreiber früher doch Regeln, z. B. zur Identifikation von Nomen und ihrer Großschreibung, gelernt; wenn diese Kenntnis Teil des prozeduralen Wissens (eigentlich besser: Könnens) wird, muss die Regel bewusst jedoch nicht mehr aktiviert werden.“ (Scheerer-Neumann 2015: 162) Weitere Hinweise zum Verhältnis dieser beiden Kompetenzausprägungen liefert die Untersuchung von Hoffmann-Erz. Sie konzipiert ein Erwerbsmodell, nach welchem „die Fähigkeit, Pseudowörter nach orthographischen Normen zu markieren, von einer entsprechenden Anzahl richtig geschriebener Echtwörter ab[hängt]. Unabhängig von der jeweiligen Jahrgangsstufe steigen die Werte der Pseudowörter mit der Anzahl der Treffer bei den Echtwörtern“ (Hoffmann-Erz 2014: 76). Dieser Befund legt nahe, dass sich Rechtschreibkompetenz ausbildet, indem zunächst eine gewisse kritische Menge an Wörtern geschrieben werden kann. Aus diesen Schreibungen werden dann orthographische Strukturen generalisiert und abstrahiert, welche wiederum auf weitere Wörter und eben auch auf Pseudowörter übertragen werden können. Dies würde bedeuten, dass der Erwerbsprozess geprägt ist von einer Wechselwirkung zwischen Aspekten des Automatisierens und des Könnens und Aspekten des Wissens und des Generalisierens. Diese Erkenntnis mag nicht unbedingt neu sein, ist aber ohne weitere Forschungen bislang kaum präziser zu formulieren. Hinzu kommt, dass innerhalb einiger Studien die Vermutung aufgestellt wird, es gäbe

Orthographie

281

unterschiedliche Lernertypen (Thomé & Eichler 2000; Becker 2011), so dass möglicherweise auch individuell ausgeprägte Wirkungen dieser Aspekte im Lernprozess zu beobachten sind. In eine ähnliche Richtung lassen sich die Befunde von Erwachsenen interpretieren, die unter einer Agraphie leiden. Da zwei Typen unterschiedlicher Störungsbilder identifiziert werden können, liegt die Vermutung nahe, dass auch zwei unterschiedliche Formen der Speicherung und des Wissens vorliegen: zum einen eine eher regularisierungs- und musterbezogene, zum anderen eine eher lexikalisch-wortbezogene (vgl. Scheerer-Neumann 2015: 157–158). Einen Überblick zur Rechtschreibkompetenzmodellierung bietet Reichardt (2015: 106–107). Dieser Überblick offenbart, dass sehr unterschiedliche Möglichkeiten und Zugänge diesbezüglich bestehen. Während von Blatt et al. (2011) für den Primarbereich eine Differenzierung orthographischer Kompetenzen geboten ist, schlägt Reichardt ein Modell vor, welches lediglich zwei Teilbereiche umfasst. Jedoch werden die vorgenommenen Differenzierungen unterschiedlich konzipiert: Blatt et al. unterteilen in einen Kernbereich und in einen Peripheriebereich. Reichardts Modell setzt sich aus mehreren Teildimensionen zusammen. Bei der Überprüfung ihres Modells kommt sie zu dem Ergebnis, dass „sich die Struktur der Rechtschreibkompetenz mit zunehmendem Schreibalter verändert.“ (Reichardt 2015: 239). Für die Rechtschreibkompetenzmodellierung würde dies bedeuten, dass sie sich „bezogen auf das Alter der Schülerinnen und Schüler nicht stabil verhält und eine stärkere Ausdifferenzierung insbesondere in unteren Grundschulklassen möglich scheint, während mit zunehmendem Rechtschreibkönnen eher globale Kompetenzstrukturen zu erwarten sind“ (Reichardt 2015: 239). Fay (2010b: 160) fordert zudem eine Differenzierung der Rechtschreibkompetenz, je nachdem ob es sich um integriertes oder nicht-integriertes Schreiben handelt. Diese Forderung zieht sie aus den Ergebnissen ihrer Studie, bei welcher die Schreibungen aus freien Texten und Schreibungen innerhalb der HSP verglichen wurden (Fay 2010b). Sie postuliert bezüglich des nicht-integrierten Schreibens in einem Rechtschreibtest: Da die Leistung im nicht-integrierten Schreiben des Tests teilweise signifikant schlechter ist als in der Dimension des freien Schreibens und dieser Leistungsunterschied in den einzelnen Kategorien nicht konstant ist, kann mit dem Testergebnis keine Aussage über die Rechtschreibkompetenz im integrierten Schreiben getroffen werden. (Fay 2010b: 161)

Derartige Befunde lassen Zweifel aufkommen an der Praxis, Rechtschreibkompetenz zu bestimmen über Leistungen in Rechtschreibtests. Zumal dies weder den curricularen Kompetenzbeschreibungen entspricht noch alltagsweltlichen und beruflichen Kompetenzanforderungen. Eine Modellierung der Rechtschreibkompetenz spezifisch für Lernerinnen und Lerner mit Deutsch als Zweitsprache wurde bisher nicht vorgenommen, vor allem auch da unklar ist, ob dies nötig bzw. überhaupt sinnvoll erscheint. Zwar wird für die Beurteilung allgemeiner gesprochen sprachlicher oder textueller Kompetenzen

282

Tabea Becker

immer wieder gefordert, auch Kompetenzen in der Erstsprache zu berücksichtigen, dies würde aber die Diagnose relativ komplex gestalten und einen hohen zeitlichen Aufwand bedeuten. Zumal der Zusammenhang diesbezüglich noch nicht ausreichend erforscht werden konnte. Die verschiedenen Positionen zur Modellierung von Rechtschreibkompetenz, wie sie einerseits durch theoretische Überlegungen und curriculare Vorgaben gegeben sind und andererseits durch Möglichkeiten und Herangehensweisen im Rahmen von Rechtschreibtests und auch wohl vielfach durch das Allgemeinverständnis, einander näher zu bringen, stellt sicherlich eine der Herausforderungen für die Zukunft dar (vgl. auch Brügelmann 2015a: 154).

3 Welche Ziele werden mit OrthographieDiagnostik verfolgt? Da sich somit orthographische Kompetenzen als etwas sehr Vielschichtiges erweisen, ist es für die nähere Erörterung diagnostischer Möglichkeiten zunächst geboten, die unterschiedlichen Ziele und Zwecke genauer zu bestimmen. Ganz allgemein kann Rechtschreibdiagnostik entweder zum Ziel haben, zu bestimmen, welche Kinder besonders schwache Leistungen zeigen. Sie hätte in diesem Falle eine Selektionsfunktion (vgl. Settinieri & Jeuk in diesem Band). Zum anderen kann Diagnostik eingesetzt werden, um konkrete Schwachpunkte und damit den genauen Förderbedarf von Lernerinnen und Lernern zu ermitteln. Diese beiden grundlegenden Funktionen lassen sich natürlich noch weiter differenzieren. Die Selektionsfunktion dient dazu, aus einer großen oder größeren Gruppe von Schülerinnen und Schülern diejenigen herauszufiltern, die Schwierigkeiten beim Erlernen der Orthographie haben. Während eine Diagnose, die selektieren soll, in erster Linie standardisiert sein muss und damit auch unweigerlich defizitorientiert, sollte Förderdiagnose immer auch berücksichtigen, dass „gleichen Fehlerzahlen durchaus unterschiedliche Lernstände zugrunde liegen können“ (Herné 2003: 890). Hier gilt es daher, nicht nur quantitativ die Fehleranzahl zu erheben, sondern auch qualitativ die Art des Fehlers zu analysieren, um hieraus Rückschlüsse auf den Lernstand ziehen zu können. Dieses wiederum bietet dann die Basis für eine an die Lernerin oder den Lerner angepasste Förderung. Einen Kompromiss suchen Verfahren, die ihrem standardisierten Test einen Fehlerschlüssel auflegen, der eine zusätzliche Differenzierung in bestimmte „Strategieprofile“ erlaubt (z. B. DRT oder HSP s. u.). Generell unterscheiden sich dementsprechend verschiedene Testverfahren hinsichtlich der Ziele, die sie verfolgen. So gibt es Tests, die ganz allgemein Rechtschreibleistungen ermitteln, Tests, die lediglich im Bereich der schwachen Rechtschreibleistung genauer differenzieren helfen, und Tests, die z. B. Schulformenoder Berufseignung ermitteln wollen (Frahm & Blatt 2011).

Orthographie

283

Die Selektionsfunktion von Rechtschreibtests ist insofern eine wichtige Funktion, als dass sie es ermöglicht, relativ große Schülergruppen daraufhin zu filtern, ob besondere Schwierigkeiten mit der Rechtschreibung bestehen. Gerade Kinder mit DaZ stehen hier immer wieder im Zentrum der Diskussion und gelten als besonders gefährdet. Es ist allerdings nicht leicht, diese weit verbreitete Annahme auch empirisch zu untermauern. Denn die Frage, inwiefern besonders Schülerinnen und Schüler mit DaZ Probleme beim Rechtschreibenlernen aufweisen, ist nicht pauschal zu beantworten. Während für das Leseverstehen recht eindeutige Nachteile dokumentiert wurden (Schründer-Lenzen & Merkens 2006; Hornberg & Valtin 2011), sind die Befunde bezüglich des Rechtschreibens unterschiedlich. Bei der Untersuchung größerer Gruppen zeigte sich zwar keine signifikante Unterlegenheit der Kinder mit DaZ (Betzel & Steinig 2013; Schründer-Lenzen & Merkens 2006), aber in Bezug auf bestimmte Bereiche (z. B. morphologische Schreibungen gemäß Fix 2002) oder bei der isolierten Betrachtung spezifischer Herkunftssprachen (Thomé 1987; Becker 2011; Grießhaber 2004) lassen sich Benachteiligungen feststellen. Vor besondere Herausforderungen sind demnach Kinder mit der Erstsprache Türkisch gestellt. Hier konfundieren oft auch sozioökonomische Faktoren. Denn übereinstimmend (jedenfalls insofern dies erhoben wird) kommen Studien zu dem Ergebnis, dass der sozioökonomische Hintergrund der Kinder einen sehr starken Einflussfaktor sowohl für die Lese- als auch die Rechtschreibentwicklung darstellt (Betzel & Steinig 2013; Zöller, Ross & Schöler 2006). Neben der Selektion besteht jedoch die Funktion einer Diagnostik vor allem darin, Ausgangspunkt für gezielte Fördermaßnahmen zu bieten. Spezifisch bei Kindern mit DaZ wäre für die Förderung wohl in erster Linie relevant zu differenzieren, ob bestimmte Schwierigkeiten, die ein Kind beim Rechtschreiben aufweist, auch tatsächlich Rechtschreibprobleme sind oder ob es sich um Fehler oder Zwischenstadien bei der Sprachaneignung in Bezug auf die Morphosyntax handelt. Bislang liegt kein Instrument vor, mit welchem ein derartiges Ziel verfolgt werden kann. Hierauf werden wir später noch einmal zurückkommen.

4 Herausforderungen der Diagnose bei DaZ Bevor auf konkrete Diagnosemöglichkeiten und -tests eingegangen wird, muss zunächst darauf hingewiesen werden, dass kein diagnostisches Verfahren besteht, welches spezifisch auf die Situation von Schreiblernerinnen und Schreiblernern orientiert ist, für die Deutsch nicht die Erstsprache darstellt. Daher muss auf bestehende Verfahren zurückgegriffen werden. Zudem mag es aus zeit- und arbeitsökonomischen Gründen geboten sein, in einer Regelklasse einheitliche Diagnoseverfahren anzuwenden. Weiterhin sind vorab noch einige grundsätzliche Dinge zu bedenken in Bezug auf die Diagnostik von Kindern mit DaZ. Allgemein ist erstens zu sagen, dass viele

284

Tabea Becker

Kinder mit DaZ den Schrifterwerb ohne Schwierigkeiten meistern. Zweitens gilt, dass sich hinter dem Attribut „Deutsch als Zweitsprache“ eine überaus heterogene Gruppe versammelt (in dritter Generation Migrierte, Seiteneinsteigerinnen und -einsteiger, Kinder Geflüchteter etc.). So lernt eine Zwölfjährige, die als irakische Arzttochter schon einige Jahre Schulbesuch hinter sich hat, anders als eine Zwölfjährige aus Somalia, die noch keine Schule besucht hat. Zudem liegen kaum verlässliche Daten vor, die es erlauben würden, den jeweiligen Gruppen bestimmte Charakteristiken zuzuschreiben. Ebenso wenig ist absehbar, wie sich die Situation in Zukunft entwickelt. Daher sollen im Folgenden einige Aspekte aufgelistet und anschließend kurz erklärt werden, die potentielle (!) Herausforderungen darstellen beim Schriftspracherwerb und damit auch bei der Rechtschreibdiagnostik von Lernerinnen und Lernern mit DaZ. 1. 2. 3. 4.

Ungünstige Lernvoraussetzungen und -bedingungen Ungünstigere sozio-ökonomische und kulturelle Ressourcen Geringere Verfügbarkeit und Zugriffsmöglichkeiten der zu verschriftenden Sprache Heterogene Leistungsprofile und Lernentwicklung (vgl. Becker & Peschel 2015)

Kinder mit DaZ bringen oft nicht die gleichen Voraussetzungen mit wie Kinder mit Deutsch als Muttersprache (vgl. auch Siebert-Ott 1998). Dies kann sich unterschiedlich äußern und unterschiedliche Ursachen haben, von denen hier nur einige beispielhaft erwähnt werden können. So mag z. B. die Phase der Migration der Familie in das Vorschulalter des Kindes gefallen sein. Es hat dann wenig Gelegenheit erhalten, sich mit der Schriftkultur, noch dazu der deutschen, auseinanderzusetzen. Möglicherweise konnte es auch nur wenige Erfahrungen sammeln im Umgang mit Papier und Stift. In vielen Fällen geht die Migrationssituation mit geringerem Zugriff auf ökonomische und kulturelle Ressourcen einher. Im Einwanderungsland besteht oft kein Angebot an herkunftssprachlicher Literatur; die Eltern haben zu wenig Geld oder Vertrautheit mit der neuen Kultur, um den Kindern das in der deutschen Mittelschicht übliche Angebot an kognitiv und kulturell anregendem Material zu machen (z. B. Museumsbesuche, kindgerechte Zeitschriften und Spielmaterialien). Auch die psycho-soziale Situation kann herausfordernd sein, sei es lediglich durch den zu verarbeitenden Wechsel des Lebensfeldes oder sogar durch traumatisierende Erfahrungen. Besonders entscheidend ist außerdem, dass Kinder mit DaZ in der Regel über geringere Kompetenzen in der Zweitsprache Deutsch verfügen als Kinder mit DaM. Fähigkeiten in der gesprochenen Sprache sind jedoch nicht gleichzusetzen mit Fähigkeiten in der geschriebenen Sprache, und zwar gilt dies in beide Richtungen. So sind sehr gute mündliche Sprachkompetenzen keine Garantie für einen problemfreien Schriftspracherwerb; ebenso ist es möglich, dass bei eher geringen Fähigkeiten in der Zweitsprache die (Recht)Schreibfähigkeiten sehr gut ausgebildet werden (vgl. Becker 2011). Man sollte sich aber klar vor Augen führen, was für eine enorme Lernleistung es bedeutet, wenn sich Kinder die Schriftsprache erschließen, ohne dabei

Orthographie

285

auf ausgebaute Fähigkeiten in allen Bereichen der gesprochenen Sprache zurückgreifen zu können. So ist z. B. bei Schwierigkeiten mit der Dehnungs- und Schärfungsschreibung unbedingt abzuklären, ob es sich nicht auch um Wahrnehmungsschwierigkeiten handelt. Eine Übersicht über mögliche Phänomene und Fehler, die auf Probleme mit der Sprache hindeuten, findet sich weiter unten. Da bei Schuleintritt bei vielen Kindern mit DaZ die Kompetenzen im Deutschen noch nicht genauso ausgebaut und differenziert sind wie bei Kindern mit DaM, – schließlich besteht oft eine geringere Kontaktdauer und damit geringere Lernzeit – sind unter Umständen sehr heterogene Lernwege zu beobachten (Becker 2011). Ein Kind, das aufgrund ungünstiger Voraussetzungen zunächst eine sehr langsame Lernentwicklung zeigt, hat möglicherweise gegen Ende der Grundschulzeit vieles kompensieren können und entwickelt sich nun überdurchschnittlich gut. Es kann aber auch sein, dass diese Entwicklung erst in der weiterführenden Schule einsetzt. Auffällig sind zudem oft sehr heterogene Leistungsprofile. Während Kinder mit DaM meist im sprachlichen Bereich einheitliche Leistungen zeigen, fällt bei Kindern mit DaZ auf, dass die Leistungsprofile sehr uneinheitlich sind in Bereichen, die üblicherweise zusammengefasst werden (vgl. Becker 2011). Daher ist gerade im sprachlichen und schriftsprachlichen Lernbereich für Kinder mit DaZ eine besonders starke Differenzierung in der Lernstandsbestimmung geboten und es sei vor zu schneller Etikettierung als leistungsstarkes oder -schwaches Kind gewarnt. Für die Diagnose bedeutet dies, – dass im Falle eines erst eher kurzen Kontaktes mit deutschen Bildungsinstitutionen darauf geachtet wird, dass die für die entsprechenden Testverfahren nötigen Voraussetzungen gegeben sind (z. B. Umgang mit Schreibgerät, sprachliche Verstehensleistungen); – dass auf eine stärkere Differenzierung geachtet werden muss, indem z. B. auch Teilleistungsbereiche untersucht werden oder Rechtschreib- und Lesefähigkeiten; – dass zwischen sprachlichen und schriftsprachlichen Schwierigkeiten unterschieden werden muss. Gegebenenfalls sind hierfür Sprachtests in der Zweitsprache erforderlich (eventuell und wenn möglich aber auch in der Erstsprache, wenn z. B. der Verdacht auf eine spezifische Sprachentwicklungsstörung besteht); – dass eine kontinuierliche Überprüfung der Diagnoseresultate nötig ist, da mit unerwartetem Leistungsanstieg oder -abfall gerechnet werden muss. Neben diesen eher allgemeinen Aspekten bleibt nun noch die Frage offen, inwieweit überhaupt „Fehler“ zu beobachten sind, die spezifisch oder besonders typisch für DaZ-Lernerinnen und Lerner sind. Die Forschung hat sich immer wieder mit dieser Frage befasst und relativ einhellig die Ergebnisse dahingehend interpretiert, dass zwar durchaus Fehlertypen zu beobachten sind, die ausschließlich von Kindern mit DaZ begangen werden, diese aber einen sehr geringen Prozentsatz ausma-

286

Tabea Becker

chen (Thomé 1987; Becker 2011). So erweist sich eine Abgrenzung zwischen DaZund DaM-typischen Fehlern als schwierig bis unmöglich, da sich im Einzelfall meist nicht eindeutig sagen lässt, welche Ursache ein bestimmter Fehler hat. Zudem werden eigentlich alle Fehlertypen, die als DaZ-spezifisch gelten, prinzipiell auch bei DaM-Kindern beobachtet, wenn auch einige ausnehmend selten (vgl. Jeuk 2012). In erster Linie sind hier die Sprossvokale zu nennen, die bei der lautlichen Realisierung der deutschen Wörter von türkischen Lernerinnen und Lernern eingefügt werden, um die Aussprache der Konsonantencluster zu erleichtern. Diese werden dann in die Schreibungen übernommen: (regnet), (Brief), (Knie). Auch die Herkunftssprache spielt eine wahrnehmbare, aber eher geringe Rolle für die Art der Fehler. So gibt es einerseits Sprachen wie das Serbo-Kroatische, welches eine recht gut geeignete lautliche Basis auch für die deutsche Schrift bietet (Grießhaber 2004); andererseits Sprachen, die z. B. keine Konsonantencluster oder Vokalquantitäten kennen, wie das Türkische, so dass dann von Kindern mit türkischer L1 mitunter eben solche Sprossvokale produziert werden. In Bezug auf den Einfluss von Schriftsystemen und Schreibkonventionen der Herkunftssprachen ist in erster Linie erheblich, inwieweit in der Erstsprache überhaupt eine Alphabetisierung stattgefunden hat. Graphematische Interferenzen werden allerdings in der Forschung äußerst selten bis gar nicht dokumentiert (Becker 2011; Berkemeier 1997; Thomé 1987). Grießhaber kommt im Rahmen einer Studie zu dem Schluss, dass „direkte Einflüsse erstsprachlicher Schriftsprachkonventionen eine im Einzelfall wahrnehmbare, aber generell vernachlässigbare Größe“ (2004: 84) darstellen. Diese Befunde lassen es gerechtfertigt erscheinen, dass für die Fehleranalyse bei Kindern mit DaZ Kenntnisse der herkunftssprachlichen Sprach- und Schriftsysteme nicht unbedingt erforderlich sind. Wie bereits erwähnt, ist es nicht leicht, Fehlertypen zu bestimmen, die spezifisch für Kinder mit DaZ sind. Bei den allermeisten Fehlern handelt es sich, wie gesagt, um Fehler, die prinzipiell auch von deutschen Schreiblernerinnen und -lernern gemacht werden. Es kann daher also nicht so sehr die Art des Fehlers sein, die DaZ-typisch ist, sondern vielmehr die Häufigkeit. Unter Fehlertypen, die bei DaZ-Kindern deutlich häufiger auftreten als bei DaM-Kindern, fallen folgende Typen, sortiert nach sprachlicher Ebene (nach Becker & Siekmann 2012: 182): Phonologisch: – keine Lautschemata (*bitanand für miteinander) – Markierung langer und kurzer Vokale (*Tire für Tiere, *stamen für stammen) Morphologisch: – mangelnde Diskriminierung der Flexionsmorpheme (*den für dem, *ginger, *rutschab) – Stammschreibung (*seuberd) Lexikalisch: – falsches Wort oder falscher Wortteil (z. B. in der HSP: Dieb für Räuber)

Orthographie

287

Der Anteil an diesen „typischen“ Fehlern an den Gesamtfehlern ist, wie oben bereits erwähnt, jedoch sehr gering. Fehlerbereiche, wie etwa die Groß- und Kleinschreibung, tauchen meist sowohl bei Kindern mit DaM als auch bei Kindern mit DaZ in etwa ähnlicher Art und Häufigkeit auf und machen in beiden Gruppen das Gros der Fehler aus (einen Überblick über Fehlertypen bietet auch Jeuk 2012). Überdies ist man sich in verschiedenen Studien nicht immer ganz einig, welche Bereiche in welcher Gruppe nun tatsächlich fehlerträchtiger sind. So postulieren Betzel & Steinig (2013) für Schülerinnen und Schüler mit Migrationshintergrund vergleichsweise geringere Schwierigkeiten im morphologischen Bereich, während Fix (2002) diesen als besonders problematisch wertet. Verantwortlich für diese Unterschiede könnte allerdings der Erhebungskontext sein, da unterschiedliche Schulstufen (Primar vs. Sekundar) und Formate (Text vs. Diktat) genutzt wurden.

5 Verfahren zur Diagnose von Rechtschreibfähigkeiten 5.1 Testabhängige Verfahren In Kapitel 2 wurden mögliche Zugänge dargelegt, was unter Rechtschreibkompetenz verstanden werden kann. Auch wenn wir dies kritisch diskutiert haben, sind Rechtschreibfähigkeiten doch im Vergleich zu anderen sprachlichen Fähigkeitsbereichen durch die klare Bezugsnorm recht gut objektivierbar. Und legt man das Verständnis zugrunde, rechtschreiben zu können bedeutet, einen diktierten Text möglichst fehlerfrei aufzuschreiben, lassen sich scheinbar einfach Verfahren und Instrumente entwickeln, die dies abtesten. In der Tat weist der Markt eine Vielzahl an Rechtschreibtests auf; fast alle vornehmlich für den Primarbereich. Im Folgenden sind gegenwärtig erhältliche standardisierte Testverfahren aufgelistet, die ausschließlich Rechtschreibfähigkeiten testen und im Primarbereich einsetzbar sind: – DRT 1 (Diagnostischer Rechtschreibtest), Rudolf Müller, seit 2003, 2. aktualisierte Auflage. Einsetzbar in Klasse 1 (Ende) und 2. – DRT 2, Rudolf Müller, seit 2003, 4. aktualisierte Auflage. Einsetzbar in Klasse 2 (Ende) und 3 (Anfang). – DRT 3, Rudolf Müller, seit 2003, 4. aktualisierte Auflage. Einsetzbar in Klasse 3 (Ende) und 4 (Anfang). – DRT 4, Martin Grund, Gerhard Haug, Carl Ludwig Naumann, seit 2003, 2. aktualisierte Auflage. Einsetzbar in Klasse 4 (Anfang bis Mitte). – HSP (Hamburger Schreibprobe) 1–4, Peter May, seit 2012, 6. neu normierte Auflage. Einsetzbar jeweils Mitte bis Ende des Schuljahres. – RST 1 (Rechtschreibtest für 1. Klassen), Peter Rathenow, seit 1993, 2. Auflage. Einsetzbar in Klasse 1.

288 –

– –

Tabea Becker

WRT 1, WRT 2 (Weingartener Grundwortschatz Rechtschreib-Test), Peter Birkel, seit 2007, 2. neu normierte und überarbeitete Auflage. Einsetzbar in Klasse 1 und 2 (letzte 2 Monate). WRT 3, WRT 4, Peter Birkel, seit 2007, 2. neu normierte und überarbeitete Auflage. Einsetzbar in Klasse 3 bzw. 4 (jeweils in den letzten 3 Monaten). WÜRT 1–2 (Würzburger Rechtschreibtest), Hans-Peter Tolldenier, seit 2014. Einsetzbar Ende Klasse 1, Anfang Klasse 2 und Ende Klasse 2, Anfang Klasse 3.

Bei einigen Verfahren werden neben den Rechtschreibfähigkeiten auch die Lesefähigkeiten getestet. Für Rechtschreib- und Lesefähigkeiten liegen vor: – BAKO 1–4 (Basiskompetenzen für Lese-Rechtschreibleistungen), Claudia Stock, Peter Marx, Wolfgang Schneider, seit 2003, jeweils Ende Klasse 1 bis 4. – SLRT-II (Salzburger Lese- und Rechtschreibtest), Kristina Moll & Karin Landerl, 2010, normiert 2006–2008, Klasse 1 bis Anfang 5. Schließlich bleibt noch zu erwähnen, dass gelegentlich auch im Rahmen allgemeiner Sprach- oder Leistungstests die Rechtschreibfähigkeiten einen Subtest bilden. Hierunter fallen die folgenden Tests: – ADST (Allgemeiner Deutscher Sprachtest), J. Steinert, seit 2011, 2. aktualisierte Auflage. Klasse 3 bis 10. – CT-D 4 (Schulleistungstest Deutsch für 4. Klassen). U. Ratz & C. Klein-Braley, 1992. – SBL I (Schultestbatterie zur Erfassung des Lernstandes in Mathematik, Lesen und Schreiben), H. Kautter et al, seit 2000, 2. Auflage. Ende Klasse 1, Diagnose eines besonderen Förderbedarfs. – KEKS (Schulleistungstest Deutsch für Klassen 1–4), P. May & Jasmine Bennöhr, 2013. Für die Sekundarstufe liegen Versionen der folgenden Tests vor: – DRT 5, Martin Grund, Gerhard Haug, Carl Ludwig Naumann, seit 2003, 2. aktualisierte Auflage. Einsetzbar Klasse 5 (Mitte). – HSP 4–5, 5–6, 7–8 und 9–10, Peter May, seit 2012 (HSP 4–5) bzw. 2015. Einsetzbar jeweils Ende des Schuljahres (letzte 3 Monate). – HSP 5–10, Peter May, seit 2012 B (Basisanforderung) oder EK (Erweiterte Kompetenz), 6. aktualisierte Auflage. Einsetzbar jeweils zum Ende des Schuljahres (letzte 3 Monate). – RST 6–7, Oskar Rieder, seit 1992, 2. Auflage. Einsetzbar in Klasse 6 und 7. – WRT 4+, Peter Birkel, seit 2007, 2. neu normierte und vollständig überarbeitete Auflage. Einsetzbar in Klasse 4 (Ende) und Klasse 5 (an Hauptschulen o. ä.). – WRT 4/5 (Westermann Rechtschreibtest), Peter Rathenow, 2. Auflage 1980. Einsetzbar Klasse 4 und 5. – WRT 6+, Peter Rathenow, Jochen Vöge, Doris Laupenmühlen, seit 1980. Einsetzbar von Ende Klasse 5 bis Ende Klasse 7.

Orthographie

289

Diese Diagnoseverfahren können als „testabhängig“ bezeichnet werden, da sie auf einem Testformat basieren, welches ein Rechtschreibinventar vorgibt, das mittels Diktat (in Form von Einzelwörtern, Sätzen oder Lückentexten) abgeprüft wird. Die Standardisierung erfolgt durch eine Eichstichprobe, durch die Repräsentativität gewährleistet werden soll. Um diese sicherzustellen, muss die Standardisierung aktuell sein. Es sollte also darauf geachtet werden, dass die letzte Teststandardisierung nicht älter als 15 Jahre ist (momentan liegt z. B. für den WRT 4 und 6 keine aktualisierte Normierung vor). Der Vorteil solcher Testverfahren besteht eben gerade in der Standardisierung, welche es erlaubt, ein Kind mit einer großen Zahl anderer Kinder zu vergleichen, und damit eine sehr valide und objektive Einschätzung ermöglicht. Zudem sind diese Verfahren meist sehr zeitökonomisch einsetzbar. Ein Klassensatz der HSP benötigt etwa 30–45 Minuten für die Durchführung und – online ausgewertet – 60–90 Minuten für die Auswertung. Ergebnisse eines solchen Rechtschreibtests sind in der Regel Prozentrangwerte. Sie geben Auskunft darüber, wie eine Testperson im Vergleich zur Eichstichprobe abschneidet. Ein gutes Testergebnis läge beispielsweise mit einem Prozentrang von 72 vor, da es die Aussage zuließe, dass 72 % der verglichenen Kinder eine schlechtere Testleistung erbringen. Im Allgemeinen wird die Grenze, ab der eine Förderbedürftigkeit besteht, mit 15 % angegeben. Dies stellt jedoch eine gewisse willkürliche, theoretisch und empirisch nicht fundierte Grenzziehung dar, was auch wiederholt diskutiert wird (im Überblick: Herné 2003: 884; vgl. Paetsch in diesem Band). Weiterhin liegt den Tests die Annahme zugrunde, dass die ausgewählten Items repräsentativ für den Schreibwortschatz sind. Allerdings werden testabhängige Verfahren gerade bezüglich der Itemauswahl kritisiert (vgl. hierzu Becker & Siekmann 2012). So handele es sich vielfach nicht nur um seltene Wörter, die meist nicht Gegenstand des Unterrichts waren, sondern auch oft um komplexe Nominalkomposita, z. B. der vielfach kritisierte „Quarkkuchen“ in der HSP 3 (Herné 2003: 888). Gerade für Kinder mit DaZ mag hierin eine besondere Hürde liegen, da sie ggf. über einen geringeren Wortschatz verfügen. Hinzu kommt, dass die Kinder in der Diktatsituation auf ihr Hörverstehen angewiesen sind. Dadurch kommt es vor, dass sie ein Wort akustisch-phonologisch nicht durchdringen. Sie schreiben dann „nach Gehör“ und es entstehen Formen wie für oder sie nehmen die Illustrationen zu Hilfe, die z. B. bei der HSP das Verständnis erleichtern sollen. Das führt aber mitunter dazu, dass statt des geforderten Wortes „Räuber“ die Kinder „Dieb“ verschriften, was entweder als Fehler gezählt werden müsste oder nicht valide ausgewertet werden könnte (vgl. Becker & Siekmann 2012: 178). Wiederum für alle Kinder gilt, dass man nicht unbedingt davon ausgehen kann, dass die Leistungen in einer belastenden Diktatsituation vergleichbar sind mit Leistungen, die beim Schreiben eigener freier Texte erbracht werden (Fay 2010a; Reichardt 2015). Einige Testverfahren nutzen, wie oben bereits erwähnt, zusätzlich Fehlerkategorien, die eine zumindest grobe Zuordnung zu bestimmten „Strategieprofilen“ erlauben. Diese Fehlerkategorien bestehen auch Korrelationstests und weisen oft eine

290

Tabea Becker

recht hohe Reliabilität auf (im Überblick: Herné 2003: 895). Auch sollte eine differenzierte Diagnostik ohnehin auf einem Erwerbsmodell oder einer graphematischen Theorie basieren. Trotz vereinzelter Kritik sind die meisten Modelle zum Schriftspracherwerb (z. B. Scheerer-Neumann 1998 oder Thomé 2003) in der didaktischen Forschung weitgehend anerkannt, da es mittlerweile auch weitreichende empirische Belege gibt (ein Überblick über die verschiedenen Erwerbsmodelle im Vergleich bietet Becker 2008). Bei allen Unterschieden im Detail beinhalten alle Modelle eine alphabetische Phase oder Stufe und eine orthographische. Diese beiden Phasen/ Stufen sind in ihrer Sukzession auch empirisch belegt durch Befunde, nach denen erst dann, wenn die Lernerinnen und Lerner weitgehend lautgerecht verschriften, auch größere Fortschritte bei den orthographischen Schreibungen zu beobachten sind (im Überblick Brinkmann: 2015). Der in Kapitel 2 thematisierte Unterschied zwischen orthographischem Wissen und orthographischem Können wird allerdings im gegenwärtigen Angebot an Instrumenten nicht aufgegriffen. Kritisch wird auch gesehen, dass nur wenige Testautoren (z. B. DRT) ihre Auswertungskategorien auch theoretisch fundieren (Frahm & Blatt 2011: 564). Zudem besteht bezüglich der Fehlerkategorien keine Einheitlichkeit, sondern es werden bestimmte Rechtschreibphänomene unterschiedlichen Fehlerkategorien zugeordnet. Frahm & Blatt nennen die Dehnungsmarkierungen und , die einmal zum „Anfängerfehler“, einmal zur „Dehnung und Kürzung“ und einmal zu „langes i“ bzw. „langer Vokal mit Kennzeichnung“ sortiert werden (2011: 564). Schließlich nennt Brügelmann noch einen weiteren kritischen Punkt: „Für die Leistungsbeurteilung bedeutsam ist der Befund, dass sich die Fehlerquote von guten Rechtschreiber/inne/n zwischen erster und zweiter Hälfte von Diktaten kaum verändert, bei schwachen Rechtschreiber/inne/n aber im zweiten Teil erheblich zunimmt“ (2015b: 189). Generell ist der diagnostische Wert, den solche testabhängigen, standardisierten Verfahren haben, daher relativ begrenzt.

5.2 Testunabhängige Verfahren Eine Alternative oder auch Ergänzung zu testabhängigen Verfahren stellen Verfahren dar, die es ermöglichen, mittels – meist sehr differenzierter – Fehlerschlüssel freie Texte auszuwerten, und damit einige der oben beschriebenen Problematiken umgehen (im Überblick: Becker & Siekmann 2012: 175). An heute verbreiteten und erprobten testunabhängigen Verfahren lassen sich die OLFA (Oldenburger Fehleranalyse, Thomé & Thomé 2014a; b) und die AFRA (Aachener Förderdiagnostische Rechtschreibfehler-Analyse, Herné & Naumann 2002) nennen. Die OLFA liegt in zwei Versionen vor: OLFA 1–2 (Thomé & Thomé 2014a, 3. Aufl.) ist in den Klassen 1 und 2 durchführbar, die OLFA 3–9 (Thomé & Thomé 2014b, 3. Aufl.) entsprechend für die Klassen 3 bis 9. Da es sich um Analyseverfahren handelt, sind sie jederzeit im Laufe des gesamten Schuljahres einsetzbar. Vorausset-

Orthographie

291

zung ist lediglich, dass eine kritische Menge an von dem zu testenden Kind selbst formulierten und verschrifteten Texten vorliegt. Für die OLFA 1–2 sind dies 100 Wörter, für die OLFA 3–9 müssen insgesamt 350 Wörter analysiert werden, um aussagekräftig auswerten zu können. Der Test besteht in einer als Kopiervorlage im Handbuch gegebenen Fehlerklassifikation, welche über 30 Analysekategorien vorsieht. Die Kategorien werden im Handbuch erklärt, indem u. a. Beispieltexte ausgewertet werden. Die Auswertung ermöglicht eine Zuordnung zu drei spezifischen Entwicklungsphasen (protoalphabetisch, alphabetisch, orthographisch), um dadurch das anschließende Förderkonzept differenzieren zu können. Ein Richtwert bezogen auf die tolerierte Fehlerzahl gibt zudem eine gewisse Jahrgangsstufen-Einschätzung. Ein weiteres testunabhängiges Verfahren ist mit der AFRA (Herné & Naumann 2002, 4. Aufl.) gegeben. Mit Hilfe dieses Analyseverfahrens können sowohl freie Texte als auch standardisierte Testverfahren ausgewertet werden. Sie bietet ein differenziertes Fehleranalyseraster, bestehend aus 16 Hauptkategorien und diversen Subkategorien. In erster Linie kann sie dann eingesetzt werden, wenn durch einen standardisierten Test, also z. B. die HSP, ein grundsätzlicher Förderbedarf ermittelt wurde und nun genauer diagnostiziert werden soll, in welchem Bereich dieser Förderbedarf vornehmlich besteht. Damit ist ein Einsatz in all jenen Klassenstufen möglich, für die generell Testverfahren bestehen, also von Klasse 1 bis 10. Durch die Möglichkeit der Anwendung auch auf freie Texte ist aber der Einsatzbereich offen. Das Verfahren sieht vor, die in einem Text oder innerhalb eines Tests fehlerhaft verschrifteten Wörter mittels Auswertungsbogen zu kategorisieren. Durch Fehlerhäufungen in bestimmten Kategorien können dann Fehlerschwerpunkte identifiziert werden. Grundsätzlich sind weder die AFRA noch die OLFA für DaZ-Lernerinnen und Lerner konzipiert, sondern allgemein für den förderdiagnostischen Gebrauch. Einen Vorschlag zur Erweiterung der OLFA, bei dem in gewissem Grade auch DaZ-Aspekte berücksichtigt werden, macht Siekmann (2014). Der Kritikpunkt, dass kein einheitliches Kategoriensystem besteht, sondern ebenfalls Rechtschreibphänomene unterschiedlich zugeordnet werden, bleibt auch für die testunabhängigen Verfahren bestehen, wenngleich beide vorgestellten Verfahren diese Kategorien theoretisch zumindest hinlänglich begründen. Beide Verfahren sind zudem sehr zeitintensiv, so dass sie sich kaum im Alltag des Regelunterrichts einsetzen lassen. Ihr Einsatz ist daher eher für die Einzeldiagnostik und die Individualförderung gedacht. Empfohlen wird meist, diese testunabhängigen Analyseverfahren dann zu nutzen, wenn während des Unterrichts oder durch Testung mit einem standardisierten Verfahren ein Kind bereits als förderbedürftig identifiziert wurde. Die Instrumente haben den Anspruch, dann zu ermitteln, in welchen Bereichen eine effektive Förderung ansetzen müsste. Sowohl das Kategoriensystem der AFRA, besonders aber das der OLFA erfordern eine intensive Einarbeitung, für die Kenntnisse der Graphematik nötig sind. Löffler (2014) empfiehlt die aufwändige Einarbeitung in das System daher nur, wenn das Verfahren auch regelmäßig ver-

292

Tabea Becker

wendet wird. Zugutehalten ließe sich, dass orthographietheoretische Kenntnisse ohnehin unerlässlich sind für zielführenden, sachangemessenen (Förder-)Unterricht. Das Analyseraster der OLFA ist zwar etwas differenzierter, seine Handhabung aber auch entsprechend aufwändiger (Löffler 2014: 115). Neben diesen beiden gängigen Verfahren sind außerdem noch sogenannte Lernbeobachtungen zu nennen (z. B. Becker 2011; Dehn 2013; Füssenich & Löffler 2005; Löffler 2012, 2014). Hierbei handelt es sich meist um eine Kombination aus freien Texten, die analysiert werden, und gezielten Schreibaufgaben. Vor dem Hintergrund sowohl schriftsystematischer als auch erwerbstheoretischer Zusammenhänge werden die Schreibprodukte der Kinder individuell analysiert, um so Einblicke in die kognitiven Möglichkeiten des Kindes zu erhalten. Dieses Verfahren kommt ohne vorgegebenes Raster oder Kategoriensystem aus, was Stärke und Schwäche zugleich ausmacht. Die Stärke liegt darin, dass auf diese Weise ermöglicht wird, auch Auffälligkeiten und Phänomene von Kindern mit DaZ aufzunehmen und mit einzubeziehen. So können z. B. Sprossvokale, Schwierigkeiten mit spezifischen Phonem-Graphem-Korrespondenzen oder Graphemschreibweisen aufgedeckt werden. Schwäche kann es insofern sein, als dass der Analyst selber über entsprechende Kenntnisse zur Interpretation der Schreibungen verfügen muss. Er muss dann z. B. wissen, dass die Schreibung *Tratror für durch Assimilationsprozesse ausgelöst werden kann (vgl. Füssenich & Löffler 2005: 167), die Schreibung *Chietzrichter für eine Hyperkorrektur der Koronalisierung von sein könnte (wie in manchen Dialekten und Ethnolekten üblich) oder dass die Schreibung *schwümmen für durch die Nachbarschaft der Laute [ɪ] und [ʏ] entstehen kann. Die Herausforderung liegt dabei nicht so sehr in der Frage, inwiefern diese Phänomene typisch für DaZ-Kinder sind, da diesbezüglich eine Abgrenzung ohnehin kaum möglich ist, sondern vielmehr in der Tatsache, dass einiges an phonetisch-phonologischem und graphematischem Wissen Voraussetzung ist. Die oben genannten Analyseraster erleichtern daher die Auswertung, indem sie diese Interpretationsleistungen zu einem gewissen Grade übernehmen, bergen aber auch die Gefahr, dass bestimmte Phänomene, und zwar möglicherweise auch DaZspezifische, unberücksichtigt und unerkannt bleiben. Die vorgestellten qualitativen Diagnoseverfahren erfüllen – zumindest in Ansätzen – Anforderungen, die für eine gezielte Förderung ganz entscheidend sind. Zum Beispiel sollten sie dafür sensibel sein, dass die Lernerinnen und Lerner individuelles Entwicklungspotential entfalten. Zwar besteht ein statistisch nachweisbarer Zusammenhang zwischen den Rechtschreibleistungen zu Beginn der Schulzeit und den Leistungen in der weiterführenden Schule. Je nach Studie gelingt es aber ungefähr einem Drittel der schwachen Rechtschreiberinnen und -schreiber in den höheren Klassen in die Gruppe der starken zu wechseln (Brinkmann 2015: 174). Gerade im Hinblick auf Kinder mit DaZ ist dies ein hochrelevanter Aspekt, auf den weiter oben bereits eingegangen wurde.

Orthographie

293

6 Alternative Diagnoseformate Neben dem entscheidenden Faktor, dass die bestehenden Test- und Analyseverfahren von der Grundkonzeption her nicht auf zweitsprachliche Rechtschreiblernerinnen und -lerner ausgelegt sind, kann in Zusammenstellung der obigen Ausführung festgehalten werden, dass 1. gängige Rechtschreibtests zwar ökonomisch sind, es aber nicht erlauben, Aussagen über die Fähigkeiten im freien und integrierten Schreiben zu treffen, 2. differenzierte Fehleranalysen zwar sehr gute förderdiagnostisch nutzbare Hinweise liefern, jedoch kaum zeitökonomisch im Regelunterricht einsetzbar sind, 3. nicht auf das der Kompetenz zugrundeliegende Wissen abgestellt wird, 4. die meisten Diagnoseverfahren eher defizitorientiert vorgehen; Fähigkeiten und bereits Erreichtes werden nicht berücksichtigt. Zwei Möglichkeiten sollen im Folgenden vorgestellt werden, mit deren Hilfe diesen Unzulänglichkeiten zumindest teilweise begegnet werden kann (für eine etwas detailliertere Beschreibung siehe Becker & Peschel 2017).

6.1 Pseudowortdiktat Von zunehmender Bedeutung für diagnostische Fragestellungen erweisen sich Pseudoworttests. Vergleiche mit Leistungen beim Schreiben von Echtwörtern, sowohl im Rahmen von Erwerbsstudien (Hoffmann-Erz 2014) als auch im Rahmen der Entwicklung standardisierter Testverfahren (May 2014), ergeben positive Korrelationen. Bei diesem Verfahren werden Wörter konzipiert, die zwar nicht im Lexikon des Deutschen enthalten sind, aber dessen phonematischer, phonotaktischer, morphematischer und graphematischer Struktur entsprechen. Um diesen Strukturen zu entsprechen, muss der folgende Satz auch so geschrieben werden: Ein Helg verbinnte die anderen Helge.

Ein Schreiber, der lediglich phonetisches und Buchstaben-Wissen besitzt, würde vielleicht folgendermaßen verschriften: ain helk fabent di andan helgh.

Eine derartige Verschriftung würde man daher lediglich von einem Schreibanfänger erwarten. Ein etwas tieferer Einblick in die phonematischen Zusammenhänge ergäbe vielleicht folgende Schreibung: Ein helk fabinte die anderen helge.

294

Tabea Becker

In einem weiteren Schritt muss sich die Lernerin oder der Lerner dann die morphologischen und syntaktischen Regularitäten erschließen, nämlich dass die Explizitform (also die zweisilbige Form) von „Helg“ „Helge“ lautet und daher ersteres mit zu schreiben ist, die Lautfolge [fa] für das Präfix steht und der Wortteil „bin“ für einen Stamm, dessen Explizitform „binnen“ lauten muss und daher einen Doppelkonsonanten fordert, und letztlich, dass Helg und Helge Kerne nominaler Gruppen sind und daher großgeschrieben werden (vgl. Günther & Nünke 2005). Die Methode des Pseudowortdiktates bildet somit eine Möglichkeit, Aufschluss über die Wissensbestände des Lerners zu erhalten, denn im Unterschied zum herkömmlichen Diktat kann nicht auf oberflächliches Regelwissen oder auswendig gelerntes Wortwissen zurückgegriffen werden. Pseudowortdiktate sind so konzipiert, dass die Schreiberinnen und Schreiber auf ihr verinnerlichtes und automatisiertes Strukturwissen zurückgreifen müssen. Dem Diagnostiker bietet es daher einen Einblick in diese Wissens- und Könnensbereiche, der andere Diagnoseergebnisse gut ergänzen kann. Gerade für die Schwachstellen der DaZ-Lernerinnen und -Lerner, die Dehnungsund Schärfungsschreibung bzw. die silbischen Grundstrukturen und die morphologischen Schreibungen, eignen sich die Pseudowortdiktate besonders, da sie aufdecken, wenn tatsächlich auf der Ebene des impliziten Wissens noch Lücken bestehen.

6.2 Erhebung zu impliziten und expliziten Wissensformen Auch der zweite Vorschlag zielt darauf ab, nicht nur oberflächliche Leistungen und Könnensaspekte in den Blick zu nehmen, sondern auch Strategie- und Regelwissen zu beleuchten. In Studien zum Rechtschreiberwerb findet sich dieser Zugang vereinzelt mittels Fragebogen oder Interview (z. B. Betzel 2015; Eckert & Stein 2006). Hierbei werden Schreibungen zu bestimmten Rechtschreibphänomenen von den Kindern elizitiert, welche dann begründet werden müssen. Die Begründungen dieser Schreibentscheidungen lassen Aussagen und Interpretationen zu über die Art des vorhandenen orthographischen Wissens. Diese Methode bietet eine Möglichkeit, Aufschluss darüber zu erhalten, ob die Kinder über Regelwissen, Strategiewissen oder generell explizierbares Wissen verfügen. Verbunden mit den jeweiligen Schreibungen kann nun analysiert werden, ob Richtig- bzw. Falschschreibungen wegen oder trotz dieses Wissens getätigt werden. Folgende Beispiele stammen aus 4. und 5. Klassen (Kindertext kursiviert): a) Das gute musizieren: Ich schreibe das Wort so, weil das sonst komisch klingt. b) Den großen Leuchturm: Ich schreibe das Wort so, weil Leuchturm wird mit einem t geschrieben weil der Turm lang gesprochen wird. c) das Schild: Es ist so weil ich verlängert habe, Schild – Schilder d) das Backblech: Wenn man das Wort Backblech ableitet kommt backen raus und man schreibt backen mit ck.

Orthographie

295

e) verlaufen: Man schreibt ver immer mit v wenn es vor einem Wort vorkommt. f) die Ränder: Ränder schreibe ich mit ä, weil es im Singular Rand ist und ich es deshalb mit ä schreibe. Dieses Verfahren hat den Vorteil, dass Zuordnungen zu Entwicklungsphasen oder auch zu Lernabschnitten möglich sind, da miteinbezogen wird, welche Schreibungen das Kind beherrscht und in welchem Grade und wie dieses Wissen sich offenbart. Es kann in schriftlicher Form erhoben werden, aber auch in Interviewform oder als Klassengespräch. Abschließend soll noch einmal erwähnt werden, dass diese beiden vorgestellten Alternativen zwar keine standardisierten Verfahren sind und zudem testabhängig. Dennoch können sie als eher qualitative Verfahren wichtige Hinweise geben über die Lernfortschritte und die Kompetenzniveaus der Schülerinnen und Schüler.

7 Fazit Besonders zu betonen bleibt, wie wichtig, ja unerlässlich der diagnostische Blick generell auf die Texte der Schreibnovizen ist (so z. B. Naumann 2015: 184), da er Voraussetzung für die konstruktive und lernförderliche Begleitung und Unterstützung der Entwicklung von Rechtschreibkompetenz ist. Umso mehr gilt dies aber für Kinder, die neben dem Deutschen noch eine oder mehrere andere Sprachen sprechen, aus anderen Kulturkreisen stammen und eine andere Bildungsentwicklung durchlaufen haben. Die bestehenden Diagnoseinstrumente, sei es in Form von Tests oder in Form von testunabhängigen Verfahren, bieten hier noch keine ausreichenden Möglichkeiten einer wirklich differenzierten und kindgerechten Vorgehensweise, die alle relevanten Aspekte berücksichtigt. Der geforderte diagnostische Blick setzt allerdings nicht nur ein umfangreiches und linguistisch fundiertes Wissen über den zu lernenden Gegenstand – die deutsche Orthographie – voraus, sondern auch Kenntnisse von Entwicklungs- und Aneignungsprozessen der Schrift sowie der Erst- und Zweitsprache.

Literatur Becker, Tabea (2008): Modelle des Schriftspracherwerbs. Didaktik Deutsch, 25, 78–95. Becker, Tabea (2011): Schriftspracherwerb in der Zweitsprache. Baltmannsweiler: Schneider Hohengehren. Becker, Tabea & Corinna Peschel (2013): Zum Zusammenhang von morphologischem Wissen und orthographischen Kompetenzen bei Kindern mit Deutsch als Zweitsprache. In Ingelore Oomen-Welke & Yvonne Decker (Hrsg.), Deutsch als Zweitsprache. Beiträge zur durchgängigen Sprachbildung. Berichte vom 8. Workshop Kinder mit Migrationshintergrund, 193– 209. Freiburg: Fillibach.

296

Tabea Becker

Becker, Tabea & Corinna Peschel (2015): Schriftspracherwerb unter Bedingungen der Inklusion und zweitsprachlichen Lernens. In Magdalena Michalak & Renata Rybarcyk (Hrsg.), Wenn Schüler mit besonderen Bedürfnissen Fremdsprachen lernen, 42–63. Weinheim: Beltz Juventa. Becker Tabea & Corinna Peschel (2017): Rechtschreibdiagnose im Regelunterricht. In: Katja Siekmann & Irene Corvacho del Toro & Ruth Hoffmann-Erz (Hrsg.), Schriftsprachliche Kompetenzen in Theorie und Praxis, 177–188. Tübingen: Stauffenburg. Becker, Tabea & Katja Siekmann (2012): Diagnose orthographischer Fähigkeiten bei mehrsprachigen Kindern. In Wilhelm Grießhaber & Zeynep Kalkavan (Hrsg.), Orthographie- und Schrifterwerb bei mehrpsrachigen Kindern, 169–187. Freiburg: Fillibach. Berkemeier, Anne (1997): Zweitschrifterwerb. In Heiko Balhorn & Heide Niemann (Hrsg.), Sprachen werden Schrift, 263–268. Lengwil: Libelle. Betzel, Dirk (2015): Zum weiterführenden Erwerb der satzinternen Großschreibung. Eine leistungsgruppendifferenzierte Längsschnittstudie in der Sekundarstufe I. Baltmannsweiler: Schneider. Betzel, Dirk & Wolfgang Steinig (2013): Rechtschreibung bei ein- und mehrsprachigen Viertklässlern. In Ingelore Oomen-Welke & Yvonne Decker (Hrsg.), Deutsch als Zweitsprache. Beiträge zur durchgängigen Sprachbildung. Berichte vom 8. Workshop Kinder mit Migrationshintergrund. DaZ, 173–191. Freiburg: Fillibach. Bialystok, Ellen (2001): Bilingualism in development. Language, literacy and cognition. Cambridge: Cambridge University Press. Bialystok, Ellen (2009): Bilingualism: The good, the bad and the indifferent. Bilingualism: Language and Cognition, 12(1), 3–11. Bialystok, Ellen & Gigi Luk (2007): Common and distinct cognitive bases for reading in EnglishCantonese bilinguals. Applied Psycholinguistics, 269–289. Birkel, Peter (2003): Aufsatzbeurteilung – ein altes Problem. In: Didaktik Deutsch 15, 46–63. Blatt, Inge, Andreas Voss, Kerstin Kowalski & Stephan Jarsinski (2011): Messung von Rechtschreibleistung und empirische Kompetenzmodellierung. In Ursula Bredel & Thilo Reißig (Hrsg.), Weiterführender Orthographieerwerb, 226–256. Baltmannsweiler: Schneider Verlag Hohengehren. Bredel, Ursula, Christina Noack & Ingo Plag (2013): Morphologie lesen: Stammkonstanzschreibung und Leseverstehen bei starken und schwachen Lesern. In Martin Neef & Carmen Scherer (Hrsg.), Die Schnittstelle von Morphologie und geschriebener Sprache, 211–249. Berlin: de Gruyter. Brinkmann, Erika (2015): Wie eignen sich Kinder die Rechtschreibung an? In Erika Brinkmann (Hrsg.), Rechtschreiben in der Diskussion, 164–174. Frankfurt: Grundschulverband. Brügelmann, Hans (2015a): Wie steht es um das Rechtschreibkönnen – im Vergleich zu früher? In Erika Brinkmann (Hrsg.), Rechtschreiben in der Diskussion, 151–154. Frankfurt: Grundschulverband. Brügelmann, Hans (2015b): Wie wirken unterschiedliche Methoden des Rechtschreibunterrichts? In Erika Brinkmann (Hrsg.): Rechtschreiben in der Diskussion. Frankfurt: Grundschulverband, 185–193. Dehn, Mechthild (2013): Zeit für die Schrift – Lesen und Schreiben im Anfangsunterricht. Berlin: Cornelsen. Eckert, Thomas & Mareike Stein (2006): Ergebnisse aus einer Untersuchung zum orthographischen Wissen von HauptschülerInnen. In Ursula Bredel & Harmuth Günther (Hrsg.), Orthographietheorie und Rechtschreibunterricht, 123–161. Baltmannsweiler: Schneider. Fay, Johanna (2010a): Kompetenzfacetten in der Rechtschreibdiagnostik. Rechtschreibleistung im Test und im freien Text. Didaktik Deutsch, 29, 15–36. Fay, Johanna (2010b): Die Entwicklung der Rechtschreibkompetenz beim Textschreiben. Frankfurt: Lang.

Orthographie

297

Fix, Martin (2002): „Die Recht Schreibung ferbesern“ – Zur orthografischen Kompetenz in der Zweitsprache Deutsch. Didaktik Deutsch, 12, 39–55. Frahm, Sarah & Inge Blatt (2011): Rechtschreibtests. In Ursula Bredel & Thilo Reißig (Hrsg.), Weiterführender Orthographieerwerb, 546–570. Baltmannsweiler: Schneider Verlag Hohengehren. Funke, Reinold (2005): Sprachliches im Blickfeld des Wissens. Zum grammatischen Wissen von Schülerinnen und Schülern. Tübingen: Niemeyer. Füssenich, Iris & Cordula Löffler (2005): Schriftspracherwerb. Einschulung, erstes und zweites Schuljahr. München: reinhardt. Grießhaber, Wilhelm (2004): Einblicke in zweitsprachliche Schriftspracherwerbsprozesse. In Monika Baumann & Jakob Ossner (Hrsg.), Diagnose und Schrift II: Schreibfähigkeiten. OBST 67/04, 65–87. Günther, Hartmut & Ellen Nünke (2005): Warum das Kleine groß geschrieben wird, wie man das lernt und wie man das lehrt. In: KöBeS (1). Hasselhorn, Marcus, Harald Marx & Wolfgang Schneider (2008): Aktuelle Trends der Rechtschreibdiagnostik. In Wolfgang Schneider, Harald Marx & Marcus Hasselhorn (Hrsg.), Diagnostik von Rechtschreibleistungen und -kompetenz, 1–6. Göttingen: Hogrefe. Herné, Karl-Ludwig (2003): Rechtschreibtests. In Ursula Bredel, Hartmut Günther, Peter Klotz, Jakob Ossner & Gesa Siebert-Ott (Hrsg.), Didaktik der deutschen Sprache, 883–897. Paderborn: Schöningh. Herné, Karl-Ludwig & Carl Ludwig Naumann (2002): AFRA Version 4: Aachener Förderdiagnostische Rechtschreibfehler-Analyse. 4. Völlig überarb. und erw. Aufl. Aachen: Alfa Zentaurus. Hinney, Gabriele (2011): Was ist Rechtschreibkompetenz? In Ursula Bredel & Tilo Reißig (Hrsg.): Weiterführender Orthographieerwerb, 191–225. Baltmannsweiler: Schneider Verlag Hohengehren. Hoffmann-Erz, Ruth (2014): Zum Einfluss sprachsystematischer Gegebenheiten auf die Lernprozesse im Orthographieerwerb. In Katja Siekmann (Hrsg.), Theorie, Empirie und Praxis effektiver Rechtschreibdiagnostik, 63–81, Tübingen: Stauffenburg. Homberg, Sabine & Renate Valtin (Hrsg.) (2011): Mehrsprachigkeit: Chance oder Hürde beim Schriftspracherwerb? – Empirische Befunde und Beispiele guter Praxis. Berlin: Deutsche Gesellschaft für Lesen und Schreiben. Jeuk, Stefan (2012): Orthographieerwerb mehrsprachiger Kinder in der ersten Klasse. In Wilhelm Grießhaber & Zeynep Kalkavan (Hrsg.), Orthographie- und Schrifterwerb bei mehrsprachigen Kindern, 105–124. Freiburg: Fillibach. Krafft, Andreas (2014): Zur Entwicklung metasprachlicher Fähigkeiten bei Kindern mit ein- und mehrsprachigem Hintergrund. Baltmannsweiler: Schneider Verlag Hohengehren. Kruse, Norbert & Anke Reichardt (Hrsg.) (2016): Wie viel Rechtschreibung brauchen Grundschulkinder? Berlin: Erich Schmidt. Löffler, Cordula (Hrsg.) (2012): Oskar Fibel – Neubearbeitung 2012: Lehrerband mit CD-Rom und Audio-CD. Leipzig: Klett. Löffler, Cordula (2014): Qualitative Rechtschreibdiagnostik in den ersten Schuljahren – zwischen Wissenschaft und Praxis. In Katja Siekmann (Hrsg.), Theorie, Empirie und Praxis effektiver Rechtschreibdiagnostik, 111–130, Tübingen: Stauffenburg. May, Peter (2014): KEKS: Rechtschreibdiagnostik mit echten und mit Pseudowörtern. In Katja Siekmann (Hrsg.), Theorie, Empirie und Praxis effektiver Rechtschreibdiagnostik, 83–110, Tübingen: Stauffenburg. Ministerium für Kultus, Jugend und Sport (Hrsg.) (2016): Bildungsplan des Gymnasiums. Deutsch. Stuttgart. Naumann, Carl Ludwig (2015): Das Lesen bestimmt das Schreiben – rundum? In Erika Brinkmann (Hrsg.), Rechtschreiben in der Diskussion, 175–184. Frankfurt: Grundschulverband.

298

Tabea Becker

Niedersächsisches Kultusministerium (Hrsg.) (2006): Kerncurriculum für das Gymnasium Schuljahrgänge 5–10. Deutsch. Hannover. Ossner, Jakob (2008): Sprachdidaktik Deutsch. Eine Einführung für Studierende. 2. Überarb. Aufl. Paderborn: Schöningh. Reichardt, Anke (2015): Rechtschreibung im Textraum – Modellierungen der Schreibkompetenz in der Grundschule. Kölner Beiträge zur Sprachdidaktik. Duisburg: Gilles & Franche. Scheerer-Neumann, Gerheid (1998): Stufenmodelle des Schriftspracherwerbs – Wo stehen wir heute? In Heiko Balhorn, Horst Barnitzky, Inge Büchner (Hrsg.), Schatzkiste Sprache 1. Von den Wegen der Kinder in die Schrift, 54–62. Frankfurt/M.: Grundschulverband − Arbeitskreis Grundschule. Scheerer-Neumann, Gerheid (2015): Rechtschreiben bei Erwachsenen. In Erika Brinkmann (Hrsg.), Rechtschreiben in der Diskussion, 155–163. Frankfurt: Grundschulverband. Scheerer-Neumann, Gerheid (2017): Anmerkungen zu Stufenmodellen des Schriftspracherwerbs. In Katja Siekmann & Irene Corvacho del Toro & Ruth Hoffmann-Erz (Hrsg.), Schriftsprachliche Kompetenzen in Theorie und Praxis, 73–86. Tübingen: Stauffenburg. Schnitzler, Carola (2008): Phonologische Bewusstheit und Schriftspracherwerb. Stuttgart: Thieme. Schründer-Lenzen, Agi & Hans Merkens (2006): Differenzen schriftlicher Kompetenzentwicklung bei Kindern mit und ohne Migrationshintergrund. In Agi Schründer-Lenzen (Hrsg.), Risikofaktoren kindlicher Entwicklung, 15–44. Wiesbaden: VS. Siebert-Ott, Gesa (1998): Probleme des Schrifterwerbs bei Kindern aus zugewanderten Sprachminderheiten. In Rüdiger Weingarten & Hartmut Günther (Hrsg.), Schriftspracherwerb, 151–182. Baltmannsweiler: Schneider. Siekmann, Katja (2014b): Kompetenzorientierte orthographische Individualförderung – Ergebnisse einer Förderstudie. Zur Förderung monolingualer und bilingualer Lerner/innen auf der Basis der OLFA. In Katja Siekmann (Hrsg.), Theorie, Empirie und Praxis effektiver Rechtschreibdiagnostik, 191–206, Tübingen: Stauffenburg. Steinig, Wolfgang, Dirk Betzel, Franz Josef Geider & Andreas Herbold (2009): Schreiben von Kindern im diachronen Vergleich. Münster: Waxmann. Thomé, Günther (1987): Rechtschreibfehler türkischer und deutscher Schüler. Heidelberg: Julius Groos. Thomé, Günther (2003): Entwicklung der basalen Rechtschreibkenntnisse. In Ursula Bredel, Hartmut Günther, Peter Klotz, Jakob Ossner & Gesa Siebert-Ott (Hrsg.): Didaktik der deutschen Sprache − Ein Handbuch, 369–379. Paderborn: Schöningh. Thomé, Günther (2011): ABC und andere Irrtümer über Orthographie, Rechtschreiben, LRS/ Legasthenie. Oldenburg: isb. Thomé, Günther & Wolfgang Eichler (2000): Über unterschiedliche Lernwege im Orthographieerwerb. Grundschule, 13 (5), 12–14. Thomé, Günther & Dorothea Thomé (2014a): OLFA 1–2. Oldenburger Fehleranalyse für die Klassen 1 und 2. 3. Bearb. Aufl. Oldenburg: isb-Verlag. Thomé, Günther & Dorothea Thomé (2014b): OLFA 3–9. Oldenburger Fehleranalyse für die Klassen 3 bis 9. 3. Bearb. Aufl. Oldenburg: isb-Verlag. Zöller, Isabelle, Jeanette Ross &Hermann Schöler (2006): Einfluss soziokultureller Faktoren auf den Schriftspracherwerb im Grundschulalter. In Agi Schründer-Lenzen (Hrsg.), Risikofaktoren kindlicher Entwicklung, 45–65. Wiesbaden: VS.

Elke G. Montanari

13 Diagnostik von Wortwissen 1 2 3 4 5 6

Wörter und Wortwissen Fragestellungen der Diagnostik Forschungsstand Wortwissen und Diagnose Anwendungsbereiche und Verfahren Ausblick It’s only words And words are all I have To take your heart away Barry, Robin & Maurice Gibb

1 Wörter und Wortwissen Mit Wörtern kann man Herzen stehlen, Freude bereiten, Kindern einen Namen geben, Sätze bilden. Aber was sind Wörter denn eigentlich? Was wissen Sprecherinnen und Sprecher über die Wörter, die sie verwenden? Wörter sind die Elementargrößen des Wortschatzes; ihre Aneignung erfolgt in sprachlichen Handlungen (Ehlich 2013) und in einer komplexen Begriffsbildung (Vygotskij 2002). Sprecherinnen und Sprecher stellen mit Wörtern Bezüge zur sprachlichen Wirklichkeit her (z. B. Haus, Tisch); sie ermöglichen die Verortung in Raum und Zeit und gestatten der Hörerin und dem Hörer die Fokussierung im Raum (z. B. ich, hier). Wörter helfen bei der Verarbeitung von Sprache im Wissen von Sprechenden und Hörenden (z. B. bei der Entscheidung, der oder ein Schüler zu sagen).

2 Fragestellungen der Diagnostik Was soll diagnostisch erfasst werden: einzelne Wörter oder Wortverbindungen? Haben Kollokationen oder die Fähigkeit, ein Wort adäquat zu verwenden, das diagnostische Interesse geweckt? Steht im Vordergrund, welche Art von Wissen über Wörter die Testperson hat, oder wie der Zugriff auf Wörter organisiert ist? Ein Modell für die Verarbeitung von Sprache und den Zugriff von Sprechenden auf Wörter in ihrem mentalen Lexikon liefert Levelt (1989). Die Suche nach einem Wort wird darin als Aktivierung verstanden: Ausgerichtet auf die Ziele einer Interaktion entwickeln Sprecherinnen und Sprecher zunächst einen Begriff (concept) dessen, was sie kommunizieren möchten. Zu diesem Begriff suchen sie dann passende Lemmata, die Wortformen. Das geeignete Lemma kann abhängig z. B. vom sozialen https://doi.org/10.1515/9783110418712-013

300

Elke G. Montanari

Kontext oder der Handlungsabsicht variieren (Levelt 1989). Für dieses Lemma wird die phonologische Form im mentalen Lexikon gesucht, die dann mit prosodischen und silbischen Merkmalen verbunden wird und als artikulierte Äußerung hervorgebracht wird. Levelt hat dieses Modell ist zunächst für einsprachige Sprechende entwickelt. Für die Anwendung auf mehrsprachige Sprecherinnen und Sprecher stellt sich die Frage, ob dieser Vorgang mehrfach, in mehreren separaten mentalen Lexika, durchlaufen wird, oder ob von einem gemeinsamen Lexikon ausgegangen werden kann, das auch sprachenspezifische Bedeutungen erfasst (Oller, Pearson & Cobo-Lewis 2007). De Bot (1992) regt für die Lösung dieser Frage an, von einer sprachenunabhängigen Makroplanung und einer sprachenspezifischen Mikroplanung auszugehen. In ähnlicher Richtung schlägt Paradis (1997) ein einziges mehrsprachiges mentales Lexikon mit Untersystemen vor; er nimmt sprachspezifische Subsets innerhalb eines einzigen Lexikons an, die miteinander verknüpft sind (Three Store Hypothesis, s. a. De Bot 2004). Für das konzeptionelle System der Begriffe nimmt er eine sprachenübergreifende Ebene an, während das Bedeutungssystem und das Ausdruckssystem sprachenspezifisch zu denken sind (Paradis 2004). Dagegen wurde von Kroll & Stewart mit dem Revised Hierarchical Model of Bilingual Language Processing (Kroll & Stewart 1994; Kroll et al. 2010) ein Zugriffsmodell auf mehrere Lexika diskutiert, die über Zugriffsmechanismen verbunden sind. Sowohl bei einem Gesamtlexikon als auch bei mehreren separaten Lexika müssen Sprechende entscheiden, aus welcher Sprache sie die Wörter wählen. Werden Sprachen ein- und ausgeschaltet? Eine aktuell diskutierte Annahme erklärt den Auswahlmechanismus mit dem Inhibitory Control Model (Green 1998). Es formuliert, dass stets alle Sprachen Mehrsprachiger aktiv sind und die Auswahl der sprachlich angemessenen Wörter durch eine Kontrolle bzw. ein Unterdrücken der gerade nicht verwendeten Sprachen erfolgt. Die oben kurz dargestellten Ansätze haben zu einer intensiven Debatte und zahlreichen Studien geführt, wobei die grundsätzliche Frage nach separierten Lexika versus einem einzigem Lexikon als noch nicht abschließend beantwortet gelten kann. In Bildungssituationen kann die Wortschatzdiagnostik dafür eingesetzt werden, Einschätzungen und Beobachtungen der pädagogischen Fachkräfte und Lehrpersonen zu bestätigen oder zu widerlegen, Förderanreize zu liefern und ist Entscheidungshilfen zu geben, ob und ggfls. welche Förderangebote bereitgestellt werden sollen. Weiterhin kann sie dazu beitragen, eine geeignete Fördermaßnahme für Wortschatzentwicklung zu bestimmen und den Erfolg zu evaluieren. Diagnostik wird in Bildungssystemen auch u. a. dafür eingesetzt, um Selektionsentscheidungen zu belegen (Reich & Roth 2007 b). Damit werden Entscheidungen, ob Bildungszugänge gewährt werden sollen oder nicht, durch diagnostische Verfahren argumentativ unterlegt. Trotzdem ist die Entscheidung, Zugänge zu Bildung zu reglementieren und nicht für alle Kinder zu öffnen, eine politische Fragestellung, die der kritischen Diskussion bedarf.

Diagnostik von Wortwissen

301

3 Forschungsstand Für fünfjährige monolingual deutschsprachig aufwachsende Kinder werden ein produktiver Wortschatz zwischen 2.600 und 5.300 Wörtern und ein rezeptiver Wortschatz im Umfang zwischen 9.000 und 14.000 Wörtern angesetzt (Meibauer & Rothweiler 1999). Studien zur Entwicklung des bilingualen Wortschatzes belegen, dass sich der Gesamtwortschatz im Umfang nicht von dem Wortschatz einsprachiger Kinder unterscheidet (De Houwer, Bornstein & Putnick 2014; Montanari, Abel, Graßer & Tschudinovski 2015; Patterson & Pearson 2004). In der Beherrschung der Schulsprache weisen Monolinguale jedoch einen größeren Einzelwortschatz auf (Bialystok et al. 2010). In ihrer dominanten Sprache verfügen Zweisprachige in einigen Studien über ähnliche Wortschatzumfänge wie Einsprachige (Hoff et al. 2012), wenn optimale Bedingungen vorliegen: wenn ausreichend Input vorhanden ist, der sozioökonomische Status kontrolliert wird und die Sprachumgebung beiden Sprachen ein hohes Prestige zuweist (Thordadottir 2011). Es lassen sich signifikante Korrelationen mit sozioökonomischen Faktoren erkennen (Hart & Risley 1995; Smithson, Paradis & Nicoladis 2014). Bei langanhaltendem Nichtgebrauch einer Sprache, aber auch bei einem Input, der sich auf familiäre Handlungskontexte beschränkt, kann es zu einer Stagnation in der Wortschatzentwicklung oder zu Verlust- bzw. Attritionseffekten kommen (Schmid & Jarvis 2014; Schmid & Köpke 2009). Im Schulalter findet ein erheblicher Umbau des Wortschatzes statt, da durch den Eintritt in die Schule ein enormer Zuwachs an Input und Anregungen im Unterrichtsmedium erfolgt und dazu dem Kind durch die weitere Aneignung von Literalität ein Medium mit enormen Möglichkeiten für den Ausbau des Wortschatzes zur Verfügung steht. Sofern das Unterrichtsmedium auch die Zweitsprache ist, stellt sich ein kontinuierlicher Zuwachs des Wortschatzes in der Zweitsprache bei gleichzeitiger Stagnation des Wortschatzes in der Herkunftssprache heraus, wobei die individuelle Variation groß ist (Montanari et al. i. Dr.; Montanari et al. 2018). Wird also nach einer Intervention, z. B. einem Unterrichtsprojekt, ein höherer Wortschatzumfang als vorher festgestellt, so offenbart sich nur im Vergleich mit einer Kontrollgruppe ohne Intervention, ob ein Effekt der Intervention vorliegt oder ob es sich um den üblichen Wortschatzanstieg im Schulalter handelt. Ein stagnierender Wortschatzumfang über einen längeren Zeitraum ist angesichts dieser grundsätzlichen Entwicklung des Wortschatzes ein problematisches Ergebnis. Ein geringerer Wortschatz im Test muss sich jedoch nicht in gleicher Stärke in der Kommunikation bemerkbar machen: Friesen & Bialystok (2013) weisen darauf hin, dass Mehrsprachige besonders viele Erfahrungen damit sammeln, wie sie ihre Handlungsziele sprachlich in unterschiedlichsten Situationen umsetzen können. Die sprachliche Handlungsfähigkeit in pädagogischen Kontexten muss daher insgesamt und im Zusammenwirken eines effizienten und multikompetenten sprachlichen Handelns unter Nutzung aller Ressourcen und eines unter Umständen knapperen Wortschatzumfangs betrachtet werden (Friesen & Bialystok 2013).

302

Elke G. Montanari

4 Wortwissen und Diagnose In den ersten Lebensjahren eines Kindes ist der expressive, d. h. der geäußerte Wortschatz, einigermaßen vollständig über Beobachtungsbögen, Audioaufnahmen oder Tagebücher erfassbar (z. B. Grimm & Doil 2000). Bei typischer Entwicklung des Kindes ist der Wortschatzausbau ab ca. dem dritten Lebensjahr so weit fortgeschritten, dass ein Mitschreiben nicht mehr vollständig möglich ist und fortan andere Wege gewählt werden müssen. Mit Langzeitaufnahmen und automatischer Transkription versucht das LENA-Projekt, umfangreiche sprachliche Äußerungen und damit eben auch Wortschatz bei älteren Kindern zu erfassen (Odean, Nazareth & Pruden 2015). Andere Verfahren versuchen, aussagekräftige und vergleichbare Wortschatzausschnitte zu konstruieren, deren Beherrschung dann zwischen Individuen verglichen werden kann.

4.1 Mehrsprachige Diagnostik Bei der Untersuchung von mehrsprachigen Schülerinnen und Schülern ist möglichst eine Diagnostik in allen ihren Sprachen anzustreben. Das bringt einige Herausforderungen mit sich. Sowohl die Form als auch die Bedeutung der Wörter sind sprachenspezifisch; eine Übersetzung kann also viel leichter oder viel schwieriger sein als das Ausgangsitem. So ist der Vergleich von Wörtern aus Sprachen mit hoher agglutinierender Intensität mit Wörtern in Sprachen, in denen die Agglutinierung weniger stark ist, nicht einfach. Der Vergleich von Deutsch und Türkisch illustriert, wie strukturspezifisch der Wortbegriff ist. Was im Türkischen als ein Wort aufgefasst werden kann, entspricht in der deutschen Sprache mehreren Wörtern. Beispiel 1 Ev -ler -im iz -den Haus PLURAL POSS. ABLATIV Häuser-unser-von = Von unseren Häusern1 Auch die Bedeutungen und Bedeutungsgrenzen stimmen in unterschiedlichen Sprachen nicht zwangsweise überein. Beispielhaft sei hier ein Item aus dem WWT 6-10 (Glück 2011, s. u.) genannt (s. u.): fressen ist in der deutschen Version die Nahrungsaufnahme von Tieren, im Gegensatz zu essen als Nahrungsaufnahme von Menschen. In vielen Sprachen wird dieser Unterschied nicht oder für andere Inhalte ausgedrückt, so z. B. Italienisch: mangiare wird für die Nahrungsaufnahme von Menschen und

1 Beispiel aus: http://www.lehrer-info.net/kompetenz-portal.php/cat/13/aid/110/title/Agglutination

Diagnostik von Wortwissen

303

Tieren verwendet, divorare ist dagegen ein hastiges, grobes Hinunterschlingen, vergleichbar mit dem fressen im Deutschen als ‚Essen mit schlechten Manieren‘. Selbst dann, wenn die Kernbedeutungen in den Testsprachen übereinstimmen, so unterscheiden sich doch sehr häufig Nebenbedeutungen und der Gebrauch; ein Ausdruck kann in einer Sprache üblich sein, in einer anderen Sprache selten oder spezifisch, höflich oder unhöflich; die Wortlängen oder die Häufigkeiten können unterschiedlich sein. All diese Problemfelder sollten reflektiert und bearbeitet werden. Die dargestellten Fragen sollten nicht dazu führen, sich auf einsprachige Diagnosesettings zurückzuziehen. So kann z. B. in den Auswertungen bei mehrsprachigen Anwendungen das zweifelhafte Item aus der Analyse ausgeschlossen werden, oder es wird die in der Zielsprache angemessene Antwort als korrekte Antwort gewertet. Ob die Ergebnisse bilingualer bzw. multilingualer Testungen innerhalb monolingualer Vergleichsnormen sinnvoll betrachtet werden können, ist Gegenstand kritischer und kontroverser Diskussionen (Pearson, Fernández & Oller 1993; Peña, Bedore & Fiestas 2013; Settinieri 2011). Unter anderem sind in der Analyse die spezifische kognitive Organisation, die besondere Leistung Mehrsprachiger sowie die Auswirkungen der Migration zu berücksichtigen. Insbesondere bei der Diagnostik des Wortschatzes ist beim Vergleich mit monolingualen Testpersonen Vorsicht geboten, da Bilinguale bei großer Varianz typischerweise geringere Wortschatzumfänge in der einzelsprachlichen Betrachtung zeigen, aber eben auch der Wortschatz in allen anderen Sprachen abgeschnitten ist. In gemeinsamen Lehr-Lernsituationen von mono- und bilingualen Schülerinnen und Schülern, wie sie zum Beispiel in der Schule vorliegen, kann jedoch nur der Vergleich aller Schülerinnen und Schüler sichtbar machen, ob eine systematische Benachteiligung mehrsprachiger Schülerinnen und Schüler oder anderer Gruppen vorliegt, für die Bildungsinstitutionen didaktische Lösungen finden müssen.

4.2 Breite, Tiefe, Häufigkeit und Diversität Der Umfang des Wortschatzes, d. h. die Anzahl von Wörtern, die Lernende beherrschen, wird Wortschatzumfang oder Breite genannt. Sie kann damit von der Tiefe, also der Qualität des Wortwissens, unterschieden werden (Milton 2009; Wesche & Paribakht 1996). Für Breite ist vor allem von Bedeutung, welchen Umfang der Wortschatz hat und wie er sich verändert, z. B. durch kognitive Entwicklung, Lernen, didaktische Intervention oder Attrition – und wie (dis-)kontinuierlich sich dieser Verlauf zeigt. Für die Entwicklungsdiagnostik liefert die Breite frühe Indikatoren für allgemeinen Spracherwerb (Grimm 2003). Für die Diagnose von Wortwissen ist aber nicht nur wichtig, wie viele Wörter Sprecherinnen und Sprecher kennen, sondern auch, was sie über diese Wörter und den Gebrauch wissen. So unterscheidet Read (2000) partielles von vollständigem Wissen eines Wortes, z. B. wenn ein Wort erle-

304

Elke G. Montanari

sen werden kann, aber nicht mündlich verstanden wird, oder wenn Merkmale wie Flexion oder Genus noch nicht beherrscht werden. Ein weiteres aktuell diskutiertes Maß für die Beherrschung von Wortschatz ist die Diversität der verwendeten Wörter. Die Vielfalt der verwendeten lexikalischen Mittel in einem schriftlichen oder mündlichen Text ermöglicht Aussagen darüber, wie der Wortschatz in sprachlichen Handlungen, z. B. Erzählungen nach Abbildungen, gebraucht wird. Sie kann mit mehreren Maßen berechnet werden, die vor allem dadurch attraktiv sind, dass sie nur eine geringe Interpretationsleistung in der Auswertung erfordern. Die Grundlage liefert die Beobachtung, dass Häufigkeit ein wichtiges Kriterium für die Organisation von Wortschatz ist: Die häufigsten Wörter lernen Lernende zuerst, und diese sind für sie auch am wichtigsten für sprachliche Handlungen (Nation 2001; Palmer 1968). Sprecherinnen und Sprecher, die Wörter kennen, die sich vorwiegend innerhalb der häufigsten 5000 Wörter eines Wortschatzes bewegen, wenden auch bei umfassenden Tests ein geringeres Wortschatzwissen an als Sprecherinnen und Sprecher, die Wörter aus dem Bereich der 10.000 häufigsten Wörter, und damit seltenere Wörter, verwenden. Es müssen also nicht lange Wortlisten untersucht werden, sondern es können, so die Annahme in der Konstruktion, Wörter aus unterschiedlichen Frequenzbereichen untersucht werden (häufige, weniger häufige und seltene Wörter), um daraus auf den Gesamtwortschatz zu schließen. Der Zusammenhang zwischen Wortschatztestergebnissen und Seltenheit/Häufigkeit der verwendeten Wörter erwies sich als robust (Milton 2009), so dass Häufigkeitsprofile gute Diagnoseoptionen darstellen und durch die Erstellung lexikalischer Profile anhand von Texten oder Transkripten der Wortschatzumfang eingeschätzt werden kann (Laufer 2012). Zwischen der Häufigkeit eines Wortes und dem Anteil, den dieses Wort in Texten abdeckt, besteht ein Zusammenhang, der als das Zipf’sche Gesetz bekannt ist (Zipf 1935). Für die englische Sprache besagt es, dass mit den häufigsten 2000 Wörtern ca. 80 % der Wörter in einem Text abgedeckt werden (Milton 2009:47); auch das ist immer noch ein zu geringer Anteil für ein tiefes Verständnis der meisten Lesetexte (s. a. Verhoeven & Perfetti 2017). Für die Diagnose bedeutet dies jedoch, dass ein ausreichend großer Wortschatz eine Voraussetzung für ein gutes Leseverständnis darstellt. Schlechte Diagnoseergebnisse in einem Wortschatztest bei gutem Leseverständnis bzw. fehlende Korrelationen sollten also die Testergebnisse zur Diskussion stellen. Durch die enge Verzahnung von Wortschatz- und Leseverständnis wird Wortschatz daher bei zahlreichen Verfahren als Kovariable explizit oder implizit mitgetestet.

5 Anwendungsbereiche und Verfahren Für die Diagnose wird eine Vielzahl von Verfahren eingesetzt – von Multiple-ChoiceVerfahren über C-Tests, Experimente, Selbsteinschätzungen, bildgebende Verfahren

Diagnostik von Wortwissen

305

bis hin zu Kommunikationsaufgaben. Die Vorteile einer Testung mit isolierten Items liegen in den guten Möglichkeiten der statistischen Weiterbearbeitung. Gleichzeitig ist jedoch kritisch anzumerken, dass die Werte oft wenig Aussagekraft für alltägliche kommunikative Handlungen haben: Was besagt ein Wert von 20 im Schulalltag? Ist es nicht entscheidend, welche Wörter eine Lernende oder ein Lernender in der Interaktion versteht und verwendet? Was ist mit jenen Sprecherinnen und Sprechern, die zwar in Tests nur über einen eingeschränkten Wortschatz verfügen, das in sprachlichen Handlungen aber ausgezeichnet ausgleichen können (Read 2000)? Ist eine kommunikative Wende zu aufgabenbasierten Testformaten zu erkennen und zu fordern? Isolierte Items haben dagegen den Vorteil, dass sie eine große diagnostische Kontrolle über den Testvorgang ermöglichen. Es scheint, als müsste noch deutlicher sortiert werden, für welche wortdiagnostischen Fragestellungen isolierte Testitems am ökonomischsten und zuverlässigsten sind, für welche Fragestellungen die Verwendung von Items in eingebetteten sprachlichen Handlungen sinnvoll ist und wann die Integration in ein komplexes Konzept von Tasks dem Diagnosezweck am nächsten kommt. Hierbei ist auch zu unterscheiden, ob Wissen oder die Verwendung von Wörtern im Fokus des diagnostischen Blickes stehen. Für die Einschätzung von Wortwissen aus didaktischer Sicht, z. B. im Rahmen einer schulischen Spracherhebung mit dem Ziel, Anhaltspunkte für die didaktische Förderung in einer Schulklasse in den kommenden Monaten zu gewinnen, gelten andere Rahmenbedingungen (etwa bzgl. Zeit, Kosten, Anforderungen an Genauigkeit u. v. m.) als für eine Untersuchung in einem Forschungsprojekt, das sich mit mentalen Prozessen der Organisation und Aktivierung des mentalen Lexikons befasst. Welche Verfahren also für ein Diagnosevorhaben optimal geeignet sind, wird vom diagnostischen Erkenntnisinteresse und der Erhebungssituation bestimmt; daher werden im Folgenden die Verfahren in Verbindung mit Fragestellungen erörtert, – wobei selbstverständlich andere Einsatzbereiche ebenso denkbar sind, wenn sie wissenschaftlich begründbar sind. Im Folgenden kann nur eine Auswahl von Verfahren dargestellt werden; diese Auswahl bedeutet aber nicht, dass weitere, hier nicht dargestellte Verfahren nicht ebenso effizient oder interessant wären.

5.1 Diagnostik mit kleinen Kindern: Elternfragebögen Mit dem Ziel, nicht-typische Entwicklungen zu erkennen, um frühzeitig Maßnahmen einzuleiten, erfolgt bereits mit sehr jungen Kindern eine Diagnostik von Wortschatz. Schon vor dem Auftauchen von syntaktisch mehrgliederigen Äußerungen ist Wortschatz ein einfaches und sehr gut erprobtes Mittel, um Hinweise auf Verläufe zu erhalten. Für Babys und sehr junge Kinder können Elternfragebögen eingesetzt werden. Eltern bzw. Erziehungspersonen sind, wenn sie sorgfältig instruiert werden, gute Beobachter ihrer Kinder. Die Korrelation von Elternangaben mit Sprachtests hat sich in mehreren Studien als mittel bis hoch gezeigt (Marchman & Martínez-Sussmann

306

Elke G. Montanari

2002; Thal et al. 1999). Elternfragebögen sollten nicht zu lang, zu komplex oder zu ausdifferenziert formuliert sein, sollen sie verlässliche Ergebnisse bringen. Daher sind sie in der Regel Screening-Instrumente, d. h. sie liefern Anhaltspunkte dafür, ob eine intensive weitere Differentialdiagnostik vorgenommen werden sollte. Verbreitete Fragebögen sind die Communicative Development Inventories (CDI) (Fenson et al. 1993; Fenson et al. 2007) und ELFRA (Grimm & Doil 2006). Für beide Verfahren liegen Vergleichswerte großer Stichproben vor. Die CDI gibt es in zwei Versionen; die Version für jüngere Kinder (CDI Words and Gestures) ist für das Alter von 8–18 Monaten bei typischer Entwicklung konzipiert und dokumentiert rezeptives und expressives Wortwissen sowie frühe Gesten. Der Fragebogen besteht aus einigen Ja/Nein-Fragen zum situativen Äußerungsverständnis (z. B. Reagiert Ihr Kind, wenn Sie es beim Namen rufen?2), aus 28 Fragen, die alltägliche und häufige Äußerungen betreffen (z. B. Nicht anfassen!), aus Fragen nach Imitationen des Kindes und aus einer Wortliste mit 396 Wörtern, bei denen angekreuzt wird, ob das Kind die Wörter versteht bzw. verwendet oder nicht. Der zweite Testteil umfasst Gesten und Handlungen. Das CDI Words and Sentences für ältere, typisch entwickelte Kinder im Alter von 16–30 Monaten ist ein Test für expressiven Wortschatz mit einer Wortliste sowie einem Testteil zur Erfassung morphologischer und syntaktischer Kriterien (Hutchins 2013). Die beiden CDI gibt es in mehr als 90 Sprachen.3 Sie werden für die angegebenen Sprachen nach wie vor häufig eingesetzt (Hadley, Rispoli & Hsu 2016). Der ELFRA (Grimm & Doil 2006) als deutschsprachiges Verfahren liegt für das Alter 12–24 Monate vor. Der Elternfragebogen 1 behandelt gestisches Verhalten, Feinmotorik, Sprachproduktion und Sprachverständnis, der Elternfragebogen 2 produktiven Wortschatz, Syntax und Morphologie. Die Inspiration durch das Vorbild CDI wird deutlich; jedoch ist der ELFRA eine umfangreiche Adaption an die deutsche Sprache. Die Sorgfalt, mit der der Fragebogen ausgefüllt wird, ist für die Datenqualität entscheidend. Hier wurden sowohl Einflüsse des Bildungsabschlusses sowie inkonsistente Antworten innerhalb des Fragebogens beobachtet (Klaiber 2007), so dass bei der Durchführung darauf zu achten ist, die Eltern gut zu informieren und für eine ruhige, optimale Situation beim Ausfüllen zu sorgen.

5.2 Beobachten und dokumentieren Beispiele für Beobachtungsbögen sind SISMIK (Sprachverhalten und Interesse an Sprache bei Migrantenkindern in Kindertageseinrichtungen, Ulich & Mayr 2003), SELDAK (Seldak – Sprachentwicklung und Literacy bei deutschsprachig aufwachsenden Kindern., Ulich & Mayr 2006) und die Niveaubeschreibungen Deutsch als

2 Alle Übersetzungen EM. 3 http://mb-cdi.stanford.edu/adaptations.html, abgerufen am 30. 7. 2017.

Diagnostik von Wortwissen

307

Zweitsprache für die Grund- und die Sekundarstufe mit dem Fokus auf Zweitsprachensprechende (Döll & Reich 2009). Alle diese Beobachtungsinstrumente enthalten einen Teilbereich zum Wortschatz. Durch Musterformulierungen werden Beobachtungen Beobachtungen zusammengefasst und systematisch erfasst. Die Stärken dieser Verfahren liegen u. a. in der alltagstauglichen Anwendbarkeit und darin, die Beobachtungen gut ausgebildeter Fachkräfte und Lehrpersonen zu dokumentieren. Eine Schwierigkeit liegt in der Inter-Rater-Reliabilität, d. h. der Vergleichbarkeit der Ergebnisse zwischen unterschiedlichen Beobachtern (Döll 2012).

5.3 Bildbenennungstests: expressiver und rezeptiver Wortschatz von Kindern und Erwachsenen Bildbenennungstests sind einfach einsetzbar und für eine große Altersspanne geeignet. Mit ihnen kann sowohl rezeptiver Wortschatz erfasst werden, indem auf ein zu einem Wort passendes Bild aus einer Auswahl aus mehreren Abbildungen gezeigt werden muss (Zeige auf ‚Katze‘!), als auch die Benennung (Wie heißt das?) geprüft werden. Sie werden typischerweise auf Papier oder an einem Bildschirm, z. B. mit einem Laptop, durchgeführt. Da ein mobiler Rechner dafür in der Regel ausreicht, sind diese Verfahren auch für Testungen in Institutionen, z. B. Schulen, geeignet. Es ist sinnvoll, expressive Tests mit einer Audioaufnahme zu kombinieren, um im Nachgang durch ein Abhören der Aufnahmen zu sichern, dass alle Äußerungen der Probandinnen und Probanden korrekt im Versuchsprotokoll vermerkt sind. Sie können u. a. die Entwicklungsdiagnostik im frühen Kindesalter, für Evaluationen von didaktischen Interventionen und für Förderdiagnostik bei Einzelpersonen und Gruppen eingesetzt werden. Ein sehr bekannter Bildbenennungstest ist der PPVT (Dunn & Dunn 2007): Er kann vom frühen Kindesalter bis in das hohe Erwachsenenalter eingesetzt werden. In der aktuellen vierten Ausgabe liegt er für die Altersgruppen 2;6 bis 90 Jahre und älter vor. Das Verfahren ist damit dafür geeignet, Sprachentwicklungsstörungen im Wortschatz im Kindesalter aufzudecken als auch Wortschatzerweiterung im Fremdsprachenlernen sichtbar zu machen. Darüber hinaus bietet es sich auch dafür an, interindividuelle Verluste und Gewinne über die gesamte Lebensspanne zu dokumentieren, z. B. auf Attrition durch geringen Sprachgebrauch, Verlust durch Aphasien oder Demenz bzw. Therapieerfolge aufmerksam zu machen. Der PPVT ist ein Multiple-Choice-Test für den rezeptiven Wortschatz in der Einzeltestung. Da der PPVT in mehreren Sprachen (u. a. Britisches und Amerikanisches Englisch, Spanisch, Deutsch (Dunn & Dunn 2004)) vorliegt, gibt es zahlreiche Vergleichsdaten. Das Verfahren besteht aus 228 Items mit je vier Abbildungen, bei denen die Probanden jeweils eine Abbildung durch Zeigen auswählen. Die Items sind nach Schwierigkeit geordnet, so dass der Test beendet werden kann, wenn die Testpersonen die Aufgaben nicht mehr lösen können und die Abbruchkriterien erfüllt sind; damit wird eine zeit- und motivationsökonomische Testung erreicht. In einem experimen-

308

Elke G. Montanari

tellen Zugriff wurde auch eine Gruppentestung mit Kindergruppen unter Verwendung der britischen Version pilotiert. Dafür erhalten die Kinder eine Art Ringbuch mit Abbildungen und es werden Wörter vorgesprochen. Die Kinder werden dann gebeten, die gewählten Abbildungen anzukreuzen. Das Verfahren wird dadurch wesentlich zeitökonomischer (Couve de Murville et al. 2015). Für junge Kinder im Alter von 3;0–5;5 steht u. a. als deutschsprachiges Verfahren der AWST-R, Allgemeiner Wortschatztest, zur Verfügung (Kiese-Himmel 2005). Das Ziel ist es, als objektives, reliables und valides Instrument Entwicklungsstörungen abzuklären. Der Allgemeine Wortschatztest ist ein Bildbenennungstest für die Einzeltestung mit 75 Items, von denen sich 51 Items auf konkrete Substantive beziehen und 24 Verben abgefragt werden; es wird ein alltagsnaher Wortschatz zugrunde gelegt (Renner 2006). Die Aufgaben sind nach Itemschwierigkeit geordnet: Der Test beginnt mit Fragen, die viele Probandinnen und Probanden der Vergleichsstichprobe lösen konnten und steigert sich zu Items, die von weniger Kindern der Vergleichsstichprobe bewältigt wurden. Die Antworten werden protokolliert, so dass eine nachträgliche Bewertung erfolgen kann. Werte aus einer Vergleichsstichprobe, die mit monolingual deutschsprachigen Kindern erhoben wurde, liegen vor. Ein Beispiel für einen expressiven und rezeptiven Bildbenennungstest im Schulalter mit deutschsprachiger Normstichprobe ist der WWT 6-10 (Glück 2011). Auch hier ist es das Ziel, Entwicklungsdiagnostik vorzunehmen, Entwicklungsstände im Wortschatz anzuzeigen, sowie Profile für Schwierigkeiten zu erheben und bei der Auswahl von Förderansätzen zu unterstützen. Es gibt ihn in einer Langversion mit 95 Items (26 Substantive, 23 Oberbegriffe, 23 Verben, 23 Adjektive) sowie einer Kurzversion und in beiden Varianten für die Sprachen Deutsch, Türkisch und Russisch (Montanari et al. 2018). Die Testungen erfolgen wieder individuell. Die Bewertung der Antworten erfolgt als Post-Bewertung auf der Grundlage eines Audioprotokolls. Jeder Test dauert ca. 45–50 Minuten. Um innerhalb einer Gruppe Rangfolgen zu bilden und stärkere und schwächere Ergebnisse zu vergleichen, hat sich das Verfahren bei neu zugewanderten Schülerinnen und Schülern auch für einen größeren Altersbereich in den ersten Jahren der Beschulung in Deutschland als geeignet gezeigt (Montanari 2017).

5.4 Elizitation von Sprachproben mit Analyserastern: von Katzen, Vögeln, Tulpenbeeten und Bumerangs HAVAS 3–5 (Reich & Roth 2004), Tulpenbeet (Gantefort & Roth 2008; Reich & Roth 2007a) und Fast Catch Bumerang (Gantefort & Roth 2008; Reich, Roth & Döll 2009) sind Beispiele für Elizitationsverfahren, die kind-/jugendgerecht mündliche (HAVAS 3–5) bzw. schriftliche Sprachproben elizitieren und Analyseraster anbieten. Neben der Einschätzung des Sprachstandes sollen Förderimpulse gegeben und Interventionserfolge evaluiert werden. Zu einer Entwicklungsdiagnostik im Sinne der Abklärung nicht-typischer Verläufe sind diese Verfahren jedoch nicht

Diagnostik von Wortwissen

309

geeignet. Wortschatz wird mit sehr einfachen Maßen (u. a. Textumfang, Anzahl der Verben) miterfasst. HAVAS 3–5 ist eine Folge von sechs Abbildungen, zu denen Kinder ab drei Jahren in mehreren Sprachen um eine Erzählung gebeten werden. Die Auswertungshinweise liegen in mehreren Sprachen vor. Im Prinzip ähnlich mit einer etwas veränderten Geschichte und einer zusätzlichen durch die Erzähler auszufüllenden Leerstelle arbeitet Tulpenbeet. Es ist eine Schreibaufgabe nach Abbildungen für die Einzel- und Gruppenanwendung und ist vor allem für Schülerinnen und Schüler mit Migrationshintergrund in den Schulstufen 4–6 entwickelt worden. Fast Catch Bumerang ist als ein sprachstandsdiagnostisches Verfahren für Jugendliche und junge Erwachsene am Übergang von der Schule in den Beruf mit dem Ziel entwickelt worden, fach- und bildungssprachliche Fähigkeiten in mehreren Sprachen zu erfassen und Handlungsfelder für pädagogische und didaktische Interventionen aufzuzeigen. In dem Verfahren werden zwei Schreibproben unterschiedlicher Textsorten erfragt: eine Bewerbung um einen Praktikumsplatz bei einer Zeitschrift und das Verfassen einer Bauanleitung für einen Bumerang nach neun Abbildungen. Der mit Bumerang erfasste Wortschatz bezieht sich vor allem auf bildungs- und fachsprachlichen Wortschatz sowie Funktionswörter: Konnektoren und Sprachmittel der Kohäsion (Dirim & Döll 2009). Auch hierfür gibt es ein Analyseraster, das zurzeit für Deutsch, Russisch und Türkisch vorliegt.

5.5 Wortschatzdiagnostik als Teilmodul von Tests Viele sprachdiagnostische Verfahren bieten einzelne Module oder Einzelauswertungen zum Wortschatz an. Sollen Wortschatzmodule in eine Gesamtdiagnostik integriert werden, so stellt sich immer das Problem der in ihrer Gesamtheit begrenzten Aufmerksamkeitsspanne der Probandinnen und Probanden. Daher entfällt auf ein Teilmodul notwendigerweise ein geringerer Zeitanteil. Andererseits ergibt sich die Chance, die Wortschatzdiagnostik in eine übergreifende Sprachdiagnostik einzuordnen, was ein umfassendes Bild für Förderzwecke und Entwicklungsdiagnostik erlaubt. Ein Beispiel für ein explizit auch für die zweite Sprache Deutsch entwickeltes Verfahren ist die Testbatterie LiSe-DaZ. Das Ziel ist entwicklungsdiagnostisch begründet und sucht die Abgrenzung von Spezifischen Sprachentwicklungsstörungen von typischer, aber ggfls. verzögerter Sprachentwicklung diagnostisch zu fassen. LiSe-DaZ wurde für Kinder im Alter von 3;0 bis 7;11 mit deutscher Erst- und Zweitsprache als Einzeltestung konzipiert und prüft in sieben Subtests, von denen sich der Subtest Lexikon und der Subtest Verbbedeutungen explizit auf den Wortschatz beziehen, Wortwissen (Schulz & Tracy 2011). Es liegen Normdaten sowohl für einals auch für mehrsprachige Probandinnen und Probanden vor. Der Wortschatztest WST (Wortschatztest) in der deutschen Version der Mill Hill Vocabulary Scale für 14–60+ Jahre ist ebenfalls Teil eines Tests: Als Element eines

310

Elke G. Montanari

Intelligenztests fragt er nach Definitionen (Ibrahimovic & Bulheller 2005). Mit diesem Verfahren können Zusammenhänge zwischen Wortschatz und Intelligenz erfasst werden. Dazu wurden 194 Begriffe aus dem DUDEN zufällig ausgewählt, die verstanden und erläutert werden müssen. Auf diese Weise werden rezeptiver und produktiver Wortschatz erfragt. Für Jugendliche liegen Vergleichsdaten aus einer Normierungsstichprobe aus dem Jahr 2004 vor.

5.6 Selbsteinschätzungen Die Selbsteinschätzung von Wortwissen lädt dazu ein, über das eigene Wissen zu nachzudenken, Lernbedarfe festzustellen und Lernerfolge zu beobachten. Sie ist für Lernende geeignet, die ihren eigenen Lernprozess bereits reflektieren können (Gollan et al. 2012; Jarvis & Daller 2013). In der didaktischen Diagnostik können Selbsteinschätzungen von Lernenden angefragt werden, zum Beispiel in der Anfangsphase einer neuen didaktischen Einheit. So erhält die Lehrperson Angaben dazu, welche Wörter schon bekannt sind und welche neu eingeführt werden müssen. Die Schülerinnen und Schüler können einschätzen, ob – – – – –

ihnen das angegebene Wort völlig unbekannt ist, es bereits gehört wurde, die ungefähre Bedeutung bekannt ist, die genaue Bedeutung bekannt ist oder im Satz gebraucht werden kann (mit Beispiel). (Wesche & Paribakht 1996)

Zu diesem Verfahren bemerken die Autoren kritisch, dass vor allem die Extrempositionen von den Lernerinnen und Lernern angekreuzt wurden. Die dabei beobachtete geringe Fähigkeit der Introspektion könnte jedoch mit größerer Übung bei den Lernenden wachsen. Selbsteinschätzungen wurden auch als X_Lex für eine häufigkeitskontrollierte Wortliste mit Multiple-Choice-Verfahren konkretisiert (Meara & Milton 2003). Die Probandinnen und Probanden geben an, ob sie ein Wort kennen oder benutzen können. In dieser Liste sind auch Fantasieworte enthalten, was den Testpersonen mitgeteilt wird. Die Durchführung ist denkbar einfach: Die Testpersonen kreuzen an, welche Wörter sie kennen. Für jedes existierende Wort, das die Testpersonen als bekannt markiert haben, erhalten sie Bonuspunkte; für jedes Fantasiewort, das sie als erkannt angekreuzt haben, gibt es Maluspunkte, also einen Abzug. Da die Wortliste über Häufigkeitslisten erstellt wird, ist die Adaption des Verfahrens in andere Sprachen sehr gut möglich. Dieses Verfahren ist gut für ältere Sprecher geeignet, z. B. für Studierende in der Fremdsprachenaneignung (Al-Masrai & Milton 2012).

Diagnostik von Wortwissen

311

5.7 Lexikalische Vielfalt Ein häufig verwendetes, einfaches Maß für die Vielfalt von Wörtern in Texten wird als das Verhältnis aller Grundformen und der wiederholten Wörter berechnet, als Type-Token-Ratio TTR (Johnson 1944; Templin 1957). An dem folgenden Beispieltext soll das anschaulich werden: Beispiel 2 Es war einmal ein liebes, nettes Mädchen, das jeder, der es auch nur ansah, sofort lieb hatte. Am allerliebsten aber hatte es ihre Großmutter, die gar nicht wusste, was sie dem Kind alles schenken sollte. Einmal schenkte sie ihr ein Käppchen, das war von rotem Sammet. Und weil ihr das so gut stand und sie nichts anderes mehr tragen wollte, nannten sie alle nur noch Rotkäppchen. Dieser Text enthält 66 Wörter (Token), jedoch kommen 14 Wörter mehrfach vor, so dass wir nur 52 Lemmata (Types) zählen. Die Entscheidung, welche Wörter zu einem Type gezählt werden, ist immer zu begründen. So ist im Beispiel lieb und allerliebs52 = 0,78.4 Bei einem Text, ten als ein Type gezählt worden. Als TTR ergibt sich also 66 in dem sich sehr viele Wörter wiederholen, sinkt die TTR; hätten wir also z. B. nur 30 = 0,45 ergeben. Es gibt also 30 unterschiedliche Types, so würde sich für die TTR 66 höhere Werte von TTR bei größerer lexikalischer Vielfalt.5 Der Guiraud-Index ist eine Variante einer Type-Token-Ratio: Die Anzahl der Types wird durch die Wurzel der Tokens dividiert. Für den Beispieltext haben wir also einen Guiraud-Index von √5266 = 6,4; bei nur 30 Types würde sich √3066 = 3,7 ergeben. Die Korrektur bewirkt, dass sich der Textumfang weniger stark auswirkt. Der Guiraud-Index bildet eine geringere lexikalische Vielfalt mit niedrigeren Werten ab; es liegt also eine positive Korrelation vor. Er liegt als Advanced Guiraud in einer Version vor, die Worthäufigkeit einbezieht (Jarvis & Daller 2013). Der TTR und der Guiraud-Index reagieren sensitiv auf Textlänge und tendieren dazu, bei längeren Texten grundsätzlich abzunehmen. Weiter wirkt sich die Textsorte (formell – informell) aus, die beispielsweise Begrenzungen für die Möglichkeiten angemessener Varianz mit sich bringen kann. Beide Maße ergeben daher die verlässlichsten Ergebnisse, wenn die Texte etwa gleichlang sind und es sich um die gleiche Textsorte handelt, und sie können nur innerhalb einer Sprache verglichen werden. Mit der TTR bzw. dem Guiraud-Index kann nicht erfasst werden, wie Redundanzen vom Lesenden und Hörenden beurteilt werden, wenn also mit vielen Wörtern nichts Neues gesagt wird (Jarvis 2013). Eine schnelle Lösung, um TTR in

4 Der TTR-Rechner von Gnutiez kommt auf 0.85; allerdings ist nicht transparent, wie er TTR berechnet. http://gnutiez.de/mtld/, zuletzt abgerufen am 15. 8. 2017. 5 In einigen Publikationen werden token als Zähler, types als Nenner behandelt; dann ergibt sich eine negative Korrelation mit Vielfalt.

312

Elke G. Montanari

der didaktischen Praxis anzuwenden, ist die mittlere TTR, d. h. in unterschiedlichen Texten einen Abschnitt von vorher bestimmter Länge (z. B. 200 Wörter) in der Mitte der jeweiligen Texte zu untersuchen. Die Vorteile dieser Maße liegen in der Anschaulichkeit und der einfachen Errechnung; sowohl TTR als auch Guiraud-Index sind in Bezug auf lexikalische Vielfalt aus theoretischer Sicht aber als vereinfachend kritisiert worden (Jarvis 2013; Jarvis & Daller 2013; Schmid & Jarvis 2014; TreffersDaller, Parslow & Williams 2016). Um daher zu einer größeren Komplexität bei der Berechnung lexikalischer Vielfalt zu gelangen, schlägt Jarvis (2013) sechs Maße vor: Variability, Volume, Evenness, Rarity, Dispersion und Disparity (Variabilität, Textumfang, Gleichmäßigkeit der Variation, Seltenheit von Ausdrücken, Klumpung und Disparität)6. Variabilität greift das Kriterium der wiederholten Wörter auf und setzt sie als TTR in Beziehung zum Textumfang. Mit der Gleichmäßigkeit in der Vielfalt wird untersucht, ob Vielfalt auf einen Absatz beschränkt ist oder sich über den gesamten Text ausdehnt, und ob sie auf wenige Types begrenzt ist; gibt es Worte, die sieben-, acht- oder mehrmals auftauchen, oder wird recht gleichmäßig ein- oder zweimal wiederholt? Mit dem Kriterium der Seltenheit wird danach gesucht, ob und wie häufig Wörter verwendet werden, die in der jeweiligen Sprache selten sind, also z. B. nicht unter den 5000 häufigsten Wörtern zu finden sind. Mit Klumpung wird beschrieben, ob Tokens zu einem Type in einem eng begrenzten Textbereich massieren oder sich über den gesamten Text verteilen. Disparität untersucht, wie stark sich unterschiedliche Ausdrücke unterscheiden, ob es sich um Variationen oder ganz andere Wörter handelt. Diesen Verfahren kann noch eine Einschätzung durch Lesende/ Hörende hinzugefügt werden (Treffers-Daller et al. 2016). Mit einem derartig vielschichtigen, aber dadurch natürlich auch aufwändigen Vorgehen kann über 60 % der Varianz der Ergebnisse in parallelen C-Tests (Jarvis 2013, vgl. Grotjahn in diesem Band) aufgeklärt werden. Die Länge der Texte stellt jedoch nach wie vor ein Problem dar und sollte möglichst konstant gehalten werden; die Kalibrierung dieser Maße ist bisher ein Desiderat.

5.8 Wortverbindungen Für Erwachsene wurde ein Verfahren entwickelt, das die Beherrschung eines komplexen Wortschatzes über Wortgrenzen hinaus thematisiert, indem Kollokationen in den Fokus gestellt werden. Der Vorteil dieses Vorgehens ist, dass die Verwendung komplexer Wortkombinationen in ihrer pragmatischen Angemessenheit erfasst wird. Als ein Beispiel für ein diagnostisches Vorgehen ist hier der von Gyllstad (2007) entwickelte Kollokationstest aufgeführt. Ursprünglich ist das Verfahren für Lernende von Englisch als Fremdsprache entwickelt worden. Es ist aber ebenfalls

6 Übersetzung EM.

Diagnostik von Wortwissen

313

gut denkbar für die Vergleiche innerhalb von Gruppen, z. B. innerhalb von neu zugewanderten Schülerinnen und Schülern nach einigen Schuljahren. Beispiel 3: Collex INSTRUCTION: In the following test your task is to choose one out of two word combinations. Choose the word combination that you think is the most common one, and the one you think native speakers of English would use in speech/writing, by putting a circle around it. If you don‘t know, and have to guess, then tick the box to the right of the word combinations. guessing 1) set the bed make the bed □ 2) drop count lose count □ 3) run a business drive a business □ (Gyllstad 2007: 74, Hervorhebung im Original) Dieses Format kann in andere Sprachen transportiert werden, u. a. um schnelle und langsame Lernende zu identifizieren, wenn genügend Vergleichsdaten erhoben werden. Da Kollokationen und Redewendungen typische Beispiele für Sprachenspezifik sind, ist hier vor allem der Vergleich innerhalb einer Sprache sinnvoll.

5.9 Verfahren und Experimente in der Diagnostik zur Organisation des mentalen Lexikons Assoziationsverfahren liefern Erkenntnisse dazu, welche Wörter mit anderen zusammen aktiviert werden (Milton 2009:141). Es können also Aktivierungs- und Organisationsprozesse beobachtet werden. Die Vorteile von Assoziationstests liegen darin, dass die Probandinnen und Probanden nicht von anderen Faktoren beeinträchtigt werden, z. B. sich um syntaktische Korrektheit bemühen müssen, und sich ganz auf die Nennung von Wörtern konzentrieren können. Ein Beispiel für einen Assoziationstest ist Lex 30 für Lerner des Englischen als Fremdsprache (Meara & Fitzpatrick 2000).7 Dabei werden 30 Items aus den 1000 häufigsten Wörtern (Nation 2001) angezeigt, zu denen die vier Assoziationen genannt werden sollen. Die ersten Assoziationen sind oft häufige Wörter, jedoch geben die nachgenannten Assoziationen oft Aufschluss darüber, ob die Probandin oder der Proband auch über seltene Wörter verfügt (Meara 2009). Die vorab geschilderten Verfahren untersuchen Produkte, die ja ein Ergebnis von Wortwissen und seiner Aktivierung sind, wie mündliche Äußerungen oder Texte,

7 Online: http://www.lognostics.co.uk/tools/Lex30/; zuletzt abgerufen am 15. 8. 2017.

314

Elke G. Montanari

und arbeiten damit „offline“. die im Folgenden dargestellten Verfahren streben an, Prozesse der Aktivierung und Organisation von Worten selbst zu erfassen oder doch zumindest diesen Prozessen nahe zu kommen und also „online“ zu wirken. Das Diagnoseziel ist in der Regel forschungsorientiert. Bei der Stroop Task (Stroop 1935). werden die Interferenzeffekte als Reaktionszeiten und Fehlerhäufigkeit bei den Reaktionen der Testpersonen bestimmt, wenn zwischen zwei Reizen Übereinstimmung besteht oder nicht besteht, z. B. bei einem der Originalexperimente s. Abb. 1, bei der nur auf die Farbe der Buchstaben, nicht das Wort selbst, reagiert werden soll:

GELB Abb. 1: Stroop Experiment Stimulus.

Versuchspersonen reagieren bei konfligierenden Stimuli langsamer als bei gleichartigen. Dieses Experiment wird in der mehrsprachigen Wortschatzforschung so eingesetzt, dass z. B. Genusmarkierungen variiert werden. Die Versuchspersonen reagieren schneller, wenn die Genusmarkierungen mit dem Substantiv über Sprachgrenzen hinweg kongruieren (Blumenfeld & Marian 2014; Costa, Miozzo & Caramazza 1999; Runnqvist & Costa 2011). Weitere Vorgehen, die Rückschlüsse auf neuronale Aktivitäten bei sprachlichen Aufgaben erlauben, sind bildgebende Verfahren, zum Beispiel als MRT oder als EEG. So zeigt Pulvermüller (2002), dass beim Denken an Bewegungsverben Aktivierung auch in Hirnarealen bemerkt wird, die für Bewegung selbst zuständig sind. Einblicke in von den Sprecherinnen und Sprechern nicht kontrollierte Prozesse ermöglicht die Untersuchung von Augenbewegungen (Eye Tracking), bei der die Augenbewegungen und die Verweildauer des Blicks festgehalten werden (Mertins 2016; Odean et al. 2015; Winke, Godfroid & Gass 2013), z. B. zu der Fragestellung, wie sich Kontext im bilingualen Zugriff auf das Wortverständnis im Text auswirkt (Libben & Titone 2009). Morales et al. (2016) setzen Bildimpulse und Augenbewegungsmessung ein, um Zusammenhänge in der Lexikonorganisation bei Zweisprachigen zu ermitteln und stellen eine sprachenübergreifende Aktivierung von Genus als Merkmal des Wortschatzes fest. Mit diesen Verfahren ist es weiterhin möglich zu untersuchen, wie lange Lernerinnen und Lerner auf ein Wort sehen, -ob sie also unbekannten Wörtern mehr Zeit widmen als bekannten Wörtern, und ob ihr Verhalten mit Lerneffekten zusammenhängt (Godfroid, Boers & Housen 2013).

5.10 Wortschatz im Deutschtest für Zuwanderer (DTZ) Die bestandene DTZ-Prüfung (Perlmann-Balme 2011) stellt den erfolgreichen Abschluss des Integrationskurses auf den Niveaustufen A2 oder B1 des Gemeinsamen

Diagnostik von Wortwissen

315

Europäischen Referenzrahmens GER dar (Europarat für interkulturelle Zusammenarbeit 2001). Sie ist damit eine wichtige Voraussetzung für arbeits- und ausländerrechtliche Verfahren. Die Testteile der DTZ lauten Hören, Sprechen, Lesen und Schreiben; deutlich wird im Testteil Lesen, wie stark Wortschatz mitdiagnostiziert wird, wie im folgenden Auszug sichtbar wird: Beispiel 4 Aufgabe: Sie wollen etwas einkaufen. Lesen Sie die Aufgaben und die Internetseite. Wo (a, b oder c) finden Sie etwas Passendes? Sie ziehen in zwei Wochen in eine neue Wohnung und suchen dafür Kartons. a Möbel & Wohnen b Heimwerker c andere Seite Beispiel aus einem Mustertest des DTZ (telc 2017)8 Ohne die entsprechenden Wortschatzkenntnisse Heimwerker, Möbel und Wohnen etc. ist es nicht möglich, diese Aufgabe zu bearbeiten. Wortschatz wird also mitgeprüft, obwohl er nicht ausgewiesen ist.

5.11 Evozierende und elizitierende Designs von Sprachproben Ein experimentelles diskursives Elizitationsverfahren, das die Handlungsqualität von Sprache berücksichtigt, ist das evozierende Feldexperiment EFE, das in der Unterrichts- und familiären Diskursforschung eingesetzt wurde (Ehlich & Rehbein 1986; Özdil 2010). Dafür werden Diskurse initiiert, in denen die Sprechenden authentische Handlungszwecke verfolgen und somit eine große Nähe zu der Realität der sprachlichen Handlung erreichen. Diese Diskurse werden aufgenommen oder protokolliert und können dann u. a. auf lexikalische Vielfalt untersucht werden. EFE können für alle Altersgruppen eingesetzt werden. Für Lernende, die noch ganz am Anfang der Aneignung einer weiteren Sprache stehen, die Schrift aber schon beherrschen, bieten freie Schreibproben erste Diagnosemöglichkeiten bei einfacher Anwendung, z. B. für die Planung des didaktischen Vorgehens innerhalb einer Lerngruppe. Sie differenzieren im untersten Aneignungsbereich und geben interessante Hinweise in den ersten Begegnungen mit Schülerinnen und Schülern, die neu in Deutschland angekommen sind und noch vor der Beschulung erste Kontakte mit der deutschen Sprache, z. B. in der Erstaufnahmeeinrichtung, erleben.

8 https://www.telc.net/fileadmin/user_upload/dtz-uebungstest.pdf, abgerufen am 29. 3. 2017.

316

Elke G. Montanari

Abb. 2: Freie Schreibproben aus dem Projekt „Sprachenlernen mit Flüchtlingen“, Stiftung Universität Hildesheim, Korpus: Katharina Melzner.

Diagnostik von Wortwissen

317

Die Anweisung ist einfach: Schreib bitte alle Wörter auf, die du in der Sprache L kennst. Dafür kann ein Zeitfenster festgelegt werden, z. B. fünf Minuten. Das Zeitfenster sollte allerdings dann systematisch und kontrolliert verkürzt werden, wenn die Testpersonen erkennbar aufgehört haben zu schreiben. Die Auswertung erfolgt quantitativ, d. h. es werden die Types gezählt. Freie Schreibproben sind geeignet für Lernende mit literalen Kompetenzen, die am Anfang des Aneignungsprozesses stehen. Ein weiteres wichtiges Format sind C-Tests; sie werden in diesem Band an anderer Stelle (vgl. Grotjahn in diesem Band) ausführlich behandelt. Für die Wortschatzdiagnostik sind sie u. a. für Vergleiche innerhalb von Gruppen, z. B. Schulklassen, sehr hilfreich. Da sie sehr ökonomisch durchzuführen sind, sind sie z. B. gut geeignet, um die Wortschatzkenntnisse zu einem spezifischen Themengebiet vor und nach einer didaktischen Einheit zu erfragen. In Texten mit systematischen Auslassungen werden je nach Vorgehen die korrekt ergänzten oder die fehlerhaften Wörter gezählt und innerhalb der Gruppen verglichen.

5.12 Adaption von Verfahren an andere Sprachen Aufgrund der jeweiligen sprachenspezifischen Eigenschaften von Wortschatz können Verfahren nicht einfach übersetzt werden, sondern müssen einen Adaptionsprozess durchlaufen, um möglichst ähnliche Bedingungen für Vergleiche herzustellen. Dafür müssen u. a. der Gebrauch der Items, die Häufigkeit, die kulturelle Verwendung sowie die linguistischen Eigenschaften, z. B. morphologische oder phonologische, berücksichtigt werden. Als Beispiel für eine Adaption eines Verfahrens für eine weitere Sprache soll die Anpassung des Bildbenennungstests WWT 6-10 für Russisch beschrieben werden (s. auch Glück 2011). Der Test liegt bereits für Deutsch und Türkisch vor und es gibt darüber hinaus zahlreiche Erfahrungen mit der mehrsprachigen Anwendung von Bildbenennungstests, z. B. dem PPVT. Für die Adaption des WWT 6-10 an die russische Sprache wurden die Stimuli vor der Testung in einem dreischrittigen Verfahren erarbeitet: i) Zuerst wurden die Übersetzungsäquivalente der Testfragen und der Zielantworten von zwei wissenschaftlichen Mitarbeiterinnen mit russischer Erstsprache im Peer-Verfahren erarbeitet. So entstanden die Testfragen sowie ein Katalog der erwarteten Antworten. ii) Die erwarteten russischen Zielantworten wurden anhand von Übersetzungen in Wörterbüchern und anhand der Testabbildungen überprüft. Dabei dienten folgende Leitfragen als Orientierungshilfe: Welche Antworten sind genau genug? Welche Antworten sind nicht angemessen, z. B. weil sie zu allgemein oder nicht alltagsentsprechend sind, und würden daher nicht gewertet werden? iii) Parallel dazu wurden die Abbildungen von zwei deutsch-russischen native speakers auf Adäquatheit der Bildstimuli überprüft, die sich dabei an der fol-

318

Elke G. Montanari

genden Frage orientierten: Stellen die Bilder tatsächlich etwas dar, das in der russischen Sprache so wahrgenommen und benannt würde? Während der Testung, die durch zweisprachige Testleitungen durchgeführt wird, notierten sich die Testleitungen Beobachtungen und Kommentare der Probandinnen und Probanden, z. B. wenn sie ein Item als auffällig anmerken. Nach der durchgeführten Testung in der adaptierten Version wurden die kindlichen Antworten auf der Grundlage des Katalogs korrekter Antworten überprüft. Alle Antworten, die darin nicht enthalten waren, wurden von zwei (bei Nichtübereinstimmung von drei) Native Speakers nochmals auf Angemessenheit bewertet. Ist die gegebene Antwort in dieser Sprache angemessen? Ist sie präzise genug? Gibt es vielleicht eine präzise Entsprechung, die jedoch im Gebrauch sehr spezifisch ist, z. B. der medizinischen Fachsprache zuzuordnen wäre, aber nicht von Kindern erwartet würde? Im Zweifelsfall wurde auf Vergleichsantworten von gleichaltrigen Sprechenden in der monolingualen Sprachumgebung zurückgegriffen (Montanari et al. 2015). In einem derartigen Verfahren können viele, aber nicht alle Probleme der Adaption gelöst werden. Schwierig sind u. a. die morphologische Komplexität, die je nach Sprachtyp unterschiedlich sein kann, sowie in der Regel die phonologische Form. Sofern sich die Häufigkeiten der Items in ähnlichen Bereichen bewegen, ist eine Vergleichbarkeit einigermaßen gegeben. Sofern es für einzelne Items keine Adaptionslösungen gibt, können diese dann aus der Auswertung ausgeschlossen werden. Dann können zwar Rohwerte nicht verglichen werden, aber z. B. Prozentränge innerhalb von Gruppen. Die mehrsprachige Testung wird sinnvollerweise von Forschungsassistentinnen bzw. -assistenten durchgeführt, die beide bzw. mehrere Sprachen der Testpersonen gut beherrschen. Für die Testung in der Herkunftssprache ist es sinnvoll, dass die Testkinder eine Ansprechperson in ihren Sprachen vorfinden und die Instruktionen auch in dieser Sprache erteilt werden können; gleichzeitig verwenden viele, insbesondere sehr junge, Probandinnen und Probanden auch die Umgebungssprache mit den Forschungsassistenten, zum Beispiel für Rückfragen, Kommentare und Bemerkungen. Um die Ergebnisse mehrsprachiger Testungen in Bezug zu setzen, können mehrere Maße für den Wortschatz errechnet werden. So sind für die Berechnung eines sprachenübergreifenden Wortschatzwertes in itembasierten Verfahren der TV (Total Vocabulary) und der TCV (Total Conceptual Vocabulary) vorgeschlagen worden (Pearson, Fernández & Oller 1993). Beide Verfahren wurden für die Ergebnisse aus dem CDI und aus Bildbenennungstests eingesetzt, u. a. mit dem PPVT und dem WWT 6-10. Um den TV-Wert zu erhalten, werden die Rohwerte in beiden bzw. allen Sprachen addiert. Die Testpersonen können bei einer zweisprachigen Testung also bei einem Item maximal zwei Punkte erhalten. Für die Berechnung des Wertes, wieviele Items in einer oder beiden Sprachen bearbeitet wurden, wird dagegen der TCV errechnet, indem für jedes bearbeitete Item ein Punkt (aber eben nur ein Punkt) vergeben wird. Diese Werte ermöglichen den Vergleich mit monolingualen Werten.

Diagnostik von Wortwissen

319

Allerdings ist zu beachten, dass TV die mehrsprachigen Sprecherinnen und Sprecher bevorzugt, da diese mehrmals um Benennungen gebeten werden, monolinguale Probanden jedoch nur einmal. Dagegen berücksichtigt der TCV nicht, dass Zweiund Mehrsprachige einen größeren kognitiven Aufwand aufbringen müssen, um aus dem mehrsprachigen Lexikon auf ein Lemma zuzugreifen.

5.13 Diagnostik bei Einschränkungen, Verletzungen oder Traumata Für die phonologische, semantische und syntaktische Verarbeitung und Diagnose der Wortsuche und Wortfindung konnten mit bildgebenden Methoden bereits zuständige Hirnareale aufgezeigt werden, z. B. das Wernicke-Areal. Liegt dort (genauer: in den dorsalen Anteilen des Gyrus temporalis superior) eine Schädigung vor, so ist typischerweise die Wortfindung gestört. Zunehmend wird jedoch diskutiert, ob für Aphasien und Traumata lokale Ansätze die besten Therapieansätze bieten oder ob vielmehr ein weiter Fokus, der sich an pragmatischen Stärken und Schwächen der Patientin oder des Patienten in Bezug auf Worteigenschaften wie Häufigkeit und Komplexität orientiert, hilfreicher ist (Stadie, Cholewa & De Bleser 2013). Die Diagnostik von Wortschatz bei Aphasien erfolgt in der Regel mehrdimensional: Beobachtung und Interaktion werden mit Tests verbunden. Das Ziel ist es, eine möglichst genaue Diagnose zu stellen, geeignete individuelle Therapieansätze zu finden, Therapieerfolge zu evaluieren und den Patientinnen und Patienten sowie ihrem Umfeld Mut zu machen und dafür Fortschritte aufzuzeigen. Für die Diagnostik von aphasischen Wortschatzproblemen steht u. a. der Aachener Aphasie Test als ein einschlägiges Verfahren zur Verfügung (Willmes et al. 1983). In der Grundannahme geht dieses Verfahren von den vier Hauptsyndromen aus: Wernicke-, Broca-, globale Aphasie, Amnesie. Der Test besteht aus sechs Testteilen: Spontansprache, Test einzelner Items, Wiederholungsaufgabe, geschriebene Sprache, Bildbenennung und Verständnis. Dabei werden vor allem solche Items verwendet, die eine Differenzierung zwischen den vier Hauptsyndromen gestatten. Ist ein abgrenzbares Syndrom jedoch nicht diagnostizierbar, stehen weitere Verfahren wie z. B. LEMO zur Verfügung, die auf der Grundlage eines psycholinguistischen Sprachverarbeitungsmodells mit Faktoren wie Häufigkeit, Wortlänge u. a. prüfen, in welchen Bereichen die Probandin bzw. der Proband Stärken und Schwächen zeigt und wo eine Therapie ansetzen kann (Stadie et al. 2013). In dem Verfahren LEMO werden unterschiedliche sprachliche Aufgaben u. a. zum Wortverständnis, Benennen sowie Lesen und Schreiben nach Diktat differentialdiagnostisch bewertet, und es werden Aussagen über kognitive Vorgänge, z. B. auditive Analyse, phonologisches Input-Lexikon, semantisches System abgeleitet. Die Vorteile dieses Verfahren liegen in der größeren Nähe an sprachlichen Handlungen der Patienten, so dass sich die im Test erarbeiteten Förderbedarfe direkt auf das Lebensfeld beziehen können.

320

Elke G. Montanari

5.14 Diagnose für die Sprecheridentifikation Sprachliche Äußerungen reflektieren auch lokalen Wortgebrauch. Isst ein Mensch gerne Karfiol, so wird er möglicherweise eine Zeitlang in Österreich gelebt haben, und bezeichnet eine Person ein Schmalzgebäck als Pfannkuchen, so wird sie vielleicht einige Zeit in Berlin verbracht haben. Bereits im frühen 20. Jahrhundert setzte Boas Sprachanalysen ein und stellte damit Verbindungen zwischen Sprachgruppen nativen Amerikanern her. Dieses Verfahren ermöglicht die Dokumentation von kulturellen und gesellschaftlichen Verbindungen. Im Lichte dieser Arbeiten ist Sprache ein Werkzeug für die kulturelle, ethnologische und historische Analyse (Duranti et al. 2003, Jakobson & Boas 1944). Doch wie zuverlässig sind Sprachanalysen für eine politische Diagnose? Hier könnte genauso gut ein Sprachkontakteinfluss vorliegen; vielleicht hat die Familie einmal in dieser Gegend gewohnt, oder viele andere Gründe können einen Sprachgebrauch erklären. Die Frage, die sich hier stellt, ist, ob und mit welchen Grenzen diagnostische Verfahren dabei helfen können, Sprecher zu identifizieren bzw. Anhaltspunkte für eine Identifikation herauszuarbeiten. So können Merkmale der Wortverwendung Rückschlüsse auf regionale Bezüge und individuellen Wortgebrauch erlauben und damit u. a. in der forensischen Linguistik einen hohen Nutzen aufweisen, insbesondere in der Analyse von Texten (Gold & French 2011; Rose 2003). Jedoch wird Sprecheridentifikation auch dafür eingesetzt, um die politische Herkunft von Menschen im Kontext von Asyl- und Flüchtlingsverfahren einzugrenzen.9 Die Unwägbarkeiten einer Diagnostik für Zwecke im Rahmen des Ausländer- und Asylrechts sind jedoch enorm hoch; so können zwar sprachliche und lexikalische Merkmale erfasst werden; völlig unklar ist jedoch, welche tatsächliche Bedeutung sie für die politische Frage der Staatsangehörigkeit haben. Hier ist also eine politische und wissenschaftliche kritische Debatte notwendig.

6 Ausblick Wohin entwickelt sich die Wortschatzdiagnostik? Die Fülle der möglichen und diskutierten Diagnostikansätze hat sich bisher noch nicht in der breiten schulischen Praxis wiedergefunden; sie wird selten angewendet, weil sie zusätzliche Arbeit verursacht, und das in der Datenerhebung wie in der Auswertung. Die Zukunft der Wortschatzdiagnostik sollte es stattdessen sein, in weit stärkerem Maße diagnostische Komplexität einzubeziehen und automatische Auswertungsansätze wie lexikalische Häufigkeitsprofile (Crossley, Cobb & McNamara 2013) zu nutzen. Gleichzeitig werden diagnostische Wege, die näher an den kognitiven Prozessen sind und

9 http://www.zeit.de/gesellschaft/zeitgeschehen/2017-03/bamf-software-asylverfahren-dialekterkennen, zuletzt abgerufen am 14. 8. 2017.

Diagnostik von Wortwissen

321

nah an der Wahrnehmung und Verarbeitung arbeiten, immer wichtiger: Die Hoffnung ist, dass nicht Sprachprodukte, sondern Sprachprozesse dadurch erfasst werden und damit für den Unterricht, die Forschung und die Therapie weitreichendere Erkenntnisse möglich werden. Sprachenübergreifende Ergebnisse zeigen, dass mehrsprachige Schülerinnen und Schüler im Vergleich mit monolingualen Altersgenossen über einen äquivalent großen Gesamtwortschatz verfügen. Also ist alles in bester Ordnung? Das gilt sicherlich für die kognitive Entwicklung und ist ein wichtiges Ergebnis, das zeigt wieder einmal den Normalfall Mehrsprachigkeit. Und doch bleibt der Wortschatzumfang der mehrsprachigen Schülerinnen und Schüler im Unterrichtsmedium hinter dem der gleichaltrigen Monolingualen bei gleicher guter Entwicklung zurück. Was bedeutet das für die Didaktik? Haben wir es hier mit einem Förderbedarf zu tun? Wer und was muss gefördert werden? Oder zeigen die Ergebnisse nicht einen starken Ausbau, Umbau von Wortschatz, der an die Handlungsbereiche des Individuums angepasst wird? Welche institutionellen Schlussfolgerungen sollten gezogen werden? Es stellt sich die Frage, ob die Diskussion um Förderbedarfe nicht den Fokus, oder besser, die Adressaten, verfehlt. Ist das eigentliche Ziel einer Förderentwicklung nicht eher das Bildungssystem und seine Institutionen? Wird so das Bild der hilfsbedürftigen Schülerin, des hilfsbedürftigen Schülers konstruiert, die/der der helfenden Unterweisung und Anleitung zur Bewältigung der eigenen Defizite und Schwächen bedarf? Steht die Falle der positiven Diskriminierung am Wegrand? Der Weg aus diesen Dilemmata scheint vor allem in der didaktischen Reflexion von sprachsensiblem und mehrsprachigkeitsorientiertem Unterricht zu liegen. Diagnostik kann, vor allem mit Blick auf die didaktischen Felder, dazu dienen, Erfolge der Aneignung der Schülerinnen und Schüler und des gemeinsamen Lehrens und Lernens zu dokumentieren und weiterzuentwickeln und den Lehrpersonen und Institutionen Anreize für die Weiterentwicklung didaktischen Vorgehens und des eigenen professionellen Handelns geben. Herzlich danke ich Barbara Graßer, Anna-Katharina Stauffenberg (Stiftung Universität Hildesheim) und den Herausgeberinnen und Herausgebern für Anmerkungen und Kommentare.

Literatur Al-Masrai, Ahmed & James Milton (2012): The vocabulary knowledge of university students in Saudi Arabia. TESOL Arabia Perspectives 19 (3). Bialystok, Ellen, Gigi Luk, Kathleen F. Peets & Sujin Yang (2010): Receptive vocabulary differences in monolingual and bilingual children. Bilingualism: Language and Cognition, 13 (4), 525–531.

322

Elke G. Montanari

Blumenfeld, Henrike K. & Viorica Marian (2014): Cognitive control in bilinguals: Advantages in Stimulus–Stimulus inhibition. Bilingualism, 17 (3), 610–629. Costa, Alberto, Michele Miozzo & Alfonso Caramazza (1999): Lexical selection in bilinguals: Do words in the bilingual’s two lexicons compete for selection? Journal of Memory and Language, 41, 365–397. Couve de Murville, Stefanie, Kristin Kersten, Esther Maier, Katharina Ponto, Martina Weitz (2015): Rezeptiver L2 Wortschatz in der Grundschule. In Anja K. Steinlen & Thorsten Piske (Hrsg.), Wortschatzlernen in bilingualen Schulen und Kindertagesstätten. 85–121. Frankfurt a. M.: Peter Lang. Crossley, Scott A., Tom Cobb & Danielle S. McNamara (2013): Comparing count-based and bandbased indices of word frequency: Implications for active vocabulary research and pedagogical applications. System, 41 (4), 965–981. De Bot, Kees (1992): A bilingual production model: Levelt’s ‚Speaking Model‘ adapted. Applied Linguistics, 13 (1), 1–23. De Bot, Kees (2004). The multilingual lexicon: Modelling selection and control. International Journal of Multilingualism, 1 (1), 17–32. De Houwer, Annick, Marc H. Bornstein & Sandrine De Coster (2014): A bilingual – monolingual comparison of young children’s vocabulary size: Evidence from comprehension and production. Applied Psycholinguistics, 35 (6), 1–23. Dirim, Inci & Marion Döll (2009): ‚Bumerang‘ – Erfassung der Sprachkompetenzen im Übergang von der Schulein den Beruf – vergleichende Beobachtungen zum Türkischen und Deutschen am Beispiel einer Schülerin. In Drorit Lengyel, Hans H. Reich & Marion Döll (Hrsg.), Von der Sprachdiagnose zur Sprachförderung, 139–146 Münster: Waxmann. Döll, Marion (2012): Beobachtung der Aneignung des Deutschen bei mehrsprachigen Kindern und Jugendlichen. Modellierung und empirische Prüfung eines sprachstandsdiagnostischen Beobachtungsverfahrens (Bd. 8). Münster: Waxmann. Döll, Marion & Hans H. Reich (Hrsg.) (2009): Niveaubeschreibungen Deutsch als Zweitsprache. Zur Beobachtung von Kompetenz und Kompetenzzuwachs im Deutschen als Zweitsprache. Kronshagen: Institut für Qualitätsentwicklung. Dunn, Lloyd M. & Leota M. Dunn (2004): Peabody Picture Vocabulary Test (PPVT) (deutsche Version). Göttingen: Hogrefe. Dunn, Lloyd M. & Leota M. Dunn (2007): Peabody Picture Vocabulary Test (PPVT-4) (4 ed.). Upper Saddle River, NJ: Pearson. Duranti, Alessandro, Laura M. Ahearn, Jenny Cook Gumperz, John Gumperz, Regna Darnell, Dell Hymes, Teun A. VanDijk (2003). Language as culture in US anthropology: Three paradigms. Current Anthropology, 44 (3), 323–347. Ehlich, Konrad (2013): Wortschatz und Diagnostik. In Johanna Fay (Hrsg.), (Schrift-) Sprachdiagnostik heute, 119–134. Baltmannsweiler: Schneider-Verlag. Ehlich, Konrad & Jochen Rehbein (1986): Muster und Institution. Untersuchungen zur schulischen Kommunikation. Tübingen: Narr. Europarat für interkulturelle Zusammenarbeit. (2001). Gemeinsamer europäischer Referenzrahmen für Sprachen: lernen, lehren, beurteilen. Berlin u. a.: Langenscheidt. Fenson, Larry, Philipp S. Dale, J. Steven Reznick, Donna J. Thal, Eleanor Bates, J. P. Hartung, S. Pethick, J. S. Reilly (1993): MacArthur Communicative Development Inventory: Users guide and technical manual. San Diego, CA: Singular Publishing Company. Fenson, Larry, Virginia A. Marchman, Donna J. Thal. (2007): The MacArthur-Bates Communicative Development Inventories user’s guide and technical manual, second edition. Baltimore: Brookes Publishing. Friesen, Deanna C. & Ellen Bialystok (2013): Control and representation in bilingualism. Implications for pedagogy. In John W. Schwieter (Hrsg.), Innovative Research and Practices in Second Language Acquisition and Bilingualism (Vol. 38), 223–240. Amsterdam: Benjamins.

Diagnostik von Wortwissen

323

Gantefort, Christoph & Hans-Joachim Roth (2008): Ein Sturz und seine Folgen. Zur Evaluation von Textkompetenz im narrativen Schreiben mit dem FörMig-Instrument ‚Tulpenbeet‘. In Thorsten Klinger, Knut Schwippert & Birgit Leiblein (Hrsg.), Evaluation im Modellprogramm FörMig, 29–50. Münster: Waxmann. Glück, Christian W. (2011): WWT 6–10. Wortschatz- und Wortfindungstest für 6- bis 10-Jährige. Göttingen: Hogrefe. Godfroid, Aline, Frank Boers & Alex Housen (2013): An eye for words: Gauging the role of attention in incidental L2 vocabulary acquisition by means of eye-tracking. Studies in Second Language Acquisition, 35 (3), 483–517. Gold, Erica, and Peter French (2011): International practices in forensic speaker comparison. International Journal of Speech, Language and the Law, 18 (2), 293–307. Gollan, Tamar H., Gali H. Weissberger, Elin Runnqyist, Rosa I. Montoya & Cynthia M. Cera (2012): Self-ratings of spoken language dominance: A Multilingual Naming Test (MINT) and preliminary norms for young and aging Spanish-English bilinguals. Bilingualism: Language and Cognition, 15, 594–615. Green, David W. (1998). Mental control of the bilingual lexico-semantic system. Bilingualism: Language and Cognition, 1 (2), 67–81. Grimm, Hannelore (2003): Störungen der Sprachentwicklung. Grundlagen − Ursachen − Diagnose − Intervention − Prävention (2. überarbeitete Auflage). Göttingen u. a.: Hogrefe. Grimm, Hannelore & Hildegard Doil, H. (2000): Elternfragebögen für die Früherkennung von Risikokindern (ELFRA). Göttingen: Hogrefe. Gyllstad, Henrik (2007). Testing English collocations: Developing receptive tests for use with advanced Swedish learners. Lund: Lund University. Hadley, Pamela A., Matthew Rispoli & Ning Hsu (2016). Toddlers’ verb lexicon diversity and grammatical outcomes. Language, Speech, and Hearing Services in Schools, 47 (1), 44–58. Hart, Betty & Todd R. Risley (1995). Meaningful differences in the everyday experience of young American children. Baltimore N.J.: Brookes Publishing. Hoff, Erika, Cynthia Core, Silvia Place, Rosario Rumiche, Melissa Senor & Marisol Parra (2012): Dual language exposure and early bilingual development. Journal of Child Language, 39 (1), 1–27. Hutchins, Tiffany (2013): MacArthur-Bates Communicative Development Inventories, second edition. In Fred R. Volkmar (Hrsg.), Encyclopedia of Autism Spectrum Disorders, 1773–1779. New York, NY: Springer. Ibrahimović, Nedina & Stephan Bulheller (2005): Wortschatztest (WST). Frankfurt a. M.: Pearson. Jakobson, Roman & Franz Boas (1944). Franz Boas’ approach to language. International Journal of American Linguistics, 10 (4), 188–195. Jarvis, Scott (2013). Defining and measuring lexical diversity. In Scott Jarvis & Michael Daller (Hrsg.): Vocabulary knowledge: Human ratings and automated measures. Amsterdam: Benjamins, 13–44. Johnson, Wendell (1944): Studies in language behavior. A program of research. Psychological Monographs, 56 (2), 1–15. Kiese-Himmel, Christiane (2005). Aktiver Wortschatztest für 3- bis 5-jährige Kinder: AWST-R: Revision. Weinheim: Beltz Test. Klaiber, Saskia Alexandra (2007): Erprobung des ELFRA (Elternfragebogen für die Früherkennung von Risikokindern): Probleme bei der Anwendung des ELFRA-1 und des ELFRA-2, LudwigMaximilians-Universität, München. https://edoc.ub.uni-muenchen.de/6784/1/Klaiber_ Saskia.pdf (9. 5. 2018). Kroll, Judith F. & Erika Stewart (1994): Category interference in translation and picture naming: Evicence for asymmetric connections between bilingual memory representations. Journal of Memory and Language, 33 (2), 149–174.

324

Elke G. Montanari

Kroll, Judith F., Janet G. van Hell, Natasha Tokowics & David W. Green (2010): The Revised Hierarchical Model: A critical review and assessment. Bilingualism: Language and Cognition, 13 (3), 373–381. Laufer, Batia (2012): Lexical frequency profiles. The Encyclopedia of Applied Linguistics. Hoboken, N.J.: Blackwell Publishing Ltd. Levelt, Willem J. M. (1989): Speaking: From intention to articulation. Cambridge: MIT Press. Libben, Maya R. & Debra A. Titone (2009): Bilingual lexical access in context: Evidence from eye movements during reading. Journal of Experimental Psycology: Learning, Memory, and Cognition, 35, 381–390. Marchman, Virgina A. & Carmen Martínez-Sussmann (2002): Concurrent validity of caregiver/ parent report measures of language for children who are learning both English and Spanish. Journal of Speech, Language, and Hearing Research, 45, 983–997. Meara, Paul (2009): Connected Words. Word Associations and Second Language Vocabulary Acquisition. Amsterdam: Benjamins. Meara, Paul & Tess Fitzpatrick (2000): Lex 30: An improved method of assessing productive vocabulary in an L2. System, 28, 19–30. Meara, Paul & James Milton (2003): X_Lex, The Swansea Levels Test. Newbury: Express. Meibauer, Jörg & Monika Rothweiler (Hrsg.) (1999): Das Lexikon im Spracherwerb. Tübingen: Francke. Mertins, Barbara (2016): The use of experimental methods in linguistic research: Advantages, problems and possible pitfalls. In Anstatt, Tanja, Anja Gattnar & Christina Clasmeier, Slavic Languages in Psycholinguistics. Chances and Challenges for Empirical and Experimental Research. Tübingen: Narr Francke Attempto, 15–33. Milton, James (2009): Measuring Second Language Vocabulary Acquisition. Bristol: Multilingual Matters. Montanari, Elke, Roman Abel, Barbara Graßer & Lilia Tschudinovski (2015): Unterwegs im bilingualen Symbolfeld: russisch-deutschsprachige Schülerinnen und Schüler. In Heidi Rösch & Julia Webersik (Hrsg.), Deutsch als Zweitsprache. Erwerb und Didaktik. Beiträge zum 10. Workshop: Kinder mit Migrationshintergrund, 73–90. Stuttgart: Klett Fillibach. https:// hildok.bsz-bw.de/frontdoor/index/index/searchtype/authorsearch/author/Elke+Montanari/ docId/679/start/7/rows/10, (9. 4. 2018). Montanari, Elke G. (2017): Beschulung von neu in das niedersächsische Bildungssystem zugewanderten Schü lerinnen und Schü lern in der Sekundarstufe I. Hildesheim: Stiftung Universität Hildesheim. https://hildok.bsz-bw.de/frontdoor/index/index/docId/699 (9. 4. 2018). Montanari, Elke G., Roman Abel, Lilia Tschudinovski & Barbara Graßer (2018). Do bilinguals create two different sets of vocabulary for two domains? Vocabulary development and overlap in the first years of schooling. Linguistic Approaches to Bilingualism. Montanari, Elke G., Roman Abel, Lilia Tschudinovski & Barbara Graßer (i.Dr.) Heritage language acquisition. In Bernhard Brehmer & Jeanine Treffers-Daller (Hrsg.), Lost in Transition. Amsterdam: Benjamins. Morales, Luis, Daniela Paolieri, Paola E. Dussias, Jorge R.Valdés Kroff, Chip Gerfen & María Teresa Bajo (2016): The gender congruency effect during bilingual spoken-word recognition. Bilingualism, 19 (2), 294–310. Nation, Paul (2001): Learning Vocabulary in Another Language. Cambridge: Cambridge University Press. Odean, Rosalie, Alina Nazareth, and Shannon M. Pruden (2015): Novel methodology to examine cognitive and experiential factors in language development: Combining eye-tracking and LENA technology. Frontiers in Psychology, 6, 1266 ff. Oller, D. Kimbrough, Barbara Z. Pearson & Alan B. Cobo-Lewis (2007): Profile effects in early bilingual language and literacy. Applied Psycholinguistics, 28 (2), 191–230.

Diagnostik von Wortwissen

325

Özdil, Erkan (2010): Codeswitching im zweisprachigen Handeln. Sprachpsychologische Aspekte verbalen Planens in türkisch-deutscher Kommunikation. Münster: Waxmann. Palmer, Harold E. (1968): The Scientific Study and Teaching of Languages. Oxford: Oxford University Press. Paradis, Michel (1997): The cognitive neuropsychology of bilingualism. In Annette. M. B. De Groot & Judith F. Kroll (Hrsg.), Tutorials in Bilingualism: Psycholinguistic Perspectives, Mahwah, NJ: Lawrence Erlbaum Publishers, 331–354. Paradis, Michel (2004): A Neurolinguistic Theory of Bilingualism. Amsterdam: Benjamins. Patterson, J. L. & Pearson, Barbara Z. (2004): Bilingual lexical development: Influences, contexts, and processes. In Brian A. Goldstein (Hrsg.), Bilingual Language Development and Disorders in Spanish-English Speakers, Baltimore: Paul H. Brookes, 77–104. Pearson, Barbara Zurer, Sylvia C. Fernández & Kimberly D. Oller (1993): Lexical development in bilingual infants and toddlers: Comparison to monolingual norms. Language Learning, 43 (1), 93–120. Peña, Elizabeth D., Lisa M. Bedore & Christine Fiestas (2013): Development of bilingual semantic norms: Can two be one? In Virginia C. Mueller-Gathercole (Hrsg.), Solutions for the Assessment of Bilinguals, Bristol: Multilingual Matters, 103–124. Perlmann-Balme, Michaela (2011): Deutsch-Test für Zuwanderer. Internationale Qualitätsstandards bei der Testentwicklung. Deutsch als Fremdsprache, 1, 13–22. Pulvermüller, F. (2002). The Neuroscience of Language: On Brain Circuits of Words and Serial Order. Cambridge: Cambridge University Press. Read, John (2000): Assessing Vocabulary. Cambridge: Cambridge University Press. Reich, Hans H. & Hans-J. Roth (2004). HAVAS 5 – Hamburger Verfahren zur Analyse des Sprachstandes bei 5-Jährigen. Hamburg: Behörde für Bildung und Sport. Reich, Hans H. & Hans-J. Roth (2007a): HAVAS 5 – das Hamburger Verfahren zur Analyse des Sprachstands bei Fünfjährigen. In Hans H. Reich, Hans-J. Roth & Ursula Neumann (Hrsg.), Sprachdiagnostik im Lernprozess. Verfahren zur Analyse von Sprachständen im Kontext von Zweisprachigkeit, Münster: Waxmann, 71–94. Reich, Hans H. & Hans-J. Roth (Hrsg.) (2007b): Sprachdiagnostik im Lernprozess. Münster u. a.: Waxmann. Reich, Hans H., Roth, Hans-J. & Döll, Marion (2009): Fast Catch Bumerang. Deutsche Sprachversion. Auswertungsbogen und Auswertungshinweise. In Drorit Lengyel, Hans H. Reich, Hans-J. Roth & Marion Döll (Hrsg.), Von der Sprachdiagnose zur Sprachförderung (FörMig Edition Band 5), Münster: Waxmann, 209–241. Renner, Gerolf (2006): Testbesprechung. Zeitschrift für Entwicklungspsychologie und Pädagogische Psychologie, 38 (3), 146–148. Rose, Phil (2003). Forensic speaker identification. Boca Raton: CRC Press. Runnqvist, Elin & Alberto Costa (2011): Is retrieval-induced forgetting behind the bilingual disadvantage in word production? Bilingualism: Language and Cognition, 15 (2), 365–377. Schmid, Monika S. & Scott Jarvis (2014): Lexical access and lexical diversity in first language attrition. Bilingualism: Language and Cognition, 17 (4), 729–748. Schmid, Monika S. & Köpke, Bernd (2009). L1 attrition and the mental lexicon. In Aneta Pavlenko (Hrsg.): The Bilingual Mental Lexicon: Interdisciplinary approaches, 209–238. Bristol: Multilingual Matters. Schulz, Petra & Rosemarie Tracy (2011): LiSe-DaZ®. Linguistische Sprachstandserhebung – Deutsch als Zweitsprache. Göttingen: Hogrefe. Settinieri, Julia (2011): Soziale Akzeptanz unterschiedlicher Normabweichungen in der L2Aussprache Deutsch. Zeitschrift fü r Interkulturellen Fremdsprachenunterricht Didaktik und Methodik im Bereich Deutsch als Fremdsprache, 16 (2), 67–80.

326

Elke G. Montanari

Smithson, Lisa, Johanne Paradis & Elena Nicoladis (2014): Bilingualism and receptive vocabulary achievement: Could sociocultural context make a difference? Bilingualism: Language and Cognition, 17 (4), 810–821. Stadie, Nicole, Jürgen Cholewa & Ria De Bleser (2013): LEMO 2.0. Lexikon modellorientiert. Diagnostik für Aphasie, Dyslexie und Dysgraphie Hofheim: NAT Verlag. Stroop, J. Ridley (1935): Studies of interference in serial verbal reactions. Journal of Experimental Psychology, 18, 643–662. Templin, Mildred C. (1957): Certain language skills in children. Minneapolis, MN: University of Minnesota Press. Thal, Donna J., Laureen O’Hanlon, Mary Clemmons & LaShon Fralin (1999): Validity of a Parent Report Measure of Vocabulary and Syntax for Preschool Children With Language Impairment. Journal of Speech, Language, and Hearing Research, 42, 482–496. Thordadottir, Elin (2011). The relationship between bilingual exposure and vocabulary development. International Journal of Bilingualism, 15 (4), 426–445. Treffers-Daller, Jeanine, Patrick Parslow & Shirley Williams (2016): Back to Basics: How Measures of Lexical Diversity Can Help Discriminate between CEFR Levels. Applied Linguistics (2016). Ulich, Michaela & Toni Mayr (2003): SISMiK. Sprachverhalten und Interesse an Sprache bei Migrantenkindern in Kindertageseinrichtungen (Beobachtungsbogen und Begleitheft). Freiburg: Herder. Ulich, Michaela & Toni Mayr (2006): Seldak. Sprachentwicklung und Literacy bei deutschsprachig aufwachsenden Kindern (Beobachtungsbogen und Begleitheft). Freiburg: Herder. Verhoeven, Ludo & Charles A. Perfetti (2017). Introduction: Operating principles in learning to read. In Ludo Verhoeven & Charles A. Perfetti (Hrsg.), Learning to Read Across Writing Systems, 1–30. Cambridge: Cambridge University Press. Vygotskij, Leo S. (2002): Denken und Sprechen. Psychologische Untersuchungen. Weinheim: Beltz. Wesche, Marjorie Binham & T. Sima Paribakht (1996): Assessing second language knowledge: Depth versus breadth. The Canadian Modern Language Review, 53 (1), 13–40. Willmes, Klaus, Klaus Poeck, Dorothea Weniger, Walter Huber (1983): Facet theory applied to the construction and validation of the Aachen Aphasia Test. Brain and Language, 18 (2), 259–276. Winke, Paula M., Aline Godfroid & Susan M. Gass (2013): Eye-Movement recordings in second language research. Second Language Research, 35 (2) 205–212. Zipf, Georg K. (1935): The psycho-biology of language. Boston: Houghton Mifflin.

Angela Grimm und Anja Müller

14 Syntax und Morphologie 1 2 3 4 5 6 7 8

Einleitung Syntax und Morphologie als sprachliche Wissenssysteme Die Erwerbsaufgabe Mehrsprachigkeit und Spracherwerb Erwerb syntaktischer Phänomene Erwerb morphologischer Phänomene Erfassung morpho-syntaktischer Fähigkeiten Zusammenfassung und Fazit

1 Einleitung Viele morphologische und syntaktische Phänomene des Deutschen gelten als „Stolpersteine“ für Lerner mit Deutsch als Zweitsprache (Rösch 2012). Dazu gehören beispielsweise die Kasusbildung und die Wortstellung im Haupt- und Nebensatz. Auch die unregelmäßigen Ableitungen von Nomen, beispielsweise in der Pluralbildung, und die unregelmäßigen Ableitungen von Verben, wie beispielsweise die Bildung von Partizipien, stellen Lerner oft vor große Herausforderungen. Interessanterweise zeigen jedoch nicht alle mehrsprachigen Lerner in gleicher Weise Schwierigkeiten im Erwerb der Morphosyntax. Die Heterogenität in den Entwicklungsmustern mehrsprachiger Lerner ist unter Berücksichtigung des Alters bei Erwerbsbeginn des Deutschen, der Spracherfahrung und der Charakteristika der untersuchten sprachlichen Phänomene zu einem erheblichen Teil erklärbar. Aus Sicht der Sprachdidaktik und der Spracherwerbsforschung wird daher seit längerem gefordert, Erkenntnisse der Spracherwerbsforschung und der Linguistik bei der Konzeption von Sprachstandserhebungsverfahren zu berücksichtigen (Ehlich 2007; Kany & Schöler 2010; Lüdtke & Kallmeyer 2007). Die Erfassung der Morphosyntax bietet sich dabei aufgrund der relativ guten Forschungslage sowie aufgrund der hohen praktischen Relevanz in besonderem Maße an. So beobachten pädagogische Fachkräfte neben dem Wortschatz am häufigsten die Entwicklung in der Grammatik (Geist 2013). Ausgehend von der spracherwerbstheoretischen und praktischen Bedeutung morpho-syntaktischer Phänomene ergeben sich für die Diagnostik grammatischer Fähigkeiten bei mehrsprachigen Kindern drei zentrale Fragen: Welche Eigenschaften morphologischer und syntaktischer Phänomene sind diagnostisch relevant? Wie werden diese Phänomene von mehrsprachigen Lernern erworben? Welche Verfahren erfassen welche morphologischen und syntaktischen Bereiche? Diesen drei Fragen soll hier nachgegangen werden. Dabei wird auf die in der empirischen Spracherwerbsforschung etablierte Unterscheidung mehrsprachiger Lerner in frühe und späte kindliche Zweitsprachlerner sowie erwachsene Lerner zurückgegriffen. Abschnitt 2 stellt zunächst die linguistischen Eigenschaften der synhttps://doi.org/10.1515/9783110418712-014

328

Angela Grimm und Anja Müller

taktischen und morphologischen Phänomene dar, die empirisch gut untersucht sind und die häufig in Sprachstandserhebungsverfahren erfasst werden. Die Abschnitte 3 bis 6 thematisieren den Spracherwerb. In Abschnitt 3 wird die Erwerbsaufgabe beschrieben, in Abschnitt 4 werden die Typen des mehrsprachigen Erwerbs definiert. Die folgenden Abschnitte fassen bisherige Ergebnisse zum Erwerb syntaktischer (Abschnitt 5) und morphologischer Phänomene (Abschnitt 6) zusammen. Der Schwerpunkt liegt dabei auf mündlichen Kompetenzen. Von diesen Erkenntnissen ausgehend werden im Abschnitt 7 Implikationen für die Diagnostik bei mehrsprachigen Kindern formuliert und die in gängigen Verfahren erfassten syntaktischen und morphologischen Fähigkeiten skizziert. In Abschnitt 8 folgen eine allgemeine Zusammenfassung und ein Fazit.

2 Syntax und Morphologie als sprachliche Wissenssysteme Die Syntax (von gr. syntaxis ‚Zusammenstellung‘) ist der Teilbereich der Linguistik, der sich mit dem Aufbau und den Eigenschaften von Sätzen beschäftigt (Eisenberg 2013; Haider 2010). Zu syntaktischen Phänomenen zählen beispielsweise die Verbstellung in Hauptsätzen und Nebensätzen (Oma hat an diesem sonnigen Mittwoch einen wunderbaren Apfelkuchen gebacken. vs. …, dass Oma an diesem sonnigen Mittwoch einen wunderbaren Apfelkuchen gebacken hat.), die obligatorische Inversion von Verb und Subjekt in Entscheidungsfragen (Hat Oma an diesem sonnigen Mittwoch einen wunderbaren Apfelkuchen gebacken?) sowie die Inversion von Subjekt und einer weiteren Nominalphrase in topikalisierten Strukturen bzw. in W-Fragen (An diesem sonnigen Mittwoch hat Oma einen wunderbaren Apfelkuchen gebacken bzw. Wann hat Oma einen wunderbaren Apfelkuchen gebacken?). Die Verbstellung im Haupt- und Nebensatz sowie die Inversion können mit Hilfe des Topologischen Feldermodells beschrieben werden (Drach 1940; Eisenberg 2013; Musan 2013). Diese Regel besagt, dass das finite Verb in Hauptsätzen in der linken Satzklammer, im Nebensatz dagegen in der rechten Satzklammer stehen muss. Aus der Besetzung der linken Satzklammer ergibt sich auch die Verberststellung in Entscheidungsfragen sowie Verbzweitstellung in topikalisierten Sätzen und bei W-Fragen. Die Morphologie (von grch. morphé ‚Gestalt‘, ‚Form‘ und lógos ‚Wort‘, ‚Lehre von‘) untersucht die Struktur und den Aufbau von Wörtern (Eisenberg & Fuhrhop 2013; Fuß 2012). Traditionell wird die Morphologie in die großen Teilbereiche Flexion und Wortbildung unterschieden. Flexion (Formenlehre) beschreibt die Bildung von Wortformen im grammatischen Kontext. Dazu gehören die Konjugation, die beispielsweise bei der Subjekt-Verb-Kongruenz vorliegt (z. B. Infinitiv: geh-en – 3. Prs. Sg. sie geh-t), und die Deklination, wie beispielsweise die Pluralbildung (Sg. der

Syntax und Morphologie

329

Baum – Pl. die Bäume). Werden durch morphologische Prozesse neue Wörter gebildet, spricht man von Wortbildung. Auch die Wortbildung wird wiederum in Teilbereiche gegliedert; diese sind die Komposition, die Derivation und die Konversion. Komposition beschreibt die Bildung neuer Wörter aus freien Morphemen wie in Apfel-kuchen. Derivation liegt vor, wenn freie und gebundene Morpheme kombiniert werden wie in Ordn-ung. Konversion schließlich beschreibt die Änderung der Wortart ohne eine sichtbare Endung wie bei der Substantivierung das Backen. Flexion und Wortbildung unterscheiden sich darin, dass sich bei Wortbildungsprozessen die Bedeutung, die Wortart und/oder die Wertigkeit von Verben (Valenz) ändern, wogegen die lexikalischen und grammatischen Eigenschaften des Stammes bei der Flexion stets erhalten bleiben. Ein weiterer Unterschied ist, dass Flexion stets im syntaktischen Kontext erfolgt, während Wortbildung nicht notwendigerweise einen syntaktischen Kontext benötigt. Beispielsweise bestimmt die syntaktische Funktion als Subjekt oder Objekt, ob eine Nominalphrase wie der Baum im Nominativ oder Akkusativ realisiert werden muss. Ob ein Kompositum oder Simplizium (= nicht-zusammengesetztes Wort) verwendet wird, ist nicht vom syntaktischen Kontext abhängig, sondern kommunikativ und lexikalisch determiniert (vgl. Oma backt einen Kuchen vs. Oma backt einen Apfel-kuchen). Syntax und Morphologie werden in der angewandten Sprachwissenschaft häufig zusammen genannt und behandelt. Dies ist unter anderem darauf zurückzuführen, dass Syntax und Morphologie als sprachliche Wissenssysteme interagieren. Definitionsgemäß gilt dies für die Flexion; beispielweise ist die morphologische Markierung des Nominativs oder Akkusativs von der syntaktischen Funktion als Subjekt oder Objekt abhängig. Auch bei der Subjekt-Verb-Kongruenz wird das Verbsuffix gemäß der morphologischen Eigenschaften des Subjekts gewählt. In empirischen Daten ist teilweise schwer zu erkennen, ob syntaktische Fähigkeiten die Grundlage für den Erwerb morphologischen Wissens sind oder der Syntaxerwerb auf morphologisches Wissen aufbaut. Ein typisches Beispiel für diese Problematik sind die unterschiedlichen Ansichten zum Erwerb der Subjekt-VerbKongruenz bei einsprachigen Kindern: Während Penner (1992) annimmt, dass die Verbzweitstellung den Erwerb der Subjekt-Verb-Kongruenz auslöst, argumentiert Clahsen (1986), dass für das Lernen der Verbzweitstellung zunächst die SubjektVerb-Kongruenz erworben sein muss. Aus Sicht der Sprachwissenschaft bilden Syntax und Morphologie jedoch separate sprachliche Ebenen, denen unterschiedlichen Regeln und Prinzipien unterliegen und die unterschiedliche Arten von Wissen repräsentieren. Während beispielsweise die Wortstellung vollständig regelgeleitet auf Grundlage des Topologischen Feldermodells beschrieben werden kann, sind morphologische Regeln nicht in allen Kontexten anwendbar. Beispielsweise entscheidet das Genus des Nomens darüber, wie der Kasus zu realisieren ist (z. B. Dativ maskulin: dem Baum vs. Dativ feminin: der Blume). Sprachlerner stehen vor der Aufgabe, nicht nur die Regeln einer Sprache zu erschließen, sondern auch zu lernen, wann Regeln nicht angewendet werden dürfen.

330

Angela Grimm und Anja Müller

3 Die Erwerbsaufgabe Ein erfolgreicher Spracherwerb setzt voraus, dass die Lerner ausreichenden und qualitativ hochwertigen Input haben, um das Regelsystem einer Sprache erwerben zu können. Das Regelsystem einer Sprache umfasst Wissen über die sprachlichen Ebenen und ermöglicht, nicht nur bereits bekannte Strukturen, sondern auch nie vorher gehörte Strukturen korrekt zu verstehen und zu produzieren. Neben regelgeleiteten Bereichen wie z. B. Kasus und Satzbau müssen Lerner auch Bereiche der Sprache meistern, für die sich Regeln nur in sehr begrenztem Maße ableiten lassen, wie z. B. für den Wortschatz und die Genuszuweisung. Auch das Wissen darüber, wann Regeln nicht angewendet werden, muss spezifisch für einzelne Formen gelernt werden. Dazu gehören Pluralbildungen von Nomen (z. B. Fluss vs. Flüsse, aber Bus vs. Busse) oder Partizipbildungen der schwachen oder gemischten Verbklassen (z. B. rennen vs. gerannt). Diese Bereiche können nur erworben werden, wenn die jeweiligen Formen tatsächlich im Input des Lerners vorkommen; bloße Anwendungen einer allgemeinen Regel würden hier zu Übergeneralisierungen führen (z. B. rennen vs. *gerennt). Tatsächlich sind Übergeneralisierungen wie *gerenn-t zeitweise charakteristisch für Sprachlerner; sie gelten als Zeichen dafür, dass das Regelsystem der Zielsprache aktiv erschlossen und angewendet wird. Aus Sicht der Spracherwerbsforschung ist die Differenzierung in regelbasierte und nicht regelbasierte Bereiche der Sprache sinnvoll, da nur bei regelbasiertem Wissen die Art und Abfolge der Entwicklungsschritte voraussagbar sind. Für den diagnostischen Prozess ist die Voraussagbarkeit wichtig, um den Entwicklungsstand feststellen und bewerten zu können. Zudem ist der Erwerb des sprachlichen Regelwissens zu einem bestimmten Zeitpunkt abgeschlossen, während der Erwerb nicht-regelgeleiteten Wissens (z. B. Wortschatz) praktisch nie abgeschlossen wird. Darüber hinaus ist nicht-regelgeleitetes Wissen in besonderem Maße beeinflusst durch nicht-sprachliche Erwerbsbedingungen wie z. B. den sozioökonomischen Status der Eltern (Hoff 2003) oder das Arbeitsgedächtnis (Gathercole & Baddeley 1989). Will man die sprachlichen Fähigkeiten weitestgehend unabhängig von den Bildungsvoraussetzungen der Familie erheben, eignen sich aus spracherwerbstheoretischer Sicht folglich regelgeleitete Strukturen wie der Satzbau deutlich besser als nicht-regelgeleitete Bereiche.

4 Mehrsprachigkeit und Spracherwerb 4.1 Spracherwerbstypen Eine weitere Sprache kann prinzipiell in jedem Alter erworben werden. Im ungesteuerten Erwerb, d. h. bei einem Erwerb ohne explizite Instruktion, geht ein früherer Erwerbsbeginn mit einer höheren Kompetenz in der weiteren Sprache einher.

Syntax und Morphologie

331

Notwendige Voraussetzung für einen erfolgreichen Spracherwerb ist qualitativ und quantitativ ausreichender Input. Das Erreichen einer muttersprachlichen Kompetenz ist zudem daran geknüpft, dass der Erwerbsbeginn innerhalb einer kritischen oder sensiblen Phase liegt (Knudsen 2004; Locke 1997; Meisel 2009). Ein Erwerbsbeginn im Erwachsenenalter schließt das Erreichen einer hohen oder sogar quasi-muttersprachlichen Kompetenz nicht aus; dem Erwerb liegen jedoch andere Lern- und Verarbeitungsstrategien zugrunde als im kindlichen Zweitspracherwerb (Klein 2000, vgl. auch Dimroth in diesem Band). Entsprechend des Alters bei Erwerbsbeginn werden verschiedene Typen mehrsprachiger Lerner unterschieden (Rothweiler 2007; Schulz & Grimm 2012). Zunächst wird der simultane vom sukzessiven Erwerb einer weiteren Sprache abgegrenzt. Als sukzessiver Erwerb gilt, wenn der Erwerb einer weiteren Sprache einsetzt, nachdem die Erstsprache „zumindestens in den Grundzügen vollzogen ist“ (Rothweiler 2007: 106). Angesichts der Vielschichtigkeit des Erwerbsgegenstands Sprache ist jedoch zu klären, welche Bereiche für die Definition herangezogen werden sollten. In der Literatur besteht keine Einigkeit bezüglich konkreter Altersfenster für die Differenzierung verschiedener Erwerbstypen. Zunehmend etabliert sich in der empirischen Spracherwerbsforschung die folgende Einteilung (Chilla, Rothweiler & Babur 2013; Müller, Schulz & Tracy 2018; Schulz & Grimm 2012): Ein simultan-bilingualer Erwerb liegt vor, wenn der Erwerbsbeginn einer weiteren Sprache ab Geburt bis vor dem zweiten Geburtstag beginnt. Setzt der Erwerb einer weiteren Sprache zwischen dem zweiten und vierten Lebensjahr ein, spricht man vom frühen kindlichen Zweitspracherwerb. Ein Erwerbsbeginn zwischen dem sechsten und zehnten Lebensjahr wird als später kindlicher Zweitspracherwerb bezeichnet. Schließlich spricht man vom Zweitspracherwerb Erwachsener, wenn der Erwerbsbeginn nach der Pubertät liegt. Ersichtlich ist, dass die Klassifikation chronologisch lückenhaft ist. Wie Kinder mit einem Erwerbsbeginn zwischen vier und sechs oder bis zum Beginn der Pubertät zu klassifizieren sind, ist empirisch derzeit ungeklärt.

4.2 Muster mehrsprachigen Erwerbs Motiviert wird die Unterscheidung der Spracherwerbstypen durch Studien zu den Erwerbsmustern in der Zweitsprache. Erwerbsmuster lassen sich in dreierlei Hinsicht betrachten. Erstens können Lerner mit Blick auf die Erwerbsgeschwindigkeit beschrieben werden. Hier zeigen Untersuchungen zum Zweitspracherwerb des Deutschen, dass frühe Zweitsprachlerner häufig einen schnelleren Entwicklungsverlauf aufweisen als gleichaltrige monolinguale oder simultan-bilinguale Lerner (Grimm & Schulz 2013; 2014b; Tracy & Thoma 2009). Bis zum Schuleintritt haben frühe Zweitsprachlerner ihren durch den späteren Erwerbsbeginn begründeten Entwicklungsrückstand in vielen sprachlichen Bereichen aufgeholt (Grimm & Schulz 2014b). Unterschiede zwischen einsprachigen Kindern und frühen Zweitsprachlernern bestehen bis in das Grundschulalter hinein vor allem in den spät erworbenen

332

Angela Grimm und Anja Müller

Phänomenen wie z. B. Kasus (Grimm & Schulz 2016). Gegenüber frühen Lernern zeigen späte Zweitsprachlerner häufig eine noch höhere Erwerbsgeschwindigkeit (Dimroth & Haberzettl 2008). Die Beobachtung, dass ein späterer Erwerbsbeginn mit einer hohen Erwerbsgeschwindigkeit einhergeht, wird mit den weiter entwickelten kognitiven Fähigkeiten, größerem Weltwissen und dem vorhandenen Wissen aus der Erstsprache begründet (Dimroth & Haberzettl 2008). Lerner können weiterhin mit Blick auf charakteristische Fehler bzw. Erwerbsschritte beschrieben werden. Auch hier ist die Differenzierung in Spracherwerbstypen hilfreich: Während simultan-bilinguale Lerner und frühe kindliche Zweitsprachlerner prinzipiell ähnliche Fehler produzieren wie monolinguale Kinder, können ältere Lerner – Jugendliche und Erwachsene – in den Fehlermustern und in ihren Entwicklungsstufen von monolingualen Kindern und frühen Zweitsprachlernern abweichen (Dimroth 2007; Dimroth & Haberzettl 2008; Haberzettl 2005; Wegener 1998b; siehe Abschnitte 5 und 6 in diesem Beitrag). So wurden beispielsweise keine Schwierigkeiten im Erwerb der Finitheit und Subjekt-Verb-Kongruenz im monolingualen Erwerb (Clahsen 1982; Tracy 1991), simultan-bilingualen Erwerb (Meisel 1990) sowie im frühen Zweitspracherwerb (Chilla 2008; Rothweiler 2016; Wojtecka et al. 2013) berichtet. Dagegen durchlaufen späte kindliche Zweitsprachlerner und Erwachsene qualitativ andere Entwicklungsstufen im Erwerb der Subjekt-Verb-Kongruenz (Clahsen, Meisel & Pienemann 1983; Haberzettl 2005). Erwachsenen Zweitsprachlernern gelingt die korrekte Markierung von Subjekt-Verb-Kongruenz auch nach langer Kontaktdauer zum Deutschen häufig nur unvollständig (Clahsen, Meisel & Pienemann 1983). Schließlich können Lerner dahingehend unterschieden werden, inwiefern das Erreichen einer muttersprachlichen Kompetenz möglich ist. Bisherige Studien zeigen, dass – unter geeigneten Inputbedingungen – bei einem Erwerbsbeginn vor dem vierten bzw. sechsten Lebensjahr das Erreichen muttersprachlicher Kompetenz der Normalfall zu sein scheint. Auch späte kindliche Zweitsprachlerner erreichen in der Regel eine muttersprachliche Kompetenz in der Zweitsprache (Dimroth 2007; Dimroth & Haberzettl 2008). Für erwachsene Zweitsprachlerner wurde eine mit einsprachigen Lernern vergleichbare Kompetenz für morphologische und syntaktische Phänomene ebenfalls berichtet; dies scheint jedoch eher die Ausnahme als der Normalfall zu sein (Birdsong 1992).

5 Erwerb syntaktischer Phänomene Der Erwerb der syntaktischen Struktur beinhaltet Phänomene wie die Haupt- und Nebensatzbildung, Inversion von Konstituenten des Vor- und Mittelfelds sowie die Ausdifferenzierung der Nominalphrase. Empirische Untersuchungen fokussierten vor allem die Wortstellung in Haupt- und Nebensätzen sowie die Inversion von

Syntax und Morphologie

333

Konstituenten des Vor- und Mittelfelds.1 Die folgende Darstellung begrenzt sich daher auf diese gut untersuchten Phänomene.

5.1 Monolingualer Erwerb Die Entwicklung von Haupt- und Nebensatzstruktur wird als schrittweise Entdeckung der rechten und linken Satzklammer in Form von morpho-syntaktischen Entwicklungsphasen bzw. Meilensteinen beschrieben (Clahsen 1986; Grießhaber 2013; Tracy 1991; 2007). Clahsen (1982; 1986) postulierte eine Abfolge von fünf Entwicklungsphasen (siehe Tracy 1991 für individuelle Varianz in den Verläufen). Tracy (2005) beschrieb den Erwerb der Satzstruktur im Erstspracherwerb auf Grundlage des Topologischen Feldermodells als vier Meilensteine. Relevant ist hier die Entwicklung ab Meilenstein II, der im Alter von ca. 24 Monaten erreicht wird und durch Wortkombinationen gekennzeichnet ist.2 Die Kinder besetzen die rechte Satzklammer mit einem infiniten Verb oder einer Verbpartikel (z. B. Mama Bus fahren). Im Alter von ca. 30 Monaten erreichen die Kinder Meilenstein III. Sie produzieren nun korrekt flektierte finite Verben in Verbzweitposition (z. B. da kommt Ball rein). Mit dem Erreichen von Meilenstein III wird die linke Satzklammer als Position für das finite Verb entdeckt. Damit einher geht auch der Erwerb der Inversion in Fragestrukturen (z. B. Wo kann der hingehen?), topikalisierten Strukturen (z. B. den Ball hab ich da.) oder satzeinleitenden Adverbialen (z. B. da kommt der Ball rein). Mit ca. 36 Monaten erreichen die Kinder Meilenstein IV und produzieren nun Nebensätze mit einer satzeinleitenden Subjunktion und dem finiten Verb in der rechten Satzklammer (z. B. …, ob der Hund weggelaufen ist?). Meilenstein IV können Vorläuferstrukturen vorausgehen, in denen die Grundstruktur erkennbar ist, jedoch einzelne Elemente noch fehlen (z. B. die Subjunktion in da klopft an Tür […] jemand nich da is; vgl. Tracy 1991: 270).

5.2 Früher Zweitspracherwerb Die oben dargestellte Erwerbsfolge lässt sich auch für frühe kindliche Zweitsprachlerner nachweisen (Chilla 2008; Schulz & Tracy 2011; Thoma & Tracy 2006). Rasch nach Beginn eines systematischen Kontakts zur Zweitsprache produzieren frühe kindliche Zweitsprachlerner Äußerungen, die Meilenstein II zuzuordnen sind (z. B.

1 Untersuchungen zum ungesteuerten Erwerb der Nominalphrase befassten sich in erster Linie mit dem Erwerb von Artikeln oder der Nominalflexion (siehe Abschnitt 6). Die Ausdifferenzierung der Nominalphrase wird v. a. in Untersuchungen zum (gesteuerten) Erwerb bildungssprachlicher Kompetenzen thematisiert. 2 Einwortäußerungen (z. B. heiß oder Mama) sowie Äußerungen mit Verbpartikeln (z. B. Tür auf) entsprechen Meilenstein I.

334

Angela Grimm und Anja Müller

ein Vogel fliegen3). Nach einer Kontaktdauer von etwa sechs bis zwölf Monaten erscheinen erste Hauptsätze mit korrekt flektierten Verben (Meilenstein III) wie z. B. Die Junge will Prinzessin holen und invertierte Strukturen wie z. B. Keine Platz mehr hab ich hier. Zum Erwerb der Nebensatzstruktur (Meilenstein IV) mit korrekter Stellung des finiten Verbs in der rechten Satzklammer und einer Konjunktion (z. B. bis der Mama fertig ist) benötigen frühe kindliche Zweitsprachlerner etwa zwölf bis 18 Kontaktmonate (Thoma & Tracy 2006; Tracy & Thoma 2009); in anderen Untersuchungen auch bis zu 30 Monate (Grimm & Geist 2012). Wie auch im monolingualen Erwerb können dem Erreichen von Meilenstein IV Vorläuferstrukturen vorangehen wie z. B. warte doch mal, wenn ich hab fertig gemal.

5.3 Später kindlicher Zweitspracherwerb Der Erwerb der Wortstellung im Satz scheint für spätere kindliche Lerner deutlich mehr Schwierigkeiten darzustellen als für frühe Lerner (Haberzettl 2005; Diehl et al. 2000). Zwar werden teilweise bereits im ersten Kontaktmonat Äußerungen mit flektierten Verben produziert; es treten jedoch im Vergleich zu frühen Zweitsprachlernern untypische Fehler in der Stellung der Negation auf (z. B. Mama nicht kauft Lutscher4). Zudem werden zahlreiche infinite Strukturen produziert (z. B. des Fahrrad Unfall machen). Der Erwerb der Wortstellung scheint bei späten Lernern in deutlich größerem Maße als bei frühen Zweitsprachlernern von der Struktur der Erstsprache (Haberzettl 2005) sowie von kognitiven und motivationalen Faktoren abzuhängen (Dimroth 2007). Der Entwicklungsverlauf im Erwerb der Wortstellung entspricht dabei teilweise den aus dem Zweitspracherwerb Erwachsener dokumentierten Mustern. Im späten kindlichen Zweitspracherwerb wurden Schwierigkeiten im Erwerb der Satzklammer dokumentiert, beispielsweise die fehlende Besetzung der rechten Satzklammer (z. B. zwei Bub geht machen einen Schneemann) oder Verbdrittstrukturen wie z. B. in landhaus sie hat mäuse und auch frosch gefresst, vgl. Dimroth 2007: 125).

6 Erwerb morphologischer Phänomene Der Erwerb der Morphologie stellt für mehrsprachige Lerner oft eine große Hürde dar. Schwierigkeiten wurden für den Erwerb der Verbalflexion (Tempus, SubjektVerb-Kongruenz), der Nominalflexion (Kasus, Genus, Numerus) sowie für die Wort-

3 Die Beispiele für frühe kindliche Zweitsprachlerner in Abschnitt 5 stammen aus Thoma & Tracy (2006). 4 Die Beispiele für späte kindliche Zweitsprachlerner in Abschnitt 6 stammen, falls nicht anders angegeben, aus Haberzettl (2005).

Syntax und Morphologie

335

bildung (Derivation und Komposition) berichtet. Aufgrund des Schwerpunkts Grammatik beschränkt sich die folgende Zusammenfassung auf die Flexion. In der verbalen Flexion werden der Erwerb der Subjekt-Verb-Kongruenz sowie das Passiv, im Bereich der nominalen Flexion der Erwerb von Kasus, Genus und Numerus thematisiert. Diese Phänomene gelten als gut untersuchte Bereiche im Erst- und Zweitspracherwerb.

6.1 Verbale Flexion 6.1.1 Monolingualer Erwerb Mit dem Erreichen von Meilenstein III erkennen monolinguale Kinder den Zusammenhang von Finitheit und Verbzweitposition. Nur marginal treten Fehler in der Markierung von Subjekt-Verb-Kongruenz auf, beispielsweise als Übergeneralisierung unregelmäßig gebildeter Formen (ich kanne drinsitzen; vgl. Clahsen 1986: 26). Infinitive in Verbzweitposition oder Ersetzungsfehler sind praktisch nicht vorhanden (vgl. jedoch Chilla in diesem Band für Kinder mit Sprachstörungen). Das Flexionsparadigma wird schrittweise erworben, wobei die Markierung für die 3. Person früher produziert wird als für die 2. Person (Clahsen 1982; Tracy 1991). Im Alter von etwa drei Jahren wurden in spontansprachlichen Daten monolingualer Kinder erste Passivstrukturen dokumentiert (Abbot-Smith & Behrens 2006). Zunächst erscheinen Passivstrukturen mit werden; sein-Passive wurden erst später produziert (Fritzenschaft 1994; Wegener 1998a). Der Erwerb des Passivs erfolgt schrittweise und vollzieht sich bis ins Grundschulalter (Wegener 1998a). Auch ein zielsprachliches Verständnis von einfachen Passivstrukturen konnte erst ab einem Alter von ca. fünf Jahren nachgewiesen werden (Schaner-Wolles, Binder & Tamchina 1986).

6.1.2 Früher kindlicher Zweitspracherwerb Im Erwerb der verbalen Flexion scheinen grundlegende Unterschiede zwischen frühen und späten kindlichen Zweitsprachlernern zu bestehen. Frühe kindliche Zweitsprachlerner meistern wie monolinguale Kinder die Subjekt-Verb-Kongruenz zusammen mit der Hauptsatzstellung auf Meilenstein III (Chilla 2008; Wojtecka et al. 2013). Vorübergehend kann es in einigen wenigen Fällen zur Produktion von Stammformen in Verbzweitposition kommen wie z. B. die flieg-0̸ bis in Himmel (vgl. Schwarze 2018), die jedoch nach ca. 22 Kontaktmonaten (Alter ca. 4;8 Jahre) nicht mehr nachweisbar waren. Fehler in der Kongruenzmarkierung wurden in Schwarzes Studie dagegen nur marginal beobachtet. Der Erwerb des Passivs wurde bei frühen kindlichen Zweitsprachlernern des Deutschen bislang nicht gezielt untersucht. Eine

336

Angela Grimm und Anja Müller

Untersuchung von Marinis (2007) mit frühen kindlichen Zweitsprachlernern des Englischen und mit Türkisch als Erstsprache zeigte jedoch deutliche Schwierigkeiten im Verständnis des Passivs noch im Alter von mehr als acht Jahren und nach vier- bis fünfjähriger Kontaktdauer zum Englischen.

6.1.3 Später kindlicher Zweitspracherwerb Späte kindliche Lerner produzieren in der Regel mit Beginn des Zweitspracherwerbs flektierte Formen (Dimroth 2007: 128; vgl. jedoch Haberzettl 2005 für Lernerin An mit Erstsprache Russisch). Vergleichende Analysen von zwei Kindern mit Erstsprache Russisch ergaben, dass späte kindliche Zweitsprachlerner im Prinzip die gleichen Entwicklungsschritte im Erwerb der Subjekt-Verb-Kongruenz durchlaufen wie monolinguale Kinder. Dimroth (2007) und Czinglar (2013) beobachteten bei der jüngeren Lernerin (Alter bei Erwerbsbeginn: 8;7 Jahre) einen insgesamt schnelleren Entwicklungsverlauf gegenüber der älteren kindlichen Zweitsprachlernerin (Alter bei Erwerbsbeginn 14;3 Jahre). Späte kindliche Lerner erwerben die Subjekt-VerbKongruenz jedoch zügiger als monolinguale Kinder (Dimroth & Haberzettl 2008). Wie auch bei monolingualen Kindern und frühen kindlichen Zweitsprachlernern wurden Übergeneralisierungen der Subjekt-Verb-Kongruenz beobachtet (z. B. Du habst den ahm die Fest gemacht; vgl. Haberzettl 2005: 83). Nur sehr selten wurden jedoch Infinitive in Verbzweitposition und Substitutionsfehler dokumentiert. Flexionsfehler betreffen vor allem die unregelmäßig gebildeten Verbformen (die Mutter die Wurst nicht genehmt; vgl. Haberzettel 2005: 116). Späte kindliche Zeitsprachlerner scheinen besondere Schwierigkeiten im Erwerb nicht-regelgeleiteter Strukturen wie z. B. den unregelmäßig gebildeten Verbformen aufzuweisen (Dimroth 2007: 134). Erste Passivstrukturen wurden für den späten kindlichen Zweitspracherwerb ab einer Kontaktdauer von acht bis 20 Kontaktmonaten berichtet (Wegener 1998a). Das Auftauchen erster Passivstrukturen fiel jedoch nur bei zwei der sechs untersuchten Kinder mit Russisch, Polnisch oder Türkisch als Erstsprache mit einer produktiven Verwendung von Passivstrukturen zusammen. Eine produktive Verwendung konnte zwischen acht bis 23 Kontaktmonaten nach dem ersten Auftauchen nachgewiesen werden. Im Entwicklungsmuster gleichen späte Zweitsprachlerner monolingualen Kindern, jedoch bestehen teilweise erhebliche Unterschiede im Zeitpunkt des Erwerbs (Wegener 1998a). Die Heterogenität zwischen den späten kindlichen Zweitsprachlernern führt Wegener (1998a) auf die Erstsprachen, das chronologische Alter, die Lernbedingungen sowie auf die Komplexität des Erwerbsphänomens zurück.

Syntax und Morphologie

337

6.2 Nominale Flexion 6.2.1 Monolingualer Erwerb Der Erwerb der nominalen Flexion umfasst das Genus-, Numerus- und Kasussystem. Während der Erwerb des Genussystems monolingualen Kindern keine Schwierigkeiten bereitet, erstreckt sich der Erwerb des Numerussystems und des Kasussystems bis ins Grundschulalter (Kauschke, Kurth & Domahs 2011; Schulz & Grimm 2012). Der Ausbau des Numerussystems beginnt bereits im Alter von etwa 16 Monaten mit -n-Pluralen (Szagun 2001). Da das Pluralsystem mit dem Genussystem interagiert und zudem wenig regelhaft ist, treten noch bis zum Alter von sechs Jahren und darüber hinaus Fehler in der Pluralbildung auf. Der Erwerb der einzelnen Pluralallomorphe vollstreckt sich in unterschiedlicher Geschwindigkeit und variiert zwischen den einzelnen Studien. Als gesichert kann gelten, dass der -n-Plural am frühesten, die Formen mit Umlaut als letzte erworben werden (Kauschke, Kurth & Domahs 2011; Szagun 2001). Da die Markierung des Kasus im Deutschen vornehmlich am Artikel erfolgt, muss zum Kasuserwerb die Nominalphrase soweit ausdifferenziert sein, dass überhaupt Artikel produziert werden. Erste Artikel erscheinen im monolingualen Erwerb ab einem Alter von 18–20 Monaten (Mills 1986; Szagun 2001); eine systematische Produktion von Artikeln erfolgt ab ca. 33 Monaten (Mills 1986). Das Kasussystem wird in der Abfolge Nominativ-Akkusativ-Dativ erworben (Eisenbeiss, Bartke & Clahsen 2005; Szagun 2001). Der Erwerb des Nominativs scheint für monolinguale Kinder keine Schwierigkeiten darzustellen (Szagun 2001). Erste Akkusativmarkierungen am direkten Objekt (z. B. den Mann sehen) werden mit ca. 36 Monaten produziert (Eisenbeiss, Bartke & Clahsen 2005; Scherger 2015). Der Dativ wird zunächst in der Präpositionalphrase (z. B. auf dem Baum) und erst später am indirekten Objekt (z. B. dem Mann helfen) markiert (Eisenbeiss, Bartke & Clahsen 2005; Scherger 2015).

6.2.2 Früher kindlicher Zweitspracherwerb Für frühe und späte kindliche Zweitsprachlerner stellt der Erwerb der nominalen Flexion aufgrund des hohen Formensynkretismus eine große Herausforderung dar. So markiert der Artikel der den Nominativ für maskuline Nomen (der Baum), aber auch den Dativ für feminine Nomen (der Frau). Da das deutsche Genussystem kaum regelgeleitet ist, zeigen mehrsprachige Lerner anhaltende Schwierigkeiten in der Realisierung des korrekten Genus. Unklar ist, ob eine Artikelvariante als präferierte Form („default“) gewählt wird (Wegener 1994) oder ob bereits eine frühe Differenzierung zwischen maskulinem und femininem Artikel erfolgt (Marouani 2006) bzw. individuelle Präferenzen in der Wahl einer der Strategien bestehen (Lemke 2008).

338

Angela Grimm und Anja Müller

Sobald das Genusmerkmal eines Nomens erworben wurde, treten keine Fehler in der Genuszuweisung mehr auf (Lemke 2008). Auch der Kasuserwerb, insbesondere der Erwerb des Dativs, bereitet Zweitsprachlernern große Schwierigkeiten. Obwohl erste Akkusativmarkierungen bereits nach sechs bis zwölf Kontaktmonaten zum Deutschen auftreten (Lemke 2008), zeigen frühe Zweitsprachlerner noch im Alter von 5;9 Jahren keine mit monolingualen Kindern vergleichbare Leistungen (Grimm & Schulz 2014b; 2016). Wie auch monolinguale Kinder benötigen frühe Zweitsprachlerner besonders lange zum Erwerb der Dativmarkierung am indirekten Objekt (Schwarze 2018). Die Anzahl korrekter Kasusmarkierungen wies im Gegensatz zu anderen Phänomenen keinen sprunghaften Anstieg auf, sondern nimmt bei monolingualen Kindern und frühen kindlichen Zweitsprachlernern eher kontinuierlich zu (Grimm & Schulz 2013).

6.2.3 Später kindlicher Zweitspracherwerb Späte kindliche Zweitsprachlerner unterscheiden bereits nach zwei bis drei Kontaktmonaten zwischen Singular und Plural (Dimroth 2007). Von Anfang an werden verschiedene Pluralallomorphe verwendet, wenngleich sie nicht immer in der korrekten Form erscheinen (Bast 2003; Dimroth 2007). Aufgrund seiner Häufigkeit wurden Übergeneralisierungen v. a. des -en-Plurals, in spezifischen Kontexten auch des -s-Plurals beobachtet. Prinzipiell ist jedoch eine zielsprachliche Numerusflexion möglich (Dimroth 2007; Wegener 1994). Innerhalb der Gruppe später kindlicher Zweitsprachlerner scheint jedoch mit zunehmendem Alter bei Erwerbsbeginn der Erwerbserfolg bezüglich der Numerusflexion geringer auszufallen (Bast 2003).

6.3 Erwerb von Syntax und Morphologie im Zweitspracherwerb Erwachsener Wie auch späte kindliche Zweitsprachlerner durchlaufen Erwachsene qualitativ andere Entwicklungsstufen als frühe Zweitsprachlerner und monolinguale Lerner. Die Unterschiede sind deutlicher als bei frühen Zweitsprachlernern auch auf Einflüsse der Erstsprache zurückzuführen. Viele Erwachsene stagnieren im Zweitspracherwerbsprozess (Clahsen, Meisel & Pienemann 1983; Klein 2000). Clahsen, Meisel & Pienemann (1983) unterscheiden sieben Entwicklungsstufen im (ungesteuerten) Erwerb der Wortstellung des Deutschen bei erwachsenen Zweitsprachlernern. Auf Stufe I wird nur eine einzelne Konstituente produziert wie z. B. gut freund, kollege deutsch5 für gute Freunde bzw. deutsche Kollegen. Stufe II umfasst bereits mehrere Konstituenten wie in keine deutsche die meine maschin. Stufe III ist

5 Alle Beispiele in Abschnitt 6.3. stammen aus Clahsen, Meisel & Pienemann (1983).

Syntax und Morphologie

339

charakterisiert durch die Voranstellung von Adverbien wie in vielleicht ich bleiben hier, meist in Verbindung mit der kanonischen Subjekt-Verb-Objekt-Abfolge. Auf Stufe IV werden infinite Verben am Satzende realisiert wie in deutsche Leute haben mir hier gebracht. Subjekt-Verb-Inversion wird auf Stufe V erworben; erwachsene Lerner produzieren dann Äußerungen wie französisch kann ich auch noch heute oder warum du muss schule so? Auf Stufe VI werden die bis dahin fest verbundenen Objekt-Verb-Abfolgen mit Adverbialen aufgelöst: ich habe nur eine kleine weintraube. Für die letzte Stufe VII wurde vorhergesagt, dass finite Verben in Nebensätzen satzfinal realisiert werden; es fanden sich jedoch keine Belege im Korpus. Auch im Erwerb der verbalen und nominalen Flexion zeigen sich anhaltende Schwierigkeiten. Im Gegensatz zu monolingualen Kindern und frühen Zweitsprachlernern ist der Erwerb der Finitheit nicht an die Entdeckung der linken Satzklammer gekoppelt, so dass finite Verben in satzfinaler Position und infinite Verben in Verbzweitstellung möglich sind. Auch die korrekte Flexion von Kasus, Genus und Numerus ist im Zweitspracherwerb Erwachsener nur unter großem Aufwand erlernbar und erfordert in der Regel intensives Training im Rahmen gesteuerter Erwerbssituationen (Diehl et al. 2000 für jugendliche Zweitsprachlerner). Zusammenfassend ist festzuhalten, dass Zweitsprachlerner abhängig vom Alter bei Erwerbsbeginn und von der Spracherfahrung deutliche Unterschiede im Entwicklungsmuster aufweisen. Je nach Erwerbstyp beeinflussen zudem nicht-sprachliche Faktoren wie Motivation und Arbeitsgedächtnis den Erwerbsverlauf in unterschiedlicher Weise. Nach bisherigem Erkenntnisstand sind frühe kindliche Zweitsprachlerner in ihrem Entwicklungsmuster mit monolingualen Kindern vergleichbar. Sie durchlaufen die gleichen Entwicklungsschritte wie monolinguale Kinder – wenngleich häufig in einer höheren Geschwindigkeit – und produzieren vergleichbare Fehler. Abweichungen gegenüber monolingualen Kindern wie z. B. die Produktion von Verbstämmen in Verbzweitposition sind vorübergehend und verschwinden rasch. Interindividuelle Unterschiede im Fehlermuster und der Erwerbsgeschwindigkeit sind eher auf die Qualität und Quantität des Inputs als auf Einflüsse aus der Erstsprache zurückzuführen. Späte kindliche Zweitsprachlerner und Erwachsene zeigen dagegen in ihrem Entwicklungsverlauf erkennbare Abweichungen gegenüber monolingualen Kindern bzw. frühen kindlichen Zweitsprachlernern. Im Vergleich zu frühen kindlichen Zweitsprachlernern gelingt späten Lernern nach nur kurzer Kontaktdauer zum Deutschen rasch der Einstieg in eine höhere Entwicklungsstufe (z. B. in der Hauptsatzstruktur oder der Subjekt-Verb-Kongruenz); sie benötigen aber teilweise deutlich länger als frühe Zweitsprachlerner zum Erwerb zielsprachlicher Fähigkeiten bzw. sie erreichen diese – wie viele erwachsene Lerner – gar nicht.

340

Angela Grimm und Anja Müller

7 Erfassung morpho-syntaktischer Fähigkeiten 7.1 Anforderungen an die Diagnostik Unabhängig vom konkreten Ziel der Diagnostik6 resultieren aus den unterschiedlichen Entwicklungsmustern früher und später kindlicher Lerner wichtige Konsequenzen für das diagnostische Vorgehen. Erstens zeigt die vergleichende Gegenüberstellung des frühen und späten kindlichen Zweitspracherwerbs, dass diagnostische Verfahren nicht nur die Mehrsprachigkeit, sondern die genaue Erwerbsbiographie der Kinder in die Auswertung und in die Interpretation der erhobenen Daten einbeziehen sollten. Zweitens sollte beachtet werden, dass die Erwerbsgeschwindigkeiten zwischen den untersuchten morpho-syntaktischen Fähigkeiten auch innerhalb eines Erwerbstyps variieren (Dimroth 2007; Grimm & Schulz 2016). Aus dem Entwicklungsmuster eines bestimmten Phänomens kann also nicht zwangsläufig auf andere Entwicklungsschritte geschlossen werden.7 Nichtbeachtung der Erwerbsbiographie und des Erwerbsmusters eines Phänomens können zu Fehleinschätzungen führen (Grimm & Schulz 2014a; 2016). Nach wie vor ist eine fundierte Diagnostik des Sprachentwicklungsstands mehrsprachiger Kinder eine große Herausforderung für die Praxis (Geist 2013; Voet Cornelli et al. 2012). So verfügen nur wenige standardisierte Verfahren über separate Normen für Untergruppen mehrsprachiger Kinder (z. B. Linguistische Sprachstandsfeststellung Deutsch als Zweitsprache – LiSe-DaZ, Schulz & Tracy 2011). Die Mehrzahl verfügbarer Verfahren berücksichtigt allgemein die Mehrsprachigkeit (z. B. Evozierte Sprachdiagnose grammatischer Fähigkeiten; ESGRAF-MK, Motsch 2011) bzw. den Migrationshintergrund (z. B. Sprachverhalten und Interesse an Sprache bei Migrantenkindern in Kindertageseinrichtungen; SISMIK, Ulich & Mayr 2008). Einige Verfahren klassifizieren Kinder nach ihrer Sprachdominanz (z. B. CITO, Konak & Duindam 2008). In Ermangelung normierter Verfahren wird teilweise empfohlen, höhere Standardabweichungen – und damit eine höhere Fehlertoleranz – gegenüber monolingualen Kindern zuzulassen (Thordardottir 2015). Die unterschiedlichen Erwerbsmuster und -geschwindigkeiten, die vom Spracherwerbstyp und sprachlichen Phänomen abhängen, lassen jedoch vermuten, dass auch bei einem solchen Vorgehen ein Risiko für Fehldiagnosen besteht (Grimm & Schulz 2016). In der Diagnostik morpho-syntaktischer Fähigkeiten kann inzwischen auf eine relativ gute empirische Datengrundlage für verschiedene mehrsprachige Lerner-

6 Bei den diagnostischen Verfahren wird zwischen Förder- und Selektionsdiagnostik unterschieden (Kany & Schöler 2010), vgl. auch Settinieri & Jeuk in diesem Band. Während förderdiagnostische Verfahren möglichst umfassende sprachliche Handlungsspielräume abdecken wollen, begrenzen sich Selektionsverfahren in der Regel auf wenige, differentialdiagnostisch relevante Phänomene. 7 Zusammenhänge sind z. B. dokumentiert zwischen dem Erwerb der Hauptsatzstellung und der Subjekt-Verb-Kongruenz bzw. zwischen der Hauptsatzstellung und dem Kasuserwerb (Clahsen 1982; 1986; Schwarze 2018).

Syntax und Morphologie

341

typen aufgebaut werden. Erwerbsschritte und -muster sind für viele Bereiche gut dokumentiert; zudem eignet sich die meist regelgeleitete Struktur vieler morphosyntaktischer Phänomene ideal für förderdiagnostische Zielstellungen. Im Folgenden werden einige gängige Verfahren für mehrsprachige Kinder und Jugendliche, die u. a. den mündlichen Sprachstand in der Morphosyntax erfassen, zusammengefasst. Die Darstellung beginnt mit normierten Verfahren in Abschnitt 4.2. (vgl. auch Paetsch in diesem Band); in Abschnitt 4.3. folgt eine Übersicht für die nicht-normierten Verfahren.8

7.2 Normierte Verfahren Normierte Verfahren verfügen über eine Umrechnungsskala, in der erreichte Punktwerte („Rohwerte“) in vergleichbare Testwerte („T-Werte“) umgerechnet werden können. Diese T-Werte werden idealerweise anhand einer repräsentativen Stichprobe ermittelt, so dass ein individuelles Testergebnis im Verhältnis zu einer Vergleichsgruppe interpretiert werden kann. Normierte Verfahren sind standardisiert, d. h., es gibt verbindliche Vorschriften hinsichtlich der Items, Durchführung, Antwortmöglichkeiten, Auswertung und Interpretation (Amelang et al. 2006). Derzeit stellt die Linguistische Sprachstandserhebung Deutsch als Zweitsprache – LiSe-DaZ (Schulz & Tracy 2011) das einzige förderdiagnostische Verfahren dar, das über separate Normen für einsprachige Kinder (Deutsch als Muttersprache, DaM) und für Kinder mit Deutsch als Zweitsprache (DaZ) verfügt. LiSe-DaZ ist für Kinder mit DaM im Alter von 3;0 bis 6;11 Jahren sowie für Kinder mit DaZ (Erwerbsbeginn des Deutschen zwischen 2;0 und 4;0 Jahren) für die Altersspanne von 3;0 bis 7;11 Jahren normiert. Die Normen für die Kinder mit DaZ berücksichtigen zusätzlich jeweils die Kontaktdauer zum Deutschen. In insgesamt elf Untertests werden regelgeleitete morpho-syntaktische und semantische Phänomene ausschließlich im Deutschen untersucht. Drei Untertests erfassen morpho-syntaktische Phänomene mittels elizitierter Produktion: Kasus, Subjekt-Verb-Kongruenz und, angelehnt an die morpho-syntaktischen Meilensteine nach Tracy (1991), die erreichte Entwicklungsstufe im Erwerb der Satzklammer. Eine Erfassung der rezeptiven Fähigkeiten in diesen Bereichen ist mit LiSe-DaZ nicht möglich.9 Für Kinder mit DaZ sind nach Auswertung des Tests direkte Rückschlüsse auf spezifische Förderbereiche möglich.

8 Zu beachten ist, dass abhängig vom Verfahren die Qualität des diagnostischen Befunds unterschiedlich sein kann. 9 Drei weitere Untertests erfassen das Sprachverständnis: Verbbedeutung (Semantik), W-Fragen und Negation (Syntax, Semantik). Im Modul Produktion erheben fünf weitere Untertests lexikalische Phänomene, die zum Erwerb morpho-syntaktischer Strukturen relevant sind: Vollverben (Aufbau von Argumentstrukturen), Hilfsverben (funktionale Kategorie), Subjunktionen (Nebensatzeinleiter), Präpositionen (Kasusmarkierung bzw. attributive Ergänzung) und Fokuspartikeln (Ausdifferenzierung des Mittelfelds).

342

Angela Grimm und Anja Müller

7.3 Nicht-normierte Verfahren 7.3.1 Verfahrensarten Im Gegensatz zu den normierten Verfahren ist in den letzten Jahren eine beachtliche Anzahl nicht-normierter Verfahren entwickelt worden, um den Sprachstand mehrsprachiger Kinder und Jugendlicher zu untersuchen. Nicht-normierte Verfahren sind häufig nur teilstandardisiert, d. h. es gibt beispielsweise Vorgaben, welche Bereiche wie beurteilt werden sollen (z. B. SISMIK, Ulich & Mayr 2008; Niveaubeschreibungen DaZ, Döll 2012; Döll & Reich 2009), aber es existieren keine verbindlichen Kriterien für die Durchführung oder Auswertung. Nicht-normierte Verfahren liegen in Form von Schätz- und Beobachtungsverfahren und Profilanalysen vor. Schätz- und Beobachtungsverfahren sollen auf Grundlage subjektiver Beobachtungen sprachliches Handeln beschreiben (= Beobachtungsverfahren) bzw. bewerten (= Schätzverfahren). In der sprachdiagnostischen Praxis ist die Unterscheidung zwischen Beobachtungs- und Schätzverfahren oft wenig sinnvoll, da das Ziel der Diagnostik nicht allein die Beobachtung ist; in der Regel soll die Diagnostik zu einer Einschätzung des Sprachstandes führen. Bei Schätzverfahren wird zwischen einer Selbsteinschätzung (z. B. als Portfolio) und Fremdeinschätzung unterschieden (siehe auch Ricart Brede in diesem Band). Aufgrund ihrer hohen Subjektivität ist die Aussagekraft von Schätzverfahren jedoch meist als eher gering zu bewerten (Döll 2012: 77–78). Ein Beobachtungsverfahren, in dem morphologische und syntaktische (sowie weiteren) Fähigkeiten eingeschätzt werden sollen, sind die Niveaubeschreibungen Deutsch als Zweitsprache, die im Rahmen des Modellprogramms FÖRMIG für Schülerinnen und Schüler der Primarstufe bzw. der Sekundarstufe I und II entwickelt wurden (Döll 2012, vgl. auch Döll in diesem Band). Profilanalysen (Grießhaber 2013, vgl. Grießhaber in diesem Band) ermitteln sehr detailliert den Entwicklungsstand in ausgewählten sprachlichen Bereichen in Form erreichter Phasen (Clahsen 1986), Meilensteine (Tracy 2005) oder Erwerbsstufen (Grießhaber 2013). Grundlage profilanalytischer Ansätze ist die typische Entwicklungsabfolge der ausgewählten Bereiche sowie ein erwerbstheoretisch begründeter Zusammenhang zwischen den Phänomenen, die den Phasen, Meilensteinen oder Erwerbsstufen zugeordnet werden. Die Mehrzahl der bestehenden profilanalytischen Verfahren für mehrsprachige Kinder erfasst vorrangig morpho-syntaktische Phänomene wie die Satzstruktur (Clahsen 1982; Grießhaber 2013) oder erfasst neben morpho-syntaktischen Fähigkeiten weitere Erwerbsbereiche (HAVAS-5, Reich & Roth 2004). Im Gegensatz zu Profilanalysen, die häufig einen engen Anwendungsbereich aufweisen, ermöglichen Beobachtungs- und Schätzverfahren die Erfassung einer großen Bandbreite alltagsrelevanter sprachlicher Fähigkeiten. In der pädagogischen Praxis sind Beobachtungen und informelle Einschätzungen aufgrund ihrer Zeitöko-

Syntax und Morphologie

343

nomie und Praktikabilität häufig eingesetzte diagnostische Verfahren (Döll 2012, vgl. Döll in diesem Band). Beobachtungen und Einschätzungen erfordern jedoch seitens der Durchführenden ein hohes Maß an Objektivität und Fachwissen, anderenfalls besteht die Gefahr verzerrender oder einseitiger Resultate. Teilstandardisierte Beobachtungsbögen können das Risiko von Fehlbeurteilungen in einem gewissen Rahmen eingrenzen. 7.3.2 Erfassung morpho-syntaktischer Fähigkeiten in nicht-standardisierten Verfahren Prinzipiell ermöglichen alle Verfahrensarten die Erfassung morpho-syntaktischer Fähigkeiten, wenngleich zwischen den Verfahren erhebliche Unterschiede im Umfang der erfassten Fähigkeiten bestehen. Tabelle 1 gibt einen Überblick über die gängigen Verfahren zur Erfassung der Morphosyntax, deren Zielgruppen und die jeweils untersuchten morpho-syntaktischen Bereiche. Deutlich wird, dass die Erfassung produktiver Fähigkeiten im Vordergrund steht. Rezeptive Fähigkeiten werden nur in Form von allgemeinem Kommunikationsverhalten bzw. Aufmerksamkeit und Handlungsaufforderungen (z. B. SISMIK) oder für den Wortschatz und das Lesen erhoben (z. B. Niveaubeschreibungen DaZ). Im Bereich der produktiven Syntax berücksichtigen die genannten Verfahren in der Regel die Verbstellung im Hauptsatz und Nebensatz, verschiedene Satztypen wie Fragesätze vs. Aussagesätze sowie die korrekte Realisierung der Satzglieder. Im Bereich der Verbflexion wird üblicherweise die Subjekt-Verb-Kongruenz sowie in einigen Verfahren die Bildung unregelmäßiger Verbformen erfasst. Tempusformen bzw. Passiv sind dagegen sehr selten Gegenstand der Sprachstandserfassung. Aufgrund der besonderen Schwierigkeiten mehrsprachiger Lerner beinhalten fast alle nicht-normierten Verfahren die Erwerbsbereiche der nominalen Flexion, Kasus, Genus und Numerus.

Nominale Flexion

Verbale Flexion

Nein

Nein

Ja

Genus

Numerus

Kasus

Ja

Ja

Ja

Nein

Nein

Nein

Ja

**

Passiv

Ja

Ja

Ja

Flexionsklassen Nein

SVK

Konjunktionen

Ja

Ja

Verbstellung im Nebensatz

Satztypen

Ja

Verbstellung im Hauptsatz

Syntax Ja

Kinder mit DaM Kinder mit DaZ (3–6;11) und (4–10 Jahre) mit DaZ (3–7;11 Jahre)

Zielgruppe

nein

ESGRAF-MK (Motsch, 2011)

LiSe-DaZ (Schulz & Tracy, 2011)

ja

Screening

Test

normiert

Verfahrensart

**

Nein

Nein

Nein

Nein

Nein

Ja**

Ja

Ja

Ja

Ja

*

Kinder mit DaZ in Grund- und Sekundarstufe

nein

Profilanalyse nach Grießhaber (2010)

Profilanalyse

nein

Niveaubeschreibung DaZ (Döll & Reich, 2009)

Beobachtung

Nein

Übergeneralisierungen als Zeichen produktiver Regelbildung (z. B. die *Fenster-s)

Ja

Ja

Ja**

Ja

Ja

Ja

Ja

Ja

Ja

Ja

Ja

Ja

Ja**

Korrekte/ inkorrekte Verwendung des Artikels

Nein

Ja 2

Ja

Ja

Nein

Ja** Ja

Ja

Ja

Kinder mit Migrationshintergrund ab 3;6 Jahre bis Schuleintritt

nein

SISMIK (Ulich & Mayr, 2008)

Ja

Ja

5- bis 6-jährige Kinder mit DaZ Kinder mit in Grundschule vermutetem und Sek I Förderbedarf

nein

HAVAS-5 (Reich & Roth, 2004)

Tab. 1: Übersicht über die untersuchten Bereiche in verschiedenen nicht-normierten Verfahren.

Ja

Ja**

Ja 2

Nein

Nein

Ja**

Ja

Ja

Ja*

Ja

Kinder mit DaZ (Erwerbsbeginn ca. 3 Jahre) im Alter von 4− 6 Jahren

nein

BESK-DaZ (Rössl, Stadlmair, & Wanka, 2011)

344 Angela Grimm und Anja Müller

Siehe 4.2.

Erzählfähigkeit, Bewältigung der Gesprächssituation, verbaler Wortschatz

Bewältigung der Gesprächssituation, Wortschatz; schriftliche Fähigkeiten, u. a.

Aufmerksamkeit, Sprachverhalten, Wortschatz, u. a.

Sprachverhalten, Wortschatz, Pragmatik, u. a.

* Die Fähigkeiten können erfasst werden, gehen jedoch nicht in die Auswertung ein. ** Erfassung im Zusammenhang mit einer anderen Fähigkeit (z.B. inkorrekte Kasusbildung aufgrund Genusfehlers; Übergeneralisierung der regulären Verbflexion).

Weitere Phänomene

Syntax und Morphologie

345

346

Angela Grimm und Anja Müller

8 Zusammenfassung und Fazit Ziel dieses Kapitels ist es, die sprachlichen Kompetenzbereiche Morphologie und Syntax unter förderdiagnostischer Perspektive zu betrachten. Die folgenden Fragen sollten dabei genauer thematisiert werden: Welche linguistischen Eigenschaften haben morphologische und syntaktische Phänomene, die in der Diagnostik relevant sind? Wie werden diese Phänomene von mehrsprachigen Lernern erworben? Welche Verfahren erfassen welche morphologischen und syntaktischen Bereiche? Zentrale morpho-syntaktische Bereiche, die in der Sprachstandsdiagnostik erfasst werden, sind die Verbstellung im Haupt- und Nebensatz, Kasus, Genus und Numerus im Bereich der nominalen Flexion sowie die Subjekt-Verb-Kongruenz bzw. Finitheit und die Partizipbildungen im Bereich der verbalen Flexion. Es wurde deutlich (vgl. Abschnitt 2), dass sich morpho-syntaktische Phänomene in ihren linguistischen Eigenschaften in mehrfacher Hinsicht unterscheiden. Ein für Lerner zentraler Unterschied besteht in der Regelhaftigkeit der Phänomene. Während beispielsweise Satzbau und Kasus regelgeleitet sind, sind für die Zuweisung von Genus und Numerus nur in sehr begrenztem Maße Regeln formulierbar. Ein weiterer Unterschied zwischen den Phänomenen besteht im Grad der Interaktion mit anderen sprachlichen Wissenssystemen. Während im Deutschen auf Grundlage weniger klar definierter Regeln verschiedene Satztypen (Fragesatz, Aussagesatz, …) gebildet werden können, kann Kasus nur korrekt zugewiesen werden, wenn beispielsweise das Genus des Nomens bekannt ist. Phänomene, die eine geringe Regelhaftigkeit und/oder eine enge Verflechtung mit anderen Wissenssystemen aufweisen, werden später erworben und sind stärker von nichtsprachlichen Faktoren (wie z. B. Sprachumgebung) abhängig als regelgeleitete Phänomene bzw. Phänomene, die geringes Vorwissen erfordern. In Bezug auf die zweite Frage ist zunächst festzuhalten: Den DaZ-Lerner bzw. die DaZ-Lernerin gibt es nicht. Die Gruppe der Kinder, Jugendlichen und Erwachsenen, die Deutsch als Zweitsprache lernen, weist höchst unterschiedliche Erwerbsbiographien auf. Mit der Erwerbsbiographie – insbesondere dem Alter bei Erwerbsbeginn und der Spracherfahrung – gehen unterschiedliche Erwerbsmuster einher. Während bei einem frühen Alter bei Erwerbsbeginn in Bezug auf den Erwerb morpho-syntaktischer Fähigkeiten kaum qualitative Unterschiede zu monolingualen Kindern bestehen, weichen spätere kindliche Zweitsprachlerner und Erwachsene in ihren Erwerbsmustern zumindest vorübergehend von monolingualen Lernern und frühen Zweitsprachlernern ab. Qualitative Unterschiede sind in unterschiedlichem Ausmaß berichtet worden und variieren zwischen den jeweils untersuchten Phänomenen. Beispielsweise wurden für den Erwerb der Satzklammer qualitative Abweichungen bei späten kindlichen Zweitsprachlernern und Erwachsenen gegenüber monolingualen Kindern und frühen Zweitsprachlernern berichtet. Dagegen scheinen frühe und späte kindliche Zweitsprachlerner im Erwerb des Passivs vergleichbare Erwerbsstufen wie monolinguale Kinder zu durchlaufen. Auch in der

Syntax und Morphologie

347

Erwerbsgeschwindigkeit unterscheiden sich die Lernergruppen. Aus mindestens zwei Gründen sollte daher die Spracherwerbsbiographie in der Diagnostik berücksichtigt werden: Erstens geht ein früherer Erwerbsbeginn häufig mit einer längeren Kontaktdauer und somit einer höheren Spracherfahrung in der Zweitsprache einher. Zweitens können Fehlermuster leichter als typisch oder atypisch für einen jeweiligen Lernertyp klassifiziert werden; dies ist z. B. erforderlich für eine Abgrenzung von prinzipiell unauffälligem und gestörtem Zweitspracherwerb (vgl. Chilla in diesem Band). Zweitsprachlerner mit geringer Spracherfahrung könnten bei Nichtberücksichtigung der Erwerbsbiographie fehlklassifiziert werden. In Bezug auf die dritte Frage stellt dieses Kapitel überblickshaft dar, welche morpho-syntaktischen Phänomene von gängigen Diagnoseverfahren erfasst werden. Unter den normierten Verfahren steht mit Lise-DaZ ein Test zur Verfügung, der morpho-syntaktische Fähigkeiten (neben andern Phänomenen) bei Kindern mit Deutsch als früher Zweitsprache und bei monolingualen Kindern erfasst. Als nichtnormierte Verfahren wurden verschiedene Beobachtungsverfahren entwickelt sowie die Profilanalyse für den mehrsprachigen Erwerb weiterentwickelt. Schwerpunkt der nicht-normierten Verfahren bilden die produktiven Fähigkeiten im Bereich der Verbstellung im Haupt- und Nebensatz sowie die verbale und nominale Flexion. Diese Fähigkeiten gelten als empirisch relativ gut überprüfte Bereiche des Erst- und Zweitspracherwerbs. Die Zielgruppen werden eher breiter gefasst, z. B. als Schulkinder mit DaZ in Primar- und Sekundarstufe I/II wie in den Niveaubeschreibungen DaZ, Vorschulkinder mit Migrationshintergrund wie im SISMIK oder Vorschulkinder mit vermutetem Förderbedarf wie im HAVAS-5. Nur zwei Verfahren, LiSe-DaZ (Schulz & Tracy 2011) und der in Österreich entwickelte Bogen zur Erfassung der Sprachkompetenz von Kindern mit Deutsch als Zweitsprache (BESK-DaZ; Rössl, Stadlmair & Wanka 2011), geben explizit einen Spracherwerbstyp an. Der Forderung nach Einbeziehung der Erwerbsbiographie in den diagnostischen Prozess kommen einige der genannten Verfahren demzufolge nur unzureichend nach. Für Fachkräfte in der Praxis hängt die Frage, welche Verfahrensart und welches konkrete Verfahren gewählt werden, letztendlich von vielen Faktoren ab. Hier sind vordergründig das Alter der Lerner, das Ziel der Diagnostik sowie die institutionellen Rahmenbedingungen zu nennen. Im schulischen Kontext sind schon aus curricularen Gründen an erster Stelle Beobachtungsverfahren einschlägig. Gegenüber normierten Verfahren stellen Beobachtungsverfahren jedoch besonders hohe Anforderungen unter anderem an die Objektivität und an die linguistische Kompetenz der pädagogischen Fachkräfte. In Bezug auf die eingangs gestellten Fragen lässt sich abschließend festhalten: Viele morphologische und syntaktische Phänomene sind aufgrund ihrer Regelhaftigkeit ideal für die Diagnostik mehrsprachiger Kinder. Diese Phänomene sind nur in geringerem Maße vorwissensabhängig und werden – abhängig vom Erwerbstyp – in voraussagbarer Weise und zu einem bestimmten Zeitpunkt erworben. Zudem sind morpho-syntaktische Phänomene in hohem Maße bildungssprachlich relevant (z. B.

348

Angela Grimm und Anja Müller

Nebensätze, Kasus). Auch wenn nicht alle Verfahren die Morpho-Syntax in ausreichendem Maße erfassen, ist es aus spracherwerbstheoretischen und didaktischen Gründen zu begrüßen, dass morpho-syntaktische Phänomene in allen diagnostischen Verfahren zumindest berücksichtigt werden. Und: Am Beispiel morpho-syntaktischer Fähigkeiten zeigen sich die Vorteile einer engen Verzahnung von Sprachwissenschaft, Spracherwerbsforschung und Didaktik für diagnostische Zwecke besonders eindrucksvoll.

Literaturverzeichnis Abbot-Smith, Kirsten & Heike Behrens (2006): How know constructions influence the acquisition of other constructions: the german passive and future constructions. Cognitive sciene 30 (6), 995–1026. Amelang, Manfred, Lothar Schmidt-Atzert, Thomas Fydrich & Werner Zielinski (2006): Psychologische Diagnostik und Intervention. Heidelberg: Springer Medizin. Bast, Cornelia (2003): Der Altersfaktor im Zweitspracherwerb. Die Entwicklung der grammatischen kategorien Nummerus, Genus und Kasus in der Nominalphrase im ungesteuerten Zweitspracherwerb des Deutschen bei russischen Lernerinnen. Dissertation. Köln. http:// kups.ub.uni-koeln.de/936/ (29. 01. 2017) Birdsong, David (1992): Ultimate Attainment in Second Language Acquisition. Language 68 (4), 706–755. Chilla, Solveig (2008): Erstsprache, Zweitsprache, spezifische Sprachentwicklungsstörung?: Eine Untersuchung des Erwerbs der deutschen Hauptsatzstruktur durch sukzessiv-bilinguale Kinder mit türkischer Erstsprache. Hamburg: Kovač. Chilla, Solveig, Monika Rothweiler & Ezel Babur (2013): Kindliche Mehrsprachigkeit: Grundlagen – Störungen – Diagnostik. München: Reinhardt. Clahsen, Harald (1982): Spracherwerb in der Kindheit. Tübingen: Narr. Clahsen, Harald (1986): Die Profilanalyse: Ein linguistisches Verfahren für die Sprachdiagnose im Vorschulalter. Berlin: Marhold. Clahsen, Harald, Jürgen M. Meisel & Manfred Pienemann (1983): Deutsch als Zweitsprache: Der Spracherwerb ausländischer Arbeiter. Tübingen: Narr. Czinglar, Christine (2013): Grammatikerwerb vor und nach der Pubertät. Berlin, Boston: De Gruyter. Diehl, Erika, Helen Christen, Sandra Leuenberger, Isabelle Pelvat & Thérese Studer (2000): Grammatikunterricht: Alles für der Katz? Untersuchungen zum Zweitsprachenerwerb Deutsch. Tübingen: Niemeyer. Dimroth, Christine (2007): Zweitspracherwerb bei Kindern und Jugendlichen: Gemeinsamkeiten und Unterschiede. In Tanja Anstatt (Hrsg.), Mehrsprachigkeit bei Kindern und Erwachsenen: Erwerb, Formen, Förderung, 115–138. Tübingen: Attempto-Verl. Dimroth, Christine & Stefanie Haberzettl (2008): Je älter desto besser: der Erwerb der Verbflexion im Kindesalter. In Bernt Ahrenholz (Hrsg.), Empirische Forschung und Theoriebildung: Beiträge aus Soziolinguistik, Gesprochene-Sprache und Zweitsprachenerwerbsforschung; Festschrift für Norbert Dittmar zum 65. Geburtstag, 227–238. Frankfurt am Main, Wien u. a.: Lang. Döll, Marion (2012): Beobachtung der Aneignung des Deutschen bei mehrsprachigen Kindern und Jugendlichen: Modellierung und empirische Prüfung eines sprachdiagnostischen Beobachtungsverfahrens. Münster u. a.: Waxmann.

Syntax und Morphologie

349

Döll, Marion & Hans Reich (2009): Niveaubeschreibungen Deutsch als Zweitsprache in der Sekundarstufe I: Zur Beobachtung von Kompetenz und Kompetenzzuwachs in Deutsch als Zweitsprache. Modellprojekt FörMIG. https://www.foermig.uni-hamburg.de/publikationen/ diagnoseinstrumente/niveaubeschreibungen-daz.html (13 01.2017). Drach, Erich (1940): Grundgedanken der deutschen Satzlehre. Darmstadt: Wissenschaftliche Buchgesellschaft. Ehlich, Konrad (2007): Anforderungen an Verfahren der regelmäßigen Sprachstandsfeststellung als Grundlage für die frühe und individuelle Förderung von Kindern mit und ohne Migrationshintergrund. Bonn, Berlin. Eisenbeiss, Sonja, Susanne Bartke & Harald Clahsen (2005): Structural and lexical case in child German: Evidence from language-impaired and typically-developing children. Language Acquisition 13 (1), 3–32. Eisenberg, Peter (2013): Grundriss der deutschen Grammatik: Der Satz. Stuttgart, Weimar: J. B. Metzler. Eisenberg, Peter & Nanna Fuhrhop (2013): Grundriss der deutschen Grammatik: Das Wort. Stuttgart: Metzler. Fritzenschaft, Agnes (1994): Activating passives in child grammar. In Rosemarie Tracy & Elsa Lattey (Hrsg.), How tolerant is universal grammar?: Essays on language learnability and language variation (Linguistische Arbeiten 309), 155–184. Berlin u. a.: De Gruyter. Fuß, Erik (2012): Morphologie. In Heinz Drügh & Hans-Heino Ewers (Hrsg.), Germanistik: Sprachwissenschaft − Literaturwissenschaft − Schlüsselkompetenzen, 48–64. Stuttgart: Metzler. Gathercole, Susan E. & Alan D. Baddeley (1989): Evaluation of the role of phonological STM in the development of vocabulary in children: A longitudinal study. Journal of Memory and Language 28 (2), 200–213. Geist, Barbara (2013): Sprachdiagnostische Kompetenz von Sprachförderkräften. Berlin, Boston: De Gruyter. Grießhaber, Wilhelm (2013): Die Profilanalyse als Instrument zur Beurteilung von Lernersprachen. Münster: WWU Sprachenzentrum. https://www.uni-due.de/imperia/md/content/prodaz/ griesshaber_profilanalyse_deutsch.pdf (06. 11. 2017). Grimm, Angela & Barbara Geist (2012): Wie erwerben DaZ-Kinder Nebensätze und Konjunktionen? Erste Ergebnisse aus dem Projekt MILA. Grundschule Deutsch 36, 43. Grimm, Angela & Petra Schulz (2013): Entwicklungsverläufe in Sprachverständnis und Sprachproduktion bei frühen Zweitsprachlernern des Deutschen. Berlin. Grimm, Angela & Petra Schulz (2014a): Specific language impairment and early second language acquisition: The risk of over- and underdiagnosis. Child Indicators Research 7 (4), 821–841. Grimm, Angela & Petra Schulz (2014b): Sprachfähigkeiten von Kindern mit DaZ bei Schuleintritt. In Beate Lütke & Inger Petersen (Hrsg.), Deutsch als Zweitsprache: erwerben, lernen und lehren: Beiträge zum 9. Workshop Kinder mit Migrationshintergrund, 35–50. Stuttgart: Klett Fillibach. Grimm, Angela & Petra Schulz (2016): Warum man bei mehrsprachigen Kindern dreimal nach dem Alter fragen sollte: Sprachfähigkeiten simultan-bilingualer Lerner im Vergleich mit monolingualen und frühen Zweitsprachlernern. Diskurs Kindheits- und Jugendforschung 1, 27–42. Haberzettl, Stefanie (2005): Der Erwerb der Verbstellungsregeln in der Zweitsprache Deutsch durch Kinder mit russischer und türkischer Muttersprache. Tübingen: Niemeyer. Haider, Hubert (2010): The syntax of German. Cambridge: Cambridge Univ. Press. Hoff, Erika (2003): The specificity of environmental influence: Socioeconomic status affects early vocabulary development via maternal speech. Child Development 74 (5), 1368–1378. Kany, Werner & Hermann Schöler (2010): Fokus Sprachdiagnostik: Leitfaden zur Sprachstandsbestimmung im Kindergarten. Berlin: Cornelsen Scriptor.

350

Angela Grimm und Anja Müller

Kauschke, Christina, Anna Kurth & Ulrike Domahs (2011): Acquisition of German noun plurals in typically developing children and children with Specific Language Impairment. Child Development Research 11, 1–17. Klein, Wolfgang (2000): Prozesse des Zweitspracherwerbs. In Hannelore Grimm, Niels Birbaumer & Carl F. Graumann (Hrsg.), Sprachentwicklung (Enzyklopädie der Psychologie Theorie und Forschung Sprache 3), 537–570. Göttingen: Hogrefe Verl. für Psychologie. Knudsen, Eric I. (2004): Sensitive periods in the development of the brain and behavior. Journal of cognitive neuroscience 16 (8), 1412–1425. Konak, Ömer A. & Tom Duindam (2008): Cito-Sprachtest: Digitale Sprachstand-Feststellung bei 4- bis 7-jährigen Kindern. Butzbach: Cito Deutschland. Lemke, Vytautas (2008): Der Erwerb der DP: Variation beim frühen Zweitspracherwerb. Dissertation. Mannheim. https://ub-madoc.bib.uni-mannheim.de/3162/1/Dissertation.pdf (06. 01. 2017). Locke, John L. (1997): A theory of neurolinguistic development. Brain and language 58 (2), 265–326. Lüdtke, Ulrike M. & Kirsten Kallmeyer (2007): Kritische Analyse ausgewählter Sprachstandserhebungsverfahren für Kinder vor Schuleintritt aus Sicht der Linguistik, Diagnostik und Mehrsprachigkeitsforschung. Die Sprachheilarbeit 52 (6), 261–278. Marinis, Theodoros (2007): On-line processing of passives in L1 and L2 children. In Alyona Belikova, Luisa Meroni & Mari Umeda (Hrsg.), Proceedings of the 2nd Conference on Generative Approaches to Language Acquisition North America (GALANA), 265–276. Somerville, Mass.: Cascadilla Proceedings Project. Marouani, Zahida (2006): Der Erwerb des Deutschen durch arabischsprachige Kinder: Eine Studie zur Nominalflexion. Dissertation. Heidelberg. http://archiv.ub.uni-heidelberg.de/ volltextserver/7284/1/diss_0700319.pdf (29. 01. 2017). Meisel, Jürgen M. (1990): INFL–ection: Subjects and subject–verb agreement. In Jürgen M. Meisel (Hrsg.), Two first languages: Early grammatical development in bilingual children (Studies on Language Acquisition [SOLA] 10), 237–300. Berlin: De Gruyter. Meisel, Jürgen M. (2009): Second Language Acquisition in Early Childhood. Zeitschrift für Sprachwissenschaft 28 (1), 5–34. Mills, Anne E. (1986): Acquisition of the natural-gender rule in English and German. Linguistics 24 (1), 31–46. Motsch, Hans-Joachim (2011): Evozierte Diagnostik grammatischer Fähigkeiten für mehrsprachige Kinder: ESGRAF-MK. München: Reinhardt. Müller, Anja, Petra Schulz & Rosemarie Tracy (2018): Spracherwerb. In Cora Tietz, Sabrina Geyer, Anna Ropeter, Hana Wagner & Marcus Hasselhorn (Hrsg.), Konzepte zur Sprach- und Schriftsprachförderung entwickeln: BiSS-Basics Band I, 53–68. Stuttgart: Kohlhammer. Musan, Renate (2013): Satzgliedanalyse. Heidelberg: Universitätsverlag Winter. Penner, Zvi (1992): The ban on parameter resetting.: Default mechanisms, and the acquisition of V2 in Bernese Swiss German. In Jürgen M. Meisel (Hrsg.), The acquisition of verb placement: Functional categories and V2 phenomena in language acquisition (Studies in theoretical psycholinguistics 16), 245–283. Dordrecht: Kluwer. Reich, Hans & Hans-Joachim Roth (2004): HAVAS-5: Hamburger Verfahren zur Analyse des Sprachstands bei 5-jährigen. Auswertungsbogen und Auswertungshinweise. https:// www.foermig.uni-hamburg.de/publikationen/diagnoseinstrumente/havas-5.html (13. 01. 2017). Rösch, Heidi (2012): Deutsch als Zweitsprache (DaZ): theoretische Hintergründe, Organisationsformen und Lernbereiche, Lehrerbildung. In Michael Matzner (Hrsg.), Handbuch Migration und Bildung (Pädagogik), 155–180. Weinheim: Beltz. Rössl, Barbara, Monika Stadlmair & Rebekka Wanka (2011): Handbuch zum BESK-DaZ Version 2.0; Beobachtungsbogen zur Erfassung der Sprachkompetenz in Deutsch von Kindern mit Deutsch

Syntax und Morphologie

351

als Zweitsprache. Wien u. a.: Bundesinstitut für Bildungsforschung, Innovation & Entwicklung. Rothweiler, Monika (2007): Bilingualer Spracherwerb und Zweitspracherwerb. In Markus Steinbach (Hrsg.), Schnittstellen der germanistischen Linguistik, 110–125. Stuttgart: Metzler. Rothweiler, Monika (2016): Zum Erwerb der deutschen Grammatik bei frühsequentiell zweisprachigen Kindern mit Türkisch als Erstsprache – Ergebnisse aus einem Forschungsprojekt. Diskurs Kindheits- und Jugendforschung 11 (1), 9–26. Schaner-Wolles, Chris, Hedwig Binder & Doris Tamchina (1986): Frühes Leid mit der Leideform: Zum Passiverwerb im Deutschen. Wiener Linguistische Gazette 37, 5–38. Scherger, Anna-Lena (2015): Schnittstelle zwischen Mehrsprachigkeit und Sprachentwicklungsstörung: Kasuserwerb deutsch-italienischer Kinder mit spezifischer Sprachentwicklungsstörung. Hamburg: Kovač. Schulz, Petra & Angela Grimm (2012): Spracherwerb. In Heinz Drügh & Hans-Heino Ewers (Hrsg.), Germanistik: Sprachwissenschaft − Literaturwissenschaft − Schlüsselkompetenzen, 155–172. Stuttgart: Metzler. Schulz, Petra & Rosemarie Tracy (2011): LiSe-DaZ − Linguistische Sprachstandserfassung Deutsch als Zweitsprache. Göttingen: Hogrefe Verl. für Psychologie. Schwarze, Rabea (2018): Sprachentwicklungsstörungen bei frühen Zweitsprachlernern: Der Erwerb von Kasus, Finitheit und Verbstellung. Frankfurt am Main: Goethe-Universität Frankfurt. Szagun, Gisela (2001): Learning different regularities: the acquisition of noun plurals by Germanspeaking children. First Language 21, 109–141. Thoma, Dieter & Rosemarie Tracy (2006): Deutsch als frühe Zweitsprache: zweite Erstsprache? In Bernt Ahrenholz (Hrsg.), Kinder mit Migrationshintergrund: Spracherwerb und Fördermöglichkeiten, 58–79. Freiburg im Breisgau: Fillibach-Verl. Thordardottir, Elin (2015): Proposed diagnostic procedures for use in bilingual and cross-linguistic contexts. In Sharon Armon-Lotem, Jan d. Jong & Natalia Meir (Hrsg.), Assessing multilingual children: Disentangling bilingualism from language impairment (Communication disorders across languages 13), 331–358. Bristol, Buffalo: Multilingual Matters. Tracy, Rosemarie (1991): Sprachliche Strukturentwicklung: Linguistische und kognitionspsychologische Aspekte einer Theorie des Erstspracherwerbs. Tübingen: Narr. Tracy, Rosemarie (2005): Spracherwerb bei vier- bis achtjährigen Kindern. In Titus Guldimann (Hrsg.), Bildung 4- bis 8-jähriger Kinder, 59–76. Münster u. a.: Waxmann. Tracy, Rosemarie (2007): Wie Kinder Sprachen lernen und wie wir sie dabei unterstützen können. Tübingen: Francke. Tracy, Rosemarie & Dieter Thoma (2009): Convergence on finite V2 clauses in L1, bilingual L1 and early L2 acquisition. In Christine Dimroth & Peter Jordens (Hrsg.), Functional categories in learner language (Studies on language acquisition 37), 1–44. Berlin: De Gruyter. Ulich, Michaela & Toni Mayr (2008): SISMIK – Sprachverhalten und Interesse an Sprache bei Migrantenkindern in Kindertageseinrichtungen: Begleitheft zum Beobachtungsbogen sismik. Freiburg im Breisgau: Herder. Voet Cornelli, Barbara, Barbara Geist, Angela Grimm & Petra Schulz (2012): Wie wird der Sprachstand mehrsprachiger Kinder in pädiatrischen Vorsorgeuntersuchungen erhoben?: Erste Ergebnisse aus dem Projekt cammino. In Stefan Jeuk (Hrsg.), Deutsch als Zweitsprache in Kindertageseinrichtungen und Schulen: Aneignung, Förderung, Unterricht; Beiträge aus dem 7. Workshop „Kinder mit Migrationshintergrund“, 2011 (Beiträge aus dem Workshop „Kinder mit Migrationshintergrund“), 43–73. Stuttgart: Fillibach bei Klett. Wegener, Heide (1994): Variation in the acquisition of German plural morphology by second language learners. In Rosemarie Tracy & Elsa Lattey (Hrsg.), How tolerant is universal grammar?: Essays on language learnability and language variation (Linguistische Arbeiten 309), 268–294. Berlin u. a.: De Gruyter.

352

Angela Grimm und Anja Müller

Wegener, Heide (1998a): Das Passiv im DaZ-Erwerb von Grundschulkindern. In Heide Wegener (Hrsg.), Eine zweite Sprache lernen: Empirische Untersuchungen zum Zweitspracherwerb (Tübinger Beiträge zur Linguistik 24), 143–172. Tübingen: Narr. Wegener, Heide (Hrsg.) (1998b): Eine zweite Sprache lernen: Empirische Untersuchungen zum Zweitspracherwerb. Tübingen: Narr. Wojtecka, Magdalena, Rabea Schwarze, Angela Grimm & Petra Schulz (2013): Finiteness and verb placement in German: A challenge for early second language learners? In Jennifer Cabrelli Amaro, Tiffany Judy & Diego Pascual y Cabo (Hrsg.), Proceedings of the 12th Generative Approaches to Second Language Acquisition Conference (GASLA 2013), 211–221. Somerville, Mass: Cascadilla Press.

Vivien Heller

15 Pragmatik 1 2 3 4 4

Grundbegriffe Herausforderungen bei der Erfassung pragmatischer Fähigkeiten in der Zweitsprache Diagnostische Verfahren zwischen Offline- und Online-Produktion Diagnostische Instrumente und ihre Einsatzmöglichkeiten Ausblick

Über pragmatische Kompetenz zu verfügen heißt, gesprächssequenzielle und situative Kontexte für rekonstruktive, explanative, argumentative und andere Aktivitäten zu erkennen und mitzukonstruieren. Eine Erfassung pragmatischer Fähigkeiten, sei es im Rahmen der Forschung oder der Diagnostik, muss somit der Kontextsensitivität sprachlicher Interaktion systematisch Rechnung tragen. Ausgehend von der Diskussion der Konzepte Pragmatik, Kontext/Kontextualisierung und pragmatische Kompetenz expliziert der vorliegende Beitrag grundsätzliche Herausforderungen, die sich bei der Erfassung pragmatischer Kompetenzen im Medium der Mündlichkeit stellen. Er diskutiert in Forschung und Diagnostik genutzte Elizitierungsverfahren mit Fokus auf die Interaktivität der konstruierten Settings und nimmt eine Systematisierung in Online- und Offline-Verfahren vor. Vorliegende diagnostische Instrumente zur Erfassung pragmatischer Fähigkeiten mehrsprachiger Kinder und Jugendlicher werden sodann im Hinblick auf ihre Elizitierungsverfahren und Auswertungsschwerpunkte untersucht.

1 Grundbegriffe 1.1 Pragmatik Geht man von der Wortbedeutung aus, die auf das griechische pragma (Handlung) zurückgeht, so lässt sich die Pragmatik als der Teilbereich der Linguistik bestimmen, der sich mit dem sprachlichen Handeln von Menschen befasst. Darüber, was genau zum Bereich der Pragmatik gehört und in welchem Verhältnis sie zu anderen Bereichen der Linguistik steht, existieren jedoch unterschiedliche Auffassungen (Levinson 1983; Kasper & Ross 2013). In einem engen Verständnis wird die Pragmatik neben der Morphosyntax und dem Lexikon als eine dritte Sprachebene gesehen. Den Hintergrund dieser modularen Konzeption bildet die Zeichentheorie von Morris (1938), die die Kombination von Zeichen (Syntax), ihre Bedeutung (Semantik) und schließlich ihre Verwendung (Pragmatik) analytisch unterscheidet. Ausgehend von dieser Dreiteilung entwickelte sich die Auffassung, dass Grammatik und Lexikon die Kernbereiche der Linguistik bilden, während sich die Pragmatik mit vergleichsweise schwer zu fassenden Phänomenen wie der Kontextabhängigkeit von Bedeutung oder https://doi.org/10.1515/9783110418712-015

354

Vivien Heller

Implikaturen und Inferenzen bei der Rezeption deiktischer Ausdrücke und indirekter Sprechakte befasse. Die Konsequenz einer solchen Auffassung sei, so Mey (2001: 19), dass die Pragmatik zu einem wastebasket für Phänomene werde, die nicht allein sprachsystembezogen erklärt werden können. Damit aber liefe sie Gefahr, zu einer Rest-Disziplin degradiert zu werden, die sich mit den Residuen befasst, die ihr die systembezogene Linguistik überlässt. In der angloamerikanischen Forschung hat sich im Anschluss an diese Auffassung die Differenzierung zwischen pragmalinguistics und sociopragmatics etabliert (Leech 1983). Während der Terminus der soziopragmatischen Kompetenz das Regelwissen bezeichnet, das benötigt wird, um Sprechakte und Routinen situationsangemessen bzw. den Normen einer bestimmten Sprachgemeinschaft entsprechend zu realisieren, bezieht sich der Begriff der pragmalinguistischen Kompetenz auf das Verfügen der dafür erforderlichen und einzelsprachspezifischen sprachlichen Mittel. In der empirischen Praxis erwies es sich jedoch bislang als schwierig bis unmöglich, pragmalinguistische und soziopragmatische Fähigkeiten als isolierte Komponenten zu erfassen (McNamara & Roever 2006; Grabowski 2016). Gleichwohl erscheint es für die Erfassung pragmatischer Kompetenzen in der Zweitsprache relevant, feststellen zu können, ob ein Sprecher bereits vertraut ist mit gesellschaftlich verfestigten kommunikativen Verfahren (sociopragmatics) und lediglich die sprachlichen Ressourcen zu ihrer Realisierung (pragmalinguistics) in der Zweitsprache erwerben muss oder ob kommunikative Verfahren von Grund auf in der Herkunfts- und/oder Zweitsprache angeeignet werden müssen. Wir werden diese Frage an späterer Stelle wieder aufgreifen und ein analytisches Beschreibungsmodell zu ihrer integrierten Erfassung vorstellen (Kapitel 2). Neben dem sprachsystembezogenen und modularen Sprachkonzept haben sich im Zuge der pragmatischen Wende mit der systemic functional linguistics, der Funktionalen Pragmatik sowie ethnomethodologisch und dialogisch basierten Ansätzen Theorien entwickelt, die Sprache grundlegend als pragmatisch fundiert verstehen. Im Unterschied zum „component view of pragmatics“ wird die Pragmatik nach diesem Verständnis zu einer „perspective on the linguistic enterprise“ (Kasper & Rose 2002: 2), einer funktionalen Perspektive also auf Phonologie, Semantik und Syntax. Aus dieser Perspektive ist „Sprache von Anfang ihrer Aneignung an Struktur, die für Funktionen und deren Realisierung erforderlich ist“ (Ehlich 2007: 18). Zum Gegenstand der Pragmatik werden dann konsequenter Weise das Sprechen, Schreiben und Lesen als Mittel des Handelns; sprachliche, paraverbale und nonverbale Formen kommen nicht allein in ihrer Systematik, sondern auch als Ressourcen für die Realisierung kommunikativer Zwecke in den Blick. Ebenso rücken „größere“ Musterhaftigkeiten als vorgeprägte und sedimentierte Lösungsverfahren für wiederkehrende kommunikative Probleme (Luckmann 1986) der mündlichen und schriftlichen Kommunikation (in Form von kommunikativen Gattungen und Textsorten) in den Fokus. Damit weitet sich der Untersuchungsgegenstand auf sprachliches Handeln oberhalb der Satzebene aus.

Pragmatik

355

Auf audiovisuellen Daten basierende sequenzanalytische Untersuchungen zeigen zudem, dass solche sprachlichen Handlungen interaktiv hervorgebracht sind (Schegloff 2010). Ihnen liegt eine verfestigte sequenzielle Organisation zugrunde, an der sich kompetente Interaktanten orientieren, um die Anforderungen an die wechselseitige Koordination zu reduzieren. Ein zentraler Mechanismus der sequenziellen Organisation sind sog. konditionelle Relevanzen bzw. Zugzwänge. Darunter werden normative Erwartbarkeiten zwischen bestimmten Typen von Äußerungen verstanden. Beispielsweise wird mit einem „Gruß“ als nächste Handlung ein Gegengruß normativ erwartbar gemacht bzw. konditionell relevant gesetzt. In der Gesprächsforschung wurden konditionelle Relevanzen zunächst für Paarsequenzen (Gruß – Gegengruß, Einladung – Annahme/Ablehnung) beschrieben (Schegloff 2007). Im deutschsprachigen Raum wurde die Untersuchung unterschiedlicher Sequenztypen darüber hinaus auch für die Analyse kommunikativer Gattungen (Günthner 2009; Quasthoff, Heller & Morek 2017) wie Erzählen, Erklären und Argumentieren fruchtbar gemacht. Empirische Analysen authentischer Interaktionen machen zudem das recipient design, d. h. den Adressatenzuschnitt einer jeden sprachlichen Äußerung sichtbar. Dieser kann nicht einfach als ein „constraint“ (Crystal 1997) für den Gebrauch von Sprache gesehen werden, sondern bildet eine konstitutive Eigenschaft sprachlichen Handelns. Für die Untersuchung sprachlicher Interaktion ist neben sequenziellen Organisationsprinzipien und Formen des Rezipientenzuschnitts auch die Frage nach dem Verhältnis zwischen sprachlichem Handeln und Kontext zentral. Im Zuge der pragmatischen Wende wurde der Begriff des Kontextes einer grundlegenden Revision unterzogen, da mit den bis dahin vorliegenden statischen Konzepten die tatsächlichen Anforderungen, die Interaktanten sowie Schreibende und Lesende bei der Herstellung, Interpretation und Aufrechthaltung des Kontextes bewältigen, nur unzureichend erfasst werden konnten.

1.2 Kontext und Kontextualisierung Dass Sprache nicht in einem Vakuum existiert, sondern Sprechen und Schreiben situiert – im Kontext – vollzogen werden, ist keineswegs eine neue Erkenntnis. Mit den Konzepten der Implikatur und Inferenz wird untersucht, wie Kommunikation gelingt, obwohl Sprecherinnen und Sprecher nicht alles Gemeinte explizieren, sondern auf das Kontextwissen ihres Gegenübers vertrauen. Ebenso wird der kontextspezifische Sprachgebrauch – also die Tatsache, dass sich bspw. die Kommunikation in der Behörde stark von der in der Familie oder Peergroup unterscheidet – seit geraumer Zeit in den Blick genommen. Dabei war die Forschung zunächst von der Sicht geprägt, dass Interaktanten ihr Handeln an den Kontext anpassen, dass also die Art des Sprechens (oder Schreibens) vom Kontext abhängt. Die Beschreibung des Kontextes erfolgt dann anhand unterschiedlicher Parameter wie Sprecher/Hörer (und evtl. ihre gesellschaftliche Stellung/institutionelle Rolle), Zeitpunkt, Ort, Medi-

356

Vivien Heller

um. Der Kontext wurde aus dieser Perspektive als Aggregat materiell und raumzeitlich gegebener Entitäten verstanden; dabei wurde stillschweigend vorausgesetzt, dass der Kontext unabhängig von der Interaktion existiert. Die Beobachtung, dass es unter Gesprächsbeteiligten inkongruente Auffassungen darüber geben kann, was gerade der Kontext der Interaktion ist – bspw. in interkulturellen Settings (vgl. Gumperz 1982) oder zwischen Lernenden und Lehrkräften im Unterricht (vgl. Michaels & Cazden 1986) –, hat zu einer Dynamisierung des Kontextbegriffes geführt (Auer 2009). Aus Sicht der Ethnomethodologie ist ein Kontext nicht unabhängig von einer Interaktion vorhanden; er kommt auch nicht einfach durch die Anwesenheit bestimmter Personen an einem bestimmten Ort zustande. Vielmehr wird der Kontext von den Beteiligten interaktiv erzeugt, indem diese ihre an sich vagen und indexikalischen Äußerungen mit Hinweisen darauf versehen, in welchem Kontext sie zu verstehen sind. Diese Hinweise wurden von Cook-Gumperz & Gumperz (1976) als Kontextualisierungshinweise bezeichnet. Mit ihnen zeigen sich die Beteiligten wechselseitig an, in welchem gesprächssequenziellen und situativen Kontext ihre Äußerung zu interpretieren ist. Den dynamischen – und durchaus störanfälligen – Prozess der Kontextherstellung fassen Cook-Gumperz & Gumperz mit dem Terminus Kontextualisierung. Für die Modellierung und Diagnostik pragmatischer Kompetenzen zieht der dynamische und reflexive Kontextbegriff erhebliche Konsequenzen nach sich. Pragmatische Kompetenzen können nicht lediglich auf die Fähigkeit beschränkt werden, sprachliche Mittel kontextangemessen „zu gebrauchen“. Ebenso zentral ist die Fähigkeit, Kontextualisierungshinweise interpretieren zu können und einen sequenziellen und situativen Kontext mitzukonstruieren (Kasper & Ross 2013). Diese Fähigkeitsdimension bezeichnen Quasthoff & Morek (2015) als Kontextualisierungskompetenz. Sie gilt es sowohl in produktiver als auch in rezeptiver Ausprägung diagnostisch systematisch zu erfassen.

1.3 Pragmatische Kompetenz (in der Zweitsprache) Das modulare Verständnis von Sprache (vgl. Abschnitt 1.1 in diesem Beitrag) findet seine Fortsetzung in nativistisch-generativistischen und kognitivistischen Konzeptionen von (mehrsprachiger) Sprachkompetenz, die diese als multi-komponentiell modellieren und der Umgebung des Kindes vor allem die Rolle eines Input-Gebers oder Triggers für die Entwicklung zusprechen. Nicht geklärt ist allerdings die Frage, welche Facetten zu einer so modellierten pragmatischen Kompetenz zu zählen sind. Neben der o. g. Differenzierung in pragmalinguistische und soziopragmatische Fähigkeiten werden ihr zumeist die Bereiche Deixis, Sprechakte, Implikaturen, Präsuppositionen und extended discourse und/oder Informationsstrukturierung (vgl. z. B. Cekaite 2013; Slabakova 2013) zugeschrieben. Mit Blick auf Definitionsversuche pragmatischer Kompetenz verzeichnen McNamara & Roever (2006: 43–44) nun einen „shift from seeing language proficiency in

Pragmatik

357

terms of knowledge of structure […] to an emphasis on the integration of many aspects of language knowledge and skill in performance, requiring evidence of the ability to comprehend and produce whole texts and to participate in face-to-face communication under real-time processing conditions”. Solchen integrativen Modellierungen pragmatischer Kompetenz ist gemeinsam, dass sie nicht allein sprecherbezogen konzipiert sind und spezifisch interaktive Anforderungen berücksichtigen. Diskutiert werden im Folgenden die Konzepte der: – Basisqualifikationen (u. a. Ehlich 2007; Guckelsberger 2013; Jeuk 2010), – Interactional Competence (u. a. Hall, Hellermann & Pekarek-Doehler 2011, Kasper & Rose 2002), – Diskurskompetenz (u. a. Quasthoff 2011; Kern 2011; Heller 2013; Quasthoff & Morek 2015). Ausgehend von einem zweckorientierten und funktionalen Verständnis von „Sprache als Handlungsmittel“ nimmt Ehlich (2007: 19) eine analytische Unterscheidung von sieben Basisqualifikationen (BQ) vor, mit der Erwerbsaufgaben in ihrer ganzen Breite sichtbar gemacht werden sollen. Realiter werden die BQ nicht getrennt voneinander erworben und bauen z. T. auch aufeinander auf. Im Hinblick auf pragmatische Dimensionen der Aneignung von Sprache differenziert Ehlich zwischen der pragmatischen BQ I und II sowie der diskursiven BQ. Die pragmatische BQ I umfasst basale Fähigkeiten des Einsatzes (bzw. Verstehens) von Sprache als Handlungsmittel vor allem in Interaktionen mit vertrauten Partnerinnen und Partnern sowie das Beherrschen elementarer basaler sprachlicher Handlungsmuster wie Aufforderungen und Frage-Antwort-Mustern (Trautmann & Reich 2008). Zu den diskursiven BQ zählen Verfahren des Sprecherwechsels und komplexere Handlungen vor allem narrativer Art, bei denen übersatzmäßige Zusammenhänge kohärent dargestellt werden müssen (Guckelsberger & Reich 2008). Die pragmatische BQ II umfasst schließlich Kompetenzen, die mit dem Eintritt in Bildungsinstitutionen relevant werden. Dazu gehören vor allem weitere komplexe Handlungsmuster wie das Instruieren/Erklären und Argumentieren. Während sich die diskursive BQ also vor allem auf Fähigkeiten der sequenziellen Organisation des interaktiven Vollzugs von Erzählungen und die kohärente Vertextung von Ereignissen bezieht, rückt mit der pragmatischen BQ II das Verfügen einer größeren Bandbreite sprachlicher Handlungsmuster und die Berücksichtigung unterschiedlicher situativer Kontexte in den Vordergrund. Das Konzept der Basisqualifikationen basiert zum einen auf Befunden aus der empirischen Erwerbsforschung; zum anderen ist die Modellierung aus den kommunikativen Anforderungen abgeleitet, die sich Kindern und Jugendlichen in vorschulischen und schulischen Bildungsinstitutionen stellen. Sog. sociocultural approaches und konversationsanalytisch inspirierte Zweitspracherwerbsstudien (vgl. zur Übersicht Atkinson 2011) schlagen mit dem Begriff der interactional competence ein Modell vor, das Kompetenzfacetten aus den von der Konversationsanalyse herausgearbeiteten konstitutiven Eigenschaften sprachlicher Interaktion ableitet. Demnach beinhaltet Interaktionskompetenz

358

Vivien Heller

[…] knowledge of social-context-specific communicative events or activity types, their typical goals and trajectories of actions by which the goals are realized and the conventional behaviors by which participant roles and role relationships are accomplished. Also included is the ability to deploy and to recognize context-specific patterns by which turns are taken, actions are organized and practices are ordered. And it includes the prosodic, linguistic, sequential and nonverbal resources conventionally used for producing and interpreting turns and actions, to construct them so that they are recognizable for others, and to repair problems in maintaining shared understanding of the interactional work we and our interlocutors are accomplishing together (Hall & Pekarek-Doehler 2011: 2).

Facetten von Interaktionskompetenz lassen sich damit auf drei Granularitätsebenen ansiedeln: – Wissen über kontextspezifische Aktivitätstypen und die Zwecke, für deren Realisierung sie „gemacht“ sind (z. B. Herstellen von Dissens zur Sichtbarmachung unterschiedlicher Geltungsansprüche); – Wissen über die sequenzielle Organisation solcher Aktivitätstypen (bspw. erfolgt die Dissensherstellung sequenziell mit mindestens zwei Zügen, dem Vorbringen einer Behauptung, Meinungsbekundung o. ä. und einem Widerspruch, einer Infragestellung o. ä.) – verbale, prosodische und nonverbale Ressourcen, mit denen die Aktivitätstypen bzw. die einzelnen Züge realisiert werden; dazu gehört insbesondere die Art und Weise, mit der sich die Interaktanten wechselseitig erkennbar („recognizable“) machen, was sie gerade miteinander tun – beim Herstellen von Dissens gehören dazu bspw. dissensankündigende Vorlaufelemente und Adversativkonnektoren. Mit diesen drei Ebenen zeichnet sich eine funktionale Beziehung zwischen drei Kompetenzebenen ab, die allerdings nicht eigens expliziert wird: Interaktanten benötigen sprachliche (und multimodale) Ressourcen, um kontextspezifische Aktivitätstypen Zug um Zug hervorzubringen und damit bestimmte kommunikative Zwecke zu realisieren. Es liegt eine Reihe empirischer Studien zum Erwerb von Interaktionskompetenz vor (vgl. den Sammelband von Hall, Hellermann & PekarekDoehler 2011), die sich vorwiegend auf fremdsprachliches Lernen bei jugendlichen oder erwachsenen Interaktanten (häufig in study abroad contexts) beziehen (vgl. Cekaite 2007 als Ausnahme). Eng verwandt mit der Konzeptualisierung der Interaktionskompetenz, jedoch spezifischer auf Anforderungen übersatzmäßiger, d. h. diskursiver Praktiken zugeschnitten ist das Konzept der Diskurskompetenz von Quasthoff (2011). Kommunikative Gattungen wie Erzählen, Berichten, Erklären und Argumentieren sind immer in ein laufendes Gespräch eingebettet. Ihre Produktion verlangt von den Interaktanten daher die Lösung organisatorischer Aufgaben (bspw. die Herstellung eines thematischen Kontextes, die Zuweisung interaktiver Rollen, das Einhalten besonderer Regeln des Sprecherwechsels). Daneben erfordern sie die kohärente und gattungsspezifische Vertextung eines globalen Zusammenhangs, was i. d. R. die Produktion eines übersatzmäßigen Äußerungspakets (Sacks 1995) erfordert. Ausgehend von

Pragmatik

359

empirischen Befunden differenziert Quasthoff (2011) drei modalitätsübergreifende Dimensionen von Diskurskompetenz: – Kontextualisierungskompetenz als Fähigkeit des Erkennens kommunikativer Erwartungen, d. h. lokaler und globaler Zugzwänge (Ist eine komplexe Diskurspraktik an einer bestimmten Stelle im Gespräch erwartet? Um welche Art von kommunikativer Handlung geht es?); – Vertextungskompetenz als Fähigkeit, einen globalen Zusammenhang (z. B. rekonstruktiver, explanativer oder argumentativer Art) kohärent zu strukturieren; – Markierungskompetenz als Fähigkeit, mit sprachlichen, prosodischen und gestischen Mitteln den Typ des Diskursbeitrags und die inhaltliche Strukturierung erkennbar zu machen. Damit ist nun ein Ausschnitt pragmatischer Kompetenz fokussiert, der sich in Bildungszusammenhängen – für die Partizipation an Unterrichtsgesprächen und die Auseinandersetzung mit komplexen fachlichen Zusammenhängen – als höchst relevant erwiesen hat (Heller et al. 2017). Zusammenfassend lässt sich feststellen, dass die drei Kompetenzmodellierungen große Überschneidungen aufweisen und lediglich unterschiedliche Schwerpunkte setzen. Das Konzept der Diskurskompetenz fasst spezifische Anforderungen im Rahmen des Berichtens, Erzählens, Erklärens und Argumentierens und hat den Vorteil, die Kompetenzebenen der Kontextualisierung, Vertextung und Markierung zum einen analytisch getrennt, zum anderen in ihrer funktionalen Bezogenheit beschreiben zu können. Im Vergleich dazu sind die Konzepte der Basisqualifikationen und der Interaktionskompetenz weiter gefasst; letztere bezieht auch Reparaturfähigkeiten als wichtige pragmatische Kompetenz mit ein. Die diskursiven und pragmatischen BQ sowie das Modell der Diskurskompetenz rücken Fähigkeiten in den Vordergrund, deren Erwerb sich nachweislich über das Kindergarten- und Schulalter erstreckt, die sich teilweise sogar erst aus spezifisch schulischen Anforderungen ergeben und die damit für den Bildungserfolg entscheidend sind. Mit Blick auf die schulische Relevanz ist somit eine Fokussierung auf diskursive Fähigkeiten sinnvoll.

2 Herausforderungen bei der Erfassung pragmatischer Fähigkeiten in der Zweitsprache Wenngleich die Erfassung pragmatisch-diskursiver Kompetenzen zunehmend in den Fokus der Aufmerksamkeit rückt, sieht sie sich doch mit folgenden Herausforderungen konfrontiert (vgl. Becker-Mrotzek et al. 2013; O’Neill 2014; Quasthoff & Heller 2014):

360 –

–

–

Vivien Heller

Wie kann pragmatische Kompetenz als eine jeweils einer einzelnen Person zukommende Fähigkeit erfasst werden, wenn doch diskursive Praktiken grundsätzlich interaktiv hervorgebracht sind? (Wie) Lassen sich Fähigkeiten des Kontextualisierens und des kontextsensitiven Interagierens in eigens für die Erhebung erzeugten, nicht-authentischen Settings elizitieren? Wie und woraus sind Normen für die Bewertung diskursiven Verhaltens zu gewinnen?

Interaktivität diskursiver Praktiken vs. Personengebundenheit von Kompetenz. Diskursive Praktiken wie das Berichten, Erzählen, Erklären und Argumentieren sind keine monologischen Handlungen, sondern interaktiv konstituiert. Zur Entlastung der koordinativen Anforderungen (s. o.) orientieren sich kompetente Interaktanten an sequenziell abzuwickelnden Gesprächsaufgaben. Im Falle des Erzählens heißt dies: Interaktanten bereiten eine Erzählung inhaltlich und organisatorisch vor, indem sie sie inhaltlich an das vorangegangene Gespräch anschlussfähig machen (Etablieren von Inhalts-/Formrelevanz), die Erzählwürdigkeit eines Ereignisses herstellen (Thematisieren) und einem der Interaktanten die Rolle des Erzählenden zuweisen, der das erzählwürdige Ereignis darstellt (Elaborieren/Dramatisieren, vgl. Hausendorf & Quasthoff 1996). Die Zuhörenden sind nicht nur bei der Vorbereitung und Durchführung des Erzählens höchst aktiv. Auch an den Aufgaben des Abschließens und Überleitens sind sie beteiligt, indem sie überraschende Momente der Erzählung durch entsprechende Reaktionen mitproduzieren, ihre Position zum Erzählten zum Ausdruck bringen und eine Folgeaktivität anschlussfähig machen. Das Erzählen – und analog das Erklären, Argumentieren – kann somit nicht als alleinige Leistung eines einzelnen Interaktanten gesehen werden. Die Tatsache, dass mündliches Erzählen grundsätzlich eine interaktive Hervorbringungsleistung darstellt, steht der Beschreibung von Erzählkompetenz als der einer Person zukommenden Fähigkeit somit erst einmal entgegen: „How are we to speak of communicative competence as residing in the individual if we are to include the hearer in the speaker’s processes“ (McNamara & Roever 2006: 46)? Dieses Problem lässt sich dann lösen, wenn Beschreibungsinstrumente zwischen interaktiv abzuwickelnden Gesprächsaufgaben, pragmatischen Mitteln und sprachlichen Formen ihrer Realisierung (Hausendorf & Quasthoff 1996; Quasthoff, Heller & Morek 2017) differenzieren. Während auf der Ebene der Gesprächsaufgaben die interaktive Organisation des gattungsorientierten gemeinsamen Handelns im Vordergrund steht, lassen sich auf der Ebene pragmatischer Mittel und sprachlicher Formen die Anteile der einzelnen Beteiligten in ihren jeweiligen interaktiven Rollen (bspw. Erzähler – Zuhörer) beschreiben. Die Grundlage dafür bildet die linguistische Beschreibung der für eine Gesprächsaufgabe typischen Mittel und Formen. Ein solches dreigliedriges Beschreibungsinstrument könnte sich auch für vergleichende Untersuchung pragmatischer Kompetenzen in der Erst- und Zweitsprache als hilfreich erweisen, weil sich auf diese Weise feststel-

Pragmatik

361

len ließe, ob das Kind bereits über sequenzielles Wissen und pragmatische Mittel in der Erstsprache verfügt und lediglich sprachliche Ressourcen in der Zweitsprache Deutsch erwerben muss. Elizitieren pragmatischer Kompetenzen in eigens für die Erhebung erzeugten, nicht-authentischen Kontexten. Aus dem dynamischen Kontextbegriff folgt, dass mit der Elizitierung von sprachlichem Handeln stets die Erzeugung eines – wie auch immer gearteten – Kontextes einhergeht, der auf das sprachliche Handeln zurückwirkt: „Der Forschende ist sozusagen Beobachtender des von ihr oder ihm kreierten kommunikativen Anlasses. […] Diese Kontextualisierung wird durch das Erhebungsinstrument selbst und die mit ihm verbundene Aufgabenstellung hergestellt“ (Mezger, Schroeder & Simsek 2014: 75). Mit der jeweiligen Aufgabenstellung werden auch bestimmte interaktive Zwecksetzungen etabliert. Diese können aus Sicht des untersuchten Interaktanten eher denen authentischer Interaktion nahekommen (z. B. Teilen eines Erlebnisses, Bearbeitung eines „echten“ Erklärbedarfs oder Dissenses) oder ersichtlich dem Zweck der Kompetenzerfassung (und somit einer Prüfsituation) entsprechen. Es liegt auf der Hand, dass die Art der Zwecksetzung die Realisierung sprachlicher Handlungen erheblich beeinflusst. Die jeweilige Kontextualisierung, die mit dem Elizitierungssetting nahegelegt wird, ist somit entscheidend für die Inhaltsvalidität des Instruments. Wird bspw. durch Abarbeiten einer auch für den Untersuchenden sichtbaren Bildfolge ein bloßes Als-ob-Erzählen inszeniert, „elizitiert“ das Instrument womöglich nicht das, was es zu erfassen beabsichtigt. Es gilt also, sehr systematisch auf Basis gesprächsanalytischer Beobachtungen zu planen und zu pilotieren, wie der Elizitierungskontext so hergestellt werden kann, dass für die untersuchten Personen vor allem die gattungsspezifischen Zwecke der Interaktion erkennbar werden. Das Konstruieren des Kontextes ist aber nicht nur mit Blick auf die Inhaltsvalidität von Bedeutung. Vielmehr bildet das Erkennen und Mitkonstruieren des Kontextes selbst auch einen zentralen Gegenstand der Beschreibung pragmatischer Kompetenzen. Es sollte somit systematisch erfasst werden, ob die untersuchte Person bestimmte situative und sequenzielle Kontexte (Zugzwang zum Erzählen, Erklären, Argumentieren) mitkonstruiert und wie explizit Zugzwänge sein müssen, damit sie erkannt und bedient werden. Normen für die Bewertung diskursiven Verhaltens. Grundlegend für die Erfassung pragmatischer Kompetenz ist die Gewinnung von Kriterien, anhand derer beobachtetes Interaktionsverhalten als mehr oder weniger kompetent, altersgemäß usw. beurteilt werden kann. Dem Gegenstand angemessene Kriterien müssen reflektieren, dass Gattungen von erfahrenen Interaktanten „for practical purposes“ (Garfinkel 1967: 7) genutzt werden, also Verfahren zur Bearbeitung kommunikativer Probleme bzw. Zwecke sind (Luckmann 1986; Günthner 2009). Beim Erzählen bestehen solche praktischen Zwecke aus Perspektive der Teilnehmer im Teilen von Erfahrungen und Bewertungen. Die Kriterien für die Kompetenzbeurteilung sollten sich folglich darauf beziehen, inwieweit es noch unerfahrenen Interaktanten gelingt, ein kommunikatives Verfahren wie das Erzählen zu dem Zweck zu realisieren, zu dem sich die

362

Vivien Heller

Gattung entwickelt hat, und keine „externen“ Normen (z. B. syntaktische Wohlgeformtheit, Vollständigkeit o. Ä.) anlegen. Neben der Gegenstandsangemessenheit von Kriterien stellt sich nun mit Blick auf die Beschreibung pragmatischer Kompetenzen in der Zweitsprache außerdem die Frage, welche Erwerbsverläufe diskursiver Kompetenzen in der Erst- und Zweitsprache „normal“ sind bzw. ob sich überhaupt typische Erwerbsverläufe ermitteln lassen. Derzeit mangelt es noch an Erwerbsstudien, die verlässliche Orientierungswerte für den mehrsprachigen Erwerb diskursiver Kompetenzen unter Berücksichtigung von Variablen wie Lebensalter bei Kontaktbeginn, Kontaktdauer sowie Quantität und Qualität der Kontakte liefern könnten (vgl. Settinieri 2012b). Die Erwerbsbedingungen, die Kinder in ihren Familien vorfinden, sind so unterschiedlich (Heller 2017), dass sich Erwerbsverläufe vielfach unterscheiden. Zwar liegen für den mehrsprachigen Erzählerwerb einige Befunde vor (Pfaff 2001; Rehbein 2007; Grießhaber 2010; Dollnick & Pfaff 2013; Heller 2013; Mehlem 2013; Blaschitz 2014), doch sind wir noch recht weit von einem umfassenden Bild von Typen von Erwerbsverläufen entfernt (dies gilt erst recht für explanative und argumentative Kompetenzen). Eine Orientierung an Normen, die unterschiedlichen Erwerbsbedingungen Rechnung tragen, muss momentan also noch als ein Fernziel gelten (Schroeder & Stölting 2005). Für die Erfassung von Kompetenzen zu Zwecken der Diagnostik, insbesondere, wenn diese nur in der Zweitsprache Deutsch erfolgt, ist die Differenzierung zwischen Fähigkeiten des Umgangs mit sequenziellen Erwartbarkeiten und des Verfügens über pragmatische Mittel einerseits sowie den sprachlichen Ressourcen für ihre Realisierung andererseits relevant. Auch wenn damit lediglich „‚die deutsche Hälfte‘ Zweisprachiger“ (Reich 2007: 154) erfasst ist, lassen sich auf diese Weise immerhin Anhaltspunkte dafür ermitteln, ob in der Herkunftssprache Erfahrungen mit der betreffenden diskursiven Praktik vorliegen.

3 Diagnostische Verfahren zwischen Offlineund Online-Produktion Zur Systematisierung von Verfahren zur Erfassung pragmatischer Fähigkeiten ist die Differenzierung zwischen Offline- und Online-Verfahren hilfreich (s. Abb. 1). OfflineVerfahren umfassen solche, in denen die Probanden nicht selbst interagieren, sondern (schriftlich beschriebene bzw. auf Video gezeigte) Handlungen Fremder beurteilen oder selbst Überlegungen anstellen, wie sie in einem bestimmten Kontext sprachlich handeln würden. Demgegenüber zeichnen sich Online-Verfahren dadurch aus, dass der oder die Untersuchte in sprachliche Interaktionen involviert wird und unter Echtzeitbedingungen agieren muss – unabhängig davon, ob dieser Kontext authentisch ist oder eigens für die Erhebung inszeniert wurde. Die im Folgenden diskutierten Verfahren lassen sich also auf einem Kontinuum von +/– Interaktivität verorten:

Pragmatik

363

Abb. 1: Offline- und Online-Verfahren.

3.1 Elizitierung sprachlichen Handelns unter Offline-Bedingungen 3.1.1 Beurteilungsaufgaben (judgement tasks) Judgement tasks bzw. Beurteilungsaufgaben werden vorrangig für die Erfassung des grammatischen Wissens eingesetzt. Daneben wurden aber auch Versuche unternommen, dieses Verfahren für die Erfassung pragmatischer Fähigkeiten zu nutzen, wobei der Fokus vor allem auf außerschulisch bedeutsamen Kompetenzen lag (s. u.). Beurteilungsaufgaben umfassen i. d. R. die schriftliche, audio- oder videobasierte Wiedergabe eines Dialogausschnitts oder einer einzelnen Äußerung, die erkennbar in ein bestimmtes Szenario eingebettet ist. Beurteilt werden soll die Äußerung meist bezüglich ihrer soziopragmatischen Angemessenheit (vgl. Abschnitt 1 in diesem Beitrag). Mit dem Szenario wird somit eine Interaktion simuliert und für die Wiedergabe in einem anderen Medium präsentiert. Der Proband nimmt die Situation in der Rolle des Zuschauers wahr und beurteilt das Verhalten offline als Außenstehender. Beispielsweise spielte Cook (2002) Japanisch-Lernenden fingierte Selbstvorstellungen dreier Bewerber vor, von denen einer nicht die erwartbaren sprachlichen Mittel zur Berücksichtigung des höheren Status des Gegenübers einsetzte. Die Probanden wurden sodann gebeten zu entscheiden, welcher Bewerber am geeignetsten für eine Jobposition ist, die mit viel Kundenkontakt einhergeht. Bardovi-Harlig & Dörnyei (1998) präsentierten Fremd- und Zweitsprachlernenden 20 Szenarien zu den Sprechakten Bitte, Entschuldigung, Vorschlag, Ablehnung, die z. T. auf Basis authentischer Interaktionen entwickelt wurden. Zu beurteilen waren Antworten daraufhin, ob sie pragmatisch und/oder grammatikalisch (un)angemessen waren. Es liegt auf der Hand, dass solcherlei Aufgabenformate ausschließlich explizites oder zumindest bewusstseinsfähiges pragmatisches Wissen – das Bemerken (Bardovi-Harlig 2013: „noticing“) von Unangemessenheit – erfassen. Ein Problem dieses Aufgabenformats besteht darin, dass nicht eindeutig festzustellen ist, inwieweit die Aufgabe selbst erst Reflexionsprozesse anstößt, die für das Interagieren der geteste-

364

Vivien Heller

ten Person bislang jedoch keine Bedeutung hatten; zudem werden die Beurteilungen aus der Rolle eines Außenstehenden und nicht der eines an einer Interaktion Beteiligten getroffen. Es ist jedoch fraglich, ob Beurteilungen aus der Beobachterperspektive Rückschlüsse auf solche aus der Beteiligtenperspektive zulassen. Als weitere Einschränkung ist festzuhalten, dass sich die bislang eingesetzten Aufgaben vorrangig auf Phänomene auf der Sprechakt- oder Satzebene bezogen. Wenngleich das Aufgabenformat mit einigen Problemen behaftet ist, so ist doch durchaus denkbar, es auch zur Erfassung rezeptiver Vertextungskompetenz einzusetzen. Beispielsweise ließen Kuhn & Udell (2003) unterschiedlich vertextete Argumente (mit/ohne Begründung und Stützung) im Hinblick auf ihre Schlüssigkeit und Überzeugungskraft beurteilen. Mehrsprachige Jugendliche wurden dabei allerdings nicht berücksichtigt. Festzuhalten bleibt jedoch, dass produktive Fähigkeiten der sequenziellen Einbettung und Hervorbringung mit diesem Aufgabenformat nicht erfasst werden können.

3.1.2 Discourse Completion Tasks Aufgaben, bei denen ein begonnener Dialog fortgesetzt werden soll, sog. Discourse Completion Tasks (DCTs), liegen in mündlicher und schriftlicher Form vor. Analog zu den Beurteilungsaufgaben wird dem Probanden ein Stück Gespräch präsentiert, das er offline wahrnimmt. Im Unterschied zu den Beurteilungsaufgaben bricht die Episode jedoch an einer Stelle ab, an der erkennbar ein bestimmter Typ von nächster Handlung folgen muss – in dem also bspw. eine konditionelle Relevanz (Schegloff & Sacks 1973) für den zweiten Paarteil eines Nachbarschaftspaares etabliert ist. Mittels einer Frage oder Aufforderung („Sie antworten darauf: …“, vgl. Golato 2003: 114) wird der Proband gebeten, diese selbst zu realisieren, und zwar i. d. R. in schriftlicher Form. Ein Vorteil dieses Aufgabenformats liegt in seiner Ökonomie: Es kann in kurzer Zeit mit einer großen Anzahl von Probanden durchgeführt und vergleichsweise zügig ausgewertet werden. Sein diagnostisches Potenzial für die Erfassung pragmatischer Fähigkeiten ist jedoch begrenzt. Mit dem Aufgabenformat des DCT wird der Versuch unternommen, eine mündliche Interaktion zu simulieren. Bei written DCTs wird dazu die ursprünglich mündliche Interaktion in das Medium der Schriftlichkeit transponiert. Bei der Bewältigung der Aufgabe muss der Proband einen Rollenwechsel vollziehen: Während er das Szenario zunächst als Außenstehender wahrnimmt, ist er anschließend gefordert, sich in die Rolle eines Beteiligten hineinzuversetzen und aus dieser Perspektive heraus eine mündliche Reaktion zu entwerfen, die er im Medium der Schriftlichkeit festhält. Angesichts der Unnatürlichkeit und Komplexität dieses Elizitierungsverfahrens stellt sich die Frage, inwieweit die elizitierten Reaktionen Rückschlüsse auf tatsächliches Verhalten zulassen. Golato (2003) verglich Komplimenterwiderungen in authentischen Gesprächen mit solchen, die im Rahmen von DCTs produziert wur-

Pragmatik

365

den. Die in der DCT produzierten Antworten waren deutlich länger und wirkten „gestelzter“. Die Transposition mündlicher Antworten in das Schriftliche führt also nachweislich zu Verzerrungen; diese können auch in mündlichen DCTs nicht vollkommen umgangen werden (Yuan 2001). Zudem stellte Golato fest, dass einige der in authentischen Gesprächen beobachteten Mittel (das Ausbleiben einer Reaktion auf ein Kompliment und die Verwendung von response pursuit-Markierungen, die eine zweite Komplimenthandlung erwartbar machen) im Schriftlichen überhaupt nicht realisiert wurden. Die in der DCT elizitierten Komplimenterwiderungen unterscheiden sich also erheblich von denen in authentischen Interaktionen. Golato kommt deshalb zu dem Schluss, dass Probanden bei der Bearbeitung einer DCT auf einer metapragmatischen Ebene agieren und ihre Antworten eher Rückschluss auf ihre beliefs über pragmatische Phänomene zulassen. Auch McNamara & Roever (2006) sehen Nutzungsmöglichkeiten von DCTs allenfalls in der Erfassung semantischer Ressourcen (bspw. Entschuldigungsformeln). Werden diese von einem Probanden genutzt, so gibt dies zwar keine Hinweise auf den Online-Gebrauch dieser Ressourcen, weist aber zumindest auf deren Vorhandensein hin. Dies setzt freilich offene Frageformate voraus, bei denen keine multiple choice-Antworten vorgegeben werden. Abschließend ist auf die bereits für Beurteilungsaufgaben festgestellte Einschränkung hinzuweisen, dass DCTs bislang vorrangig für Phänomene auf der Sprechaktebene (Jucker 2009) bzw. Phänomene lokaler Reichweite (adjacency pairs) eingesetzt wurden. Des Weiteren lässt sich beobachten, dass sie vor allem im außerschulischen Bereich und im Kontext fremdsprachlichen Lernens eingesetzt werden.

3.1.3 Elizitierung von Erzählungen anhand von Bildergeschichten und Filmen Werden diskursive Fähigkeiten in der Zweitsprache erfasst, so fällt die Wahl fast durchgängig auf die kommunikative Gattung des Erzählens. Soll sich die Untersuchung nicht nur auf Fähigkeiten der Kohärenzherstellung beim Elaborieren eines Ereignisses, sondern auch auf Fähigkeiten der interaktiven Einbettung und sequenziellen Organisation beziehen, muss die Erzählsituation so konstruiert werden, dass sie die interaktive – d. h. vom Zuhörenden und Erzählenden gemeinsam zu leistende – Abwicklung der Gesprächsaufgaben ermöglicht (Hausendorf & Quasthoff 1996). Zweitens muss die Erzählsituation vergleichbar gehalten werden, ohne formalistisch zu sein: Für die untersuchte Person muss es einen nachvollziehbaren Anlass oder Zweck des Erzählens geben, d. h. vor allem ein Gegenüber, für das das Erzählte neu und erzählwürdig ist (Labov 1972: „reportability“; Sacks 1995: „tellability“). Häufig werden nun für die diagnostische oder forschungsbezogene Untersuchung des Erzählens Bilder, Bildfolgen oder (Stumm-)Filme verwendet. Zwar kann mit der Verwendung visueller Stimuli das Kriterium der Vergleichbarkeit i. d. R. problemlos erfüllt werden, doch lässt sich nicht ohne Weiteres eine Situation erzeu-

366

Vivien Heller

gen, in der das Erzählen für die Beteiligten auch einen nachvollziehbaren Zweck erfüllt. Sind beispielweise die Bilder für den Zuhörer bzw. die Zuhörerin sichtbar, verliert das Erzählen seinen Neuigkeits- und Unterhaltungswert und nimmt fast zwangsläufig einen Prüfcharakter an. Sieht das Setting außerdem noch vor, dass keine Rezipientensignale oder Nachfragen produziert werden dürfen, wird das Erzählen quasi unter Offline-Bedingungen vollzogen.1 Fähigkeiten des interaktiven Einbettens und des Repizientenzuschnitts können auf diese Weise nicht erfasst werden (Rank 1995; Hausendorf & Quasthoff 1996; Knapp 2001) . Weiterhin elizitieren die o. g. visuellen Stimuli ganz bestimmte Narrationstypen, nämlich reproduktive Nach- bzw. Bilderzählungen (Becker 2001). Im Unterschied zu einem einzelnen Bildimpuls strukturieren Bildfolgen die Inhalte des zu Erzählenden dabei stärker vor, so dass Fähigkeiten der Vertextung nur bedingt sichtbar werden. Empirische Studien weisen zudem darauf hin, dass Bildfolgen eher Zustandsbeschreibungen evozieren (Rank 1995; Bredel 2001; Knapp 2001). Es werden daher auch Filmclips verwendet, um die Generierung einer Erzählung (anstelle einer Beschreibung) wahrscheinlicher zu machen. Filme zeigen Ereignisse in ihrer Prozessualität, so dass der Erzähler den Hergang nicht aus statischen Bildern rekonstruieren muss. Mit Blick auf die Auswertung lassen sich unterschiedliche Schwerpunktsetzungen beobachten. Nur die wenigsten Verfahren berücksichtigen in der Auswertung auch interaktive Fähigkeiten der sequenziellen Einbettung und Organisation. Häufig werden Schwerpunktsetzungen vorgenommen, die sehr spezifischen Untersuchungsinteressen entsprechen. Dazu werden die Stimuli so aufbereitet, dass sie das interessierende Phänomen mit hoher Wahrscheinlichkeit provozieren. Beispielsweise schneiden Hickmann & Henriks (1999) Bildfolgen (Horse Story und Cat Story) so zu, dass der Erzähler zwischen neuer und bereits gegebener Information unterscheiden muss. In ähnlicher Weise entwickelt Dimroth (zusammenfassend 2012) einen Video-Stimulus (The Finite Story), dessen untypische Informationsverteilung bestimmte Formen der sprachlichen Markierung erfordert. Sowohl das Elizitierungsverfahren als auch die Auswertung sind nicht primär darauf angelegt, ein Erzählen in Gang zu setzen, dass dem Nacherzählen im Alltag nahekommt. Vielmehr zielen sie auf die Ermittlung bestimmter diskursgrammatischer Ressourcen.

1 Wird hingegen ein quasi-natürlicher Erzählkontext erzeugt, in dem das Erzählen zumindest aus Sicht des/der Untersuchten eine echte Funktion hat, kann von einem Erzählen unter Online-Bedingungen gesprochen werden (vgl. Abschnitt 3.2.3 in diesem Beitrag).

Pragmatik

367

3.2 Elizitierung sprachlichen Handelns unter Online-Bedingungen 3.2.1 Rollenspiele Rollenspiele sind vergleichsweise häufig für die empirische Untersuchung pragmatischer Fähigkeiten in der Zweitsprache eingesetzt worden. Mit einem Rollenspielszenario wird eine kommunikative Aufgabenstellung vorgegeben, für deren „Lösung“ dem Probanden ein größerer Spielraum zugestanden wird (Mezger Schroeder & Simsek 2014). So wurde bspw. der Erwerb von Sprechakten wie Bitten (Trosborg 1995; Hassall 2003), Ablehnungen (Félix-Brasdefer 2004), Beschwerden (Trosborg 1995) und Entschuldigungen (Trosborg 1995) empirisch untersucht. House (1996) nutzt ein Rollenspiel zur Erfassung von „pragmatic fluency“, die sie als Gebrauch von Routinen, Initiieren von Themaeinführungen und -wechseln und Antizipation von turnübergaberelevanten Stellen operationalisiert. Bis auf den letzten Fall zeigen die Beispiele, dass die Szenarien meist bestimmte Sprechakte elizitieren; mitunter werden auch Variablen wie „power“ und „social distance“ in Bezug auf einen Sprechakt systematisch variiert (Félix-Brasdefer 2004). Rollenspiele können sehr unterschiedliche Formen annehmen. So können die Spieler ihre altersbezogene, soziale und/oder berufliche Identität behalten und eine in ihrer Lebenswelt regelmäßig auftauchende Situation (nach)spielen; Rollenspiele können aber auch die Übernahme einer fremden Rolle und die Imagination weniger vertrauter Situationen vorsehen. Weiterhin unterscheiden sich Rollenspiele stark nach dem Grad ihrer inhaltlichen Vorstrukturierung. Kasper & Dahl (1991) differenzieren daher zwischen offenen und geschlossenen Rollenspielen. Bei geschlossenen Rollenspielen (ähnlich den mündlichen DCTs) erhalten die Spieler eine Situationsbeschreibung und müssen auf eine standardisierte Vorgängeräußerung reagieren. Bei offenen Rollenspielen sind i. d. R. lediglich Ausgangssituation, Rollen und Ziel vorgegeben; das Vorgehen der Interaktion ist jedoch nicht vorbestimmt. Zwar sind die mit offenen Rollenspielen elizitierten Interaktionen nur eingeschränkt vergleichbar, doch haben offene Rollenspiele gegenüber geschlossenen den Vorteil, dass Mechanismen des Sprecherwechsels und der sequenziellen Organisation weitestgehend erhalten bleiben. Dennoch gleichen auch sie natürlichen Interaktionen nur sehr bedingt, denn die Beteiligten handeln in einem Als-ob-Kontext, in dem ihre Handlungen ohne Konsequenzen bleiben (Wildner-Basset 1989; McNamara & Roever 2006). Dass Rollenspiele keine authentischen Interaktionen generieren, haben vergleichende Untersuchungen wiederholt belegt. So zeigte sich, dass die vorgegebenen Interaktionsziele auf schnellerem bzw. direkterem Wege erreicht wurden als in authentischen Interaktionen und sich von diesen schon in ihrer Länge unterschieden (Eisenstein & Bodman 1993). Im Vergleich zu DCTs produzieren die Spielenden aber längere Äußerungen mit mehr Wiederholungen. Im Hinblick auf die Auswertung sind Rollenspiele deutlich aufwändiger als Beurteilungsaufgaben und DCTs. Sie müssen zumindest grob transkribiert werden.

368

Vivien Heller

Kasper & Dahl (1991) weisen darauf hin, dass sich die Kodierung bei offenen Rollenspielen generell schwieriger gestaltet als bei geschlossenen, weil die größere Variation der Antworten die Zuordnung zu Kategorien erschwert. Vereinzelt liegen auch sequenzanalytische Auswertungen von Rollenspielen vor (Félix-Brasdefer 2004).

3.2.2 Quasi-experimentelle Settings Quasi-experimentelle Daten umfassen aufgabenbasierte und inszenierte Settings. Bei letzteren fingieren die Untersuchenden ein Ereignis, aus dem Interaktionen folgen, die aus Sicht der untersuchten Interaktanten unter nahezu authentischen Bedingungen stattfinden. So wird von Quasthoff et al. (2011; für monolinguale Kinder) für das Elizitieren von Narrationen im Kindergarten zunächst ein erzählenswertes Ereignis inszeniert, in das der prospektive Erzähler, nicht aber der prospektive Zuhörer involviert ist. Aus Sicht des Erzählenden gibt es also sowohl ein erzählenswertes Ereignis als auch ein Gegenüber, für das dieses Neuigkeitswert besitzt. Das Verhalten der Zuhörenden ist so standardisiert, dass nur die für das Erzählen konstitutiven Mittel des Herstellens von Inhaltsrelevanz, Zuhörersignale sowie Mittel des Abschließens realisiert werden. Damit sind die Erzählbedingungen hochgradig vergleichbar. In anderen quasi-experimentellen Settings erhalten die untersuchten Interaktanten eine Aufgabe, für deren Bearbeitung sie mit hoher Wahrscheinlichkeit auf argumentative (oder analog explanative) Verfahren zurückgreifen müssen. Zwar tritt hier der Aufgabencharakter deutlicher zutage, doch bleibt die Funktionalität der elizitierten diskursiven Praktik grundsätzlich erhalten. Wird eine Gruppe von Kindern bspw. bei der argumentativen Bewältigung einer Entscheidungsaufgabe oder eines moralischen Dilemmas aufgezeichnet, so ist damit ein Kontext geschaffen, in dem das Argumentieren funktional ist und sich erfassen lässt, in welchem Maße Kinder bereits in der Lage sind, Funktionen des Argumentierens zu realisieren. Aufgrund der Komplexität und Flüchtigkeit von Interaktion sind quasi-experimentelle Erhebungssettings auf die Aufzeichnung und Transkription der Interaktionen angewiesen und somit recht zeitaufwändig. Ein Vorteil ist jedoch darin zu sehen, dass sie eine hohe Vergleichbarkeit sowohl in quer- als auch in längsschnittlicher Hinsicht gewährleisten. Sie eignen sich nicht nur für empirische Erwerbsstudien, sondern auch für die Individualdiagnostik. Bislang liegt ein entsprechendes diagnostisches Verfahren nur für das Erzählen einsprachiger Kinder vor (Dortmunder Beobachtungsinstrument zur Interaktions- und Narrationsentwicklung von Quasthoff et al. 2011).

3.2.3 Aufzeichnung und Beobachtung authentischer sprachlicher Interaktion Von authentischen Daten spricht man, wenn sprachliche Interaktionen nicht eigens elizitiert werden. Der/die Untersuchende begibt sich in die Lebenswelt der Unter-

Pragmatik

369

suchten und zeichnet sprachliches Handeln in den „natürlichen“ Kontexten seiner Verwendung auf. Wenngleich solche Aufzeichnungen dem Beobachter-Paradoxon (Labov 1972) nicht entgehen können, werden doch Mechanismen des Sprecherwechsels, der sequenziellen Organisation und Verständnissicherung nicht metapragmatisch kontrolliert und weitestgehend authentisch realisiert. Solche Daten werden bislang vorrangig für (Zweitsprach-)Erwerbsstudien, nicht aber für die Individualoder Gruppendiagnostik generiert. Soll authentisches sprachliches Handeln für diagnostische Zwecke erfasst werden, werden Verfahren der strukturierten bzw. systematischen Beobachtung (Ricart Brede 2014) genutzt. Ebenso wie die Aufzeichnung authentischer Daten haben Beobachtungsverfahren den Vorteil, dass Interaktionsverhalten in natürlichen Kontexten und unter authentischen Bedingungen erfasst werden kann. Grundlage ist ein Beobachtungssystem, das eine Reihe von Deskriptoren umfasst (bspw. sismik von Ulich & Mayr 2006a, b und die Niveaubeschreibungen DaZ von Döll & Reich 2010; 2013, s. u.). Deskriptoren sind Operationalisierungen von bzw. Indikatoren für Kompetenzen, die grundsätzlich einer unmittelbaren Beobachtung nicht zugänglich sind (Quasthoff & Heller 2014). Aufgrund der Komplexität und Flüchtigkeit von Interaktion beziehen sich Beobachtungen vor allem auf das Vorkommen oder die Häufigkeit bestimmter Handlungen und weniger auf deren Qualität. Zu unterscheiden sind niedrig-, mittel- und hochinferente Beobachtungssysteme (Ricart Brede 2014), deren Deskriptoren mehr oder weniger interpretativ sind (z. B. „blättert langsam, schaut einzelne Bilder an“ vs. „liest aufmerksam“). Niedrig-inferente Deskriptoren bieten i. d. R. eindeutige Kriterien für das Feststellen des (Nicht-)Vorliegens eines Verhaltens. Allerdings verlangen auch diese im Anschluss an die Beobachtung Schlüsse im Hinblick auf zugrundeliegende Kompetenzprofile. Diese Schlussverfahren sind bestenfalls Teil des Beobachtungsverfahrens.

4 Diagnostische Instrumente und ihre Einsatzmöglichkeiten Im Folgenden werden diagnostische Instrumente berücksichtigt, die pragmatische Kompetenzen mehrsprachiger Kinder und Jugendlicher im Medium der Mündlichkeit zu erfassen versuchen (s. Tabelle 1). Von den ausgewählten Verfahren legen einige den Schwerpunkt auf pragmatische Kompetenzen, während andere diese lediglich zum Gegenstand einzelner Untertests machen.

Feststellung von Sprachförderbedarf

HAVAS 5 5–6 Jahre Förderdiagnostik Hamburger Verfahren zur Analyse des Sprachstands bei Fünfjährigen

DELFIN 4/5 4/5 Jahre Diagnostik, Elternarbeit und Förderung der Sprachkompetenz 4/5-Jähriger in NRW

4–6 Jahre Feststellung von Sprachentwicklungsverzögerungen/ -störungen, Förderdiagnostik

MSS Marburger Sprachscreening

Begleitung und Dokumentation von ‚normaler‘ Sprachentwicklung

3;6– 6 Jahre

sismik Sprachverhalten und Interesse an Sprache bei Migrantenkindern in Kindertageseinrichtungen

Zweck

Altersbereich

Instrument

Profilanalytisches Verfahren (nicht normiert)

Testbatterie (normiert)

Testbatterie mit Fragebogen (normiert)

durch Beobachtung und Befragung der Eltern

Erfassung in der Zweitsprache

–

–

Bewältigung der Gesprächssituation (Selbstkorrektur, Umgang mit Ausdrucksnot, Sprachwechsel) Erzählen (Referenz auf die Akteure und ihr Handeln)

Untertest „Bilderzählung“: – Erzählen

ja

nein

Untertests „Spontansprache“, „Sprachverständnis“, durch Befragung „Sprachproduktion“: der Eltern – Fragen nach kindseitigem Erzählen, Fragen, Verstehen von Arbeitsanweisungen als „ergänzende Information“ – Zeigeaufforderungen umsetzen und produzieren

–

–

Umgang mit Fragen rezeptiv und produktiv Erzählen in unterschiedlichen Konstellationen Rollenspiele (in der Erst- und Zweitsprache) Verstehen einfacher und mehrschrittiger Handlungsanweisungen Beteiligung an Gesprächen (in der Erst- und Zweitsprache) Umgang mit Verständigungsproblemen/Ausdrucksnot

Erfasste pragmatische Kompetenzen

Beobachtung und – Befragung der – Eltern (normiert) – –

Diagnostisches Verfahren

Tab. 1: Instrumente und erfasste pragmatische Kompetenzen.

4.1 Übersicht

370 Vivien Heller

Förderdiagnostik

Klasse 5–10

Klasse 1– Förderdiagnostik 10

Klasse 1–4

Klasse 5/ Förderdiagnostik 6

Niveaubeschreibung DaZ für die Sekundarstufe I

UBS DaZ Unterrichtsbegleitende Sprachstands-beobachtung DaZ

SFD Sprachstandsüberprüfung und Förder-diagnostik für Ausländer- und Aussiedlerkinder

Praxismaterial Förderdiagnostik

Beobachtung (nicht normiert)

Beobachtung (nicht normiert)

Beobachtung (nicht normiert)

6 Werkzeuge (z. T. normiert)

Bedarfsermittlung Testbatterie f. Vorberei(normiert) tungskurs / DaZFörderung / integrierte Förderung

Förderdiagnostik, Schullaufbahnberatung

Niveaubeschreibung Klasse DaZ für die Primarstufe 1–4

Werkzeug „Mündliches Erzählen“ – Erzählen

Untertest „Bildergeschichte – Freies Sprechen“ – Mündliches Erzählen/Freies Sprechen

Fähigkeit zum sprachlichen Handeln – Beobachtungsbereich „mündliche Sprachhandlungsfähigkeit“ (basale Verständigung, Erzählen/ Beschreiben, Erklären/Instruieren, Argumentieren) – Beobachtungsbereich „Strategien“ (Paraphrasen, Frageverhalten, Selbstkorrekturen)

mit Werkzeug „Sprachbiographie“

Ja

ja

Weite der sprachlichen Handlungs- und Verstehensfähigja keit – Elementare und komplexere Sprachhandlungen in privaten, unterrichtlichen und formellen Gesprächen – Umgang mit Ausdrucksnot/Verstehensproblemen – Freude und Interesse am Sprechen – in Deutsch und in der Herkunftssprache (im Unterricht und in privaten Situationen)

Weite der sprachlichen Handlungs- und ja Verstehensfähigkeit – elementare und komplexere Sprachhandlungen in privaten und unterrichtlichen Gesprächen – Umgang mit Ausdrucksnot/Verstehensproblemen – Freude und Interesse am Sprechen – in Deutsch und in der Herkunftssprache (im Unterricht und in privaten Situationen)

Pragmatik

371

372

Vivien Heller

Es liegen somit drei Instrumente vor, die bei der Erfassung pragmatischer Kompetenzen auf die Erzählfähigkeit fokussieren (DELFIN, SFD, Praxismaterial Förderdiagnostik). Vier Instrumente sehen Deskriptoren für pragmatische Kompetenzen in einer größeren Bandbreite vor. Bei diesen Instrumenten handelt es sich durchgängig um Beobachtungsverfahren, die sich entweder auf den vorschulischen (sismik) oder schulischen (Niveaubeschreibung DaZ für Primarstufe/Sekundarstufe I und die UBS DaZ) Bereich beziehen. Im MSS nehmen pragmatische Kompetenzen eine Randstellung ein und werden lediglich als „zusätzliche Informationen“ mittels eines Fragebogens ermittelt (Holler-Zittlau, Berger & Dux 2006). Im Folgenden werden zunächst die Beobachtungsverfahren im Hinblick auf die berücksichtigte Bandbreite pragmatischer Kompetenzen diskutiert. Im Anschluss werden die Instrumente zur Erfassung narrativer Kompetenzen mit einem Fokus auf die jeweiligen Elizitierungsverfahren und Auswertungsschwerpunkte untersucht.

4.2 Welche pragmatischen Kompetenzen werden beobachtet? Das Beobachtungsverfahren sismik (Ulich & Mayr 2006a, b) nimmt neben familialen Ressourcen sowie lexikalischen und morphologisch-syntaktischen Fähigkeiten auch pragmatische Kompetenzen in den Blick. Deskriptoren für pragmatische Kompetenzen finden sich vor allem im Teil „Sprachverhalten in verschiedenen Situationen“, und zwar in den Kategorien „Kind-Kind-Interaktionen Frühstück, Rollenspiel, Spielpartner in der Freispielzeit, Einzelgespräche mit pädagogischen Bezugspersonen, Gesprächsrunden/Stuhlkreis, Verständigungsprobleme/ Ausdrucksnot, Bilderbuchbetrachtung in der Kleingruppe, Vorlesen/Erzählen in der Kleingruppe, selbstständiger Umgang mit Bilderbüchern“. Weiterhin enthält der Teil „Sprachliche Kompetenz im engeren Sinne (deutsch)“ die Kategorie „Verstehen von Handlungsaufträgen/ Aufforderungen“. Das Erzählverhalten des Kindes wird in sismik in unterschiedlichen Kontexten und mit vertrauten und weniger vertrauten Interaktionspartnerinnen und -partnern betrachtet. So findet sich der Deskriptor „erzählt auf Deutsch verständlich von etwas, das der Gesprächspartner nicht kennt oder sieht (z. B. von zu Hause)“ in den Kategorien „am Frühstückstisch“ und „in Einzelgesprächen mit pädagogischen Bezugspersonen“. Auch im Zusammenhang mit Bilderbüchern wird das kindseitige Erzählen erfasst, etwa mit den Deskriptoren „versucht (auf Deutsch) einen Zusammenhang zwischen Bildern herzustellen, wird zum „Erzähler“ (Bilderbuchbetrachtung Kleingruppe)“ und „beteiligt sich am Gespräch über eine kurze Erzählung, die nicht durch Bilder/Gestik/Gegenstände veranschaulicht wird“. Erfasst werden dabei jeweils die Häufigkeiten („nie“, „sehr selten“, „selten“, „manchmal“, „oft“, „sehr oft“). Dennoch lassen die Items ein vergleichsweise umfassendes Bild kommunikativer Fähigkeiten entstehen: So werden als für die spätere Teilhabe an Unterrichtsgesprächen grundlegende Fähigkeiten (a) die Kommunikation mit unterschiedlichen Interaktionspartnerinnen und -partnern, (b) das Kommunizieren über situations-

Pragmatik

373

transzendierende Themen (Heller 2012) und (c) das Produzieren komplexerer Äußerungspakete (Quasthoff, Heller & Morek 2017) berücksichtigt. Eine wichtige Erweiterung wären Items, die die Selbstständigkeit bei der Realisierung solcher Äußerungspakete betreffen: Erzählt das Kind nur auf (explizite) Aufforderung hin oder auch initiativ (Kontextualisierungskompetenz)? Ist das Kind für die Realisierung seiner Erzählung auf strukturierende Nachfragen des Erwachsenen angewiesen oder stellt es das Geschehen ohne Zuhörerunterstützung kohärent und verständlich dar (Vertextungskompetenz)? Wenngleich sich narrative Kontextualisierungs- und Vertextungskompetenz durch Beobachtung sicherlich nicht detailliert erfassen lassen, würden doch die genannten Fragen zumindest ansatzweise Aufschluss über Kompetenzgrade geben. Vertextungs- und Kontextualisierungskompetenzen werden jedoch noch mit anderen Deskriptoren abgefragt: So verbergen sich hinter dem Item „beteiligt sich aktiv an Rollenspielen, die in deutscher Sprache ablaufen“ Kontextualisierungskompetenzen, nämlich die Fähigkeiten, mit sprachlichen Mitteln einen fiktionalen Kontext herzustellen, Rollenzuweisungen vorzunehmen und Als-ob-Handlungen zu vollziehen. Darüber hinaus werden mit dem Item „Kind kann ‚einfache‘/‚mehrschrittige‘ Handlungsanweisungen umsetzen, die es nur sprachlich verstehen kann“ Aspekte rezeptiver Vertextungskompetenz erfasst. Im Hinblick auf die Auswertung bleibt es vor allem dem Beobachtenden überlassen, Rückschlüsse auf die zugrundeliegenden Kompetenzen zu ziehen. Zwar werden Auswertungen an zwei Fallbeispielen vorgeführt, doch stellt sismik keine Grundlagen zur Verfügung, die eine Einordnung der Beobachtungen in zentrale Erwerbsdimensionen erlaubten. Ob sich die an die Beobachtung anschließende Förderung an Erwerbslogiken orientiert, hängt also weitgehend vom fachlichen Wissen der Beobachtenden ab. Neben der deskriptiven Kompetenzerfassung erlaubt sismik auch eine quantitative Auswertung. Grundlage ist der Vergleich eines Kindes mit Normwerten, die anhand einer Stichprobe von 2011 Kindern mit Migrationshintergrund (84 Nationalitäten, 56 Sprachgruppen) gewonnen wurden. Demirkaya, Gültekin-Karakoç & Settinieri (2009) und Settinieri (2012a) kommen jedoch zu dem Schluss, dass sismik nicht zu selektionsdiagnostischen Zwecken eingesetzt werden sollte. Wesentliche Gründe bestehen darin, dass die Formulierungen der Deskriptoren z. T. zu viel Interpretationsspielraum zulassen und die Skalen zudem keine verlässliche Ermittlung von Mittelwerten bei fehlenden Werten erlauben. Demnach ist sismik vor allem als förderdiagnostisches Instrument einzusetzen. Die Niveaubeschreibungen DaZ liegen für die Primarstufe (Döll & Reich 2010) und die Sekundarstufe I (Döll & Reich 2013) vor. Die analog aufgebauten Beobachtungsverfahren sollen Aufschluss über den Grad des Erreichens der Zielvorgaben der Bildungsstandards im Fach Deutsch geben und orientieren sich dementsprechend an den dort formulierten Kompetenzbereichen. Pragmatische und diskursive Kompetenzen werden im Teilbereich „Weite der sprachlichen Handlungs- und Verstehensfähigkeit“ erfasst. Er ist gegliedert in die vier Kategorien „private Gesprä-

374

Vivien Heller

che“, „Unterrichtsgespräche“, „Strategien zur Überwindung von Ausdrucksnot“ und „Freude und Interesse am Sprechen“. Jede Kategorie enthält eine Reihe von Deskriptoren, die einer Stufe von I–IV zugeordnet sind. Dabei entspricht Stufe IV den Zielvorgaben der KMK- Bildungsstandards im Fach Deutsch. Im Unterschied zu sismik werden hier also unterschiedliche Ausprägungen von Kompetenz erfasst. In der Kategorie „private Gespräche“ werden Fähigkeiten des Kindes auf dem Kontinuum zwischen elementaren Sprechhandlungen (Mitteilungen, Aufforderungen) und komplexeren Diskursfähigkeiten (Beschreiben, Erzählen, Argumentieren) verortet. Analog wird in der Kategorie „Unterrichtsgespräche“ verfahren, wobei hier auch unterrichtstypische diskursive Kompetenzen wie „Beobachtetes wiedergeben“ (Stufe III) und „Erklärungen“ und „Begründungen“ (Stufe IV) Berücksichtigung finden. Des Weiteren werden „Strategien zur Überwindung von Ausdrucksnot/Verstehensproblemen“ auf einem Kontinuum zwischen Ignorieren, Signalisieren und Beheben eingeordnet. „Freude und Interesse am Sprechen“ wird sowohl in Bezug auf die deutsche als auch die Herkunftssprache und differenziert nach Unterricht und privaten Situationen erfasst. Die Granularität der Deskriptoren ist vergleichsweise grobkörnig. So werden narrative, deskriptive, explanative und argumentative Kompetenzen nicht in ihren Qualitäten beobachtet, sondern lediglich im Hinblick auf ihr Vorkommen. Soll das Instrument auch förderdiagnostische Informationen zur Verfügung stellen, fragt sich, ob sich aus erwerbstheoretisch etwas stärker spezifizierten Deskriptoren (bspw. „kann mit Hilfe von Ergänzungs- und Elaborierungsfragen/ohne Zuhörerunterstützung einen Begriff/ein Vorgehen/einen kausalen Zusammenhang erklären“) konkretere Hinweise für die unterrichtliche Förderung ableiten ließen. Auf der anderen Seite liegt aber mit den Niveaubeschreibungen DaZ ein vergleichsweise zeitökonomisches Beobachtungsinstrument vor, das zudem auf unterrichtliche Diskursanforderungen zugeschnitten ist. Die USB DaZ (Fröhlich, Döll & Dirim 2014) sind im Unterschied zu den Niveaubeschreibungen DaZ schulstufenübergreifend für die unterrichts- und schullaufbahnbegleitende Beobachtung konzipiert. Sprachliche Handlungsfähigkeiten werden im Vergleich zu den Niveaubeschreibungen DaZ weniger genau beschrieben und auch nicht nach privaten, unterrichtlichen und formellen Kontexten differenziert.

4.3 Wie werden welche Erzählfähigkeiten erfasst? Die fünf Instrumente, die Erzählfähigkeiten mehrsprachiger Kinder und Jugendlicher erfassen (s. Tabelle 2), nutzen durchgängig Bildfolgen als Elizitierungsverfahren. Das Erzählen stellt dabei entweder eine Teilaufgabe innerhalb einer größeren Testbatterie (Delfin 4 von Fried 2008, Delfin 5 von Fried 2010, SFD von Hobusch, Lutz & Wiest 2017) bzw. eine von mehreren Auswertungsdimensionen im Rahmen einer umfänglicheren Profilanalyse dar (HAVAS 5 von Reich & Roth 2004; 2007) oder wird schwerpunktmäßig fokussiert (Praxismaterial Förderdiagnostik von Junk-

Pragmatik

375

Deppenmeier & Jeuk 2015; Jeuk & Reeb-Ramos 2013). Vor dem Hintergrund der in Kapitel 2 diskutierten Herausforderungen bei der Erfassung diskursiver Fähigkeiten sollen die vorliegenden Instrumente im Hinblick auf a) die Geeignetheit der Elizitierungsverfahren und b) die jeweiligen Auswertungsschwerpunkte untersucht werden. Bezüglich der Elizitierungsverfahren fällt auf, dass mehrere Instrumente auf die narrative Subgattung der Fabel rekurrieren. Da Fabeln nicht die für persönliche Erlebniserzählungen typische Komplikation (Labov & Waletzky 1967) oder einen Erwartungsbruch (Quasthoff 1980; Ehlich 1983)2 aufweisen, sondern an einem Einzelfall einen allgemeinen moralischen Satz exemplifizieren, stellen sie nicht nur recht spezielle Anforderungen an die Vertextung, sondern beruhen auch auf literarischem Wissen. Ob und wie die Leistungen bei dieser spezifischen Subgattung tatsächlich mit Leistungen beim Erzählen persönlicher Erlebnisse oder fantastischer Geschichten korrelieren (für die die meisten Erzählerwerbsbefunde vorliegen), müsste empirisch überprüft werden. Die Bildfolgen in Delfin 4/5 stellen dagegen Geschehen mit einem unerwarteten Ereignis oder Problem dar. Alle Instrumente verwenden Bildfolgen und setzen sich der o. g. Gefahr aus, Beschreibungen anstelle von Erzählungen zu elizitieren (vgl. Abschnitt 3.1.3 in diesem Beitrag). Durchgängig werden dem Kind bzw. Jugendlichen die Bilder vom Untersuchenden vorgelegt, so dass das Erzählen aus Sicht des Erzählers bzw. der Erzählerin keinen Neuigkeitswert für die Rezipienten haben kann und den Charakter einer Prüfung annimmt. Es ist zu erwarten, dass die Komplikation bzw. das Unerwartete oder affektive Bewertungen in abgeschwächter oder anderer Weise markiert werden (vgl. Rank 1995; Bredel 2001). Die vorgesehenen Impulse/Zugzwänge setzen das Erzählen zumeist in formaler Weise relevant (Hausendorf & Quasthoff 1996: 129); d. h. dass das Erzählen formal als Aktivität, nicht aber inhaltlich – hinsichtlich der Erzählwürdigkeit einer Begebenheit – an das laufende Gespräch anschlussfähig gemacht wird. Der Prüfcharakter des Erzählens wird dadurch verstärkt. Zudem steuern einzelne der genannten Zugzwänge eher in die diskursive Praktik des Beschreibens (z. B. „Was passiert hier?“, „Was siehst du auf diesem Bild?“). Wenn der Auswertung dann eine Orientierung an der erzähltypischen globalen Strukturierung (temporale Abfolge, Kontrast zwischen Normalität und ungewöhnlichem Ereignis) und Markierung (bspw. durch Wahl des Perfekts/Präteritums) zugrunde liegt, besteht die Gefahr, dass dem Kind eine Verwendung unangemessener/noch nicht voll entwickelter Strategien oder Ressourcen zugeschrieben wird, die tatsächlich aber durch das Elizitierungsverfahren bedingt sind. Fast alle Instrumente sehen Anschlussfragen vor, die darüber Aufschluss geben sollen, ob das Kind die Pointe oder die Makrostruktur der Geschichte verstanden

2 Vgl. aber Wagner (1986) und Becker & Stude (2017) zu Geflechterzählungen im Alltag, die nicht zwangsläufig eine Komplikation bzw. einen Erwartungsbruch aufweisen.

Bilderbuch mit 4 Bildern: Junge geht mit Regen spazieren, Schirm wird fortgeweht; Junge (mit nachdenklicher Mimik) findet Schirm, in dem nun eine Ente schwimmt. Die Bilder werden vor dem Erzählen betrachtet, so dass das Kind die Handlung antizipieren und die Erzählung entsprechend strukturieren kann.

Bilderbuch mit 4 Bildern: Fälschliche Beschimpfung eines Kindes für ein Missgeschick, das ein Hund verursacht hat, mit Aufdeckung, aber ohne Bild für die Auflösung. Bilder werden vor dem Erzählen betrachtet (s. o.).

Folge aus 6 Bildern: „Katze und Vogel“; Fabel vom Typ „Wer zuletzt lacht“ ohne Komplikation i. e. S. (Vogel wird von Katze beobachtet und gejagt; der Verfolger kommt nicht vom Baum hinunter und wird vom Verfolgten beobachtet.)

Delfin 4

Delfin 5

HAVAS 5

Bilder/Geschichtentyp

Protokollierung

Auswertungsschwerpunkte

Aufzeichnung; Protokollierung optional

Aufgabenbewältigung (Umfang der wiedergegebenen Handlungen) – Bewältigung der Gesprächssituation (Initiative während des Gesprächs, Kontinuität und Flüssigkeit des Sprechens, Deutlichkeit d. Aussprache) (außerdem: verbaler Wortschatz und Formen/Stellung d. Verbs)

–

Protokollierung der Auswertung bezogen auf gesamte ErzähÄußerungen des Kindes lung; Items zu: Bedienen des globalen Zugzwangs während des Erzählens – – Unterstützungsbedarf bei der Vertextung – Erkennen/Darstellen des Planbruchs – Pronominalisierung und syntaktische Komplexität – Redewiedergaben

Im Anschluss: „Warum weint Erhebung in der Erstdie Katze?“, „Was würdest und Zweitsprache du tun, wenn du die Katze wärst?“

„Was passiert hier?“ oder „Was ist hier los?“

„Erzähle mir die Geschichte so genau wie möglich. Fange jetzt an, mir die ganze Geschichte zu erzählen. Beginne am Anfang.“

„Jetzt kannst du mir die Protokollierung der Bildweise Auswertung Strukturierung der Erzählung (12 ganze Geschichte erzählen.“ Äußerungen des Kindes – Items zu globalstrukturellen und während des Erzählens syntaktischen Aspekten) Im Anschluss: – Sprachäußerung (6 Items zu phone„Was macht der Junge jetzt tisch-phonologischen, lexikalischen wohl?“ und syntaktischen Aspekten

Impulse

Tab. 2: Elizitierungsverfahren und Auswertungsschwerpunkte bei der Erfassung narrativer Kompetenzen in der L2.

376 Vivien Heller

Folge aus 5 Bildern zu fabelartiger Begebenheit (vom Typ „Wer zuletzt lacht“) ohne Planbruch i. e. S. (Eis essendes Mädchen wird von Jungen geschubst und lässt Eis fallen; beobachtet dann, wie der Junge auf einer Banane ausrutscht und hinfällt)

Folge aus 8 Bildern; Fabel vom Typ „Wer zuletzt lacht“ ohne Planbruch i. e. S. (Fuchs serviert Storch Suppe auf einem flachen Teller, so dass dieser mit dem Schnabel Suppe nicht aufnehmen kann. Danach umgekehrt.)

SFD

Praxismaterial Förderdiagnostik Im Anschluss: „Warum ist der Fuchs traurig?“ oder „Warum freut sich der Storch?“

„Ich habe eine Bildergeschichte mitgebracht. Was siehst du auf dem ersten Bild?“

Ggf. „Was passiert auf diesem Bild?“, „Kannst du mir noch etwas mehr dazu sagen?“

Transkription der Schüler- und Lehreräußerungen nach der Aufzeichnung

„Bitte erzähle mir zu diesen Aufzeichnung optional; Bildern eine Geschichte. Wie Protokollierung der fängt sie an, wie geht es Äußerungen des Kindes weiter, und wie endet sie?“

Umgang mit der Reihenfolge der Bilder – Bezug der Äußerungen zu den Bildern – Flüssigkeit des Sprechens – Verknüpfung der Äußerungen – Referenz – Initiative während des Gesprächs – Emotionale Markierung (sprachlich/ inhaltlich) – Beteiligung des Zuhörers – Strukturtyp nach Boueke & Schülein (1995) (außerdem: Auswertungsbögen zu Grammatik und Wortschatz)

–

Optional nach: – Pronomen – Konjugation, Verbstellung – Artikel – Präpositionen – Verwendung von Zeiten – Satzlänge – Nebensätze – Verständlichkeit – Inhaltliche Richtigkeit und Vollständigkeit – Aussprache

Pragmatik

377

378

Vivien Heller

hat. Diese Anschlussfragen stellen zugleich selbst schon wieder Zugzwänge in eine andere diskursive Praktik, nämlich die des Erklärens, dar. Sie geben somit Aufschluss über die Fähigkeit des Kindes, die für Unterrichtsgespräche außerordentlich typischen explanativen Zugzwänge zu erkennen (Kontextualisierungskompetenz). Der Umgang mit Anschlussfragen könnte also nicht nur in Bezug auf das Verstehen der Makrostruktur betrachtet, sondern auch unter dem Gesichtspunkt des Verstehens und Bedienens explanativer Zugzwänge diagnostisch nutzbar gemacht werden. Bezüglich der Protokollierung ist zentral, dass das „Mitschreiben“ während des Erzählens den Rezipienten daran hindert, die für das Erzählen konstitutiven Zuhöreraktivitäten zu realisieren. Die meisten Instrumente empfehlen deshalb eine Aufzeichnung und ggf. eine anschließende Protokollierung. Dabei werden allerdings in den meisten Fällen nur die Äußerungen des Untersuchten protokolliert. Nur ein Instrument (Praxismaterial Förderdiagnostik) sieht die Protokollierung der Äußerungen aller Interaktionsbeteiligten vor und nutzt diese für die Diagnostik (Jeuk & Reeb-Ramos 2013). Das dabei sichtbar werdende Ausmaß der erwachsenenseitigen Unterstützung („Beteiligung des Zuhörers“) ist grundlegend, um Rückschlüsse auf das Erkennen von Zugzwängen (Kontextualisierung) sowie auf die lokale vs. globalstrukturelle Vertextung ziehen zu können. Im Hinblick auf die Auswertung zeigt Tabelle 2, dass neben den spezifisch diskursiven Aspekten häufig vor allem phonetisch-phonologische oder morphologischsyntaktische Aspekte beurteilt werden (vgl. Blaschitz 2014: 40). In Bezug auf die Erfassung spezifisch diskursiver Kompetenzen fällt auf: – Die für den Umgang mit diskursiven Anforderungen grundlegende Kontextualisierungskompetenz findet nur bei Delfin 5 systematisch Berücksichtigung, indem der Umgang mit lokalen und globalen Zugzwängen erfasst wird. – Bei der Beurteilung der Vertextungskompetenz fokussieren einige Instrumente vor allem auf die Vollständigkeit bzw. den Umfang der wiedergegebenen Handlungen, nicht aber auf narrative Strukturierung um die Komplikation bzw. das unerwartete Ereignis. Delfin 4 sieht eine bildweise Auswertung vor, die für die Beurteilung der Vertextung globaler Zusammenhänge als kritisch zu beurteilen ist. Nur Delfin 5 und das Praxismaterial Förderdiagnostik untersuchen gezielt, ob das Kind eher lokal operierende Zugriffsweisen verwendet (und auf Elaborierungsfragen der Erwachsenen angewiesen ist) oder bereits global vertextet, d. h. einen größeren Zusammenhang kohärent darstellt. – Die Ebene sprachlicher Formen findet in allen Instrumenten die größte Berücksichtigung. Wie stark allerdings sprachliche Formen in Bezug auf ihre Funktionalität, als Markierungen also für narrative Strukturelemente (bspw. die Auflösung der Komplikation), erfasst werden, variiert. Die vergleichende Betrachtung der Elizitierungsverfahren und Auswertungsschwerpunkte offenbart die enormen Herausforderungen, vor der die Diagnostik diskursi-

Pragmatik

379

ver Kompetenzen steht. Eine Diagnostik, die auch Fähigkeiten der interaktiven Einbettung und der Markierung des Unerwarteten für den Zuhörer erfassen will, ist auf Settings angewiesen, in denen es aus Sicht der Beteiligten etwas Erzählenswertes gibt, in denen also die gattungsspezifischen Zwecke des Erzählens erkennbar werden. Als Desiderat ist zu formulieren, dass bei der Entwicklung von Instrumenten zukünftig unterschiedliche Settings exploriert werden sollten, um das Spannungsverhältnis zwischen Ökonomie und Vergleichbarkeit auf der einen Seite und interaktiv „funktionierendem“ Setting auf der anderen Seite aufzulösen. Als hilfreich könnte sich hier die gesprächsanalytische Untersuchung von in unterschiedlichen Settings und mit unterschiedlichen Stimuli generierten Erzähldaten erweisen.

4 Ausblick Die Untersuchung diagnostischer Verfahren zur Erfassung pragmatisch-diskursiver Kompetenzen mehrsprachiger Kinder und Jugendlicher zeigt, dass von den möglichen Verfahrensweisen (vgl. Abschnitt 3 in diesem Beitrag) vor allem Beobachtungsverfahren sowie das Elizitieren von Erzählungen mittels Bildern bzw. Bildfolgen genutzt werden. Damit ist die Bandbreite der pragmatisch-diskursiven Kompetenzen, die wir derzeit erfassen können, eingeschränkt. Es liegen bislang keine Instrumente für die Diagnostik der für die Unterrichtspartizipation und das fachliche Lernen hochgradig relevanten Erklär- und Argumentationskompetenz vor. Dies ist allerdings auch dem Umstand geschuldet, dass der Erwerb dieser Kompetenzen unter Bedingungen der Mehrsprachigkeit in der Erwerbsforschung bislang kaum Berücksichtigung fand. Wenngleich das Erzählen die erste diskursive Praktik ist, mit der sich junge Kinder produktiv auseinandersetzen, ist doch fraglich, ob Erzählfähigkeiten diskursive Kompetenzen in Gänze repräsentieren. Ein weiteres Desiderat ist mit Blick auf diagnostische Instrumente zu formulieren, die außerschulisch bzw. für die berufliche Bildung relevante Kompetenzen erfassen. Mit Fast Catch Bumerang (Reich, Roth & Döll 2009) liegt ein Analyseverfahren für schriftliche pragmatische Kompetenzen (Bewerbungsschreiben, Bauanleitung) vor; für mündliche pragmatische Kompetenzen ist dies jedoch nicht der Fall. Es besteht also nach wie vor ein erheblicher Forschungsbedarf, um auf empirischer Grundlage ein größeres Repertoire an diagnostischen Instrumenten entwickeln zu können. Diese sollten sowohl Kontextualisierungskompetenzen als auch gattungs- und fachspezifische Verfahren des Vertextens sowie die dafür erforderlichen sprachstrukturellen Mittel berücksichtigen. Möglicherweise könnte gerade in der Kombination von Online- und OfflineVerfahren, bspw. Beobachtung, DCTs und aufgabenbezogene/inszenierte Settings, eine Chance liegen, Dimensionen pragmatischer Kompetenz zugleich ökonomisch und in förderdiagnostisch informativer Weise zu erfassen.

380

Vivien Heller

Literatur Atkinson, Dwight (Hrsg.) (2011): Alternative approaches to second language acquisition. New York: Routledge. Auer, Peter (2009): Context and Contextualization. In Jef Verschueren & Jan-Ola Östman (Hrsg.): Key Notions for Pragmatics, 86–101. Amsterdam, Philadelphia: Benjamins. Bardovi-Harlig, Kathleen (2013): Developing L2 Pragmatics. Language Learning 63 (1), 68–86. Bardovi-Harlig, Kathleen & Zoltan Dörnyei (1998): Do Language Learners Recognize Pragmatic Violations? Pragmatic Versus Grammatical Awareness in Instructed L2 Learning. TESOL Quarterly 32 (2), 233–259. Becker, Tabea (2001): Kinder lernen erzählen. Zur Entwicklung der narrativen Fähigkeiten von Kindern unter Berücksichtigung der Erzählform. Baltmannsweiler: Schneider Hohengehren. Becker, Tabea & Juliane Stude (2017): Erzählen. Heidelberg: Universitätsverlag Winter. Becker-Mrotzek, Michael, Konrad Ehlich, Iris Füssenich, Hartmut Günther, Marcus Hasselhorn, Michaela Hopf, Stefan Jeuk, Drorit Lengyel, Uwe Neugebauer, Argyro Panagiotopoulou, Petra Stanat, Jürgen Wilbert (2013): Qualitätsmerkmale für Sprachstandsverfahren im Elementarbereich. Ein Bewertungsrahmen für fundierte Sprachdiagnostik in der Kita. Köln: Mercator Institut für Sprachförderung und Deutsch als Zweitsprache. Blaschitz, Verena (2014): Narrative Qualifizierung. Dimensionen ihrer Erfassung bei Kindern mit Deutsch als Zweitsprache. Münster: Waxmann. Bredel, Ursula (2001): Ohne Worte − Zum Verhältnis von Grammatik und Textproduktion am Beispiel des Erzählens von Bildergeschichten. Didaktik Deutsch 11, 4–21. Boueke, Dietrich; Frieder Schülein (1995): Wie Kinder erzählen. Untersuchungen zur Erzähltheorie und zur Entwicklung narrativer Fähigkeiten. München: Fink. Cekaite, Asta (2007): A Child’s Development of Interactional Competence in a Swedish L2 Classroom. Modern Language Journal 91 (1r), 45–62. Cekaite, Asta (2013): Child pragmatic development. In Carol Chapelle (Hrsg.), The encyclopedia of applied linguistics, 602–609. Malden, MA: Wiley-Blackwell. Cook, Haruko Minegichi (2002): Why can’t learners of JFL distinguish polite from impolite speech styles? In Gabriele Kasper & Kenneth R. Rose (Hrsg.), Pragmatic development in a second language, 80–102. Malden, MA: Blackwell. Cook-Gumperz, Jenny & John J. Gumperz (1976): Context in children’s speech. In dies.: Papers on Language and Context. Working Papers No. 46. Berkeley: Language Behavior Research Laboratory. Crystal, David (Hrsg.) (1997): The Cambridge encyclopedia of language. New York: Cambridge University Press. Demirkaya, Sevilen, Nazan Gültekin-Karakoç & Julia Settinieri (2009): Mit Sismik punkten? Zum quantitativen Einsatz des Beobachtungsbogens. In Bernt Ahrenholz (Hrsg.), Empirische Befunde zu DaZ-Erwerb und Sprachförderung, 43–62. Freiburg i. Br.: Fillibach. Dimroth, Christine (2012): Videoclips zur Elizitation von Erzählungen: Methodische Überlegungen und einige Erlebnisse am Beispiel der „Finite Story“. In Bernt Ahrenholz (Hrsg.), Einblicke in die Zweitspracherwerbsforschung und ihre methodischen Verfahren. Berlin, Boston: de Gruyter, 77–97. Döll, Marion & Hans H. Reich (2010): Niveaubeschreibungen Deutsch als Zweitsprache für die Primarstufe zur Beobachtung von Kompetenz und Kompetenzzuwachs im Deutschen als Zweitsprache. Erprobungsfassung. Kiel: IQSH. Döll, Marion & Hans H. Reich (2013): Niveaubeschreibungen. Deutsch als Zweitsprache für die Sekundarstufe I. Dresden: Sächsisches Bildungsinstitut. Dollnick, Meral & Carol W. Pfaff (2013): Entwicklung von Diskursorganisation in verschiedenen Sprachen: Einführung und Schluss in narrativen und erörternden Texten in Türkisch, Deutsch

Pragmatik

381

und Englisch bei Schülern mit türkischer Erstsprache in Berlin. In Tabea Becker & Petra Wieler (Hrsg.), Erzählforschung und Erzähldidaktik heute. Entwicklungslinien, Konzepte, Perspektiven, 147–162. Tübingen: Stauffenburg. Eisenstein, Miriam & Jean W. Bodman (1993): Expressing gratitude in American English. In Gabriele Kasper & Shoshana Blum-Kulka (Hrsg.), Interlanguage pragmatics, 64–81. New York: Oxford University Press. Ehlich, Konrad (1983): Alltägliches Erzählen. In Willy Sanders & Klaus Wegenast (Hrsg.), Erzählen für Kinder – Erzählen von Gott. Begegnungen zwischen Sprachwissenschaft und Theologie, 128– 50. Stuttgart: Kohlhammer. Ehlich, Konrad (Hrsg.) (2007): Anforderungen an Verfahren der regelmäßigen Sprachstandsfeststellung als Grundlage für die frühe und individuelle Förderung von Kindern mit und ohne Migrationshintergrund. Berlin, Bonn: Bundesministerium für Bildung und Forschung. Félix-Brasdefer, J. César (2004): Interlanguage Refusals: Linguistic Politeness and Length of Residence in the Target Community. Language Learning 54 (4), 587–653. Fried, Lilian (2008): Delfin 4. Diagnostik, Elternarbeit und Förderung der Sprachkompetenz Vierjähriger in NRW. Unter Mitarbeit von Eva Briedigkeit, Patrick Isele und Rabea Schunder. Düsseldorf: Ministerium für Schule und Weiterbildung NRW. Fried, Lilian (2010): Delfin 5. Unter Mitarbeit von Eva Briedigkeit und Rabea Schunder. Düsseldorf: Ministerium für Schule und Weiterbildung NRW. Fröhlich, Lisanne, Marion Döll, Inci Dirim (2014): Unterrichtsbegleitende Sprachstandsbeobachtung Deutsch als Zweitsprache. Wien: Bundesministerium für Bildung und Frauen. Garfinkel, Harold (1967): Studies in Ethnomethodology. Cambridge: Polity Press. Golato, Andrea (2003): Studying Compliment Responses. A Comparison of DCTs and Recordings of Naturally Occurring Talk. Applied Linguistics 24 (1), 90–121. Grabowski, Kirby C. (2016): Assessing pragmatic competence. In Dina Tsagari & Jayanti Banerjee (Hrsg.), Handbook of Second Language Assessment, 165–180. Boston, Berlin: de Gruyter. Grießhaber, Wilhelm (2010): Spracherwerbsprozesse in Erst- und Zweitsprache. Eine Einführung. Duisburg: Universitäts-Verlag Rhein-Ruhr. Guckelsberger, Susanne (2013): Zur Aneignung diskursiver Qualifikationen im Vor- und Grundschulalter − allgemein und am Beispiel einer Lagebeschreibung in der ersten Klasse. In Stefan Jeuk & Ingrid Schmid-Barkow (Hrsg.), Differenzen diagnostizieren und Kompetenzen fördern im Deutschunterricht, 21–41. Stuttgart: Fillibach bei Klett. Guckelsberger, Susanne & Hans H. Reich (2008): Diskursive Basisqualifikation. In Konrad Ehlich, Ursula Bredel & Hans H. Reich (Hrsg.), Referenzrahmen zur altersspezifische Sprachaneignung, 83–93. Berlin: Bundesministerium für Bildung und Forschung. Günthner, Susanne (2009): Intercultural communication and the relevance of cultural specific repertoires of communicative genres. In Helga Kotthoff & Helen Spencer-Oatey (Hrsg.), Handbook of intercultural communication, 127–152. Berlin: Mouton de Gruyter. Gumperz, John J. (1982): Discourse strategies. Cambridge: Cambridge University Press. Hall, Joan Kelly & Simona Pekarek-Doehler (2011): L2 Interactional Competence and Development. In Joan Kelly Hall, John Hellermann & Simona Pekarek Doehler (Hrsg.), L2 interactional competence and development, 1–15. Bristol, Buffalo: Multilingual Matters. Hall, Joan Kelly, John Hellermann, Simona Pekarek Doehlerr (Hrsg.) (2011), L2 interactional competence and development. Bristol, Buffalo: Multilingual Matters. Hassall, Tim (2003): Requests by Australian learners of Indonesian. Journal of Pragmatics 35 (12), 1903–1928. Hausendorf, Heiko & Uta M. Quasthoff (1996): Sprachentwicklung und Interaktion. Eine linguistische Studie zum Erwerb von Diskursfähigkeiten. Radolfzell: Verlag für Gesprächsforschung.

382

Vivien Heller

Heller, Vivien (2012): Kommunikative Erfahrungen von Kindern in Familie und Unterricht. Passungen und Divergenzen. Tübingen: Stauffenburg. Heller, Vivien (2013): Der Erwerb von Diskurskompetenz in multilingualen Kontexten: Ressourcen der interaktiven Unterstützung im „shared language space“. In Yvonne Decker-Ernst & Ingelore Oomen-Welke (Hrsg.), Deutsch als Zweitsprache: Beiträge zur durchgängigen Sprachbildung, 53–72. Stuttgart: Fillibach bei Klett. Heller, Vivien (2017): Mehrsprachigkeit in Familien. In Bernt Ahrenholz & Ingelore Oomen-Welke (Hrsg.), Deutschunterricht in Theorie und Praxis, Band 9: Deutsch als Zweitsprache, 41–53. Baltmannsweiler: Schneider Hohengehren. Heller, Vivien; Uta Quasthoff, Susanne Prediger & Anna Vogler (2017): Bildungssprachliche Praktiken aus professioneller Sicht: Wie deuten Lehrende Schülererklärungen und -begründungen? In Bernt Ahrenholz, Britta Hövelbrinks & Claudia Schmellentin (Hrsg.), Fachunterricht und Sprache in schulischen Lehr-/Lernprozessen, 139–160. Tübingen: Narr. Hickmann, Maya & Henriette Henriks (1999): Cohesion and anaphora in children’s narratives: a comparison of English, French, German, and Mandarin Chinese. Journal of Child Language 26 (2), 419–452. Hobusch, Anna, Nevin Lutz, Uwe Wiest (2017): Sprachstandsüberprüfung und Förderdiagnostik für Ausländer- und Aussiedlerkinder (SFD). 1. bis 4. Klasse. Buxtehude: Persen. Holler-Zittlau, Inge, Winfried Dux & Roswitha Berger (2006): Marburger Sprach-Screening für 4- bis 6-jährigeg Kinder (MSS). Ein Sprachprüfverfahren für Kindergarten und Schule. Horneburg: Persen. House, Juliane (1996): Developing Pragmatic Fluency in English as a Foreign Language. Routines and Metapragmatic Awareness. Studies in Second Language Acquisition 18 (02), 225–252. Jeuk, Stefan (2010): Analyse der diskursiven Basisqualifikationen bei mehrsprachigen und einsprachigen Kindern zum Zeitpunkt der Einschulung. In Martina Rost-Roth (Hrsg.), DaZSpracherwerb und Sprachförderung Deutsch als Zweitsprache, 123–139. Freiburg: Fillibach. Jeuk, Stefan; Irene Reeb-Ramos (2013): Konzeption eines Verfahrens im Bereich des mündlichen Erzählens. In Stefan Jeuk (Hrsg.), Sprachförderung und Förderdiagnostik in der Sekundarstufe I, 73–91. Stuttgart: Fillibach. Junk-Deppenmeier, Alexandra & Stefan Jeuk (2015): Praxismaterial Förderdiagnostik. Freiburg: Fillibach bei Klett. Jucker, Andreas H. (2009): Speech act research between armchair, field and laboratory. Journal of Pragmatics 41 (8), 1611–1635. Kasper, Gabriele & Merete Dahl (1991): Research Methods in Interlanguage Pragmatics. Studies in Second Language Acquisition 13 (02), 215–247. Kasper, Gabriele; Kenneth R. Rose (2002): Pragmatic development in a second language. Malden, MA: Blackwell. Kasper, Gabriele & Steven Ross (2013): Assessing second language pragmatics: An overview and introductions. In Steven Ross & Gabriele Kasper (Hrsg.), Assessing second language pragmatics, 1–40. Basingstoke, New York: Palgrave Macmillan. Kern, Friederike (2011): Der Erwerb kommunikativer Praktiken und Formen − Am Beispiel des Erzählens und Erklärens. In Stephan Habscheid (Hrsg.), Textsorten, Handlungsmuster, Oberflächen. Linguistische Typologien der Kommunikation, 231–253. Berlin, New York: de Gruyter. Knapp, Werner (2001): Erzähltheorie und Erzählerwerb. Didaktik Deutsch 10, 26–48. Kuhn, Deanna & Wadiya Udell (2003): The Development of Argument Skills. Child Development 74 (5), 1245–1260. Labov, William (1972) Sociolinguistic Patterns Oxford: Blackwell. Labov, William & Joshua Waletzky (1967): Narrative Analysis. Oral Versions of Personal Experience. In: June Helm (Hrsg.), Essays on the verbal and visual arts, 12–44. Seattle: University of Washington Press.

Pragmatik

383

Leech, Geoffrey (1983). Principles of pragmatics. London: Longman. Levinson, Stephen C. (1983): Pragmatics. Cambridge, UK: Cambridge University Press. Luckmann, Thomas (1986): Grundformen der gesellschaftlichen Vermittlung des Wissens: Kommunikative Gattungen. Kölner Zeitschrift für Soziologie und Sozialpsychologie 27, 191–211. McNamara, Tim & Carsten Roever (2006): Language Testing: The Social Dimension. Malden, MA, Oxford: Blackwell. Mehlem, Ulrich (2013): Literate und narrative Textgestaltung in der Zweitsprache zwischen Mündlichkeit und Schriftlichkeit − Grundschüler türkischer Herkunftssprache erzählen einen Stummfilm auf Deutsch. In Arnulf Deppermann (Hrsg.), Das Deutsch der Migranten, 339–367. Berlin: de Gruyter. Mey, Jacob L. (2001): Pragmatics: an introduction. Oxford: Blackwell. Mezger, Verena, Christoph Schroeder & Yazgül Simsek (2014): Elizitierung von Lernersprache. In Julia Settinieri, Sevilen Demirkaya & Alexis Feldmeier (Hrsg.), Empirische Forschungsmethoden für Deutsch als Fremd- und Zweitsprache. Eine Einführung, 73–86. Paderborn: Ferdinand Schöningh. Michaels, Sarah & Courtney B. Cazden (1986): Teacher/Child Collaboration as Oral Preparation for Literacy. In Bambi B. Schieffelin & Perry Gilmore (Hrsg.), The Acquisition of Literacy: Ethnographic Perspectives, 132–154. Norwood, NJ: Ablex Press. Morris, Charles (1938): Foundations of the theory of signs. In Otto Neurath, Rudolf Carnap & Charles Morris (Hrsg.), International encyclopedia of unified science, 77–138. Chicago: University of Chicago Press. O’Neill, Daniela K. (2014): Assessing pragmatic language functioning in young children: Its importance and challenges. In Danielle Matthews (Hrsg.), Pragmatic Development in First Language Acquisition, 363–286. Amsterdam, Philadelphia: John Benjamins. Pfaff, Carol W. (2001): The development of co-constructed narratives by Turkish children in Germany. In Ludo Verhoeven & Sven Strömqvist (Hrsg.), Narrative development in a multilingual context, 153–187. Amsterdam, Philadelphia: John Benjamins. Quasthoff, Uta M. (1980): Erzählen in Gesprächen. Linguistische Untersuchungen zu Strukturen und Funktionen am Beispiel einer Kommunikationsform des Alltags. Tübingen: Narr. Quasthoff, Uta M. (2011): Diskurs- und Textfähigkeiten: Kulturelle Ressourcen ihres Erwerbs. In Ludger Hoffmann, Kerstin Leimbrink & Uta M. Quasthoff (Hrsg.): Die Matrix der menschlichen Entwicklung, 210–251. Berlin: de Gruyter. Quasthoff, Uta, Lilian Fried, Nitza Katz-Bernstein, Anke Lengning, Anja Schröder & Juliane Stude (2011): (Vor)Schulkinder erzählen im Gespräch. Kompetenzunterschiede systematisch erkennen und fördern. Baltmannsweiler: Schneider Hohengehren. Quasthoff, Uta M. & Vivien Heller (2014): Mündlichkeit und Schriftlichkeit aus sprachwissenschaftlicher und sprachdidaktischer Sicht: Grundlegende Ein-/Ansichten und methodische Anregungen. In Astrid Neumann & Isabel Mahler (Hrsg.), Empirische Methoden in der Deutschdidaktik: Audio- und videografierende Unterrichtsforschung, 6–37. Baltmannsweiler: Schneider Hohengehren. Quasthoff, Uta M. & Miriam Morek (2015): Diskursive Praktiken von Kindern in außerschulischen und schulischen Kontexten. Abschlussbericht. Dortmund. Quasthoff, Uta M.; Heller, Vivien; Morek, Miriam (2017): On the sequential organization and genre-orientation of discourse units in interaction. An analytic framework. Discourse Studies 19 (1), 84–110. Rank, Bernhard (1995): Wege zur Grammatik und zum Erzählen. Grundlagen einer spracherwerbsorientierten Deutschdidaktik. Baltmannsweiler: Schneider Hohengehren. Ricart Brede, Julia (2014): Beobachtung. In Julia Settinieri, Sevilen Demirkaya & Alexis Feldmeier (Hrsg.), Empirische Forschungsmethoden für Deutsch als Fremd- und Zweitsprache. Eine Einführung, 137–146. Paderborn: Ferdinand Schöningh.

384

Vivien Heller

Rehbein, Jochen (2007): Erzählen in zwei Sprachen − eine Anforderung. In Katharina Meng, Jochen Rehbein & Lev S. Vygotskij (Hrsg.), Kindliche Kommunikation − einsprachig und mehrsprachig. Mit einer erstmals auf Deutsch publizierten Arbeit von Lev S. Vygotskij zur Frage nach der Mehrsprachigkeit im kindlichen Alter, 393–459. Münster: Waxmann. Reich, Hans H. (2007): Forschungsstand und Desideratenaufweis zu Migrationslinguistik und Migrationspädagogik für die Zwecke des „Anforderungsrahmens“. In: Konrad Ehlich (Hrsg.), Anforderungen an Verfahren der regelmäßigen Sprachstandsfeststellung als Grundlage für die frühe und individuelle Förderung von Kindern mit und ohne Migrationshintergrund, 121–169. Berlin: Bundesministerium für Bildung und Forschung. Reich, Hans H. & Hans-Joachim Roth (2004): Hamburger Verfahren zur Analyse des Sprachstands Fünfjähriger − HAVAS 5. Landesinstitut für Lehrerbildung und Schulentwicklung Hamburg. Reich, Hans H. & Hans-Joachim Roth (2007): HAVAS 5 − das Hamburger Verfahren zur Analyse des Sprachstands bei Fünfjährigen. In Hans H. Reich, Hans-Joachim Roth & Ursula Neumann (Hrsg.), Sprachdiagnostik im Lernprozess. Verfahren zur Analyse von Sprachständen im Kontext von Zweisprachigkeit, 71–94. Münster: Waxmann. Reich, Hans H., Hans-Joachim Roth & Marion Döll (2009): Fast Catch Bumerang: Auswertungshinweise, Sprachimpuls und Auswertungsbogen. In Drorit Lengyel, Hans H. Reich, Hans-Joachim Roth & Marion Döll (Hrsg.), Von der Sprachdiagnose zur Sprachförderung, 207–242. Münster: Waxmann. Sacks, Harvey (1995): Lectures on conversation. Malden, MA: Blackwell. Schegloff, Emanuel A. (2007): Sequence organization in interaction. Cambridge: Cambridge Univ. Press. Schegloff, Emanuel A. (2010): Discourse as an Interactional Achievement III: The Omnirelevance of Action. In Deborah Schiffrin, Deborah Tannen & Heidi Ehernberger Hamilton (Hrsg.), The handbook of discourse analysis, 229–249. Malden, MA: Blackwell. Schegloff, Emanuel A. & Harvey Sacks (1973): Opening Up Closings. Semiotica 8, 289–327. Schroeder, Christoph & Wilfried Stölting (2005): Mehrsprachig orientierte Sprachstandsfeststellungen für Kinder mit Migrationshintergrund. In Ingrid Gogolin, Ursula Neumann & Hans-Joachim Roth (Hrsg.), Sprachdiagnostik bei Kindern und Jugendlichen mit Migrationshintergrund, 59–74. Münster: Waxmann. Settinieri, Julia (2012a): Zur Messgüte sprachstandsdiagnostischer Verfahren im Vorschulalter. Erste Ergebnisse der Korrelationsstudie Sismik/Seldak – Delfin 4. In Bernt Ahrenholz & Werner Knapp (Hrsg.), Sprachstand erheben – Spracherwerb erforschen, 35–52. Freiburg im Breisgau: Fillibach. Settinieri, Julia (2012b): Möglichkeiten und Grenzen der Prüfung konvergenter Validität sprachstandsdiagnostischer Verfahren. In Bernt Ahrenholz (Hrsg.): Einblicke in die Zweitspracherwerbsforschung und ihre methodischen Verfahren. Berlin, Boston: de Gruyter, 325–348. Slabakova, Roumyana (2013): Discourse and pragmatics. In Julia Rogers Herschensohn & Martha Young-Scholten (Hrsg.), The Cambridge handbook of second language acquisition, 482–504. New York: Cambridge University Press. Trautmann, Caroline & Hans H. Reich (2008): Pragmatische Basisqualifikationen I und II. In Konrad Ehlich, Ursula Bredel & Hans H. Reich (Hrsg.), Referenzrahmen zur altersspezifische Sprachaneignung, 41–48. Berlin: Bundesministerium für Bildung und Forschung. Trosborg, Anna (1995): Interlanguage pragmatics: Requests, complaints, and apologies. Berlin, Boston: Mouton de Gruyter. Yuan, Yi (2001): An inquiriy into empirical pragmatics data-gathering methods: Written DCTs, oral DCTs, field notes, and natural conversations. Journal of Pragmatics 33, 271–292. Ulich, Michaela & Toni Mayr (2006a): SISMIK − Sprachverhalten und Interesse an Sprache bei Migrantenkindern in Kindertageseinrichtungen. Begleitheft zum Beobachtungsbogen SISMIK. Überarbeitete Aufl. Freiburg im Breisgau: Herder.

Pragmatik

385

Ulich, Michaela & Toni Mayr (2006b): SISMIK − Sprachverhalten und Interesse an Sprache bei Migrantenkindern in Kindertageseinrichtungen. Beobachtungsbogen. Überarbeitete Aufl. Freiburg im Breisgau: Herder. Wagner, Klaus R. (1986): Erzähl-Erwerb und Erzählungs-Typen. Wirkendes Wort 36 (2), 142–156. Wildner-Basset, Mary E. (1989): Coexisting discourse worlds and the study of pragmatic aspects of learner’s interlanguage. In Wieslaw Oleksy (Hrsg.), Contrastive pragmatics, 251–275. Amsterdam, Philadelphia: John Benjamins.

Sylwia Adamczak-Krysztofowicz und Christiane Limbach

16 Hören 1 2 3 4 5

Einleitung Hören, Hörverstehen, Hörverstehenskompetenz: Klärung grundlegender Begriffe Gesichtspunkte für die Diagnostik der Hörverstehenskompetenz im Deutschen als Zweitsprache Überblick über bereits entwickelte hörverstehensdiagnostische Verfahren für DaZ Fazit und Ausblick

1 Einleitung Der vorliegende Beitrag hat zum Ziel, die Teilkompetenzdiagnostik Hören im Bereich Deutsch als Zweitsprache (DaZ) im Hinblick auf sprachdiagnostische Verfahren genauer zu untersuchen. Diesbezüglich soll zunächst eine Abgrenzung zwischen den grundlegenden Begriffen „Hören“, „Hörverstehen“ (HV) und „Hörverstehenskompetenz“ erfolgen. Ausgehend von dieser Begriffsklärung soll dann auf unterschiedliche Gesichtspunkte für die Diagnostik im Bereich Hörverstehenskompetenz für Deutsch als Zweitsprache eingegangen werden. Der Schwierigkeitsgrad von Sprachstandsfeststellungsverfahren im Bereich des verstehenden Hörens ist von den gewählten Hörtexten, von den jeweilig zu diesen Hörvorlagen gestellten Hörverstehenstestaufgaben und von den zu ihrer Lösung erforderlichen Hörstilen abhängig.1 Daher werden in Abschnitt 3 des vorliegenden Beitrags unterschiedliche Hör(seh)texte klassifiziert, die mit verschiedenen Verstehensabsichten (Hörstilen) zu rezipieren sind und in diesem Zusammenhang jeweils andere Hörverstehensaufgaben nach sich ziehen. Anschließend soll in Abschnitt 4 dieses Beitrages auf die bereits bestehenden Sprachstandsfeststellungsverfahren für Deutsch als Zweitsprache genauer eingegangen werden. Der Beitrag endet mit Schlussfolgerungen zu Sprachstandsfeststellungsverfahren für die Teilkompetenzdiagnostik des verstehenden Hörens und den Forschungsdesiderata.

2 Hören, Hörverstehen, Hörverstehenskompetenz: Klärung grundlegender Begriffe Im Hinblick auf die Überprüfung des zweitsprachlichen Hörverstehens ist die Klärung grundlegender mit dem Hörverstehensprozess eng verbundener Begriffe von zentraler Bedeutung. 1 Die differenzierten Hörverstehensaufgaben legen die Hörstile fest, welche die DaZ-Lernenden bei der Teilkompetenzdiagnostik im Bereich Hören zu verfolgen haben. https://doi.org/10.1515/9783110418712-016

388

Sylwia Adamczak-Krysztofowicz und Christiane Limbach

In der aktuellen kognitionswissenschaftlichen Verstehensforschung wird Hörverstehen als ein mehrdimensionaler, konstruktiver und interaktiver Prozess der zweiseitigen (bottom-up- und top-down-gesteuerte Dekodierungsprozesse) Textverarbeitung aufgefasst, bei dem die Informationen aus dem Text mit denen aus dem Erfahrungs- und Wissensspeicher im Langzeitgedächtnis des Textrezipienten (Schemakenntnisse) verknüpft werden (vgl. hierzu das zweitsprachliche Verstehensmodell von Wolff 2002: 294). Um dem Textinhalt Bedeutung zuzuweisen, werden auf allen ineinander wirkenden Ebenen bzw. Stufen des Hörverstehensvorgangs horizontale (Inferenzen und Elaborationen) sowie vertikale Verarbeitungsteilprozesse (Auslassungen, Generalisierungen, Selektionen und Konstruktionen) wirksam (zur Modellierung des Hörverstehensprozesses in der Mutter- und Fremdsprache vgl. Adamczak-Krysztofowicz 2009a: Kap. 2 und Pabst-Weinschenk 2012: 94–95). Der Prozess des verstehenden Hörens beginnt mit dem Hören (also der Fähigkeit des Hörers, akustische Signale einer Sprache zu registrieren und aufgrund der Leistungen bestimmter Gehirnteile zu diskriminieren) und führt zum Textverstehen als einer komplexen, aktiven, dynamischen und evaluierenden mentalen Handlung, welche die Bedeutungszuordnung, Sinnentnahme und Interpretation von sprachlichen Äußerungen einschließt. Beim gegenwärtigen Forschungsstand ist davon auszugehen, dass diese Teilschritte daten- und wissensgeleitet sowie rekursiv und inkrementell verlaufen, wobei empirische Befunde über deren Gewichtung und zeitliche Verteilung noch ausstehen. Das Hörverstehen ist in eine Reihe von situativen Faktoren eingebettet und muss daher im Rahmen eines Kommunikationssystems und seiner Komponenten (wie Kommunikationspartner und deren Rollen und Absichten) immer als Hörhandlung analysiert werden. Die auditive Textverarbeitung ist darüber hinaus ein individueller Prozess, der von vorhandenen unterschiedlichen Sprach-, Text- und Sachkenntnissen in der Erst-, Zweit- und Fremdsprache (in Form von frames und scripts, vgl. hierzu Zydatiß 2005: 98–99), individuellen Verstehensabsichten, eingesetzten Verstehensstrategien sowie vielen anderen lernerbezogenen psychologischen Faktoren, wie z. B. der Gedächtnisleistung, der Aufmerksamkeitsrichtung etc., beeinflusst wird. Dies hat Konsequenzen für die Diagnostik der Hörverstehenskompetenz, die laut Buck (2001: 103) aus der sprachlichen2 und aus der strategischen3 Kompetenz besteht. Die hier aus Platzgründen nur kurz erwähnten erwarteten Teilfähigkeiten der zweit-/fremdsprachlichen Hörverstehenskompetenz sind sowohl im Gemeinsamen

2 Der sprachliche Kompetenzbereich schließt neben der grammatischen und der lexikalischen Kompetenz auch das Diskurswissen sowie das soziolinguistische und das pragmatische Sprachwissen mit ein (zur Vertiefung vgl. Buck 2001:102–111 und Elsner 2007: 107). 3 Die strategische Kompetenz bezieht sich dagegen auf Prozesse der Informationsverarbeitung, bei denen sowohl kognitive als auch metakognitive Strategien aktiviert werden (zur Vertiefung vgl. Buck 2001:102–111).

Hören

389

Europäischen Referenzrahmen für Sprachen (GER; Europarat 2001) als auch in den aktuellen Veröffentlichungen zur Sprachstandsüberprüfung von Hörverstehen (vgl. z. B. das für die DESI-Studie entwickelte Testkonstrukt zum Hörverstehen, besprochen bei Nold & Rossa 2007) ersichtlich und lassen bereits an dieser Stelle die vielfältigen Dimensionen erkennen, die bei der Diagnostik der auditiven bzw. audiovisuellen Kompetenz4 (beide wurden in den Bildungsstandards der KMK 2012 als obligatorische Prüfungsbestandteile verankert) bei der breit gefächerten DaZ-Zielgruppe5 mit unterschiedlichem Alter, Bildungsgrad und Sprachniveau als grundlegend erachtet werden sollten.

3 Gesichtspunkte für die Diagnostik der Hörverstehenskompetenz6 im Deutschen als Zweitsprache Für zielbezogene diagnostische Festlegungen im Deutschen als Zweitsprache7 sind Entscheidungen bezüglich der einzusetzenden auditiven und audiovisuellen Textsorten erforderlich. Da in der Realität Texte mit verschiedenen Verstehensabsichten rezipiert werden, sind bei der differenzierten Lernzielbestimmung darüber hinaus konkrete Überlegungen hinsichtlich der zu stellenden Aufgaben und zu den zu ihrer Bearbeitung erforderlichen Hörstilen sowie der mit ihnen verbundenen kognitiven Verarbeitungsvorgänge unentbehrlich. Aus diesem Grunde werden im Folgenden die wichtigsten Hörstile, Hör(seh)texte und Höraufgaben charakterisiert, die ursprünglich aus dem fremdsprachenunterrichtlichen Kontext stammen und die bei der Teilkompetenzdiagnostik des Hörverständnisses bei DaZ-Lernenden in Frage kommen könnten.

3.1 Hörstile Bei den Sprachstandsfeststellungsverfahren im Bereich des verstehenden Hörens sollen mehrere Hörstile berücksichtigt werden, welche die Lernenden zu kompeten-

4 Mehr Informationen zum Hör-Sehverstehen als bild- und zeichengestütztem Hörverstehen liefert Badstübner-Kizik (2016), der wir an dieser Stelle für die Revision des vorliegenden Beitrags herzlich danken möchten. Zur Überprüfung des Hör-Sehverstehens im fremdsprachlichen Kontext wird auf Grotjahn & Kleppin (2015: 88–91) sowie Grotjahn & Porsch (2016) verwiesen. 5 Zu ihrer Charakteristik vgl. u. a. Riemer (2009: 367). 6 Die Ausführungen in Abschnitt 3 beruhen in Teilen auf Adamczak-Krysztofowicz (2009a: Kap. 3) und Adamczak-Krysztofowicz (2009b). 7 Für eine kurze Zusammenfassung weniger empirischer Ergebnisse zum Hörverstehen in Deutsch als Zweitsprache vgl. Eckhardt (2008: 258–260).

390

Sylwia Adamczak-Krysztofowicz und Christiane Limbach

ten Teilhabern an zielsprachiger Kommunikation befähigen und extensives globales, dann zunehmend selektives und stellenweise auch intensives Hören (vgl. hierzu Dahlhaus 1994: 79; Eggers 1996: 20; Wiemer 1999: 37) voraussetzen: – extensives Hören, bei dem zentrale Informationen des Textes genügen, um die Gesamtaussage richtig zu verstehen, umfasst folgende drei Hörstile: – globales (= kursorisches, hauptsinnerfassendes) Hören bezeichnet einen Hörstil, bei dem die Hauptaussagen eines Textes zu verstehen sind. Relevant dabei ist die Konzentration auf die Makrostruktur, das Erkennen des Themas oder der agierenden Personen, das Erfassen der Hörsituation, das Identifizieren der Intention und der Gesamtaussage, Einblick in die Textstruktur sowie Erkennen der Schlüsselbegriffe. Vereinfachend wirkt bei diesem Hörverhalten eine gute Strukturierung des Hörtextes. Da das globale Hören der ersten Orientierung dienen soll, werden bei der Überprüfung dieser Hörstrategie am häufigsten folgende Fragen gestellt: Um welche Textsorte handelt es sich? Wie ist der Text gegliedert? Wer spricht zu wem? Worüber wird gesprochen? Was ist passiert? – selektives Hören, bei dem es um das rasche Auffinden von bestimmten Informationen geht. Die Konzentration des Hörenden kann dabei auf punktuelle Daten, Eigennamen oder Zahlen gelenkt werden, aber auch auf bestimmte Definitionen, Pro- und Contra-Argumente sowie konkrete Thesen und Fakten. Bei Übungen zum selektiven Hörverstehen werden häufig solche Textsorten wie Wetterberichte, Verkehrsdurchsagen, Hörerumfragen, Nachrichten auf dem Anrufbeantworter oder kurze Ansagen (z. B. am Bahnhof oder im Kaufhaus) eingesetzt. – selegierendes Hören, bei dem sich die Auswahl von wesentlichen Inhaltsinformationen an dem subjektiven Interesse des Hörers orientiert. Diese Art des Hörens kommt deshalb authentischen monologischen und dialogischen Hör- und Sprechanlässen im Alltag besonders nahe, kommt allerdings in den Sprachstandsfeststellungsverfahren relativ selten vor. – intensives Hören, bei dem alle der Hörvorlage entnommenen Informationen relevant sind. Um die Gesamtaussage zu verstehen, müssen auch einzelne inhaltliche Details (z. B. Zahlenangaben, Namen oder Einzelinformationen) herausgehört werden. Bei dieser Art des Hörens sollen sowohl die Makro- als auch die Mikrostruktur des Textes sowie logische Relationen, Modalaussagen und Sprecherintentionen erfasst werden. Um die Einzelheiten richtig zu verstehen, muss man den Text also gleichzeitig auch global hören und verstanden haben. Es ist daher gutes Sprachwissen und Sprachkönnen erforderlich, weil die Details nicht nur den Inhalt, sondern auch Grammatik, Lexik, Phraseologie und Intonation umfassen können. Intensives Hören wird in der Fachterminologie daher auch als detailliertes bzw. synthetisches oder totales Hören (auch/inkl. reflektierendes Verstehen) bezeichnet. Die gerade genannten Hörstile richten sich nach den Hörtexten, die den Schwierigkeitsgrad der Hörverstehensüberprüfung in besonderem Maße bestimmen. Daher

Hören

391

sollen die bei der Diagnostik des Hörverständnisses8 in Frage kommenden auditiven (und audiovisuellen) Textsorten sowie die an ihre Auswahl gestellten Forderungen im nächsten Abschnitt fokussiert werden.

3.2 Hörtexte In der gesichteten Fachliteratur zu Möglichkeiten der Klassifizierung von gesprochenen Textsorten werden leider keine konkreten Vorschläge hinsichtlich einer speziellen Typologie im Hinblick auf die Diagnostik des Hörverständnisses thematisiert. Aus diesem Grunde werden wir uns im Folgenden in Anlehnung an einen weit gefassten integrativen Textbegriff auf sechs komplexe textbezogene Klassifikationsund zugleich Auswahlkriterien aus der fremdsprachlichen Didaktik stützen müssen. Hierzu gehören: textuelle Realisierung, Präsentationsform, Textsortenmerkmale, Form der Mündlichkeit, Authentizitätsgrad sowie Schwierigkeitsgrad. – Form der medialen Mündlichkeit bzw. Schriftlichkeit 9: In Bezug auf dieses Kriterium kann folgender Katalog von den bei der Förderung und Überprüfung des verstehenden Hörens einsetzbaren auditiven Texten vorgelegt werden: – auditive Texte, die eine einkanalige auditive Textverarbeitung in den Fokus nehmen (z. B. bei der Arbeit mit aufgezeichneten Interviews, Nachrichten, Durchsagen etc.); – Hörsehtexte (audiovisuelle Texte), für die es charakteristisch ist, dass die gesprochenen Texte mit parallel gezeigten Bildern in einen Zusammenhang gebracht werden müssen, um die Bedeutung zu konstituieren; – auditive Texte in Kombination mit Schrifttexten, zu denen beispielsweise Lieder auf einer CD gehören, denen der Text beigelegt ist oder vorgetragene Dichtung bzw. literarische Kleinformen mit Text (Hörbücher). Die Arbeit mit den genannten Mischformen von Hörtexten umfasst die simultane Verarbeitung von auditiven und geschriebenen Informationen und ermöglicht die Hilfestellung des Leseverstehens bei der Aufgabenlösung im Bereich des verstehenden Hörens; – Hörsehtexte in Kombination mit Schrifttexten: Bei dieser Gruppe handelt es sich um Hörvorlagen, bei denen Ton, Bild und geschriebene Sprache als parallele Bestandteile in einem Textverarbeitungsprozess auftreten (z. B. Filme mit Untertiteln, Musikclips mit Liedtext etc.).

8 Bickes differenziert zwischen „Hörverstehen als einem durch auditiven Input ausgelösten Verarbeitungsprozess und Hörverständnis als dem hieraus resultierenden Bewusstseinsinhalt“ (1996: 151). Seiner Ansicht nach ist nur das über andere sprachliche bzw. nichtsprachliche Tätigkeiten vermittelte Hörverständnis nachvollziehbar und dadurch überprüfbar. 9 Ausführlicher zu diesem Thema vgl. Koch & Oesterreicher (1985: 22–23).

392

Sylwia Adamczak-Krysztofowicz und Christiane Limbach

An dieser Liste zeigt sich, dass in den Mischformen von auditiven Texten mehrere Informationen parallel und rasant erschlossen werden müssen (Mehrfachkodierung der Kombination von Bild, Sprache und Geräuschen). Trotz des technischen und zeitlichen Aufwands sollte der Einsatz von Hörsehtexten (z. B. von diversen Fernsehbeträgen), der mit visuellen Stimuli (z. B. unter Tonabschaltung) zur Herausbildung und Weiterentwicklung einer Hörererwartung erheblich beiträgt und einen intensiven Einblick in die fremdsprachige Kultur gewährt, die bewährten Formen der herkömmlichen Hörverstehens-(HV)-Teilkompetenzdiagnostik regelmäßig vervollständigen. – Anzahl der Sprecher: In Anlehnung an Hüllen (1977: 35) können nach diesem Kriterium drei Gruppen von Hörtexten unterschieden werden und zwar: – monologische Hörtexte: Zu dieser Gruppe zählen vor allem Kurzmeldungen im Radio, Werbung, Präsentationen, Berichte, Kommentare, Reportagen, Vorträge, Nachrichten etc. – dialogische Hörtexte: Dazu gehören Telefonanrufe, Interviews, an denen zwei Gesprächspartner beteiligt sind oder Dialoge aus Filmen oder Theaterstücken etc. – multilogische Hörtexte: Zu dieser Gruppe zählen Gruppeninterviews, Talkshows, Unterhaltungen, Diskussionen etc. Grundsätzlich sollten alle unterschiedenen Präsentationsmodalitäten in förderdiagnostischen Verfahren zum Tragen kommen, wobei hinsichtlich des Schwierigkeitsgrades auf den anfänglichen Sprachniveaus zuerst den monologischen Hörtexten, dann den dialogischen und im letzten Schritt den multilogischen Hörtexten der Vorzug zu geben ist. – Form der textsortenspezifischen Mündlichkeit bzw. Schriftlichkeit: In Anlehnung an Glaboniat (2008: 58–61) kann man bei der Typologisierung von Hörtexten von den Unterschieden zwischen geschriebener und gesprochener Sprache ausgehen und folglich drei Gruppen von Hörtexten unterscheiden: – nicht spontan gesprochene Hörtexte: Unter diese Kategorie fallen alle Texte, die zuerst geschrieben wurden und erst dann vorgelesen bzw. auswendig aufgesagt werden. Wegen ihrer geringen Redundanz und der daraus folgenden hohen Informationsdichte können solche Hörtexte (wie auf Tonträger gesprochene Literatur (Hörbücher) oder Vorlesungen) einerseits den Rezeptionsprozess beeinträchtigen. Andererseits können sie aber durch ihre sprachliche Korrektheit und thematische Geschlossenheit das verstehende Hören erleichtern; – vorbereitet spontan gesprochene Hörtexte: Zu dieser Zwischenkategorie gehören Interviews, Reden, Ansprachen, Nachrichten oder Debatten, die zum einen auf Grund der Vorbereitungsmöglichkeit des Sprechers strukturiert, kontrolliert und durchdacht sind, zum anderen durchweg die Besonderheiten der spontan gesprochenen Sprache enthalten (wie Wiederholungen, Betonungen, Gliederungssignale oder Denkpausen etc.);

Hören

–

393

unvorbereitet spontan gesprochene Hörtexte: Dieser Gruppe sind diverse Alltagsgespräche zuzuordnen, die durch Lexik aus dem Bereich der gesprochenen Umgangssprache, grammatische Unregelmäßigkeiten, ellipsenförmige Sätze, sprachliche Redundanzen oder Anakoluthe gekennzeichnet sind. Diese Hörtexte eignen sich insbesondere für die Diagnostik des globalen Verstehens.

In Sprachstandsfeststellungsverfahren sollten alle drei Hauptkategorien der gesprochenen Sprache verwendet werden (zu ihren Mischformen vgl. Glaboniat 2008: 59– 60), wobei den vorbereitet spontan gesprochenen Hörtexten wegen ihrer sprachlichen für die Sprachdiagnostik am besten geeigneten Besonderheiten Priorität einzuräumen ist. Das Kriterium Textsortenmerkmale umfasst zwei Hauptgruppen von Hörtexten. Das sind zunächst fiktionale Hörtexte, denen alle Hörtexte literarischer Art zugeordnet werden und zu denen sowohl poetische Hörtexte (z. B. vorgelesene Gedichte) als auch erzählende (d. h. narrative) Hörtexte (z. B. vorgelesene Kurzgeschichten, Ausschnitte aus Hörbüchern etc.) gehören. Zu den nicht-fiktionalen Hörtexten zählen allgemeine Gebrauchstexte (z. B. Radiokommentare, Fernsehnachrichten, Reportagen etc., die als Alltagstexte oder auch pragmatische, populärwissenschaftliche bzw. expositorische Texte bezeichnet werden) sowie spezialisierte Sachtexte (z. B. mündliche Präsentationen, Referate oder Vorträge zu einem Sachthema). Die genannten nicht-fiktionalen Hörtexte können gegenüber fiktionalen Hörtexten durch drei entscheidende Kriterien abgegrenzt werden: reine Zweckhaftigkeit, unmittelbarer Realitätsbezug und Explizitheit der Information. Wichtige Komponenten der HV-Kompetenz lassen sich mit beiden besprochenen Hauptgruppen von Hörtexten überprüfen. Da jedoch nicht jeder Hörtext im Hinblick auf den Ausbau von Teilfähigkeiten verstehenden Hörens in gleicher Weise relevant ist, sollen im Folgenden weitere wichtige textbezogene Kriterien (d. h. Authentizitäts- und Schwierigkeitsgrad) behandelt werden, die ebenso als Anhaltspunkte für eine angemessene Auswahl von rezipientengerechten Hörvorlagen für die Sprachstandsfeststellung heranzuziehen sind. – Authentizitätsgrad:10 Bei diesem Kriterium werden das erweiterte Authentizitätspostulat (vgl. hierzu Solmecke 1996: 80–82) und der Didaktisierungsgrad als zusätzliche Auswahlrichtlinien mit einbezogen und der Katalog der bei der Teilkompetenzdiagnostik einsetzbaren authentischen Hörtexte somit wie folgt erweitert: – authentische Hörtexte im engeren Sinne (d. h. Originaltexte): Zu dieser Gruppe gehören Originalaufnahmen, die mit keiner pädagogischen Absicht produziert und auch nicht für die Sprachstandsüberprüfung verändert worden sind; 10 Zum textlich-sprachlichen Authentizitätsbegriff und seiner Problematik vgl. Adamczak-Krysztofowicz (2003: 85–87).

394

Sylwia Adamczak-Krysztofowicz und Christiane Limbach

–

–

didaktisch-authentische Hörtexte: Darunter werden in Anlehnung an die erweiterte Definition von authentischen Texten alle Hörtexte gefasst, die sowohl von Muttersprachlern als auch von Nichtmuttersprachlern im Hinblick auf die Lernsituation produziert wurden, die jedoch in einer realen Kommunikationssituation zum Einsatz kommen könnten. Dafür müssen sie aber möglichst „echt“ wirken (d. h. authentischen Texten mit ihrem Sprechtempo zum Verwechseln ähnlich klingen) und eine Reihe von typischen textinternen und wesentlichen textexternen Merkmalen der jeweils beabsichtigten Textsorte erfüllen, d. h. reale situative Einbettung und eine wirkliche Autorenintention aufweisen, einen wirklichen Adressaten haben, themenbezogen sein und erkennbare Textstrukturmuster besitzen; didaktisierte Hörtexte, die von den ausgebildeten Sprechern und Sprecherinnen langsamer und deutlich gesprochen werden und mit ihrem Schwierigkeitsgrad an das jeweilige Sprachniveau angepasst sind.

Im Zusammenhang mit den auf den anfänglichen Niveaustufen noch begrenzt ausgebildeten zweitsprachigen Verarbeitungs- und Gedächtnisentlastungsstrategien muss jedes auditive Material für die Zwecke der Teilkompetenzdiagnostik sorgfältig einer strengen Kontrolle unterzogen werden. Dabei soll neben der wichtigen Frage nach der Aktualität der Textinhalte immer auch die Frage nach dem Schwierigkeitsgrad der bei der Sprachstandsüberprüfung potentiell einzusetzenden authentischen Hörtextsorten gestellt werden. – Schwierigkeitsgrad: Der Grad der Schwierigkeit von Hörtexten wird in der Fachliteratur (vgl. dazu Buck 2001: 149–151; Zydatiß 2005: 100–101) mit folgenden externen Einflussfeldern bestimmt: – Eigenschaften des Sprechenden: d. h. Zahl der Sprecher sowie deren Diktion und Sprechtempo, Sprecherwechsel, Nebengeräusche, Überlappungen sowie Unterscheidbarkeit der Stimmen und andere bereits angeführte sprecherbezogene Einflussfelder, die das verstehende Hören erschweren. – Inhalt und Thema des Textes: d. h. thematisch-inhaltliche Komplexität, die von der Menge und Explizitheit der Einzelinformationen, der Vertrautheit der Hörer mit dem thematischen Gegenstand, dem Umfang der vorausgesetzten Sachkenntnisse, dem Spezialitätsgrad, dem Abstraktionsniveau, der Informationsdichte (viele Informationen werden dicht gedrängt angeboten) und der Informationsredundanz (eine neue Information wird ausführlich beschrieben) abhängig ist. – Sprachliche Eigenschaften des Textes: d. h. sprachlich-syntaktische Vielfalt, die von dem Anteil neuer Vokabeln, unerwarteter Wortkombinationen, unbekannter syntaktischer Erscheinungen, Abweichungen von der Standardsprache, Zahl der zu entschlüsselnden Metaphern und Anspielungen auf lexikalischer und syntaktischer Ebene (also vom Grad der Verschlüsselung), Zahl der Gliederungssignale und von der sprachlichen Authentizität bestimmt wird.

Hören

–

–

395

Aufbau des Textes: d. h. Vertrautheit bzw. fehlende Vertrautheit der Hörer mit der Textsorte und der Textorganisation sowie mit den relevanten soziokulturellen und soziolinguistischen Merkmalen des Textes, Textlänge, Textgliederung, Kohärenz, Authentizität der Textsorte. Übertragung des Textes: d. h. Bild-Ton-Kopplung und andere bereits genannte situative Einflussbereiche, die den Hörverstehensprozess behindern können.

Die bisher ermittelten Kriterien der Klassifikation und zugleich Auswahl von Hörtexten signalisieren, dass bei der Aufbereitung von geeigneten Hörmaterialien für die Teilkompetenzdiagnostik viele Gesichtspunkte in den Fokus zu nehmen sind (vgl. die Auflistung von Forderungen an Hörtexte bei Eggers 1996: 35–36 und Wiemer 1999: 49 sowie an Sprecher bei Pabst-Weinschenk 2012: 111). Neben der textuellen Realisierung, der Präsentationsform, der textsortenspezifischen Besonderheiten, der Form der Mündlichkeit sowie des Schwierigkeitsgrads eines Hörtextes und seiner Authentizität muss immer noch eine adäquate Aufgabenstellung an die Diskussion um eine angemessene Auswahl von förder- und zuweisungsdiagnostischen Hör(seh)texten gekoppelt werden: So sollte man potenzielle Schwierigkeitsfaktoren bereits bei der Textauswahl berücksichtigen. Weiterhin kann man (zusätzlich) versuchen, die Schwierigkeit einer Aufgabe über die Manipulation relevanter Merkmale systematisch in Richtung auf eine bessere Übereinstimmung mit dem Fähigkeitsprofil der Testpopulation zu verändern. (Grotjahn 2012: 79)

3.3 Aufgabenstellung Mit den bereits dargestellten Hörtexten und Hörstilen hängen die unterschiedlichen im Bereich der Förderung bzw. der Diagnostik des verstehenden Hörens erarbeiteten modularen und ganzheitlichen (prozessorientierten und/oder ergebnisorientierten) Aufgabenformate11 zusammen, die vermehrt online angeboten und sowohl als informelle Tests als auch als Leistungstests eingesetzt werden (können). Von ihnen hängt der Schwierigkeitsgrad einer Hörverstehensüberprüfung entscheidend ab. Obwohl Grotjahn (2012: 76) dafür plädiert, bei der Testung von Hörverstehen bei nicht so weit fortgeschrittenen Lernern auch „speziell die Fähigkeit zum schnellen und korrekten Dekodieren des sprachlichen Inputs in hinreichendem Maße“ zu erfassen, werden aus Platzgründen in Tabelle 1 nur die Höraufgabentypen in infor-

11 Während sich Aufgaben auf komplexere, inhaltsorientierte (= focus on meaning), möglichst authentische, für die Lernenden relevante (= personal involvement) und auf das ganzheitliche Textverstehen zielende Handlungsangebote beziehen, dienen Übungen der Schulung und Automatisierung einzelner sprachlicher Phänomene (= focus on form) (vgl. hierzu Caspari, Grotjahn & Kleppin 2008: 85).

Aufgabenart/ Antwortmodus: erwartete Reaktion (verbal-gering verbal-nonverbal)

Aufgabenart/ Antwortmodus: Grad der Offenheit

Aufgabenart/ Antwortmodus: Verhältnis zu anderen Fertigkeiten

1.

2.

3.

Höraufgaben mit ihrem Antwortmodus

nonverbale spielerische Reaktion (z. B. Nachzeichnen einer im Hörtext gegebenen Wegbeschreibung, Ergänzen eines vorgegebenen Bildes nach gehörter Instruktion) geringe verbale Reaktion (z. B. Ergänzen einer Tabelle oder eines Flussdiagramms, Formulierung von Stichworten) verbale Reaktion mit schriftlicher/mündlicher Sprachproduktion (z. B. Beantwortung von Fragen zum Hörtext, Zusammenfassung der Textaussagen).

geschlossene Aufgaben: Multiple-Choice-Aufgaben, Alternativantwort-Aufgaben (d. h. Ja/Nein oder Richtig/Falsch ankreuzen bzw. Zwei-Thesen-Aufgabe), Zuordnungsaufgaben. halboffene Aufgaben: Ergänzungen von Lücken in Einzelsätzen, Listen und Tabellen, Lückentexte, Cloze-Tests. offene Aufgaben: offene Fragen zum Textinhalt und zu Textzusammenhängen, stichwortartige Beantwortung von globalen W-Fragen, Eintragungen von einzelnen Informationen in Raster oder Zusammenfassungen der relevanten Hauptinformationen von Texten.

Aufgaben, die reduzierte Schreib-, Sprech- bzw. Lesetätigkeiten voraussetzen (z. B. Anfertigen von Notizen in Form von Stichworten, Lesen der geschlossenen bzw. halbgeschlossenen Aufgaben).

Hierunter wird zwischen Verfahren ohne Sprachproduktion, Verfahren mit geringer verbaler Reaktion (d. h. Reproduktion) und Verfahren mit Sprachproduktion unterschieden, wobei die Art der schriftlichen/mündlichen Sprachtätigkeit weiter auszudifferenzieren ist (imitierend reproduktiv, problemlösend produktiv, formbezogen, inhaltsbezogen etc.). Die förderdiagnostischen Verfahren sollten eine Progression von nonverbalen Aufgabenformaten über Aufgabenformate mit geringer Sprachproduktion/Reproduktion zu Aufgabenformaten mit schriftlicher/ mündlicher Sprachproduktion zulassen.

geschlossene Aufgaben, bei denen Lernende die richtige Lösung markieren und bei denen es in erster Linie um die Leistungsmessung geht. halboffene Aufgaben, die innerhalb eines präzise begrenzten Kontextes nur teilweise von den Lernern selbst zu formulieren sind und die beim Hörverstehen wegen zu hoher Anforderungen an das Speichern und Mitschreiben relativ selten zum Einsatz kommen. offene Aufgaben, die mit relativ selbständiger Schreibarbeit des Textrezipienten verbunden sind und daher an den Hörer höhere Anforderungen stellen. Sie können sowohl zur Diagnostik des extensiven als auch des intensiven Hörens verwendet werden.

Die Schwierigkeit dieser Aufgabenformate ist umso größer, je mehr Schreib-, Sprech- bzw. Lesetätigkeit während der Textrezeption verlangt wird. Darüber hinaus kann die Komplexität von solchen Aufgaben wenig fortgeschrittene DaZ-Lernende frustrieren und ihre Motivation lähmen.

Aufgaben, die erhöhte Schreib-, Sprech- bzw. Lesetätigkeiten voraussetzen (z. B. Schreiben einer Textzusammenfassung, mündliche Beantwortung der zum Hörtext gestellten Fragen).

Beispiele von Höraufgaben

Charakteristik

Tab. 1: Prozess- und ergebnisorientierte Aufgaben12 zur Förderung und Überprüfung der Hörverstehenskompetenz im Unterricht DaZ/DaF13.

396 Sylwia Adamczak-Krysztofowicz und Christiane Limbach

Aufgabenart/ Antwortmodus: geforderte Textverarbeitung

Durch die Progression in der Aufgabenschwierigkeit werden verschiedene Verstehensebenen angesprochen. Am Anfang der Progression stehen nach Solmecke (1993) Aufgaben zum Wiedererkennen, gefolgt von Aufgaben zum Verstehen, dann zum analytischen Verstehen und schließlich zur Evaluation, die erhöhte analytische und sprachproduktive Aktivitäten voraussetzt. Die geforderte Textverarbeitung lässt sich erleichtern, wenn man mehr Fragen zum Globalverständnis formuliert und sie immer vor Fragen zum Detailverständnis stellt. Dieser Ebenen-Ansatz macht auf die Tatsache aufmerksam, dass der Schwierigkeitsgrad von Aufgaben zum Textverstehen nicht nur von den Texteigenschaften abhängig ist, sondern auch von der Art der Aufgabenstellung.

Aufgaben zur Evaluation des Textes, die schlussfolgerndes Denken, Reflektieren und Interpretieren erfordern (z. B. Diskussion von Motiven oder Einstellungen des Textproduzenten).

Fragen zum analytischen Verstehen; die wenig sprachliche Leistungen verlangen (z. B. Ordnen von Intentionen des Textproduzenten in einem Raster, Zusammenstellen von Unterschieden zwischen zwei Aussagen zu einem Thema)

Fragen zum Verstehen, die keine sprachproduktiven Leistungen seitens der Lernenden voraussetzen (z. B. Zuordnung von vertauschten Satzhälften bzw. Sätzen) oder eine wortwörtliche Antwortformulierung erfordern, die auf die Erfassung der Textoberfläche gerichtet ist.

Aufgaben zum Wiedererkennen von Wörtern und Wortgruppen (z. B. Erkennungsübungen zu Stammformen, Suche nach Internationalismen)

12 Die Testforschung unterscheidet in der Regel zwei Bedeutungen für den Begriff „Aufgabe“, und zwar eine enge und eine erweiterte Bedeutung. Die Aufgabe sensu stricto steht nach Grotjahn (2000: 339) lediglich für das jeweilige Item (z. B. eine geschlossene Multiple-choice-Aufgabenform). Die Aufgabe im erweiterten Sinne besteht nach Grotjahn (2000: 339) aus einem zu rezipierenden Hörtext (z. B. einem dialogischen Text), einigen zu lösenden Items und aus einer Instruktion, welche die Art des zur Problemlösung erforderlichen Hörstils (z .B. selektives Hören) festlegt. 13 Zur näheren Erläuterung des Verhältnisses zwischen den einzelnen Spalten und Zeilen der Tabelle vgl. Adamczak-Krysztofowicz (2009a: 118–120 und 330–332).

4.

Hören

397

398

Sylwia Adamczak-Krysztofowicz und Christiane Limbach

mellen und standardisierten Tests14 tabellarisch zusammen gestellt, die auf eine meistens inhaltlich orientierte ganzheitliche Diagnostik der auditiven Textrezeption bei DaZ-/DaF-Lernenden abzielen. Um den unterschiedlichen Leistungsniveaus der DaZ-Lernenden gerecht zu werden, – sollten die aufgabengeleiteten Aktivitäten eine Progression von nonverbalen Aufgabenformaten über Aufgabenformate mit geringer Sprachproduktion/Reproduktion zu Aufgabenformaten mit schriftlicher/mündlicher Sprachproduktion zulassen, – ist eine sinnvolle Progression von geschlossenen Aufgaben über halboffene Aufgabenformate zu offenen Aufgaben15 bei der Diagnostik der Hörverstehenskompetenz sinnvoll einzuplanen, – sollten mehr Fragen zum Globalverständnis formuliert und immer vor Fragen zum Detailverständnis gestellt werden, – ist zu beachten, dass Aufgabenformate zur Informationsentnahme auf der Textoberfläche, die wenig komplexe Denkoperationen seitens der Hörer erfordern, leichter sind als Aufgabenformate zum analytischen Verstehen oder zur Evaluation des Gehörten, die tiefgehende kognitive Teilprozesse und häufig auch erhöhte sprachproduktive Aktivitäten voraussetzen. Die Schwierigkeit einer komplexen Aufgabe lässt sich teilweise auch durch folgende hörtext- sowie anweisungs- und itembezogene Kriterien dosieren: – Positionierung und Eindeutigkeit der Textinformation: Hierunter wird zwischen den in den Items erfragten Informationen unterschieden, die sich auf zwei Sätze eines Hörtextes oder ganze Textpassagen beziehen bzw. über den ganzen Text verteilt sind oder sich auf Schlussfolgerungen erstrecken. – Präsentationshäufigkeit: Hierbei geht es um die Fragestellung, wie oft man einen Hörtext zur Aufgabenlösung einspielt.16 – Präsentationsform: Hierbei wird überlegt, auf welche Weise der Hörtext zur Aufgabenlösung präsentiert wird (Hörtext vom Lehrer oder von der CD, DVD etc., Präsentation des ganzen Textes oder mit Pausen in Abschnitten etc.). – Anzahl und Merkmale der Verstehenshilfen: Hierbei handelt es sich um die Frage, mit welchen den Verstehensprozess begünstigenden Vorentlastungshilfen

14 Auf die Differenzierung zwischen standardisierten und informellen Tests sowie feine Unterschiede zwischen Einstufungstests (Placementtests), Diagnosetests, lernzielorientierten Tests (Achievementtests), Aptitudetests und Proficiencytests kann im Rahmen des vorliegenden Beitrags nicht näher eingegangen werden. Siehe dazu u. a. Eggers (1989: 83–84) oder Zehren (1999: 57–58). 15 Zu den Vor- und Nachteilen dieser drei Grundtypen von Testaufgaben sowie zur Analyse, welche Hörstile mit welchen Hörtexten von diesen Aufgabenstellungen überprüft werden können, vgl. Adamczak-Krysztofowicz (2009b: 128–131). 16 Da die Frage der Positionierung der Items und der Präsentationshäufigkeit der Texte kontrovers ist, geht Grotjahn (2012: 80) auf diese Aspekte etwas ausführlicher ein.

Hören

–

–

–

399

ein Hörtext eingespielt wird (Hörtext mit oder ohne Schriftbild, Fotos, Illustrationen etc.). Komplexität der Itemstruktur: Unter diese Kategorie fallen die Anzahl der Itemteile, die miteinander verbunden sind, sowie die sprachliche Schwierigkeit in der Formulierung, durch die Hörverstehensprobleme hervorgerufen werden können. Verständlichkeit der Anweisungs- und Itemformulierung: Darin inbegriffen sind die Länge der Distraktoren, die Zahl der schwierigen Wörter und Negationen in den einzelnen Items sowie die Eindeutigkeit und Konkretheit der Anweisung. Zeitpunkt und Zeitlimit für die Aufgabenbearbeitung: Hierbei handelt es sich um die Fragen, wann die Aufgabe gestellt wird (vor oder nach der Textpräsentation), wie sie zu lösen ist (gleich beim Hören oder nach dem Hörvorgang) und den Zeitdruck, unter dem die jeweilige Instruktion mit ihren Items zu bearbeiten ist.

Die bis jetzt gemachten Erläuterungen zu relevanten Hörverstehensaufgaben samt vorangegangenen Ausführungen zu Hörstilen und Hörtexten, die allerdings keinen Ausschließlichkeits- und Vollständigkeitsanspruch erheben und nicht als dogmatisch missverstanden werden dürfen, können nicht nur den Hintergrund zu einer kurzen Darstellung der bereits entwickelten hörverstehensdiagnostischen Verfahren für DaZ (vgl. Abschnitt 4) bilden, sondern auch eine Grundlage für die Formulierung von Empfehlungen für die Teilkompetenzdiagnostik verstehenden Hörens (vgl. Abschnitt 5) sein.

4 Überblick über bereits entwickelte hörverstehensdiagnostische Verfahren für DaZ In den letzten Jahren ist eine große Vielfalt an Sprachstandsfeststellungsverfahren entstanden. Eine ausführliche Übersicht über die in Deutschland bestehenden Verfahren wurde von Schnieders & Komor (2005) für das Bundesministerium für Bildung und Forschung erarbeitet. Aufstellungen der verschiedenen Verfahren findet man ebenso bei Jeuk (2008), Siems (2013) sowie Reif & Abel (2015), die jedoch keinen Anspruch auf Vollständigkeit erheben. Aufgrund der großen Anzahl der Verfahren ist eine Kategorisierung sinnvoll, die von den oben genannten Autorinnen und Autoren auf verschiedene Arten vorgenommen wird. Gängige Differenzierungen erfolgen aufgrund des Alters der Testpersonen, dem Zweck oder Ziel des Verfahrens, der Verfahrensarten, der Standardisierung (normierte oder informelle Verfahren) oder auch nach den in den Verfahren getesteten Basisqualifikationen (Ehlich 2012), um nur einige wenige zu nennen. Es bleibt ebenfalls festzuhalten, dass diese Verfahren nicht unbedingt explizit für mehrsprachige Personen mit Deutsch als Zweit-

400

Sylwia Adamczak-Krysztofowicz und Christiane Limbach

sprache entworfen wurden, sondern ebenfalls für Personen mit Deutsch als Erstsprache durchgeführt werden können, um z. B. Sprachauffälligkeiten festzustellen. Wir wollen uns im Folgenden jedoch auf die Verfahren beschränken, die explizit (obwohl nicht ausschließlich) für Personen mit Migrationshintergrund entwickelt wurden. Die Basisqualifikationen nach Ehlich (2005, 2012, vgl. auch Kleinbub in diesem Band) spielen bei der Sprachaneignung eine fundamentale Rolle und bieten für das Ziel unseres Beitrages eine gute Orientierungshilfe. So ist es möglich, Verfahren ebenfalls nach den sprachlichen Teilfertigkeiten, die bei den sprachdiagnostischen Erhebungen berücksichtigt werden, aufzuschlüsseln. Ehlich (2012) unterscheidet zwischen den folgenden acht sprachlichen Basisqualifikationen: A. die rezeptive und produktive phonische Qualifikation B. die pragmatische Qualifikation I C. die semantische Qualifikation D. die morphologisch-syntaktische Qualifikation E. die diskursive Qualifikation F. die pragmatische Qualifikation II G I. die literale Qualifikation I G II. die literale Qualifikation II Diese Basisqualifikationen sollten jedoch nicht separat betrachtet werden, da sie eng miteinander in Zusammenhang stehen (Ehlich 2012: 3). In Bezug auf das Hörverstehen nimmt die Basisqualifikation der rezeptiven phonischen Qualifikation (A) einen zentralen Platz ein. Laut Ehlich (2012: 3) handelt es sich hierbei um die phonetische und phonologische Lautunterscheidung, Erfassung von suprasegmental-prosodischen Strukturen (Wort- und Satzintonation) und sonstige paralinguistische Diskriminierung (Betonung, Schreien vs. Flüstern etc.). Diese muss jedoch auch zusammen mit den pragmatischen Qualifikationen I und II und der semantischen Qualifikation gesehen werden, da bei den pragmatischen Qualifikationen u. a. Handlungsziele anderer Sprecher erkannt werden müssen sowie die Fähigkeit erlangt werden muss, Handlungsbezüge in unterschiedliche soziale Wirklichkeitsbereiche einzubetten. Bei der semantischen Qualifikation müssen u. a. sprachliche Ausdrücke zu Wirklichkeitselementen zugeordnet werden und zu Vorstellungselementen sowie zu deren Kombinatorik rezeptiv hergestellt werden (Ehlich 2012: 3). Sollten diese pragmatischen und semantischen Qualifikationen auf mündlicher Ebene geschehen, sind diese für die Kompetenz des Hörverstehens ebenfalls von Bedeutung. In Tabelle 2 wird eine Übersicht über die verschiedenen Sprachstandsfeststellungsverfahren für DaZ, ausgehend von den bereitgestellten Informationen bei Schnieders & Komor (2005) sowie Reif & Abel (2015), dargestellt, bei der der Fokus auf der Kompetenz des Hörverstehens liegt und die auf Deutschland beschränkt ist. Diese Tabelle erhebt keinen Anspruch auf Vollständigkeit. Wie der Tabelle zu entnehmen ist, berücksichtigen die unterschiedlichen sprachdiagnostischen Verfahren die rezeptive phonische Basisqualifikation (also

Hören

401

das Hörverstehen) auf unterschiedliche Weise. Bei unserem Überblick können wir zwischen drei Kategorien unterscheiden: wird erhoben, wird nicht explizit erhoben und wird nicht erhoben. Auffällig ist, dass nur bei drei Verfahren (Praxismaterial Förderdiagnostik, Teiltest Hören; LiSe-DaZ; Niveaubeschreibung DaZ) von den 16 aufgeführten Verfahren für Kinder und Jugendliche die Hörverstehenskompetenz explizit berücksichtigt wird: Beim Praxismaterial Förderdiagnostik Teiltest Hören wird das Verstehen eines gehörten Textes auf verschiedenen Ebenen ausgewertet, während bei LiSe-DaZ das Sprachverständnis von Kindern im Vorschulalter oder früher Primarstufenalter durch drei Untertests zum Verstehen der Verbbedeutung, dem Verstehen von W-Fragen17 und dem Verstehen von Negation getestet wird. Bei den Niveaubeschreibung DaZ wird die Kompetenz „Verstehensfertigkeit“ als eine von sieben erhoben. Obwohl bei Schnieders & Komor (2005) angegeben wurde, dass auch die Verfahren Sismik und HAVAS-5 explizit die rezeptive phonische Basisqualifikation erheben, wird u. E. das Hörverstehen nur implizit erhoben – wie auch bei anderen in Tabelle 2 aufgeführten Verfahren – da dieses indirekt bei vielen sprachlichen Handlungen vorliegen muss. So müssen zum Beispiel mündlich formulierte Handlungsanweisungen oder Aufforderungen verstanden werden, um diese im nächsten Schritt durchführen zu können (wie zum Beispiel eine Bildergeschichte mündlich zu beschreiben, siehe HAVAS-5). Beim SSV sollen Kinder im Vorschulalter (teilweise auch sinnlose) Wörter nachsprechen, das heißt, es wird nicht unbedingt das Hörverstehen erhoben, sondern eher das phonologische Kurzzeitgedächtnis. Auch im Dialog, bei anderen Gesprächssituationen (Frage und Antwort), bei denen die Testperson kommunikativ handeln soll, oder bei dem Ausführen bzw. Lösen von Aufgaben, muss die Hörverstehenskompetenz indirekt zugrunde (wie z. B. bei SFD, PLAV, etc.) liegen; ebenso bei den Beobachtungsverfahren, bei denen die Testpersonen in verschiedenen Gesprächssituationen beobachtet und eingestuft werden (wie z. B. bei Bayern-Hessen-Screening, Sismik, BESK-DaZ etc.). Erhoben wird das Hörverstehen also bei Beobachtungsverfahren bisher scheinbar nur in interaktiven Sprechsituationen zwischen Prüfling und Prüfer sowie Prüfling und weiteren Prüflingen. Dabei ist bei den verschiedenen Sprachstandsfeststellungsverfahren durchaus eine Progression von nonverbalen Aufgabenformaten über Aufgabenformate mit geringer Sprachproduktion/Reproduktion zu Aufgabenformaten mit schriftlicher/mündlicher Sprachproduktion zu erkennen (vgl. z. B. Sismik und PLAV). Die Häufigkeit dieser Art von Testung bei den bisher bestehenden sprachdiagnostischen Verfahren mag durchaus am Alter der Testperson liegen, da viele der Verfahren für Kinder im Vorschulalter oder Primarstufenalter angelegt sind. Allerdings muss auch festgestellt werden, dass ab einem fortgeschritteneren Alter der Testpersonen die Teilkompetenz des Hörverstehens immer weniger mit einbezogen

17 Beispiel einer Testfrage zu einer Abbildung: „Wem hilft Ibo aus der Tonne?“ Zielantwort: „Dem Hund“. (vgl. Schwarze, Geyer & Voet Cornelli 2016).

Erhebungszeitpunkt (Alter) und Person

ab 3 Jahren bis zum Schuleintritt, Kinder mit Deutsch als Zweitsprache

3–5 Jahre (Verfahren differenziert nach 3und 4- bis 5-jährigen Kindern); „deutsche“ und „ausländische“ Kinder

3–6 Jahre; Kinder mit Migrationshintergrund

3–7Jahre (DaZ), 3–6 Jahre (DaM), Kinder mit und ohne Migrationshintergrund

Name des Verfahrens / Entstehungsjahr18

BESK-DaZ (Bogen zur Erfassung der Sprachkompetenz von Kindern mit Deutsch als Zweitsprache) / 2009

SSV (Sprachscreening für das Vorschulalter) / 2003

Sismik ( Sprachverhalten und Interesse an Sprache bei Migrantenkindern in Kindertageseinrichtungen) / 2003, 2006

LiSe DaZ (Linguistische Sprachstandserhebung Deutsch als Zweitsprache) / 2011

wird erhoben

wird nicht explizit erhoben

wird nicht explizit erhoben

wird nicht explizit erhoben

rezeptive phonische Qualifikation

Sprachtest/Screening: kindgerechte Bilder und Bildergeschichte Drei Untertests Sprachverständnis: Verstehen der Verbbedeutung, Verstehen von W-Fragen, Verstehen von Negation Vier Untertests Sprachproduktion: Satzklammer, Subjekt-Verb-Kongruenz, Wortklassen, Kasus (morphologische, syntaktische und semantische Bereiche des Deutschen)

Beobachtungsverfahren: Aufforderung – Durchführung Nacherzählen alltägliche Sprechhandlungen im Kindergarten, handlungsbegleitende sprachliche Handlungen

Nachsprechen (auch sinnlose Formen) Aufgabe stellen – Aufgabe lösen

Systematische Beobachtung: (Verlaufsbeobachtung) + Leitfaden für Elterngespräch; Dokumentation der Beobachtungen durch verschiedene Beobachtungsraster, Auswertung durch Auswertungsprofile Erhebung: Schwerpunktsetzung auf die morpho-syntaktischen, kognitivsprachlichen und diskursiven Qualifikationen

testrelevante bzw. getestete sprachliche Handlungen

Tab 2: Aufstellung der sprachdiagnostischen Verfahren für DaZ in Deutschland im Hinblick auf die Hörverstehenskompetenz.

402 Sylwia Adamczak-Krysztofowicz und Christiane Limbach

wird nicht explizit erhoben

Frage – Antwort, Bildbeschreibung, elizitiertes Erzählen Der Lehrer soll versuchen, ausgehend von Bildvorlagen, ein Gespräch zu evozieren, das aufgenommen und analysiert wird. In die Bewertung gehen längerfristige Beobachtungen mit ein.

Frage – Antwort Aufgabe stellen – Aufgabe lösen Aufforderung – Durchführung Bildergeschichte beschreiben

Sprachstandsbestimmung mit dem Kind, Beobachtungsbogen für pädagogisches Fachpersonal und Eltern Aufgaben: Nachsprechen Bildbeschreibung (Nacherzählen) Frage – Antwort Aufforderung – Durchführung Anweisung – Durchführung

Bildbeschreibung (diskursiv) Beurteilungsrelevant sind neben sprachlichen Handlungen wie Frage – Antwort, Aufforderung – Durchführung, Aufgabe stellen – Lösen usw., auch Gesprächsstrategien

Ermittlung der grammatikalischen Komplexität von mündl. und schrifl. Äußerungen

18 Die Verfahren sind in der Tabelle – so weit möglich – nach dem Alter der Testpersonen aufsteigend geordnet.

PLAV (Projektives Lingu- 6–10 Jahre; „ausländische Kinder, flächende- wird nicht explizit istisches Analyseverckende Untersuchung ist nicht vorgesehen, erhoben fahren) / 1985 da das Verfahren relativ aufwändig ist.“

SFD (Sprachstandsüber- Das Verfahren ist für das 1., 2. und 3./4. prüfung und Förderdiag- Schuljahr differenziert (6–7, 7–8 und nostik / 1999, 2002 8–10 Jahre); Kinder, für die Deutsch nicht die Erstsprache ist.

während der Einschulung (ca. 6 Jahre); Kinder mit nichtdeutscher Erstsprache

Bayern-HessenScreening / 2002

wird nicht explizit erhoben

5 Jahre; einsprachig deutsche und mehrspra- wird nicht explizit chige Kinder mit Türkisch, Russisch, erhoben Polnisch, Italienisch, Spanisch und Portugiesisch als Herkunftssprachen und Deutsch als Zweitsprache

HAVAS-5 (Hamburger Verfahren zur Analyse des Sprachstandes bei Fünf-Jährigen) / 2004

wird nicht erhoben

für Kindergartenkinder sowie SchülerInnen der Primarstufe und der Sekundarstufe I; Migrationshintergrund

Profilanalyse DaZ / 2006, 2013

Hören

403

für die Primarstufe und die Sekundarstufe I; SchülerInnen mit Migrationshintergrund

für die Primarstufe und die Sekundarstufe I; SchülerInnen mit Migrationshintergrund

für SchülerInnen im Übergang von der Grund- wird nicht erhoben schule zur weiterführenden Schule; SchülerInnen mit Migrationshintergrund

Niveaubeschreibung DaZ / 2009

Unterrichtsbegleitende Sprachstandsbeobachtung DaZ / 2014

FörMig (Förderung von Jugendlichen mit Migrationshintergrund) Profilanalyse: „Tulpenbeet“ / 2008 wird erhoben

wird nicht erhoben

Praxismaterial Förderdi- Klasse 5–6 agnostik, Teiltest Hören

FörMig (Förderung von für Jugendliche im Übergang von der OberJugendlichen mit Migra- stufe in den Beruf; Jugendliche mit Migrationshintergrund) Protionshintergrund filanalyse: „Fast Catch Bumerang“ / 2009

wird nicht explizit erhoben

wird erhoben

wird nicht explizit erhoben

9–10 Jahre (2. Hälfte der 4. Klasse); alle SchülerInnen, explizit auch mehrsprachige

CT-D4 (Schulleistungstest für Deutsch 4. Klassen) / 1992

rezeptive phonische Qualifikation

Erhebungszeitpunkt (Alter) und Person

Name des Verfahrens / Entstehungsjahr

Tab. 2 (fortgesetzt)

Zwei Schreibaufgaben: Bewerbung zu einem Praktikumsplatz in einer Redaktion und Beschreibung des Baus eines Bumerangs anhand einer Bilderreihenfolge

Fragen beantworten auf der Grundlage eines gehörten Textes (Fabel). Gruppenauswertung nach Verstehensebenen (Informationen ermitteln, Wiedererkennen und Zuhören, Verstehen/Interpretieren) und Individualauswertung

Schreibaufgabe (Schwerpunkt mehr auf pragmatischer Qualifikation als auf syntaktischer)

Beobachtungsbereiche richten sich nach folgenden Basisqualifikationen nach Ehlich (Ehlich, Bredel & Reich 2008): Pragmatische, Lexikalisch-semantische, Morphologischsyntaktische und Literale Basisqualifikationen

Beobachtungen werden in 23 Kompetenzrastern zu sieben Abschnitten (sprachliche Handlungs- und Verstehensfertigkeit, Wortschatz, Aussprache, Lesen, Schreiben, Grammatik (mündl./schriftl.), Persönlichkeitsmerkmale) und einem Dokumentationsformular erfasst.

Aufgabe stellen – Aufgabe lösen schriftlicher Lückentext (C-Test)

testrelevante bzw. getestete sprachliche Handlungen

404 Sylwia Adamczak-Krysztofowicz und Christiane Limbach

für Erwachsene, die einen Nachweis über Ihre Sprachkenntnisse für die Einbürgerung in Deutschland brauchen, für den erfolgreichen Abschluss der Integrationskurse, für alle anderen Interessierten

für Erwachsene; Personen mit Migrationshin- wird nicht erhoben tergrund, die sich in Deutschland einbürgern möchten

für Erwachsene, die 100–150 Stunden Deutschunterricht besucht haben

Deutsch-Test für Zuwanderer A2·B1 / 2009

Einbürgerungstest in Deutschland / 2008

telc Deutsch A1 für Zuwanderer / 2009

wird erhoben

wird erhoben

für junge Erwachsene, die einen Nachweis wird erhoben über ihre Sprachkenntnisse für die Einbürgerung in Deutschland brauchen, für den erfolgreichen Abschluss von Jugendintegrationskursen. Die Themen sind gemäß den Interessen junger Erwachsener unter 27 Jahren gestaltet.

Deutsch-Test für Zuwanderer A2·B1 Jugendintegrationskurs / 2009

Die Kompetenz „Hören“ wird zusammen mit den Teilen „Sprachbausteine“ und „Lesen“ im schriftlichen Teil des Tests (Dauer 55 Minuten) erhoben. Der Teil „Hören“ ist in die beiden Teile „Hören“ und „Hören und antworten“ untergliedert. Die Teilnehmer haben hierfür 15 Minuten Zeit. Bei dem Teil „Hören“ sind für das selektive Verstehen vier Richtig-Falsch-Aufgaben und für das Detailverstehen fünf Multiple-Choice-Aufgaben zu lösen. Bei dem Teil „Hören und antworten“ sind für den Teil „A Situationsbezogenen Antworten“ 3 Zuordnungsaufgaben und für den Teil „B Situationsbezogenen Antworten“ 4 Zuordnungsaufgaben zu lösen.

33 Fragen mit je 4 Antwortmöglichkeiten. Dabei beziehen sich 30 Fragen auf die Themenbereiche „Leben in der Demokratie“, „Geschichte und Verantwortung“ und „Mensch und Gesellschaft“. Die übrigen drei Fragen werden von dem jeweiligen Bundesland gestellt

Die Kompetenz „Hören“ wird zusammen mit den Kompetenzen „Lesen“ und „Schreiben“ im schriftlichen Teil des Tests erhoben. Dauer des Hörteils: 25 Minuten. Der Teil „Hören“ ist in vier Teile gegliedert: Teil 1 – Ansage am Telefon, öffentliche Durchsagen verstehen, Teil 2 – Kurze Informationen in den Medien verstehen, Teil 3 – Alltägliche Gespräche verstehen und Teil 4 – Unterschiedliche Meinungen zu einem Thema verstehen. Für den Teil 1 sind 4 Multiple-Choice-Aufgaben, für den Teil 2 5 Multiple-Choice-Aufgaben, für den Teil 3 4 RichtigFalsch-Aufgaben und 4 Multiple-Choice-Aufgaben und für den Teil 4 3 Zuordnungsaufgaben zu lösen.

Hören

405

Erhebungszeitpunkt (Alter) und Person

für Erwachsene, die sich für ein Hochschulstudium bewerben möchten und einen Nachweis ihrer deutschen Sprachkenntnisse brauchen

für Erwachsene, die sich für ein Hochschulstudium bewerben möchten und einen Nachweis ihrer deutschen Sprachkenntnisse brauchen

Name des Verfahrens / Entstehungsjahr

DSH (Deutsche Sprachprüfung für den Hochschulzugang) /

Test DaF

Tab. 2 (fortgesetzt)

wird erhoben

wird erhoben

rezeptive phonische Qualifikation

Die Kompetenz „Hörverstehen“ wird als eine von vier Kompetenzen getestet. Es werden drei Aufgaben gestellt, die insgesamt in 40 Minuten bearbeitet werden dürfen.

Die Hochschulen und Studienkollegs gestalten die DSH gemäß der Rahmenverordnung selbst. Die Kompetenz „Hörverstehen“ wird in zwei Aufgaben, die zusammen in 50 Minuten bearbeitet werden dürfen, getestet.

testrelevante bzw. getestete sprachliche Handlungen

406 Sylwia Adamczak-Krysztofowicz und Christiane Limbach

Hören

407

wird, da es in den FörMig-Verfahren, dem C-Test, der Profilanalyse und auch dem Einbürgerungstest gar nicht berücksichtigt wird. In Zukunft sollten u. E. weitere Testverfahren der Sprachdiagnostik für das Hörverstehen berücksichtigt werden, um ein möglichst umfassendes und aussagekräftiges Ergebnis zu erzielen. Im Bereich der Sprachstandsfeststellungsverfahren für junge Erwachsene und Erwachsene ändert sich das Panorama jedoch, denn bei diesen Verfahren wird die Kompetenz „Hörverstehen“ explizit als einer von mehreren Teilen und durch verschiedene Aufgaben erhoben, wie es in der Tabelle erkenntlich ist. Ebenso verhält es sich bei den Prüfungen des Goethe-Instituts,19 wo das „Hörverstehen“ ebenfalls explizit und durch verschiedene Aufgaben getestet wird.

5 Fazit und Ausblick Wie die Aufstellung der bisherigen Sprachstandsfeststellungsverfahren zeigt, besteht noch viel Handlungsbedarf, um die Teilkompetenzdiagnostik des Hörverstehens in die verschiedenen Verfahren explizit zu integrieren. Bisher wird das Hörverstehen kaum explizit getestet, so wie es im DaF-Bereich üblich ist. Wünschenswert für die Zukunft wäre, dass auch bei den DaZ-Sprachstandsfeststellungsverfahren der Teil des Hörverstehens als eine der vier Basiskompetenzen (gemäß des Europäischen Referenzrahmens für Sprachen) durch verschiedene Aufgaben explizit erhoben wird. Bei den wenigen Ausnahmen der Erhebung des Hörverstehens im DaZ-Bereich (siehe Tabelle 2) handelt es sich um das interaktive Hören in einer Sprechsituation zwischen den Prüflingen selbst (Beobachtungsverfahren) oder dem Prüfling und dem Prüfer. Es gibt derzeit kein ausgearbeitetes Konzept der Teilkompetenzdiagnostik im Bereich Hören, das die DaZ-Lernenden mit unterschiedlichen Hörstilen, authentischen Hör(seh)texten und differenzierten Testaufgaben konfrontieren würde. Dies stellt mit Sicherheit eine besondere Herausforderung für die DaZ-Didaktiker dar, von denen mehr fachdidaktische Kenntnisse, Engagement und eine zeitaufwändigere Vorbereitung der diagnostischen Verfahren verlangt werden. Für die Sprachstandsfeststellung der Teilkompetenz des Hörverstehens sollten u. E. die Hörstile, die verschiedenen Hörtextarten, die Höraufgaben mit ihren jeweiligen Antwortmodi und ihrem Schwierigkeitsgrad progressiv an das Alter und die Kontaktzeit mit DaZ angepasst werden, indem sehr junge Testpersonen oder Testpersonen, die bisher nur wenig Kontakt mit DaZ hatten, mit einfachen Hörtextarten und Aufgaben konfrontiert werden und diese mit zunehmendem Alter und Kontakt zur deutschen Sprache komplexer und schwieriger werden. Grotjahn schlägt hierbei vor, dass bei der Testung des Hörverstehens

19 Unter dem nachstehenden Link sind sowohl die verschiedenen Prüfungen als auch Modellsätze abrufbar: https://www.goethe.de/de/spr/kup/prf/prf.html (21. 09. 2017).

408

Sylwia Adamczak-Krysztofowicz und Christiane Limbach

[…] die Messung hierarchieniedriger Kompetenzen wie die Fähigkeit zum oberflächennahen Hören fokussiert werden [sollte]. Weiterhin sollten auf den hierarchiehöheren Ebenen vor allem solche inferenziellen Fähigkeiten überprüft werden, die in einem engen Zusammenhang mit typischen Merkmalen des akustischen Signals stehen, wie z. B. Intonations- und Akzentverläufe zur Signalisierung bestimmter Bedeutungen und Einstellungen. (Grotjahn 2012: 83)

Ebenfalls sollte bei Verfahren der Sprachstandsfeststellung für die Teilkompetenz Hörverstehen darauf geachtet werden, dass Aspekte, die spezifisch für das Hörverstehen getestet werden sollen und die nicht in anderen Teilen getestet werden können (vgl. Grotjahn 2012: 82), in die bereits bestehenden Verfahren aufgenommen und ebenfalls bei neu entstehenden Verfahren berücksichtigt werden. Des Weiteren kann bei der Teilkompetenzdiagnostik des Hörens von der Testung der einzelnen modularen Teilkompetenzen verstehenden Hörens progressiv zu einer ganzheitlichen Testung der Kompetenzen des Hörverstehens übergegangen werden. Einer stärkeren Einbeziehung der HV-Kompetenz in Sprachfeststellungsverfahren in Zukunft steht eine unzureichende theoretische und empirische Absicherung entgehen. Dass konkrete Empfehlungen für eine adressatengerechte Diagnostik des verstehenden Hörens sowohl im Bereich der Testforschung als auch der Testpraxis im Bereich Deutsch als Zweitsprache bis heute wenig im Fokus liegen, zeigt u. a. ein kurzer Überblick in die wenigen wissenschaftlichen Veröffentlichungen zu diesem Thema, in denen man einzelne Rufe nach einer sachlich fundierten Ausarbeitung von diagnostischen Verfahren zur Testung des verstehenden Hörens für DaZ-Lernende finden kann: Um umfassende Aussagen zum Hörverstehen im Zweitspracherwerbsprozess treffen zu können, sind außerdem weitere Anstrengungen im Bereich der Operationalisierung von Hörverstehen und der Entwicklung von diagnostischen Instrumenten zur Messung des Hörverstehens im Zweitspracherwerbsprozess nötig. Diese dienen zum einen der Diagnostik und zur Feststellung des Förderbedarfs im Bereich des Hörverstehens. Zum anderen tragen sie zur Klärung der Bedeutung des Hörverstehens im Zweitspracherwerbsprozess bei. (Eckhardt 2008: 260)

Voraussetzung für eine gelungene Implementierung der von Eckhardt bereits vor neun Jahren genannten Desiderata ist die Fokussierung auf die einzelnen Subkompetenzen der Hörverstehenskompetenz, die in Abhängigkeit von der Textkompetenz und schwach oder stark ausgeprägten Wahrnehmungslernressourcen unterschiedlicher DaZ-Zielgruppen (also kleiner Kinder, älterer Kinder und Jugendlicher sowie Migranten mit differenzierter Schulausbildung und außerschulischer literaler Bildung sowie Kontaktzeit bzw. Intensität DaZ) einer Progression hinsichtlich der einzusetzenden Hörtexte und der mit ihnen verbundenen Höraufgaben und Hörstile unterliegen und sowohl einzeln (modular) als auch kombiniert (ganzheitlich) überprüft werden sollten. Ein stärkeres Eingehen auf die Hörsubkompetenzen der DaZLernenden mit geringer Textkompetenz (also für einen Teil von Arbeitsmigranten, Geflüchteten, Aus- und Umsiedlern in unterschiedlichen Lebensaltern) sei dabei dringend empfohlen.

Hören

409

Literaturverzeichnis Adamczak-Krysztofowicz, Sylwia (2003): Texte als Grundlage der Kommunikation zwischen Kulturen. Eine Studie zur Kultur- und Landeskundevermittlung im DaF-Studium in Polen. Hamburg: Dr. Kovač. Adamczak-Krysztofowicz, Sylwia (2009a): Fremdsprachliches Hörverstehen im Erwachsenenalter. Theoretische und empirische Grundlagen zur adressatengerechten und integrativen Förderung der Hörverstehenskompetenz am Beispiel Deutsch als Fremdsprache in Polen. Poznań: Wydawnictwo Naukowe UAM. Adamczak-Krysztofowicz, Sylwia (2009b): Zur Überprüfung des Hörverstehens in der neuen Fassung der DaF-Abiturprüfung in Polen. In Agnieszka Hunstiger & Uwe Koreik (Hrsg.), Chance Deutsch. Schule-Studium-Arbeitswelt. 34. Jahrestagung des Fachverbandes Deutsch als Fremdsprache 2006 an Leibnitz Universität Hannover, 121–148. Göttingen: Universitätsverlag. Badstübner-Kizik, Camilla (2016): Hör- und Hör-Sehverstehen. In Eva Burwitz-Melzer, Grit Mehlhorn, Claudia Riemer, Karl-Richard Bausch, Hans-Jürgen Krumm (Hrsg.), Handbuch Fremdsprachenunterricht. 6. Auflage, 93–97. Tübingen: Narr. Bickes, Gerhard (1996): Hörverstehensüberprüfung als methodisches Problem. In Peter Kühn (Hrsg.), Hörverstehen im Unterricht Deutsch als Fremdsprache. Theoretische Fundierung und unterrichtliche Praxis, 149–170. Frankfurt a. M.: Peter Lang. Buck, Gary (2001): Assessing Listening. Cambridge: Cambridge University Press. Caspari, Daniela, Rüdiger Grotjahn & Karin Kleppin (2008): Kompetenzorientierung und Aufgaben. In Bernd Tesch, Eynar Leupold & Olaf Köller (Hrsg.), Bildungsstandards Französisch: konkret. Sekundarstufe I: Grundlagen, Aufgabenbeispiele und Unterrichtsanregungen, 85–87. Berlin: Cornelsen Scriptor. Dahlhaus, Barbara (1994): Fertigkeit Hören. (Fernstudieneinheit 5 des Fernstudienprojekts zur Fort- und Weiterbildung im Bereich Germanistik und Deutsch als Fremdsprache). Berlin: Langenscheidt. Eckhardt, Andrea G. (2008): Hörverstehen in der Zweitsprache Deutsch. In Bernt Ahrenholz & Ingelore Oomen-Welke (Hrsg.), Deutsch als Zweitsprache, 253–264. Baltmannsweiler: Schneider-Verl. Hohengehren. Eggers, Dietrich (1989): Einige Aspekte zur Analyse von Hörverstehenstests. In Dietrich Eggers (Hrsg.), Didaktik Deutsch als Fremdsprache. Hörverstehen – Leseverstehen – Grammatik. Materialien Deutsch als Fremdsprache. Heft 28, 83–90. Regensburg: AKDaF. Eggers, Dietrich (1996): Hörverstehen: Bestandsaufnahme und Perspektiven. In Peter Kühn (Hrsg.), Hörverstehen im Unterricht Deutsch als Fremdsprache. Theoretische Fundierung und unterrichtliche Praxis, 13–44. Frankfurt a. M.: Peter Lang. Ehlich, Konrad (2005): Sprachaneignung und deren Feststellung bei Kindern mit und ohne Migrationshintergrund – Was man weiß, was man braucht, was man erwarten kann. In: Bundesministerium für Bildung und Forschung (Hrsg.), Anforderungen an Verfahren der regelmäßigen Sprachstandsfeststellung als Grundlage für die frühe und individuelle Förderung von Kindern mit und ohne Migrationshintergrund. Bildungsreform Band 11, 11–75. https://www.bmbf.de/pub/Bildungsforschung_Band_11.pdf (17. 04. 2017). Ehlich, Konrad (2012): Sprach(en)aneignung – mehr als Vokabeln und Sätze, 1–11. https:// www.uni-due.de/imperia/md/content/prodaz/sprach_en_aneignung__mehr_als_vokabeln_ und_s__tze.pdf (17. 04. 2017). Ehlich, Konrad, Ursula Bredel & Hans H. Reich (2008): Sprachaneignung – Prozesse und Modelle. In Konrad Ehlich, Ursula Bredel & Hans H. Reich (Hrsg.), Referenzrahmen zur altersspezifischen- Sprachaneignung. Bildungsforschung: Band 29 I, 9–28. Bonn, Berlin: Bundesministerium für Bildung und Forschung (BMBF).

410

Sylwia Adamczak-Krysztofowicz und Christiane Limbach

Elsner, Daniela (2007): Hörverstehen im Englischunterricht der Grundschule. Ein Leistungsvergleich zwischen Kindern mit Deutsch als Muttersprache und Deutsch als Zweitsprache. Frankfurt a. M.: Peter Lang. Europarat, Rat für kulturelle Zusammenarbeit (2001): Gemeinsamer europäischer Referenzrahmen für Sprachen: lernen, lehren, beurteilen. Deutsche Fassung. Berlin: Langenscheidt. Glaboniat, Manuela (2008): Wer nicht hören kann, muss üben … Zur Schulung der HV-Kompetenz aus der Sicht des Deutsch als Fremdsprache-Unterrichts. ide 1, 51–65. Grotjahn, Rüdiger (2000). Kognitive Determinanten der Schwierigkeit von fremdsprachlichen Leseund Hörverstehensaufgaben. Zur Prognose der Aufgabenschwierigkeit in Sprachtests. In Claudia Riemer (Hrsg.), Kognitive Aspekte des Lehrens und Lernens von Fremdsprachen. Festschrift für Willis J. Edmondson zum 60. Geburtstag, 338–353. Tübingen: Gunter Narr Verlag. Grotjahn, Rüdiger (2012): Hörverstehen: Konstrukt und Messung. FLuL 1, 72–86. Grotjahn, Rüdiger & Karin Kleppin (2015): Prüfen, Testen, Evaluieren. München: KlettLangenscheidt. Grotjahn, Rüdiger & Raphaela Porsch (2016): Konzeptualisierung des Hörverstehens in Lehrplänen und Bildungsstandards und seine Überprüfung im fremdsprachlichen Kontext. In Christine Michler & Daniel Reimann (Hrsg.), Sehverstehen im Fremdsprachunterricht, 57–83. Tübingen: Narr. Hüllen, Werner (1977): Hörverstehen im Fremdsprachenunterricht der Sekundarstufe I. In René Dirven (Hrsg.): Hörverständnis im Fremdsprachenunterricht, 27–39. Kronberg: Scriptor. Jeuk, Stefan (2008): Sprachstandsfeststellungen bei Kindern mit Deutsch als Zweitsprache im Hinblick auf Aufnahme in eine Vorbereitungsklasse an der Grundschule, 1–15. http://www.phludwigsburg.de/fileadmin/subsites/2b-spze-t-01/user_files/Service/VwV_DaZ_Sprachstand_ 2.pdf (17. 04. 2017). Koch, Peter & Wulf Oesterreicher (1985): Sprache der Nähe – Sprache der Distanz. Mündlichkeit und Schriftlichkeit im Spannungsfeld von Sprachtheorie und Sprachgeschichte. Romanistisches Jahrbuch 36, 15–43. Nold, Güner & Henning Rossa (2007): Hörverstehen. In Bärbel Beck & Eckhard Klieme (Hrsg.), Sprachliche Kompetenzen. Konzepte und Messung. DESI-Studie, 178–196. Weinheim und Basel: Beltz. Pabst-Weinschenk, Marita (2012): Sprechen und Zuhören in mehrsprachigen Klassen fördern. In Magdalena Michalak & Michaela Kuchenreuth (Hrsg.), Grundlagen der Sprachdidaktik Deutsch als Zweitsprache, 85–117. Baltmannsweiler: Schneider Verlag Hohengehren. Reif, Susanne & Andrea Abel (2015): Sprachstandserhebungsverfahren – Handbuch zum Kennenlernen ausgewählter Verfahren (Teil 2). http://maledive.ecml.at/Portals/45/ Lehrerhandbuch%20Teil%202_V2.docx (17. 04. 2017). Riemer, Claudia (2009): DaF und DaZ: Gemeinsamkeiten und Unterschiede – lerntheoretisch betrachtet. In Monika Clalüna & Barbara Etterich (Hrsg.), Deutsch unterrichten zwischen DaF, DaZ und DaM. Sondernummer Rundbrief AkDaF, 25–39. Stallikon: Käser. Schnieders, Guido & Anna Komor (2005): Eine Synopse aktueller Verfahren der Sprachstandsfeststellung. In Bundesministerium für Bildung und Forschung (Hrsg.), Anforderungen an Verfahren der regelmäßigen Sprachstandsfeststellung als Grundlage für die frühe und individuelle Förderung von Kindern mit und ohne Migrationshintergrund. Bildungsreform Band 11, 261–352. https://www.bmbf.de/pub/Bildungsforschung_Band_ 11.pdf (17. 04. 2017). Schwarze, Rabea, Sabrina Geyer & Barbara Voet Cornelli (2016): Sprachdiagnostik als Ausgangspunkt für Förderung mehrsprachiger Schülerinnen und Schüler. Pädagogik Leben, 10–12. Siems, Maren (2013): Verfahren der Sprachstandsfeststellung für Schülerinnen und Schüler mit Deutsch als Zweitsprache, 1–6. https://www.uni-due.de/imperia/md/content/prodaz/ sprachstandsfeststellungsverfahren_siems.pdf (17. 04. 2017).

Hören

411

Solmecke, Gert (1993): Texte hören, lesen und verstehen. Eine Einführung in die Schulung der rezeptiven Kompetenz mit Beispielen für den Unterricht Deutsch als Fremdsprache. Berlin u. a.: Langenscheidt. Solmecke, Gert (1996): Authentische Texte – authentisches Hören? In Peter Kühn (Hrsg.). Hörverstehen im Unterricht Deutsch als Fremdsprache. Theoretische Fundierung und unterrichtliche Praxis. Frankfurt am Main u. a.: Peter Lang, 79–92. Wenk, Michaela & Stefan Jeuk (2015): Hörverstehen. In Alexandra Junk-Deppenmeier, Stefan Jeuk (Hrsg.): Praxismaterial Förderdiagnostik. Stuttgart: Fillibach bei Klett, 31–50. Wiemer, Claudia (1999): Aspekte des Hörverstehens im fremdsprachlichen Lernprozess. In Dietrich Eggers (Hrsg.), Hörverstehen aus andragogischer Sicht. Sprachlern- und Spracherwerbsstrategien im Fremdsprachenunterricht mit Erwachsenen. (Sprachandragogik Jahrbuch 1998), 37–55. Mainz: Johannes Gutenberg-Universität Mainz Zentrum für wissenschaftliche Weiterbildung. Wolff, Dieter (2002): Fremdsprachenlernen als Konstruktion: Grundlagen für eine konstruktivistische Fremdsprachendidaktik. Frankfurt a. M.: Peter Lang. Zehren, Sigrid (1999): Hörverstehenstests. In Dietrich Eggers (Hrsg.), Hörverstehen aus andragogischer Sicht. Sprachlern- und Spracherwerbsstrategien im Fremdsprachenunterricht mit Erwachsenen. (Sprachandragogik Jahrbuch 1998), 57–69. Mainz. Zydatiß, Wolfgang (2005): Bildungsstandards und Kompetenzniveaus im Englischunterricht. Konzepte, Empirie, Kritik und Konsequenzen. Frankfurt a. M.: Peter Lang.

Julia Webersik

17 Sprechen 1 2 3 4

Sprechen als Untersuchungsgegenstand – Begriffsklärung und Relevanz Theoretische Fundierung Diagnose diskursiver Fähigkeiten Fazit

1 Sprechen als Untersuchungsgegenstand – Begriffsklärung und Relevanz Geht es um die Diagnose von Fähigkeiten im Fertigkeitsbereich Sprechen, so betrifft dies medial mündlich produzierte Sprache. Innerhalb dieser Kategorie gibt es entlang des Kontinuums konzeptioneller Mündlichkeit bzw. Schriftlichkeit jedoch ein weites Spektrum z. T. sehr unterschiedlicher kommunikativer Praktiken: Die Formen mündlicher Kommunikation sind sehr vielfältig. Dialogische interaktive Formen mündlichen sprachlichen Handelns (Gespräche) stehen mehr oder weniger monologischen Formen (Rede, Vortrag, Präsentation usw.) gegenüber. Kommunikation mit räumlicher und zeitlicher Kopräsenz der Beteiligten unterscheidet sich von medial vermittelten Formen, in denen diese Kopräsenz (teilweise) aufgehoben ist (z. B. Telefongespräche, Nachrichten auf dem Anrufbeantworter). Ferner kann Kommunikation zwar medial mündlich sein, konzeptionell aber eine schriftliche Charakteristik besitzen (z. B. Radionachrichten). (Brünner 2012: 52)

Sprechen verbindet man üblicherweise mit längeren Redebeiträgen. Doch strenggenommen ist natürlich schon die mündliche Produktion eines einzelnen Wortes oder Satzes als Sprechen zu bezeichnen. So heißt es gemeinhin von Kleinkindern, die ihre ersten Worte produzieren, dass sie anfangen zu sprechen. Von Anfang an dienen diese Sprechversuche der Kommunikation; sie sind also interaktiv ausgerichtet. Sprechen ermöglicht eine Erweiterung des Mitteilungs- und Handlungsspektrums. Dies gelingt allerdings nur, wenn die nötigen Sprachmittel auf lexikalisch-semantischer und grammatikalischer Ebene zur Verfügung stehen. Sprechen ist damit eine hochkomplexe Fähigkeit, bei der alle sprachlichen Basisqualifikationen im Sinne von Ehlich et al. (2008) – die literale Basisqualifikation ausgenommen – zusammenspielen. Während Sprechen als Fertigkeit zunächst den Code, d. h. die lautliche Produktion von Sprache, in den Vordergrund stellt, fokussieren die meisten Sprachstandsdiagnoseverfahren ausgewählte Teilbereiche von Sprache, ohne dabei gezielt zwischen mündlichen und schriftlichen Produktionsformen zu unterscheiden. Meist spielt gesprochene Sprache immer dann eine Rolle, wenn die Verfahren sich an Kinder richten, die sich aufgrund ihres Alters noch vor bzw. erst zu Beginn ihres Schriftspracherwerbs befinden. Untersucht werden meist ausgewählte Teilbereiche https://doi.org/10.1515/9783110418712-017

414

Julia Webersik

wie Wortschatz und Grammatik, wobei die Spezifika mündlicher Sprachproduktion meist gar nicht oder nur unzureichend berücksichtigt werden.1 Zusammenfassende Beiträge zu den verschiedenen Sprachstandsdiagnoseverfahren für diese Zielgruppe, d. h. für Kinder im Elementarbereich bzw. zu Beginn der Primarstufe, gibt es mittlerweile zur Genüge (z. B. Lisker 2013; Neugebauer & Becker-Mrotzek 2013; Schnieders & Komor 2007; Fried 2004). Spannender ist daher die Frage, welche Verfahren tatsächlich die Fähigkeit zu sprechen im Sinne übergeordneter kommunikativer bzw. diskursiver Kompetenzen untersuchen. Denn letztlich haben die lexikalischen oder grammatikalischen Teilfähigkeiten primär eine dienende Funktion, um übergeordnete sprachliche Aufgaben zu erfüllen und die eigenen Handlungsziele erreichen zu können, wobei diese Teilfähigkeiten allein eben noch keine gute Kommunikationskompetenz ausmachen (Guckelsberger & Reich 2008: 91). Die Ausbildung diskursiver Fähigkeiten ist umso relevanter, als Gesprächskompetenz „der vielleicht wichtigste Teil der sozialen Kompetenz“ ist (Becker-Mrotzek & Brünner 2009: 7). Einen Menschen, mit dem man nicht vernünftig reden kann, nehmen wir nicht für voll, lehnen ihn ab. Ein guter Gesprächspartner zu sein, verschafft umgekehrt Achtung und Sympathie. Ein gelungenes Gespräch erzeugt Bindungen und kann Probleme lösen – im beruflichen wie im privaten Leben. (Becker-Mrotzek & Brünner 2009: 7)

Auch Schulz (2012: 4) bezeichnet mündliche Kompetenz als Basisqualifikation, die insbesondere für den Unterricht, wo Inhalte zu großen Teilen mündlich vermittelt werden und die Ausbildung mündlicher Fähigkeiten zugleich Lerngegenstand und Lernziel sind, von entscheidender Bedeutung sei. Weiterhin konnte in Studien belegt werden, dass gute mündliche Fähigkeiten eine wichtige Rolle für den späteren Erwerb von Literacy spielen (Griffin et al. 2004; Minami 2002). Mit Blick auf die so wichtige Ausbildung bildungssprachlicher Fähigkeiten im Laufe der Schulzeit wird insbesondere die mündliche Erzählkompetenz als wichtige Vorläuferfähigkeit hervorgehoben, da sie die Fähigkeit zur situationsentbundenen Kommunikation anbahnt (z. B. Lengyel 2008; Quasthoff et al. 2011). Die Ausbildung von Erzählkompetenz ist eine „komplexe Entwicklungsaufgabe, die noch weit ins Primarschulalter“ hineinragt (Lengyel 2008: 264) und sich Halm (2010) und Grommes (2015) zufolge in der Sekundarstufe fortsetzt. Vor diesem Hintergrund wird kritisiert, dass „das Sprechen im Klassenzimmer“ lange Zeit nur „dienende Funktion“ hatte und „daher als Unterrichtsgegenstand wenig(er) Beachtung“ fand (Nauwerck 2010: 177). Dieser Befund ist besorgniserregend, da sich die für gesellschaftliche Teilhabe und v. a. beruflichen Erfolg nötigen kommunikativen Kompetenzen ohne gezielte Vermittlung gerade bei Personen aus bildungsfernen Familien

1 Eine Ausnahme stellt das Verfahren von Webersik (2015) dar, das sich zwar auch auf ausgewählte morphosyntaktische und lexikalisch-semantische Teilbereiche konzentriert, dabei aber systematisch die Besonderheiten mündlicher Sprachproduktion berücksichtigt.

Sprechen

415

offensichtlich nicht ausreichend von selbst entwickeln (Becker-Mrotzek & Brünner 2009; Quasthoff 2012) und schon bei Grundschulkindern große Unterschiede in den mündlichen Erzählfähigkeiten festgestellt wurden (Quasthoff et al. 2011: 27). Die Ausbildung und Förderung diskursiver Fähigkeiten setzt eine gezielte Diagnose bereits entwickelter und sich entwickelnder Kompetenzen voraus. Dieser Beitrag fokussiert daher auf das Sprechen als von Kindern im Laufe ihres Spracherwerbs zu entwickelnde diskursive Fertigkeit. Explizit ausgeklammert hingegen wird die Diagnose allgemeinsprachlicher Kompetenzen auf Basis mündlicher Sprachdaten (vgl. Porsch und Wendt in diesem Band) sowie der Aussprache (vgl. Mehlhorn in diesem Band). Bevor im Folgenden einige Diagnoseverfahren mit Blick auf diese Zielsetzung vorgestellt werden, ist jedoch einerseits zu klären, was unter Gesprächsoder Diskurskompetenz überhaupt verstanden wird und andererseits, was bislang über ihren Erwerb bekannt ist.

2 Theoretische Fundierung 2.1 Diskurskompetenz Als Bezugsdisziplin für die Modellierung von Gesprächs- oder Diskurskompetenz bietet sich primär die (Angewandte) Gesprächs- oder Diskursforschung an. Nicht ganz unproblematisch ist dabei, dass die Gesprächsforschung traditionell eine rein empirisch-deskriptive Herangehensweise verfolgt, bei der sie „faktisches Gesprächshandeln“ untersucht, wobei „das faktische Interagieren als eine immer schon sinnvolle Lösung“ verstanden wird (Deppermann 2009: 19). Im Gegensatz dazu impliziert Gesprächskompetenz die Differenzierung von gut und weniger gut entwickelten Gesprächsfähigkeiten. Dabei beinhaltet „die normative Bestimmung von Kompetenzkriterien […] immer eine nicht-empirische Wert-Entscheidung“ (Deppermann 2009: 20). Dennoch sind inzwischen erste Modellierungen von Gesprächskompetenz bzw. kommunikativer Kompetenz entstanden, die versuchen, das „komplexe Fähigkeitsbündel“ in Form von Teilfähigkeiten zu beschreiben und dabei einen funktionalen Kompetenzbegriff zugrunde zu legen (Quasthoff 2012: 85). Becker-Mrotzek (2012) definiert im Rahmen seiner Modellierung von Gesprächskompetenz vier Dimensionen von Gesprächsfähigkeit (vgl. Abb. 1): Die thematische Fähigkeit basiert auf dem thematischen Wissen. Der Sprecher muss auf dieses zugreifen und die thematischen Inhalte in der passenden lexikalischen und syntaktischen Form kohärent versprachlichen können (Becker-Mrotzek 2012: 74). Ob und wie dies gelingt, hängt u. a. von „der Bekanntheit, der Komplexität und der subjektiven Involviertheit ab“. Weiterhin „gehört zu einer guten Gesprächskompetenz die Fähigkeit, das gemeinsame Thema dadurch voranzutreiben, dass das eigene Wissen verständlich verbalisiert und das vom Koaktanten verbalisierte Wissen in das eigene integriert wird“ (Becker-Mrotzek 2012: 79). Die Fähigkeit zur Identitätsgestaltung be-

416

Julia Webersik

rezeptiv +

+ rezeptiv

Thematische Fähigkeiten

Fähigkeiten zur Identitätsgestaltung

X

X

produktiv +

– –

+ produktiv

– –

X X Fähigkeiten zur Musterrealisierung

Fähigkeit zur Unterstützung rezeptiv +

+ rezeptiv

Abb. 1: Kompetenzmodell Gesprächsfähigkeit nach (Becker-Mrotzek 2012: 81).

zieht sich v. a. darauf, „die (Rollen)identitäten sowie weitere Personenmerkmale (Motivation, Einstellung, etc.) des anderen“ ebenso wie die „wechselseitigen Identitätszuschreibungen“ einzuschätzen und bei der Gestaltung der Redebeiträge zu berücksichtigen (Becker-Mrotzek 2012: 75). Weiterhin muss ein kompetenter Sprecher wissen, in welcher Reihenfolge und unter welchen Bedingungen die einzelnen Beiträge realisiert werden sollten. Dafür müssen typische Handlungsmuster bekannt sein und umgesetzt werden können (Fähigkeit zur Musterrealisierung, BeckerMrotzek 2012: 75). Die Fähigkeit zur Unterstützung betrifft insbesondere den Umgang mit zu erwartenden und tatsächlichen Verstehensschwierigkeiten. Dazu gehört z. B. das Antizipieren und Erkennen von Verstehensproblemen sowie eine entsprechende Reaktion darauf (z. B. größere Detailliertheit, Reformulieren, Wiederholen etc., vgl. Becker-Mrotzek 2012: 76). Bei der Diagnose von Gesprächsfähigkeit lässt sich für jede Dimension im Vierfelder-Schema in Abb. 1 eintragen, wie gut die jeweilige Fähigkeit auf produktiver und rezeptiver Ebene ausgebildet ist. „Durch die mittige Anordnung der Minuspole (= geringe Fähigkeit) ergibt sich, dass eine gute Gesprächskompetenz dann vorliegt, wenn alle vier Dimensionen möglichst weit außen angesiedelt sind“ (BeckerMrotzek 2012: 81). Auch Quasthoff (2012) definiert verschiedene Teilfähigkeiten bzw. Dimensionen von Gesprächsfähigkeit: Vertextung, Kontextualisierung und Markierung. Die Fähigkeit zur Vertextung bezieht sich auf den „Ausbau der Einheit und die Art der Verknüpfung ihrer (inhaltlichen) Elemente zu einem Ganzen auf lokaler und globaler

Sprechen

417

Ebene“ (Quasthoff 2012: 89) und entspricht damit in vielen Teilen der thematischen Fähigkeit bei Becker-Mrotzek (2012). Die Fähigkeit zur Kontextualisierung betrifft globalstrukturelle Aspekte. Dazu gehört die Fähigkeit, eine globale Einheit wie z. B. die Erzählung eines bestimmten Ereignisses eigenständig „an der richtigen Stelle im Gespräch platzieren zu können […] und dann auch einen mehrere Äußerungen umfassenden Gesprächszug anzuschließen“ (Quasthoff et al. 2011: 30). Die dritte Dimension (Markierung) bezieht sich auf die Fähigkeit, den spezifischen satzübergreifenden Beitrag durch muster- bzw. gattungsspezifische Merkmale wie typische Formulierungen und stilistische Mittel, eine genre-spezifische Struktur oder „die genre-angemessene Verwendung von Tempora und Modi“ explizit zu markieren (Quasthoff 2012: 90). Bei allen Versuchen, Gesprächskompetenz zu modellieren, weist Deppermann (2009: 24) jedoch zu Recht darauf hin, dass es aufgrund der Vielzahl unterschiedlicher Gesprächsanlässe und -aufgaben die eine Gesprächskompetenz gar nicht geben kann. Gesprächskompetenz kann demnach nur in Abhängigkeit von „den Anforderungen, Problemen und Möglichkeiten“ eines spezifischen Kommunikationsfeldes beschrieben werden. Bezogen auf unterschiedliche Kommunikationsfelder bzw. kommunikative Praktiken, Sprachhandlungsmuster und Genres ist die Forschung unterschiedlich weit. Am besten untersucht ist bislang das Feld des Erzählens, was insbesondere auch für Fragen des Erwerbs und daraus abgeleitete diagnostische Überlegungen gilt. Dabei wird wiederum zwischen verschiedenen Formen des Erzählens differenziert (mündlich vs. schriftlich, monologisch vs. dialogisch, schulisch vs. außerschulisch, Höhepunkterzählung vs. Geflechterzählung, Nacherzählung vs. Erlebniserzählung vs. Phantasieerzählung usw.), woraus sich entsprechend unterschiedliche Anforderungen ergeben (Kapica et al. 2014: 7). Das vermutlich einflussreichste Erzählmodell orientiert sich an der Struktur von Höhepunkterzählungen und geht auf empirische Studien von Labov & Waletzky (1966) zurück. Demnach setzt sich eine Erzählung aus den Komponenten abstract (Hinführung zur Erzählung), orientation (Rahmen, Kontext der Erzählung), complication (inhaltlicher Kern, Höhepunkt), evaluation (Kommentare und Bewertungen), resolution (Auflösung, Ergebnis) und coda (formaler Abschluss) zusammen, wobei nicht immer alle Strukturelemente versprachlicht werden müssen (betrifft insbesondere abstract und coda) (vgl. Hauser 2005: 84–86). Erzählkompetenz besteht darin, diese Komponenten in geeigneter Weise zu versprachlichen. Auch im Rahmen des Story-Grammar-Ansatzes wird Erzählkompetenz über die Realisierung relevanter textstruktureller Merkmale definiert. Hier geht man basierend auf generativgrammatischen und kognitionspsychologischen Annahmen von einer zugrundeliegenden Tiefenstruktur prototypischer Erzählungen aus, durch die Regeln für den Aufbau einer Erzählung definiert sind. Es existieren verschiedene Modellierungen solcher Geschichtengrammatiken.2 Exemplarisch seien hier die von 2 Für einen Überblick vgl. Hausendorf & Quasthoff (1996: 14–16).

418

Julia Webersik

Stein & Glenn (1979) angenommenen notwendigen Komponenten einer einfachen Erzählung genannt: setting (Rahmen, Kontext der Erzählung), initiating event (Auslöser für Ereignis, Reaktion etc.), internal response (innere, psychologische Reaktion der Erzählfigur), internal plan (Planung des weiteren Verhaltens), attempt (Umsetzung des Plans, Aktion), direct consequence (Ergebnis der Aktion), reaction (affektive Reaktionen, Überlegungen und Reflexion bezogen auf Aktion und Ergebnis) (Stein, Nancy, L. & Glenn 1979: 61–67). Story-grammar-Ansätze wie der von Stein & Glenn (1979) finden heute hauptsächlich im Kontext der Sprachheilpädagogik und der Diagnostik von Sprachstörungen Anwendung (z. B. Schelten-Cornish 2015). Hausendorf & Quasthoff (1989; 1996) wählen einen anderen Ansatz für ein Erzählmodell, das sich am mündlichen Erzählen von eigenen Erlebnissen orientiert, da dieses als „prototypische Form des Sprechens und Kommunizierens“ angesehen werden könne (Quasthoff et al. 2011: 22). Erzählen ist in diesem Verständnis eine in ein Gespräch eingebettete kommunikativ und interaktiv motivierte Sprechhandlung, die als Diskurseinheit von Erzähler und Zuhörer in wechselnder Rollenverteilung interaktiv ko-konstruiert wird und sich deshalb nicht allein über textstruktuelle Merkmale definieren lässt (Quasthoff et al. 2011: 28). In ihrem Modell zur Beschreibung von Erzählinteraktion postulieren Hausendorf & Quasthoff (1996: 133–146) deshalb interaktiv zu erfüllende „Jobs“, die das Interaktionsteam bei Erzählungen nacheinander bewältigen und durch bestimmte Mittel und sprachliche Formen realisieren muss: 1. Darstellung von Inhalts- und/oder Formrelevanz, d. h., eine Geschichte muss inhaltlich zum Gespräch passen und das Erzählen eine formal angemessene Aktivität sein. 2. Thematisieren, d. h., der „Eintritt in eine narrative Diskurseinheit [muss] erwartbar gemacht werden“ (Quasthoff et al. 2011: 137). 3. Elaborieren/Dramatisieren, d. h., die Narration muss sprachlich ausformuliert und ggf. im Sinne einer szenischen Erzählung dramatisiert werden. 4. Abschließen, d. h., das Ende der Erzählung muss markiert bzw. erwartbar gemacht werden. 5. Überleiten, d. h., ein nahtloser Anschluss zur nächsten Diskurseinheit muss ermöglicht werden. Ebenso wie die textstruktuellen Konzeptualisierungen von Labov & Waletzky (1966) und den Vertretern von Geschichtengrammatiken orientiert sich auch das interaktive Modell von Hausendorf und Quasthoff an Höhepunkterzählungen: „Damit ein Ereignis erzählswert ist, muss es aus dem Strom von Routineabläufen des Lebens herausgehoben werden, muss also durch Ungewöhnlichkeit, Überraschung, Dramatik erinnerungswürdig sein und Erlebnischarakter gewinnen.“ (Quasthoff et al. 2011: 23) Diese Fokussierung auf Höhepunkterzählungen wird jedoch auch kritisch gesehen: Schon Wagner (1986) hat Kritik an der normativen Setzung von Höhepunkterzählungen als Prototyp des Erzählens geübt. Auf der Basis seiner Daten, die auch sog. Geflechterzählungen

Sprechen

419

ohne Höhepunkt enthalten, fordert er, das didaktische Primat der Höhepunkterzählung zu relativieren. Geflechterzählungen sind mündliche Erzählungen, bei denen mehrer Personen gemeinsam erzählen, und zwar häufig von gemeinsamen zurückliegenden Erlebnissen. Ziel sei nicht die Darstellung eines ungewöhnlichen Ereignissen mit entsprechender Erzeugung von Spannung, sondern die Vergewisserung kollektiver Erfahrungen. Daher dürfe das Fehlen des Höhepunktes nicht als Ausdruck unvollkommender narrativer Fähigkeiten gedeutet werden. (Andresen 2013: 27)

Eine stärker psycholinguistisch motivierte Herangehensweise zur Beschreibung dessen, was Erzählfähigkeit ausmacht, wählen Berman & Slobin (1994) in ihrer sprachvergleichenden Untersuchung zur Erzählentwicklung. In ihrem Modell setzt sich Erzählkompetenz aus der Fähigkeit zur Bewältigung zweier Hauptaufgaben zusammen: filtering und packaging. Filtering bezeichnet die Fähigkeit, in Abhängigkeit von der gewählten Perspektive bzw. kommunikativen Zielsetzung und den in der jeweiligen Sprache zur Verfügung stehenden sprachlichen Mitteln einzelne Ereignisse auszuwählen und diese entsprechend des „plots“ in einer für den Hörer nachvollziehbaren Weise zu verbalisieren (Berman & Slobin 1994: 9–10). Beim packaging geht es darum, dass eine ausgereifte Erzählung nicht nur aus einer linearen Kette aufeinanderfolgender und hinsichtlich Zeit und Raum spezifizierter Ereignisse besteht, sondern dass die verbalisierten Ereignisse auch auf syntaktischer Ebene hierachisch strukturiert werden müssen (Berman & Slobin 1994: 13). Gemeint ist die Fähigkeit, die einzelnen Informationsbausteine nicht nur zeitlich und räumlich passend zu kombinieren, sondern sie mithilfe komplexer Satzgefüge auch ökonomischer „um einen zentralen Punkt herum“ anzuordnen (Halm 2010: 41). Ein linguistisches Modell zur Ermittlung der Kerninhalte konkreter Erzählungen und wie diese auf kohärente Weise zu versprachlichen sind, wird durch das Quaestio-Modell von Klein & Stutterheim (1987) vorgeschlagen, das u. a. im Rahmen von Studien zum Erzählerwerb Anwendung findet (z. B. Ahrenholz 2006; Halm 2010; Grommes 2015).3

2.2 Diskurserwerb Sowohl die Gesprächsforschung als auch die Spracherwerbsforschung haben sich lange Zeit kaum mit der Entwicklung diskursiver und pragmatischer Fähigkeiten beschäftigt. Während sich die Gesprächsforschung auf die faktische Beschreibung von Gesprächshandeln (s. o.) konzentrierte, fokussieren die meisten Arbeiten der Spracherwerbsforschung primär lexikalische und grammatikalische Teilfähigkeiten. Für den zweitsprachlichen Erwerb diskursiver Fähigkeiten liegen kaum Studien vor. Insgesamt scheint der Erwerb hier aber den gleichen Mustern zu folgen wie in der Erstsprache (Landua et al. 2008: 194), was Guckelsberger & Reich (2008: 84) darauf

3 Für eine gute Zusammenfassung des Quaestio-Modells und seiner Anwendbarkeit als Analysewerkzeug im Kontext der Erzählerwerbsforschung siehe Halm (2010).

420

Julia Webersik

zurückführen, dass die Entwicklung diskursiver wie auch pragmatischer Fähigkeiten nicht an Einzelsprachen gebunden sei, sondern vielmehr von den sozialen Umständen und Anforderungen abhänge. Gerade bezogen auf narrative Fähigkeiten ist aber einschränkend darauf hinzuweisen, dass diese durch erstsprachliche Erzähltraditionen durchaus kulturabhängig geprägt sein können. Zwar ist über „kulturspezifische Erzählelemente bei zweisprachigen Kindern und Jugendlichen kaum etwas bekannt, doch wird in einer Untersuchung festgestellt, dass Kinder mit Türkisch als Erstsprache in etwas stärkerem Maße als ihre einsprachig deutschen Peers dazu neigen, das erzählte Geschehen moralisch zu werten“. (Guckelsberger & Reich 2008: 91) Im Folgenden werden einige mit Blick auf diagnostische Verfahren besonders relevante Arbeiten vorgestellt.4 In ihren längsschnittlichen Forschungsprojekten DASS und OLDER untersuchten Quasthoff & Kern (2003) und Quasthoff et al. (2005) anhand narrativer Textsorten (Fantasie- und konversationelle Erlebniserzählung) und einer explanativ-instruktiven Diskursform (Spielanleitung) die Erzählentwicklung von Kindern im Primarschulalter. Basierend auf den Ergebnissen dieser Studien fasst Quasthoff (2012) bezogen auf die o. g. Dimensionen Vertextung, Kontextualisierung und Markierung folgende Entwicklungslinien zusammen: Vertextung: – Der kohärente Aufbau von Diskurseinheiten wird zunehmend global organisiert und folgt am Ende der Grundschulzeit für vertraute Gattungen wie dem Erzählen den strukturellen Erwartungen des Genres. – Unterschiedliche Gattungen stellen jedoch unterschiedliche strukturelle Anforderungen, sodass etwa das Anleiten erst im Verlauf der Sekundarstufe 1 strukturell angemessen realisiert wird. Kontextualisierung: – Im Verlauf des Grundschulalters können Kinder mindestens rudimentäre globale Gesprächseinheiten, die aus mehreren Zügen bestehen, in einem entsprechenden Gesprächskontext angemessen platzieren, und sie können einen derartigen Gesprächskontext selbst herstellen. – Für die selbstständige Durchführung der komplexen Einheit gemäß den situativen Erwartungen des Zuhörers brauchen Grundschulkinder in unterschiedlichem Ausmaß Zuhörerunterstützung (DASS), die sich sowohl nach den Gattungen als auch nach dem Erwerbsniveau der Kinder richtet. Markierung: – Die Fähigkeit, komplexe Diskurseinheiten in ihrer Strukturierung gemäß den spezifischen Anforderungen der jeweiligen Gattung an der sprachlichen Oberfläche angemessen zu markieren, entwickelt sich bis an das Ende der Sekundarstufe 1 selbst bei vertrauten Genres wie dem Erzählen weiter. (Quasthoff 2012: 94–95)

4 Für einen umfassenden Forschungsüberblick zum Erwerb diskursiver und dabei insbesondere narrativer Fähigkeiten siehe Guckelsberger (2008); für den Kontext Deutsch als Zweitsprache Landua et al. (2008: 194–197).

Sprechen

421

Alle anderen größer angelegten Untersuchungen zur Aneignung satzübergreifender mündlicher Fähigkeiten beziehen sich primär auf den Bereich der Erzählentwicklung von Kindern im Elementar- und Primarschulalter5, wobei sie v. a. monologische Erzählformen untersuchen. Als grundlegend sind hier die Arbeiten von Boueke & Schülein (1995), Becker (2011) und Andresen & Schmidt (2010) zu nennen, wobei sich aktuelle Diagnoseverfahren zum Erzählerwerb insbesondere auf Boueke & Schülein (1995) beziehen. In dieser Studie untersuchten die Autoren basierend auf einem Erzählmodell, das sich an Strukturmodellen aus der Erzählforschung orientiert (vgl. Kap. 2.1), mündliche Erzählungen von 96 Kindern zwischen fünf bis neun Jahren, die mithilfe einer höhepunktorientierten Bildergeschichte erhoben worden waren. Als Ergebnis dieser Untersuchung ergab sich ein vierstufiges Entwicklungsmodell der Erzählfähigkeit:6 1. Stufe der isolierten Ereignisdarstellung Zunächst haben Kinder die Fähigkeit entwickelt, begriffliche Konzepte von Gegenständen, Personen, Handlungen usw. kognitiv zu aktivieren und sprachlich umzusetzen, jedoch sind sie nicht in der Lage, diese zu strukturieren. Die einzelnen Ereignisse werden ohne temporale oder kausale Verknüpfungen hintereinander gereiht, so dass für den Zuhörer die Äußerungen nur verständlich werden, wenn er die Situation kennt. Boueke u. a. bezeichnen das Vorgehen der Kinder als ‚enumerativ‘. 2. Stufe der linearen Ereignisdarstellung Die zweite Stufe ist dadurch gekennzeichnet, dass die isoliert nebeneinander stehenden Ereignisse lokal miteinander verknüpft werden. Solche temporal und teilweise kausal verknüpften Ereignisketten werden jedoch noch sehr mechanisch verbunden (und, und dann). 3. Stufe der strukturierten Ereignisdarstellung Charakteristikum dieser Stufe ist die Durchbrechung der sequentiellen Verkettung (Planbruch). Dabei wird durch kognitive und sprachliche Markierung ein unvorhergesehenes Ereignis in die Erzählung eingebaut, wodurch der Ereignisverlauf in ein „Vorher“ und „Nachher“ gegliedert wird. 4. Stufe der narrativ strukturierten Ereignisdarstellung Auf der vierten Stufe der Entwicklung operieren die Kinder auf der obersten Ebene des Schemas, d. h., sie verfügen jetzt über die Fähigkeit, die Diskontinuität und die Kontrastivität der Ereignisfolgen durch Affekt-Markierungen emotional zu qualifizieren (Boueke u. a. 1995: 193). Den Kindern gelingt es, durch diese emotionale Aufwertung der Erzählung den Zuhörer zu involvieren und ihm dadurch ein Gefühl des Dabei-Seins zu ermöglichen (Reeb-Ramos & Jeuk 2015: 80–81).

Bezogen auf die Kritik, die an diesem Stufenmodell geübt wurde,7 sind mit Blick auf diagnostische Fragestellungen insbesondere die Ergebnisse der Studie von Be5 Eine Ausnahme stellt die Untersuchung von Halm (2010) zur Entwicklung narrativer Kompetenzen zwischen sieben und 14 Jahren dar. 6 Hier zusammengefasst aus Reeb-Ramos & Jeuk (2015: 80–81), ausführlich in Boueke & Schülein (1995: 191–193). 7 Für einen Überblick vgl. Reeb-Ramos & Jeuk (2015: 81); zur generellen Problematik von Stufenmodellen zur Erzählentwicklung vgl. Andresen (2013).

422

Julia Webersik

cker (2011) bedeutsam, der zufolge sich kindliche Erzählungen systematisch in Abhängigkeit von Erzählanlass bzw. Genre unterscheiden. So erreichten die von ihr untersuchten Kinder je nach Erzähltyp (Erlebniserzählung, Phantasieerzählung, Bildergeschichte, Nacherzählung) unterschiedliche Entwicklungsstufen. Während junge Kinder bei Erlebniserzählungen schon relativ früh die erforderlichen strukturellen Merkmale umsetzen konnten, stellte die Versprachlichung einer Bildergeschichte im Vergleich zu allen anderen Erzählformen offensichtlich die höchsten Anforderungen an die Probanden. Becker (2011: 178) begründet diesen letzten, für die Datenelizitierung im Rahmen von Diagnoseverfahren äußerst wichtigen Befund wie folgt: Für die verzögerte Entwicklung [bei Bildergeschichten, J. W.] ist zunächst die komplexe Aufgabe verantwortlich, bei der größere kognitive Leistungen vollbracht werden müssen als bei den anderen Formen. […] Allein durch den visuellen Stimulus sind schließlich mehr außersprachliche Einflüsse […] gegeben […]. Bei den übrigen Erzählformen besteht bereits die mentale Repräsentation einer Geschichte; bei dieser Aufgabe muss das Kind erst eine solche erstellen. Man mag einwenden, dass die Bildvorlage sowohl Erinnerungsschwierigkeiten ausräumt (wie etwa bei der Nacherzählung gegeben sein könnten) als auch eine episodische Gliederung vorgibt und daher eher unterstützend wirken sollte. Gerade die visuelle Präsenz stellt aber für das Kind eher eine Verwirrung der Aufgabensituation dar […]. Vor allem die jüngeren Kinder verwechseln dann Bildbeschreibung und Narration. (Becker 2011: 178)

Demgegenüber konnten „in den Bereichen Struktur und Länge sowie Affektmittel und rhythmische Elemente“ bei den Nacherzählungen eines zuvor gehörten Textes die besten Ergebnisse erzielt werden. Becker (2011: 181) schlussfolgert daher, dass sich Textvorlagen sehr positiv auf die Erzählleistung auswirken. Mit Blick auf diagnostische Fragestellungen könnte es bei solchen Nacherzählungen jedoch schwierig sein, die Einflüsse, die sich aus der Textvorlage ergeben, im Sinne der Validität zu kontrollieren (z. B. Textverstehen, Wiedergabe memorierter Einheiten). Auch wenn Guckelsberger (2008: 113–114) die Forschungssituation zum Erzählen zu Recht problematisiert, weil sich die Erhebungsmethoden teilweise extrem unterscheiden und auch die Beurteilung der Erzählfähigkeiten im Verhältnis zum Alter häufig sehr verschieden ausfällt, besteht mit Hauser (2005: 104) in der Erzählforschung „dennoch Einigkeit darüber, dass eine Entwicklung stattfindet von kurzen und wenig kohärenten Texten resp. Textfragmenten, die kein globales ErzählKonzept erahnen lassen, hin zu strukturierten und elaborierten Erzählungen, die deutlich auf den Hörer und dessen Wissen Bezug nehmen“. Neben diesen übergreifenden Erwerbsmerkmalen diskursiver bzw. narrativer Kompetenz wurden insbesondere Sprachmittel zur Herstellung von Relation genauer untersucht. Dabei wurde festgestellt, dass zu Beginn des Erwerbs vor allem reihende Konjunktionen und temporale bzw. deiktische Adverbien wie und, und da/ dann oder hier verwendet werden. Später kommen weitere temporale, kausale und adversative Konnektoren hinzu (Kapica et al. 2014: 11). Ein weiteres Untersuchungsfeld betrifft die (Personen-)Referenz. Hier zeigt sich, dass Referenz zunächst über

Sprechen

423

die Wiederaufnahme nominaler Ausdrücke hergestellt wird, bevor später auch Pronominalformen und der unbestimmte bzw. bestimmte Artikel systematisch für Referenzeinführung und -erhalt verwendet werden (vgl. Kapica et al. 2014: 10–11). Für den DaZ-Erwerb liegen nach Guckelsberger & Reich (2008: 91) ähnliche Untersuchungsergebnisse zur Erwerbsreihenfolge hinsichtlich Referenz und Relation vor: 1. Verkettung von Einzelaussagen durch Deixis und Wiederholungen der referentiellen Ausdrücke, meist unverbundene oder durch und verbundene Sätze. 2. Aktanten-Einführung und -Erhalt durch unbestimmten bzw. bestimmten Artikel. 3. Temporale Verkettungen mit dann und und dann, teilweise Inversionen zur thematischen Verkettung. Der weitere Verlauf sei gekennzeichnet durch den vermehrten Gebrauch verschiedener Konnektoren, gefolgt vom Gebrauch von Modalpartikeln, Gesprächspartikeln und Kommentaradverbien als Zeichen eines „souveränen Umgangs mit der Erzählaufgabe“.8

3 Diagnose diskursiver Fähigkeiten 3.1 Herausforderungen Angesichts der relativ dünnen Forschungslage zum Erwerb diskursiver Fähigkeiten (mit Ausnahme der Erzählforschung) überrascht es nicht, dass es nur sehr wenige linguistisch fundierte diagnostische Verfahren gibt, die systematisch Fähigkeiten der Diskursproduktion berücksichtigen.9 Dies ist auch auf die besonderen methodischen Herausforderungen zurückzuführen, die mit der Erhebung und Analyse satzübergreifender mündlicher Sprachproduktionen einhergehen. So ist mündliche Kommunikation als hoch komplexe Form sprachlichen Handelns zu verstehen, bei der nicht nur verschiedene sprachliche Teilfähigkeiten zusammenspielen, sondern

8 Neben diesen linguistisch ausgerichteten Arbeiten zur Entwicklung diskursiver Fähigkeiten beschäftigt sich auch die Entwicklungspsychologie mit Blick auf Diagnose und Therapie möglicher Sprachentwicklungsstörungen mit der Narrationsentwicklung. Dabei gilt eine „wenig entwickelte Erzählfähigkeit […] als Indikator für drohende Sprachentwicklungsprobleme“ (Fried 2008a: 42). Da der Fokus des vorliegenden Beitrags auf der Diagnose mündlicher Fähigkeiten im Rahmen eines normalen Entwicklungsverlaufs liegt, soll an dieser Stelle jedoch nicht weiter darauf eingegangen werden. 9 Ein etwas anderes Bild zeigt sich bezogen auf die Diagnose von Erzählfähigkeiten für angewandtdiagnostische Zwecke (Identifikation von Sprachstörungen). Hier wurden gerade im englischsprachigen Kontext einige Verfahren entwickelt, die mit ihrem Fokus auf Auffälligkeiten aber eine andere, weniger änderungssensitive Zielsetzung verfolgen. Für einen Überblick siehe Schröder (2010).

424

Julia Webersik

auch kognitive und soziale Faktoren sowie der unmittelbare kommunikative Kontext und dabei insbesondere der Gesprächspartner entscheidende Einflussgrößen darstellen. Mündliche Kommunikation im Sinne von Gesprächen oder Diskursen ist immer ein Zusammenspiel von sprachlichen und außersprachlichen Faktoren (Multimodalität). Deshalb ist es weder möglich, sich nur auf sprachliche Teilfähigkeiten (z. B. Wortschatz oder Grammatik) zu beschränken, um daraus Aussagen über die Gesprächskompetenz abzuleiten, noch kann man die Gesprächsfähigkeit vollständig von außersprachlichen Einflüssen ‚bereinigen‘. Der Versuch, diese Einflussgrößen zu kontrollieren, führt deshalb unweigerlich zu einer reduzierten Authentizität und damit eingeschränkten Validität. Hinzu kommt, dass die Diagnose mündlicher Spontansprache meist mit dem Fiehler’schen Dreischritt Aufzeichnung – Verschriftlichung – Analyse verbunden und damit sehr aufwändig ist (Fiehler 2006). Last but not least fehlt es an operationalisierbaren Modellierungen für spezifische Diskursformen. Denn wie oben dargestellt ist Gesprächskompetenz immer in Abhängigkeit von konkreten kommunikativen Praktiken zu sehen, so dass sich auch die kommunikativen Fähigkeiten einer Person je nach kommunikativer Aufgabe deutlich unterscheiden können. Am weitesten ist die Forschung bezogen auf die Modellierung von Erzählkompetenz (vgl. Kap. 2), doch auch hier fehlt ein verbindlicher Vergleichsmaßstab, was auch auf die traditionell eher hermeneutisch-interpretative Ausrichtung der Gesprächsforschung zurückzuführen ist.

3.2 Empfehlungen Angesichts der dünnen Forschungslage konzentrieren sich die Empfehlungen für diagnostische Verfahren auf den Bereich des Erzählens. Hier werden Beobachtungsverfahren mit einem weiter gefassten Sprachbegriff gegenüber streng standardisierten Tests, die meist nur Teilfähigkeiten erfassen können, als geeigneter eingestuft (z. B. Lengyel 2012: 19; Guckelsberger & Reich 2008: 92). Auch hinsichtlich Datenelizitierung und -auswertung können mittlerweile in Abhängigkeit von der diagnostischen Zielsetzung Empfehlungen gegeben werden:

Datenelizitierung Fast alle diagnostischen Verfahren zur Erzählkompetenz arbeiten mit Bildimpulsen, meist Bilderfolgen. Diese können laut Guckelsberger & Reich (2008: 92) „Informationen über Unterstützungsbedarf und Hörerbezug, Vollständigkeit, Referenz und Kohäsion, Kohärenz und sprachliche Mittel“ liefern, wobei jedoch die Gefahr besteht, eher Beschreibungen als Erzählungen im engeren Sinne zu elizitieren. Auch wird die Makrostruktur durch die Reihenfolge der Bilder schon vorgegeben, wobei jedoch nicht immer vorausgesetzt werden kann, dass gerade junge Kinder mit Bildergeschichten als spezifischer Geschichten-Form überhaupt vertraut sind. Demgegenüber eignen sich Nacherzählungen besser, tatsächlich Erzählungen zu elizitie-

Sprechen

425

ren. Dabei ist jedoch sicherzustellen, dass die Textvorlage verstanden wurde, oder man arbeitet mit nicht-sprachlichen Impulsen wie z. B. Stummfilmen. Gerade bei längeren Geschichten bzw. Filmen kann jedoch auch die Gedächtnisleistung Einfluss auf Vollständigkeit und Elaboriertheit haben; sie sollten deshalb nicht zu lang sein (vgl. Webersik 2012: 193). Auch muss sichergestellt werden, dass die Vorgaben auch ohne spezifisches Vorwissen verständlich sind. Stehen interaktive Fähigkeiten wie z. B. der Hörerbezug im Vordergrund des Interesses, eignen sich Erlebniserzählungen bzw. „gelenktes Erzählen im Kreis“ besser (Guckelsberger & Reich 2008: 92). Dabei ist zu beachten, dass das Verhalten des Gesprächspartners bzw. der Gesprächspartnerin die Erzählungen maßgeblich beeinflusst. Diesen Einfluss in diagnostischen Verfahren zu kontrollieren, ohne die Authentizität einzuschränken, ist eine besondere Herausforderung. Weiterhin ist zu beachten, dass „Kinder für die Planung und Formulierung einzelner Erzählschritte mehr Zeit benötigen als Erwachsene“ (Guckelsberger & Reich 2008: 92). Die Interviewpartner sollten also nicht zu schnell durch Nachfragen oder Unterstützungsangebote eingreifen (Guckelsberger & Reich 2008: 92), was Testleiter/innen erfahrungsgemäß häufig schwer fällt. Datenauswertung: mögliche Indikatoren Abgeleitet aus Studien zur Erzählentwicklung (vgl. Kap. 2) fassen Kapica et al. (2014: 9–10) einige Fähigkeiten zusammen, die „im spezifischen Kontext der Narration“ von besonderer Bedeutung sind und im Rahmen von diagnostischen Verfahren daher besondere Berücksichtigung finden sollten: a. die Fähigkeit zu sprachlicher Kooperation (Sprecherwechsel) und die Beherrschung der entsprechenden verbalen Mittel [z. B. Ankündigung, Abschluss einer Erzählung, J. W.], b. Fähigkeiten zur Berücksichtigung des Hörerwissens (z. B. Informationsauswahl und Informationsstruktur) […], c. Fähigkeiten und Mittel zur Erzeugung textueller Kohärenz (referentielle und relationale Kohärenz) [neben sprachl. Mitteln wie Konnektoren, Fokuspartikeln, Adverbien, Definitheit etc., grundlegende Komponenten einer Erzählung, also Setting, Plot, Schluss sowie Fähigkeit zur emotionalen Qualifizierung, z. B. direkte Rede, Internal-State-Ausdrücke, expressive Ausdrücke, Onomatopoetika, Mittel zur Kennzeichnung von ‚Plötzlichkeit‘ etc.)., J. W.], d. Diskursartenwissen. (Kapica et al. 2014: 9–10)

Weiterhin können nach Guckelsberger & Reich (2008: 93) auch sprachliche Mittel wie die Sprechweise (Flüssigkeit, Intonation), Wortschatzdiversität, der Gebrauch von Partikeln, die „Beibehaltung eines Ankertempus“, Tempusgebrauch und die Satzverbindungen Aufschluss über die Erzählkompetenz geben.

3.3 Diagnoseverfahren Basierend auf den theoretischen Überlegungen in Kap. 2 und den Empfehlungen in Kap. 3.2 sollen nun aktuelle Diagnoseverfahren vorgestellt und diskutiert werden,

426

Julia Webersik

die Teilbereiche satzübergreifender diskursiver Fähigkeiten gezielt in den Blick nehmen.10 Ausgangspunkt sind dabei in allen Fällen Erzählsituationen, wobei in unterschiedlichem Maße auch kommunikativ-interaktive Fähigkeiten berücksichtigt werden. HAVAS 5 HAVAS 5 (Reich & Roth 2007) ist ein profilanalytisches förderdiagnostisches Verfahren zur Analyse des Sprachstands fünf bis sechsjähriger mit Deutsch als Erst- oder Zweitsprache. Das Verfahren kann auf Deutsch und in sechs weiteren Herkunftssprachen durchgeführt werden, so dass ein Vergleich zwischen erst- und zweitsprachlichen Fähigkeiten möglich wird. Ausgangspunkt ist die Bildergeschichte „Katze und Vogel“, anhand derer eine mündliche Erzählung elizitiert wird. Dies findet im Rahmen einer Testleiter-KindInteraktion statt, die damit beginnt, dass sich das Kind die aus sechs Bildern bestehende Höhepunkt-Geschichte in Ruhe anschauen kann und dann aufgefordert wird zu erzählen, was in der Geschichte passiert. In dieser Phase soll sich der Testleiter möglichst zurückhalten, um den monologischen Erzählfluss des Kindes nicht zu unterbrechen. Anschließend werden die Bilder noch einmal schrittweise gemeinsam angeschaut und versprachlicht. Zum Schluss werden zwei Anschlussfragen gestellt: „Warum weint die Katze?“ und „Was würdest du tun, wenn du die Katze wärst?“. Bei der anschließenden Auswertung werden die Bereiche A) Aufgabenbewältigung (= Erzählfähigkeit), B) Bewältigung der Gesprächssituation, C) verbaler Wortschatz, D) Formen und Stellung des Verbs und E) Verbindung von Sätzen berücksichtigt, wobei qualitative und quantitative Auswertungsmethoden kombiniert werden. Bezogen auf diskursive Fähigkeiten sind vor allem die Bereiche A), B) und E) relevant. Im Aufgabenbereich A) zur Erzählfähigkeit wird überprüft, ob es dem Kind gelingt, „die Handlungen der beiden Akteure auf den Bilder so zu schildern, dass ein Zuhörer den jeweiligen Einzelvorgang, den Zusammenhang zwischen den Einzelvorgängen und die Pointe der Geschichte versteht“ (Reich & Roth 2004a: 5). Im Auswertungsbogen wird zu diesem Zweck für jedes Bild geprüft, ob die dargestellten Szenen versprachlicht wurden und ob das Kind die Reihenfolge der Bilder „unsicher, planlos“, „sprunghaft“ oder „folgerichtig“ wiedergegeben hat. Für die Versprachlichung der Teilszenen werden Punkte vergeben, deren Summe mit einem Durchschnittswert für ein- und zweisprachige Kinder verglichen werden kann (Reich & Roth 2004a: 8). Weiterhin wird durch die Anschlussfragen geprüft, ob das Kind die Pointe bzw. den Höhepunkt der Geschichte erkannt hat, wobei jedoch nicht berücksichtigt wird, ob die Versprachlichung der Pointe auch angemessen in die eigene Erzählung ein-

10 Die Darstellung beschränkt sich dabei auf deutschsprachige Verfahren, die nicht oder nicht nur für die Diagnose auffälliger Entwicklungsverläufe (Sprachstörungen) entwickelt wurden.

Sprechen

427

geflochten wurde. Im Auswertungsbereich E) wird mit der Analyse der verwendeten Satzverbindungen zudem ein zentraler Parameter für die Fähigkeit zur Herstellung von Kohäsion/Kohärenz berücksichtigt (Kapica et al. 2014: 13). Dabei wird basierend auf Erkenntnissen der Spracherwerbsforschung (vgl. Kap. 2.2) die Verwendung bestimmter Konnektoren als Indikator für das Erreichen der Erwerbsstufen 0–V angenommen. Zusammenfassend lässt sich sagen, dass das Verfahren damit wichtige, auch in der Erzählforschung identifizierte Komponenten von Erzählfähigkeit berücksichtigt, diese aber teilweise recht isoliert betrachtet. Die Kategorien zur Bewertung der Sequenzierung erscheinen zudem trotz Beispielen in der Anleitung recht vage und anfällig für subjektive Einflüsse des Auswerters bzw. der Auswerterin. Bezogen auf den Auswertungsbereich B) (Umgang mit der Gesprächssituation) räumen die Autoren die geringe Authentizität der Kommunikationssituation ein, glauben aber dennoch, Einblicke in die Kommunikationskompetenz der Kinder gewinnen zu können: In der gegebenen halb künstlichen, halb natürlichen Situation lassen sich sprachliche Handlungsweisen des Kindes beobachten, die als Hinweise auf seine sprachliche Selbstsicherheit verstanden werden können: Lässt es sich lenken oder ergreift es die Initiative? Muss es immer angestoßen werden oder spricht es selbstständig? Spricht es flüssig und deutlich oder stockend und undeutlich? (Reich & Roth 2004b: 2–3)

Kommunikative Kompetenz wird dabei definiert als „umfassender Ausdruck für die Fähigkeit, sprachlich gegenüber Anderen und zusammen mit Anderen zu handeln“ (Reich & Roth 2004b: 19); eine umfassendere Modellierung von Gesprächskompetenz liegt dem Verfahren jedoch nicht zugrunde. Die zwar intuitiv nachvollziehbaren Teilfähigkeiten im Auswertungsbogen, die jeweils auf einer vierstufigen Skala beurteilt werden müssen, erscheinen daher theoretisch relativ dünn fundiert: 1. „Initiative während des Gesprächs“ (0 = „nie eigenaktiv“ bis 4 = „durchgehend eigenaktiv“), 2. „Kontinuität des Sprechens“ (0 = „verstummt häufig“ bis 4 = „spricht durchgehend von selbst“), 3. „Flüssigkeit des Sprechens“ (0 = „durchgehend stockend“ bis 4 = „durchgehend flüssig“) und 4. „Deutlichkeit der Aussprache“ (0 = „durchgehend undeutlich“ bis 4 = „durchgehend deutlich“). Auch sind subjektive Einflüsse bei der Einstufung relativ wahrscheinlich. Eine systematische Validierung von HAVAS hat bislang nicht stattgefunden bzw. die Ergebnisse wurden nicht veröffentlicht.

Delfin 4 und 5 Das Verfahren Delfin 4 (Fried 2008b) ist ein Screeningverfahren für Vierjährige, bestehend aus den Stufen 1 „Besuch im Zoo“ und 2 „Besuch im Pfiffikushaus“, mit dem bis vor kurzem in NRW Kita-Kinder zwei Jahre vor der Einschulung getestet wurden. Für Kinder, bei denen Delfin 4 noch nicht durchgeführt wurde, steht seit 2010 mit Delfin 5 (Fried 2010) ein an Delfin 4 angelehntes Instrument für Fünfjährige

428

Julia Webersik

zur Verfügung, durch das ebenfalls Sprachförderbedarf diagnostiziert werden soll. In beiden Fällen handelt es sich um standardisierte, normierte und messtheoretisch erfolgreich geprüfte Testverfahren, die v. a. zur Selektionsdiagnostik entwickelt wurden. Für die Durchführung werden jeweils zwei Personen benötigt, von denen die eine die Testung durchführt, während die andere die Leistungen des Kindes auf einem Protokollbogen festhält. Dabei werden für das Auftreten verschiedener Merkmale Punkte vergeben, die dann mit Normwerten verglichen werden können. Während die beiden Stufen von Delfin 4 als Gruppentestung in Form eines Brettspiels mit bis zu vier Kindern, bei dem die Mitspieler verschiedene sprachliche Aufgaben bewältigen müssen, angelegt ist, wird Delfin 5 mit ähnlich spielerischen Elementen als Einzeltestung durchgeführt. In allen drei Verfahren zielt ein Aufgabenbereich auf die Untersuchung satzübergreifender mündlicher Fähigkeiten, wobei es primär um Erzählfähigkeiten geht. Beim Grobscreening auf Stufe 1 ist dies die Aufgabe „Bildbeschreibung“. Ziel dieser Aufgabe ist es, „herauszufinden, inwieweit ein Kind schon in der Lage ist, die Beschreibung eines Bildausschnittes des [Spiel-]planes zu strukturieren und auszugestalten“ (Fried 2008a: 26). Zu diesem Zweck werden die Kinder aufgefordert, sich einen Bildausschnitt mit einem Zoogehege genau anzuschauen und zu erzählen, was dort alles los ist. Nachdem zunächst Zeit für spontanes Erzählen gegeben wird, kann das Kind zusätzlich zum Erzählen ermutigt werden, indem der Testleiter z. B. auf den Höhepunkt deutet oder das Kind auffordert, von eigenen Erlebnissen zu erzählen. Während Stufe 1 eher zur Beschreibung des Bildimpulses als zu einer Erzählung auffordert, soll die in Stufe 2 sowie in Delfin 5 eingesetzte Bildergeschichte zum Erzählen im eigentlichen Sinne motivieren. Dafür wird das Kind aufgefordert, sich zunächst alle vier Bilder, die in Form eines Bilderbuches präsentiert werden, in Ruhe anzuschauen und dann die ganze Geschichte zu erzählen. Das Verhalten des Testleiters folgt dabei standardisierten Regeln, die dazu dienen, das Kind zwar zum (Weiter-)Sprechen zu motivieren, dabei jedoch keine sprachlichen oder inhaltlichen Hilfestellungen zu geben. Bei der Auswertung in Stufe 1 stehen inhaltliche Vollständigkeit bzw. Ausführlichkeit, erste Formen der Verknüpfung sowie die Markierung eines möglichen Höhepunktes im Vordergrund. Ergänzend zu diesen Aspekten werden im Auswertungsbogen von Stufe 2 ebenso wie bei Delfin 5 zusätzlich affektive, evaluative und ansatzweise auch interaktive Merkmale erfasst. Auch berücksichtigt die Auswertung, ob die Erzählung des Kindes eine Makrostruktur erkennen lässt und HauptNebensatz-Konstruktionen enthält. Hinsichtlich seiner erzähltheoretischen Orientierung ist Delfin 4/5 damit in der Tradition von Labov & Waletzky (1966) und Boueke & Schülein (1995) zu verorten (vgl. Kap. 2). Als Stimuli werden Bildvorlagen eingesetzt, wobei wie schon bei HAVAS 5 zu bedenken ist, dass sich diese gerade für Kinder im Vorschulalter nur bedingt für die Erfassung von Erzählfähigkeiten eignen. Erzählkompetenz wird hier primär an textstrukturellen Merkmale von Erzählungen festgemacht, während interaktive Fähigkeiten, wie sie in authentischen Erzählsituationen gefordert sind und

Sprechen

429

entsprechend in den Modellen von Becker-Mrotzek und Quasthoff (vgl. Kap. 2.1) konzeptualisiert werden, kaum berücksichtigt werden. Darüber hinaus sind viele Kinder von der Testsituation eingeschüchtert, was bei bis zu einem Viertel der Kinder zur Testverweigerung führt (vgl. Settinieri 2012). Dies hat natürlich auch damit zu tun, dass in Delfin 4/5 aus Gründen der Standardisierung und Objektivität tendenziell monologische und daher für die anvisierte Zielgruppe wenig authentische Erzählungen der Kinder elizitiert werden. Diese ausschließlich monolinguale Norm verstößt Settinieri (2012) zufolge außerdem gegen das Primat der Testfairness.

Deutsch für den Schulstart (Klages & Kaltenbacher 2013) Auch im Rahmen von Deutsch für den Schulstart wurde ein Verfahren zur Diagnose von Erzählfähigkeiten entwickelt (vgl. Ermonies-Jargielo, Klages & Kaltenbacher 2014), das eine förderdiagnostische Zielsetzung verfolgt und diverse anknüpfende Förderempfehlungen und -materialien enthält. Es handelt sich dabei um ein informelles Verfahren, das innerhalb von ca. zehn Minuten mit vier bis achtjährigen Kindern durchgeführt werden kann. Ebenso wie bei den bisher beschriebenen Verfahren besteht die Aufgabe in der Versprachlichung einer Bildergeschichte mit Höhepunkt, hier bestehend aus fünf Bildern. Anders als bei HAVAS 5 und Delfin 4/5 wird die Erzählsituation jedoch authentischer gestaltet: Nachdem sich Testleiter bzw. Testleiterin und Kind gemeinsam die Bildergeschichte angeschaut und orientiert an vorgegebenen Fragen bzw. Impulsen darüber unterhalten haben, soll das Kind die Geschichte ohne Bildvorlage einer Handpuppe erzählen, die sich sehr für die Geschichte interessiert, diese aber nicht kennt (Ermonies-Jargielo et al. 2014b: 1–3). Kind und Testleiter/innen sollten sich nach Möglichkeit kennen. Außerdem wird empfohlen, die Äußerungen des Kindes aufzunehmen, so dass die Auswertung anhand der Transkription dieser Tonaufnahmen im Nachhinein durchgeführt werden kann. Dafür liegt ein Auswertungsbogen vor, der folgende Fähigkeitsbereiche erfassen soll: – Vollständigkeit und Differenziertheit der Erzählung (d. h., wie viele Inhalte/Szenen der Bildergeschichte das Kind in seiner Erzählung wiedergibt); – die richtige zeitliche Abfolge der erzählten Inhalte/Szenen; – die Verknüpfung der Sätze (z. B. zuerst, und dann, aber, weil, zum Schluss). (Ermonies-Jargielo et al. 2014b: 1)

Damit stehen wiederum textuelle Merkmale von Erzählungen im Vordergrund, während interaktive und kommunikative Fähigkeiten nicht erfasst werden. Auch Merkmale hinsichtlich Quasthoffs Dimension der Markierung, wie sie bei Kindern im Primarschulalter durchaus schon erwartbar sind, werden nicht berücksichtigt. Dennoch erfasst das Verfahren durch die Berücksichtigung der Kriterien Vollständigkeit, Sequenzierung und Verkettung anerkannte Indikatoren narrativer Kompetenz. Im Gegensatz zu HAVAS 5, wo die verwendeten Konnektoren verschiedenen Entwicklungsstufen zugeordnet werden, werden hier unabhängig von der Art der Verknüp-

430

Julia Webersik

fung lediglich die Häufigkeit sowie die Korrektheit der Verwendung vermerkt. Bezüglich der Frage nach der richtigen Reihenfolge der versprachlichten Inhalte kann der Auswerter nur zwischen „ja“ (= richtig), „nur teilweise“ und „nein“ (= falsch) entscheiden. Dabei wird unterstellt, dass es nur die eine, im Auswertungsbogen vorgegebene, richtige Reihenfolge gibt, ohne zu berücksichtigen, dass gerade beim kreativen Erzählen auch Vor- oder Rückgriffe auf bestimmte Ereignisse möglich sind, die die chronologische Handlungsabfolge zwar unterbrechen, die Narration aber abwechslungsreicher und spannender gestalten können.

Diagnosewerkzeug „mündliches Erzählen“ Ein weiteres bildgesteuertes Verfahren stellen Reeb-Ramos & Jeuk (2015) vor. Es handelt sich dabei um ein informelles Verfahren, das sich an ältere Kinder und Jugendliche im Sekundarschulalter richtet und als Einzelinterview durchgeführt wird. Ziel ist eine individuelle Förderdiagnose, die auch daraus abgeleitete konkrete Förderempfehlungen mit einschließt. Zur Elizitierung der Sprachproben wird den Probanden eine Bildergeschichte bestehend aus acht Bildern vorgelegt, die sie Bild für Bild möglichst eigenständig, d. h. monologisch beschreiben sollen. Als Vorschlag für die Formulierung dieser Aufgabe heißt es: „Ich habe eine Bildergeschichte mitgebracht. Was siehst du auf dem ersten Bild?“ (Reeb-Ramos & Jeuk 2015: 97). Durch diese Durchführungsanweisung wird die bei Bildergeschichten ohnehin gegebene Gefahr, dass die Bilder eher nacheinander beschrieben werden, anstatt eine Erzählung im eigentlichen Sinne zu produzieren, noch verstärkt. Die Entscheidung für eine Bildergeschichte als Stimulus wird von den Autoren wie folgt begründet: Bildergeschichten sind gut geeignet, Schüler zum Sprechen anzuregen, um auf diese Weise möglichst viele auswertbare Äußerungen aufnehmen zu können […]. Allerdings muss beachtet werden, dass durch die vorgegebene Struktur der Bildergeschichte einige Schüler in ihrer Erzählfreude auch eingeengt werden können. Dieser Nachteil wird in Kauf genommen, da sich gezeigt hat, dass sich so vergleichsweise viele Äußerungen der Schüler erheben lassen. (ReebRamos & Jeuk 2015: 79)

Im Vordergrund steht also die Elizitierung möglichst umfangreicher Sprachproben, wobei die Textsorte bzw. das sprachliche Handlungsmuster eine nachgeordnete Rolle spielt. Dies ist für die verschiedenen grammatikalischen und lexikalischen Auswertungsbereiche des Verfahrens nachvollziehbar, stellt für die Diagnose von Erzählkompetenz aber einen Nachteil dar. Weiterhin schränken die Autoren ein, dass „nur einzelne Aspekte der Gesprächskompetenz analysiert werden, denn durch die mündliche Nacherzählung der Bildergeschichte findet eine Einschränkung der kommunikativen Situation statt“ (Reeb-Ramos & Jeuk 2015: 82). Nachdem die Geschichte versprachlicht wurde, werden zwei Abschlussfragen gestellt („Warum ist der Fuchs traurig?“ und „Warum freut sich der Storch?“), die

Sprechen

431

noch einmal auf die Pointe der Geschichte abzielen und über die „sich ein kurzes Gespräch entspannen“ könnte (Reeb-Ramos & Jeuk 2015: 97). Die verschiedenen Durchführungshinweise zeigen, dass sowohl zu narrativem als auch deskriptivem und diskursivem Sprechen motiviert wird, wobei es teilweise zu einer für die Diagnose nicht unproblematischen Mischung von Handlungsmustern kommen kann. Die Äußerungen der Schüler werden in einen Protokollbogen eingetragen und dann hinsichtlich verschiedener diskursiver bzw. narrativer, morphosyntaktischer und lexikalisch-semantischer Kriterien ausgewertet. Der hier interessierende Auswertungsbogen zu den Gesprächs- bzw. Erzählfähigkeiten umfasst die folgenden Kategorien: 1. Umgang mit der Reihenfolge der Bilder (Skala: planlos/sprunghaft/folgerichtig), 2. Bezug der Äußerungen zu den Bildern (Skala: angedeutet/vollständig/ausführlich), 3. Flüssigkeit des Sprechens (Skala: stockend/häufig flüssig/flüssig), 4. Verknüpfung der Äußerungen (Skala: wenig/„dann“/„und dann“/weitere), 5. Referenz (Skala: Nomen/Pronomen/Pronomen korrekt), 6. Eigenaktivität (Skala: wenig/häufig/immer), 7. Emotionale Markierung – sprachlich (Skala: wenig/teilweise/häufig), 8. Emotionale Markierung – inhaltlich (Skala: wenig/teilweise/häufig), 9. Beteiligung des Zuhörers (Skala: umfangreich/stellenweise/kaum). Zum Schluss sieht der Auswertungsbogen eine zusammenfassende Zuordnung zu den von Boueke & Schülein (1995) identifizierten Strukturtypen (vgl. Kap. 2.2) vor. Damit werden wichtige Merkmale, die in der Erzählforschung als relevant bzw. als geeignete Indikatoren für eine sich entwickelnde Erzählfähigkeit identifiziert wurden, berücksichtigt und auf ein anerkanntes Entwicklungsmodell zur Erzählkompetenz bezogen. Einschränkend ist jedoch zu sagen, dass die Kategorien der Einschätzungs-Skalen wenig trennscharf und nicht immer eindeutig sind (z. B. „planlos/sprunghaft/folgerichtig“, oder „angedeutet/vollständig/ausführlich“), was die Objektivität des Verfahrens einschränken dürfte. Die Kategorien zur Gesprächskompetenz („Flüssigkeit des Sprechens“, „Initiative während des Gesprächs“ und „Beteiligung des Zuhörers“) betreffen zwar ebenfalls relevante Merkmale von Gesprächskompetenz, werden aber auf kein bestimmtes Kompetenzmodell bezogen und wirken entsprechend unspezifisch. DO-BINE DO-BINE (Quasthoff et al. 2011) ist ein standardisiertes und teststatistisch geprüftes11 Beobachtungsinstrument zur Erfassung interaktiver Erzählfähigkeiten von vier 11 Die statistische Prüfung des Verfahrens ergab zufriedenstellende Ergebnisse hinsichtlich der Reliabilität des Gesamtwertes von DO-BINE sowie Hinweise auf die Validität des Verfahrens. Nicht geprüft wurde die Objektivität des Verfahrens (vgl. Lengning et al. 2012: 131–136).

432

Julia Webersik

bis siebenjährigen Kindern mit entwicklungssensitiver und förderdiagnostischer Zielsetzung. Dabei versteht sich DO-BINE zwar nicht als Test, bemüht sich aber sehr wohl darum, ein objektivierbares Einschätzungsinstrument vorzulegen, das eine relativ komplexe Fähigkeit wie das Erzählen in Gesprächen in einer alltagstauglichen, umfassenden und prognostisch relevanten Weise erlaubt. DO-BINE blendet also nicht die Funktionalität, Kontextualität und Interaktivität sprachlicher Prozesse aus Gründen der Operationalisierbarkeit aus. (Quasthoff et al. 2011: 44)

DO-BINE basiert auf dem in Kap. 2.1 beschriebenen Modell diskursiver Kompetenz nach Quasthoff mit den Komponenten Vertextung, Kontextualisierung und Markierung, die in DO-BINE als globalsemantische und globalstrukturelle Dimension bzw. Dimension der Form bezeichnet werden, inhaltlich aber weitgehend identisch sind (vgl. Quasthoff et al. 2011: 30–31). Anders als bei den bisherigen Verfahren, die alle mit Bildimpulsen arbeiten, werden in DO-BINE Erlebniserzählungen erhoben, die den Ergebnissen von Becker (2011) zufolge von der angesprochenen Altersgruppe am besten bewältigt werden können und zudem für die alltägliche Kommunikation äußerst relevant sind (vgl. Kap. 2.2). Dafür „werden in einem Stuhlkreis mit mehreren Beteiligten zwei erzählenswerte Anlässe – der ‚Erbsenvorfall‘ und der ‚Keksvorfall‘ – inszeniert“, wobei die Kinder aktiv handelnd eingebunden werden (Lengning et al. 2012: 132). Diese beiden Vorfälle sollen die Kinder anschließend in einem Einzelinterview einer Person erzählen, die zuvor nicht anwesend war. Dabei agiert der Gesprächspartner durchaus als aktiver Zuhörer, wobei seine Beiträge standardisierten Regeln folgen, so dass bei einer größtmöglichen Authentizität dennoch für alle Kinder die gleichen Gesprächsbedingungen gelten, was eine zentrale Grundlage für vergleichbare Ergebnisse ist. Das Erzählinterview wird aufgenommen und anschließend transkribiert. Daran schließt sich die Auswertung mithilfe eines Protokollbogens an, der sich an den drei Dimensionen des zugrunde gelegten Modells zur Diskurskompetenz orientiert. Zu diesem Zweck werden den drei Dimensionen sprachliche Teilfähigkeiten zugeordnet, die anhand von insgesamt 13 Abfragen beurteilt und bepunktet werden, wofür umfangreiche und detaillierte Auswertungshinweise mit vielen Beispielen vorliegen (vgl. Quasthoff et al. 2011: 78–99): I Globalsemantische Dimension 1. Wesentliche Informationen (Inhalte) für den Einstieg 2. Wesentliche Informationen (Inhalte) im Erzählverlauf 3. Wahl einer Ereignisperspektive bei der Wiedergabe des Höhepunktes II Globalstrukturelle Dimension 4. Interaktive Selbstständigkeit des Kindes beim Einstieg in die Erzählung 5. Längere sprachliche Einheiten 6. Interaktive Selbstständigkeit des Kinds während des Erzählprozesses 7. Selbstständiges Abschließen

Sprechen

433

III Dimension der formalen Umsetzung a) global 8. Hervorbringung der Höhepunkte 9. Hervorbringung des Einstiegs 10. Hervorbringung des Abschlusses b) lokal 11. Einführung der zentralen Bezugnahmen in der Erzählung 12. Bezug zu vorhergehenden Äußerungen 13. Vertextung des Inhalts Während die Gesamtpunktzahl die Erzählkompetenz insgesamt wiedergibt, lässt sich aus dem Vergleich der Punktzahl pro Dimension ableiten, ob insgesamt ein synchrones Entwicklungsprofil vorliegt oder die Fähigkeiten unterschiedlich gut entwickelt sind (Quasthoff et al. 2011: 100). Die Aussagekraft ist aber dahingehend einzuschränken, dass die Reliabilität der einzelnen Dimensionen bislang nicht zufriedenstellend ist (Lengning et al. 2012: 133). Auch die faktorielle bzw. Konstruktvalidität konnte statistisch bislang nicht nachgewiesen werden, was auch an der relativ geringen Stichprobengröße liegen kann.12 Zusammenfassend lässt sich dennoch festhalten, dass mit DO-BINE ein Verfahren vorliegt, das eine systematische Operationalisierung eines anerkannten Diskurskompetenzmodells darstellt. Als Besonderheit ist weiterhin das bewusst interaktiv ausgerichtete Elizitierungsverfahren zu nennen, bei dem erstmals eine authentische und kindgerechte Erzählsituation (Erlebniserzählung) mit einer standardisierten Durchführung und Auswertung kombiniert wird. sismik und seldak Bestehend aus Beobachtungsbogen und Begleitheft stellen sismik (Ulich & Mayr 2005) und seldak (Ulich & Mayr 2006) förderdiagnostische Verfahren dar, die die Entwicklung von Kindern in alltäglichen Situationen beobachten und dokumentieren. Dabei richten sie sich an dreieinhalb bis sechsjährige Kinder, basieren auf sehr ähnlichen konzeptionellen Überlegungen und gleichen sich auch in der Vorgehensweise. Unterschiede bestehen bezogen auf die Zielgruppen: Während sich sismik an Kinder mit Deutsch als Zweitsprache richtet, wurde seldak für monolingual deutschsprachig aufwachsende Kinder entwickelt und ist verglichen mit sismik vor allem im Grammatikbereich auf einem höheren Schwierigkeitsniveau angesiedelt (Mayr & Ulich 2010: 77). Die Verfahren sollen primär eine qualitative Analyse von Beobachtungen für fachliche Reflexionen und die Ableitung von Fördermaßnahmen ermöglichen. Zu-

12 Vor diesem Hintergrund kann auch das angenommene Kompetenzmodell bislang nicht als empirisch geprüft gelten.

434

Julia Webersik

sätzlich wird aber eine quantitative Auswertung anhand von faktorenanalytisch ermittelten Dimensionen bzw. entsprechender Skalen ermöglicht.13 Die Ergebnisse können dann mit Prozentnormen, die im Zuge der Normierung aufgestellt wurden, verglichen werden. Hinsichtlich der Messgüte wird eine hohe Reliabilität der Skalen bestätigt. Nicht ausreichend gesichert ist die Validität, da diese nicht empirisch geprüft wurde und dem Verfahren kein eindeutiges theoretisches Konstrukt zugrunde liegt. Auch die Objektivität ist aufgrund eines relativ großen Interpretationsspielraumes bei der Beurteilung der einzelnen Items möglicherweise eingeschränkt (Trägerkonsortium BiSS 2016a, 2016b). Inhaltlich fokussieren beide Verfahren vor allem Interesse bzw. Engagiertheit bei sprachbezogenen Angeboten (Ulich & Mayr 2008: 14). Dabei beziehen sich die Autoren auf psychologische Arbeiten, insbesondere zum Konzept der Engagiertheit und zum Beziehungsverhalten (vgl. Mayr & Ulich 2010: 80–82). Hintergrund ist die Annahme, dass ein erfolgreicher Spracherwerb maßgeblich von diesen Faktoren abhängt. Bei sismik und seldak wird sprachliches Verhalten in vielen verschiedenen kommunikativen Situationen (z. B. Gesprächsrunden, Rollenspiele, Bilderbuch-Gespräche, Erzählen, Einzelgespräche, Sprachspiele) beobachtet, wobei es weniger um die Erfassung spezifischer sprachlicher Kompetenzbereiche geht als um die Beobachtung der Sprachlernmotivation.14 Dies spiegelt sich auch in den rechnerisch konstruierten Skalen zum Verhalten in bestimmten Kommunikationssituationen (z. B. Gesprächsrunden/Gruppendiskussionen, Rollenspiele, Einzelgespräche mit pädagogischen Bezugspersonen) wieder. Bezogen auf die hier interessierenden diskursiven Fähigkeiten im linguistischen Sinne sind am ehesten die Skalen „Bilderbuchbetrachtung als pädagogisches Angebot in Kleingruppe“ in sismik (Skala G) und seldak (Skala B) sowie „Kinder erzählen als Erzähler“ in seldak (Skala E) von Interesse. Die auf einer sechsstufigen Skala zu beurteilenden Items berücksichtigen von den in der Erzählforschung als relevant eingestuften Teilfähigkeiten allerdings nur: – die Fähigkeit zur Markierung der Gattung, – die Fähigkeit, den nötigen kontextuellen Rahmen für die eigene Erzählung zu liefern, – die Fähigkeit, Inhalte narrativ zu verknüpfen. Aufgrund der Ausrichtung auf motivationale und soziale Aspekte des Sprachverhaltens sowie literale Vorläuferfähigkeiten ergibt sich mit diesen und weiteren, auf die anderen Skalen verteilten Items zwar eine Zusammenschau verschiedener diskurs-

13 Vgl. die ausführliche Dokumentation der Skalenkonstruktion von seldak in Mayr & Ulich (2010). 14 In einem kürzeren, zweiten Teil werden jedoch aus ausgewählte sprachliche Teilbereiche wie Artikulation, Grammatik und Wortschatz erfasst (Ulich & Mayr 2008: 16–17).

Sprechen

435

kompetenzrelevanter Einzelaspekte, nicht aber ein zusammenhängendes Bild kommunikativer Kompetenz im Sinne linguistischer Modellierungen (vgl. Kap. 2.1).

4 Fazit Zusammenfassend lässt sich festhalten, dass linguistisch und empirisch fundierte Verfahren zur Diagnose satzübergreifender diskursiver Fähigkeiten nach wie vor ein großes Desiderat darstellen. Dies liegt zum einen daran, dass die existierenden Modellierungen von Gesprächskompetenz aufgrund der Multimodalität und Interaktivität mündlicher Kommunikation und des Zusammenspiels verschiedener sprachlicher Teilfähigkeiten sehr komplex und damit schwer operationalisierbar sind. Die vorliegenden Verfahren konzentrieren sich fast ausschließlich auf den vergleichsweise gut erforschten Bereich des Erzählens, wobei fast alle Instrumente mit Bildimpulsen als Stimuli arbeiten. Diese sind jedoch vor allem bei jüngeren Kindern eher ungeeignet, um narrative Fähigkeiten zu untersuchen. Außerdem zielen mit einer Ausnahme alle Verfahren auf Höhepunkterzählungen ab. Das einzige Verfahren, das ein theoretisch und empirisch fundiertes und zudem interaktiv ausgerichtetes Diskurskompetenzmodell zugrunde legt und systematisch operationalisiert, ist derzeit DO-BINE.

Literatur Ahrenholz, Bernt (2006): Zur Entwicklung mündlicher Sprachkompetenzen bei Schülerinnen und Schülern mit Migrationshintergrund. In Bernt Ahrenholz & Ernst Apeltauer (Hrsg.), Zweitspracherwerb und curriculare Dimensionen: Empirische Untersuchungen zum Deutschlernen in Kindergarten und Grundschule (Forum Sprachlehrforschung 6), 91–109. Tübingen: Stauffenburg. Andresen, Helga (2013): Zur Problematik von Stufenmodellen bei der Erzählentwicklung in Spracherwerbsforschung und Sprachdidaktik. In Tabea Becker & Petra Wieler (Hrsg.), Erzählforschung und Erzähldidaktik heute: Entwicklungslinien, Konzepte, Perspektiven (Stauffenburg Deutschdidaktik 1), 19–38. Tübingen: Stauffenburg. Andresen, Helga & Astrid Schmidt (2010): Abschlussbericht zum Projekt „Sprachliche Fähigkeiten vierjähriger Kinder beim Rollenspiel und Erzählen in einer förderorientierten Perspektive für den Kindergarten“. Flensburg: unveröffentlicht. Becker, Tabea (2011): Kinder lernen erzählen. 3. Aufl. Baltmannsweiler: Techn. Univ. Becker-Mrotzek, Michael (2012): Mündliche Kommunikationskompetenz. In Michael BeckerMrotzek & Winfried Ulrich (Hrsg.), Mündliche Kommunikation und Gesprächsdidaktik, 2. Aufl. (DTP; Bd. 3), 66–83. Baltmannsweiler: Schneider Hohengehren. Becker-Mrotzek, Michael & Gisela Brünner (2009): Einleitung. In Michael Becker-Mrotzek & Gisela Brünner (Hrsg.), Analyse und Vermittlung von Gesprächskompetenz, 2. Aufl. (Forum angewandte Linguistik 43), 7–14. Frankfurt am Main: Lang. Berman, Ruth A. & Dan I. Slobin (1994): A Crosslinguistic Developmental Study (Relating events in narrative [Vol. 1]). Hillsdale, NJ u. a.: Erlbaum.

436

Julia Webersik

Boueke, Dietrich & Frieder Schülein (1995): Wie Kinder erzählen: Untersuchungen zur Erzähltheorie und zur Entwicklung narrativer Fähigkeiten. München: Fink. Brünner, Gisela (2012): Analyse mündlicher Kommunikation. In Michael Becker-Mrotzek & Winfried Ulrich (Hrsg.), Mündliche Kommunikation und Gesprächsdidaktik, 3. Aufl. (DTP; Bd. 3), 52–65. Baltmannsweiler: Schneider Hohengehren. Deppermann, Arnulf (2009): ‚Gesprächskompetenz‘ − Probleme und Herausforderungen eines möglichen Begriffs. In Michael Becker-Mrotzek & Gisela Brünner (Hrsg.), Analyse und Vermittlung von Gesprächskompetenz, 3. Aufl. (Forum angewandte Linguistik 43), 15–27. Frankfurt am Main: Lang. Ehlich, Konrad, Ursula Bredel & Hans H. Reich (Hrsg.) (2008): Referenzrahmen zur altersspezifischen Sprachaneignung (Bildungsforschung 29/1). Berlin u. a.: BMBF, Referat Bildungsforschung. Ermonies-Jargielo, Joanna, Hana Klages & Erika Kaltenbacher (2014): Deutsch für den Schulstart: Erzählen. Fiehler, Reinhard (2006): Gesprochene Sprache. In Duden (Hrsg.), Die Grammatik. Unter Mitarbeit von Kathrin Kunkel-Razum und Franziska Münzberg. Überarb. Neudr. der 7., völlig neu erarb. und erw. Aufl. / [Reihe: Der Duden: in 12 Bänden; das Standardwerk zur deutschen Sprache / hrsg. vom Wiss. Rat der Dudenred.: Matthias Wermke …; Bd. 4], 1175–1256. Mannheim: Dudenverl. Fried, Lilian (2004): Expertise zu Sprachstandserhebungen für Kindergartenkinder und Schulänfänger: Eine kritische Betrachtung. München: Dt. Jugendinst. Fried, Lilian (2008a): Delfin 4: Durchführungsanleitung zur Stufe 1. http://www.lvr.de/media/ wwwlvrde/jugend/service/rundschreiben/dokumente_96/kinder_und_familien/ sprachfoerderung/Nr554_durchfuehrungsanleitung.pdf (07. 09. 2016). Fried, Lilian (2008b): Delfin 4: Screening Stufe 1 und 2. Düsseldorf: Ministerium für Schule und Weiterbildung NRW. Fried, Lilian (2010): Delfin 5 – Diagnostik, Elternarbeit und Förderung der Sprachkompetenz Fünfjähriger in NRW. Dortmund: Technische Universität. Griffin, Terri M., Lowry Hemphill, Linda Camp & Dennis P. Wolf (2004): Oral Discourse in the Preschool Years and Later Literacy Skills. First Language 24 (2). 123–147. Grommes, Patrick (2015): Quaestio und Erzählstruktur in Texten mehrsprachiger Jugendlicher. In Heidi Rösch & Julia Webersik (Hrsg.), Deutsch als Zweitsprache − Erwerb und Didaktik: Beiträge aus dem 10. Workshop „Kinder mit Migrationshintergrund“, 2014, 127–143. Stuttgart: Fillibach bei Klett. Guckelsberger, Susanne (2008): Diskursive Basisqualifikation. In Konrad Ehlich, Ursula Bredel & Hans H. Reich (Hrsg.), Referenzrahmen zur altersspezifischen Sprachaneignung − Forschungsgrundlagen (Bildungsforschung 29/2), 103–133. Berlin u. a.: BMBF, Referat Bildungsforschung. Guckelsberger, Susanne & Hans H. Reich (2008): Diskursive Basisqualifikation. In Konrad Ehlich, Ursula Bredel & Hans H. Reich (Hrsg.), Referenzrahmen zur altersspezifischen Sprachaneignung (Bildungsforschung 29/1), 83–93. Berlin u. a.: BMBF, Referat Bildungsforschung. Halm, Ute (2010): Die Entwicklung narrativer Kompetenz bei Kindern zwischen 7 und 14 Jahren. Marburg, Heidelberg: Univ. Hausendorf, Heiko & Uta Quasthoff (1989): Ein Modell zur Beschreibung von Erzählerwerb bei Kindern. In Konrad Ehlich & Klaus R. Wagner (Hrsg.), Erzähl-Erwerb (Arbeiten zur Sprachanalyse 8), 89–112. Bern: Lang. Hausendorf, Heiko & Uta M. Quasthoff (1996): Sprachentwicklung und Interaktion: Eine linguistische Studie zum Erwerb von Diskursfähigkeiten. Opladen: Westdt. Verl. Hauser, Stefan (2005): Wie Kinder Witze erzählen: Eine linguistische Studie zum Erwerb narrativer Fähigkeiten (Zürcher germanistische Studien Bd. 60). Bern, New York: P. Lang.

Sprechen

437

Kapica, Natalia, Hana Klages & Giulio Pagonis (2014): Narrative Kompetenz: Anforderungen an ein Verfahren der Sprachstandsfeststellung im Elementarbereich. Zeitschrift für Interkulturellen Fremdsprachenunterricht 2. 5–19. Klages, Hana & Erika Kaltenbacher (2013): Deutsch für den Schulstart. Fördermaterialien für Vorschüler mit Deutsch als Erst- oder Zweitsprache. Inkl. Verfahren der Sprachstandsfeststellung. Heidelberg: IDF. Vertrieb über Baier Digitaldruck. Klein, Wolfgang & Christiane von Stutterheim (1987): Quaestio und referentielle Bewegung in Erzählungen. Linguistische Berichte 109/87 87(109). 163–183. Labov, William & Joshua Waletzky (1966): Narrative Analysis: Oral Versions of Personal Experience. In June Helm (Hrsg.), Essays on the Verbal and Visual Art, 12–44. Seattle u. a.: Univ. of Washington Press. Landua, Sabine, Christa Maier-Lohmann & Hans H. Reich (2008): Deutsch als Zweitsprache. In Konrad Ehlich, Ursula Bredel & Hans H. Reich (Hrsg.), Referenzrahmen zur altersspezifischen Sprachaneignung − Forschungsgrundlagen (Bildungsforschung 29/2), 171–201. Berlin u. a.: BMBF, Referat Bildungsforschung. Lengning, A., Nitza Katz-Bernstein, Anja Schröder, Juliane Stude & Uta M. Quasthoff (2012): Das Dortmunder Beobachtungsinstrument zur Interaktion und Narrationsentwicklung (DO-BINE). Frühe Bildung 1 (3). 131–136. Lengyel, Dorit (2008): Sprachförderung durch Erzählen – Indikatoren zur Analyse der Erzählfähigkeit von Vorschulkindern mit Deutsch als Zweitsprache. Diskurs Kindheits- und Jugendforschung 3 (3). 259–276. Lengyel, Drorit (2012): Sprachstandsfeststellung bei mehrsprachigen Kindern im Elementarbereich: Eine Expertise der Weiterbildungsinitiative Frühpädagogischer Fachkräfte (WiFF) (WiFF-Expertisen 29). München: Dt. Jugendinst. Lisker, Andrea (2013): Sprachstandserhebung und Sprachförderung vor der Einschulung – Eine Bestandsaufnahme in den Bundesländern: Expertise im Auftrag des Deutschen Jugendinstituts. http://www.dji.de/fileadmin/user_upload/bibs2014/Expertise_ Sprachstandserhebung_Lisker_2013.pdf. (07. 09. 2016). Mayr, Toni & Michaela Ulich (2010): Der Beobachtungsbogen „Seldak“ − theoretische und empirische Grundlagen. In Klaus Fröhlich-Gildhoff, Iris Nentwig-Gesemann & Petra Strehmel (Hrsg.), Forschung in der Frühpädagogik (Materialien zur Frühpädagogik 5), 75–106. Freiburg i. Br.: FEL Verl. Forschung Entwicklung Lehre. Minami, Masahiko (2002): Culture-specific language styles: The development of oral narrative and literacy (Child language and child development 1). Clevedon, Buffalo: Multilingual Matters. Nauwerck, Patricia (2010): Schuleingangsstufe: Vom Aussagewert freier Sprachproben. In Martina Rost-Roth (Hrsg.), DaZ-Spracherwerb und Sprachförderung Deutsch als Zweitsprache: Beiträge aus dem 5. Workshop „Kinder mit Migrationshintergrund“, 163–181. Freiburg im Breisgau: Fillibach. Neugebauer, Uwe & Michael Becker-Mrotzek (2013): Die Qualität von Sprachstandsverfahren im Elementarbereich: Eine Analyse und Bewertung. Köln: Mercator-Institut für Sprachförderung und Deutsch als Zweitsprache. Quasthoff, Uta (2012): Entwicklung der mündlichen Kommunikationskompetenz. In Michael Becker-Mrotzek & Winfried Ulrich (Hrsg.), Mündliche Kommunikation und Gesprächsdidaktik. 2. Aufl. (DTP; Bd. 3), 84–100. Baltmannsweiler: Schneider-Verl. Hohengehren. Quasthoff, Uta, Lilian Fried, Nitza Katz-Bernstein, Anke Lengning, Anja Schröder & Juliane Stude (2011): (Vor)Schulkinder erzählen im Gespräch: Kompetenzunterschiede systematisch erkennen und fördern. Das Dortmunder Beobachtungsinstrument zur Interaktions- und Narrationsentwicklung (DO-BINE) und der Dortmunder Förderansatz (DO-FINE). Baltmannsweiler: Schneider Hohengehren.

438

Julia Webersik

Quasthoff, Uta, Sören Ohlhus & Juliane Stude (2005): Orale und literale Diskursfähigkeiten: Erwerbsmechanismen und Ressourcen. DFG-Abschlussbericht. http://home.edo. tu-dortmund.de/~older/AbschlussberichtOLDER.pdf (06. 09. 2016). Quasthoff, Uta M. & Friederike Kern (2003): Diskursfähigkeiten als sprachliche Sozialisation: Individuelle Unterschiede in den Diskursfähigkeiten und -praktiken von Schulanfängern unter ontogenetischen, interaktiven und institutionellen Aspekten. DFG-AbschlussberichtDASS. http://home.edo.tu-dortmund.de/~quasthoff/dass/DASS%20Abschlussbericht_ neu1.pdf (06.09.2016). Reeb-Ramos, Irene & Stefan Jeuk (2015): Mündliches Erzählen. In Alexandra Junk-Deppenmeier & Stefan Jeuk (Hrsg.), Praxismaterial Förderdiagnostik: Werkzeuge für den Sprachunterricht in der Sekundarstufe I, 1st edn., 79–105. Stuttgart: Fillibach bei Klett. Reich, Hans H. & Hans-Joachim Roth (2004a): Hamburger Verfahren zur Analyse des Sprachstands Fünfjähriger − HAVAS 5: Auswertungshinweise. Hamburg: Eigendruck. Reich, Hans H. & Hans-Joachim Roth (2004b): HAVAS 5: Begleitkommentar. Eigendruck. Hamburg. Reich, Hans H. & Hans-Joachim Roth (2007): HAVAS 5 − das Hamburger Verfahren zur Analyse des Sprachstands bei Fünfjährigen. In Hans H. Reich (Hrsg.), Sprachdiagnostik im Lernprozess: Verfahren zur Analyse von Sprachständen im Kontext von Zweisprachigkeit (FörMig-Edition 3), 71–94. Münster: Waxmann. Schelten-Cornish, Susan (2015): Förderung der kindlichen Erzählfähigkeit: Geschichten erzählen mit Übungen und Spielen (Materialien zur Therapie), 2. Aufl. Idstein: Schulz-Kirchner Verlag. Schnieders, Guido & Anna Komor (2007): Eine Synopse aktueller Verfahren der Sprachstandsfeststellung. In Konrad Ehlich (Hrsg.), Anforderungen an Verfahren der regelmäßigen Sprachstandsfeststellung als Grundlage für die frühe und individuelle Förderung von Kindern mit und ohne Migrationshintergrund, 261–342. Bonn u. a.: BMBF. Schröder, Anja (2010): Interaktive Erzählfähigkeiten sprachentwicklungsgestörter Kinder: Eine vergleichende Analyse. Saarbrücken: Südwestdeutscher Verl. für Hochschulschriften. Schulz, Lisa (2012): Der Erzählkreis: Förderung von Erzählkompetenz in der Grundschule. LINSE (Linguistik Server Essen). 1–26. Settinieri, Julia (2012): Zur Messgüte sprachstandsdiagnostischer Verfahren im Vorschulalter. Erste Ergebnisse der Korrelationsstudie Sismik/Seldak – Delfin 4. In Bernt Ahrenholz, Werner Knapp (Hrsg.): Sprachstand erheben – Spracherwerb erforschen. Beiträge aus dem 6. Workshop „Kinder mit Migrationshintergrund“, 2010, 35–52. Freiburg im Breisgau: Fillibach. Stein, Nancy, L. & Christine G. Glenn (1979): An Analysis of Story Comprehension in Elementary School Children. In Roy O. Freedle (Hrsg.), New Directions in Discourse Processing (Advances in discourse processes v. 2), 53–120. Norwood, N.J.: Ablex. Trägerkonsortium BiSS (2016a): Sprachentwicklung und Literacy bei deutschsprachig aufwachsenden Kindern (Seldak). http://www.biss-sprachbildung.de/biss.html?seite=122& Id=5 (30. 08. 2016). Trägerkonsortium BiSS (2016b): Sprachverhalten und Interesse an Sprache bei Migrantenkindern in Kindertageseinrichtungen (Sismik). http://www.biss-sprachbildung.de/biss.html?seite= 122&Id=6 (30. 08. 2016). Ulich, Michaela & Toni Mayr (2005): sismik − Sprachverhalten und Interesse an Sprache bei Migrantenkindern in Kindertageseinrichtungen: Begleitheft mit 10 Beobachtungsbögen. Freiburg im Breisgau: Herder. Ulich, Michaela & Toni Mayr (2006): seldak − Sprachentwicklung und Literacy bei deutschsprachig aufwachsenden Kindern: Begleitheft zum Beobachtungsbogen + 10 Beobachtungsbogen für Kindertageseinrichtungen. Freiburg im Breisgau: Herder Freiburg. Ulich, Michaela & Toni Mayr (2008): Sprachentwicklung von Migrantenkindern im Kindergarten − der Beobachtungsbogen SISMIK. In Argyro Panagiotopoulou & Ursula Carle (Hrsg.),

Sprechen

439

Sprachentwicklung und Schriftspracherwerb: Beobachtungs- und Fördermöglichkeiten in Familie, Kindergarten und Grundschule. (Entwicklungslinien der Grundschulpädagogik), 12–22. Baltmannsweiler: Schneider Hohengehren. Wagner, Klaus R. (1986): Erzähl-Erwerb und Erzählungs-Typen. Wirkendes Wort 36. 142–156. Webersik, Julia (2012): Wie effektiv ist Sprachförderung? Entwicklung eines quantitativen Verfahrens zur Ermittlung von Fördereffekten. In Bernt Ahrenholz & Werner Knapp (Hrsg.), Sprachstand erheben – Spracherwerb erforschen: Beiträge aus dem 6. Workshop „Kinder und Jugendliche mit Migrationshintergrund“, 187–205. Freiburg im Breisgau: Fillibach. Webersik, Julia (2015): Gesprochene Schulsprache in der Primarstufe. Dissertation. Berlin: De Gruyter.

Zeynep Kalkavan-Aydin und Katja Winter

18 Lesen 1 2 3 4 5 6

Lesekompetenz und Textverstehen Lesen und Textverstehen in der Zweitsprache Deutsch Textverstehen und Kompetenzniveaus Diagnoseinstrumente Neueste Entwicklungen Fazit

In diesem Beitrag werden wir uns dem Bereich der Lesediagnostik im Kontext Deutsch als Zweitsprache1 widmen. Dazu gehen wir im ersten Abschnitt auf Lesekompetenz und Textverstehen ein und geben einen Überblick über die Teilkomponenten des Lesens. In Abschnitt 2 fokussieren wir den Aspekt Lesen im zweitsprachlichen Kontext und gehen auf Besonderheiten des Textverstehens sowie auf mögliche Problembereiche ein, die beim Lesen in der Zweitsprache Deutsch auftreten können. Im dritten Abschnitt beziehen wir uns auf Kompetenzniveaus nach der Internationalen Grundschul-Lese-Untersuchung (IGLU), des Programme for International Student Assessements (PISA) und dem Gemeinsamen Europäischen Referenzrahmen (GER), die sich auf das Textverstehen beziehen. Anschließend widmen wir uns in Abschnitt 3 Aufgabenbereichen und Aufgabentypen, die in Diagnoseverfahren eingesetzt werden. Im vierten Abschnitt stellen wir Diagnoseverfahren für die Grundschule und die Sekundarstufe vor, die wir nach ausgewählten Kriterien gegenüberstellen und ausgewählte zusätzliche Verfahren samt Kurzdarstellung zu Aufgabentypen näher beschreiben. Darauffolgend gehen wir im fünften Abschnitt auf neuere Entwicklungen zu diesem Bereich ein. Im letzten Abschnitt folgt schließlich das Fazit mit Überlegungen zu didaktischen Konsequenzen.

1 Lesekompetenz und Textverstehen Wenn wir in diesem Beitrag von Lesen sprechen, dann gehen wir im Sinne Ehlers (u. a. 2016: 226) davon aus, dass […] Lesen […] eine Art Räsonnement [ist], das fortlaufend von Problemlösen, Hypothesenbilden, Abstraktionen und Schlussfolgerungen begleitet wird und wo breite Bereiche von Wissen, Erfahrungen, Glaubenssystemen und Erwartungen ins Spiel kommen, um Plausibilitäten herzustellen und argumentativ abzusichern.

1 Im Folgenden abgekürzt mit DaZ. https://doi.org/10.1515/9783110418712-018

442

Zeynep Kalkavan-Aydin und Katja Winter

Entsprechend kann Lesekompetenz (z. B. Artelt et al. 2007; Lenhard & Schneider 2009; Rosebrock & Nix 2014) als ein komplexes aus mehreren verschiedenen, aber miteinander agierenden Teilkomponenten bestehendes Konstrukt beschrieben werden, das soziale, motivationale, volitionale, kognitive und metakognitive Faktoren umfasst. Diese Teilkomponenten wirken in unterschiedlicher Weise auf das Verstehen von Texten, wobei hier prinzipiell zwischen dem Verstehen von Sachtexten und dem literarischen Verstehen, zwei grundlegend verschiedenen Facetten des Verstehens, unterschieden werden muss. Wie die einzelnen Teilkomponenten auf das Verstehen von Texten wirken und inwieweit die Differenzen zwischen Leserinnen und Lesern mit Deutsch als Erstund Zweitsprache eine Rolle spielen, soll im Folgenden beschrieben werden.

1.1 Soziale, motivationale und volitionale Faktoren Grundlegend für die Lesekompetenz sind lesesoziale Faktoren wie soziokulturelle Hintergründe und Einflussnahmen außerschulischer Instanzen, z. B. Familie oder Peers. Faktoren dieser Art lassen sich ausschließlich durch Befragungen erheben und werden in diesem Beitrag ausgeklammert. Gleiches gilt auch für die Erhebung motivationaler und volitionaler Faktoren. Die Lesemotivation, also der Wunsch oder die Absicht, einen Text lesen zu wollen, sowie die Ausdauer, die Aufmerksamkeit, das lesebezogene Selbstkonzept sowie die Selbstwirksamkeitserwartungen (vgl. z. B. Fuchs 2005) sind zwar entscheidende Einflussfaktoren auf die Lesekompetenz, lassen sich jedoch lediglich über selbstbezogene schriftliche oder mündliche Aussagen erfassen.

1.2 Kognitive Faktoren Grundsätzlich wird das Verstehen von Texten nicht als passiver Prozess der Bedeutungsentnahme, sondern als Konstruktionsleistung des Lesers bzw. der Leserin verstanden, „in der die im Text enthaltene ‚Botschaft‘ aktiv mit dem Vor- und Weltwissen des Rezipienten […] verbunden wird“ (Christmann & Groeben 1999: 146). Textverstehen kann also als eine kognitiv-konstruktive Text-Leser-Interaktion, als ein vom Text gesteuerter Konstruktions- und ein vom Vorwissen, den Fähigkeiten und Aktivitäten des Lesers beeinflusster Integrationsprozess beschrieben werden (vgl. Kintsch 1988). Das Ergebnis dieser Konstruktions-Integrationsprozesse ist die „mehr oder weniger kohärente mentale Repräsentation eines Textes“ (Artelt et al. 2007: 11). Dieser komplexe Prozess des Textverstehens besteht aus mehreren Teilprozessen, die sich in Anlehnung an Kintsch (1998) in hierarchieniedrige und hierarchiehohe Prozesse unterscheiden lassen (vgl. Richter & Christmann 2006: 26).

Lesen

443

Hierarchieniedrige Teilprozesse Die hierarchieniedrigen Teilprozesse umfassen basale Lesefähigkeiten sowie die Kohärenzbildung auf lokaler Textebene. Im Konzept der Leseflüssigkeit (Fluency) werden die basalen Lesefähigkeiten umfassend beschrieben. Unter Fluency wird dabei die „genaue, automatisierte, schnelle, sinnkonstituierende Fähigkeit zur leisen und lauten Textlektüre verstanden, die es der Leserin bzw. dem Leser ermöglicht, die Bedeutung eines Textabschnittes mental zu konstruieren“ (Rosebrock & Nix 2006: 93). Leseflüssigkeit umfasst demnach die Einzelfähigkeiten einer Leserin bzw. eines Lesers auf Wort- und Satz- bzw. lokaler Textebene und wird in Dekodiergenauigkeit, Automatisierung, Lesegeschwindigkeit und Prosodie differenziert. Mit Dekodiergenauigkeit ist die Fähigkeit gemeint, die Wörter eines Textes genau und richtig zu lesen. Automatisierung bezeichnet den Grad, in dem Wörter bzw. Wortbestandteile oder Wortgruppen als ganze erkannt und nicht (mehr) buchstabenweise dekodiert werden müssen. Dass einzelne Wörter und Wortgruppen direkt erfasst werden und ihnen unmittelbar eine Bedeutung zugeordnet werden kann, gilt als eine Grundvoraussetzung für das Textverstehen, denn erst durch die Automatisierung dieser hierarchieniedrigen Leseprozesse werden kognitive Kapazitäten für hierarchiehöhere Prozesse freigesetzt, die für das Verstehen von Texten unabdingbar sind. Eine logische Folge der Automatisierung ist die Lesegeschwindigkeit, also die Schnelligkeit der Wort- und Satzerfassung. Das heißt: Je höher die Automatisierung des Dekodierens ist, desto höher ist die Lesegeschwindigkeit. Zu langsames Lesen führt zu Verständnisproblemen, da durch die verzögerte Informationserfassung die zusammengehörgien Sinneinheiten nicht gleichzeitig ins Kurzzeitgedächtnis gelangen und gemeinsam verarbeitet werden können. Angemessen schnell ist die Lesegeschwindigkeit dann, wenn die Aufmerksamkeitsspanne über einen Satz oder mehrere Sätze aufrechterhalten werden kann. Eine angemessene Lesegeschwindigkeit kompetenter Leserinnen und Leser liegt im Durchschnitt bei 250–300 gelesenen Wörtern pro Minute (vgl. Rosebrock et al. 2011: 16). Im Bereich der Prosodie zeichnet sich flüssiges Lesen (sowohl beim Vorlesen als auch beim leisen bzw. innerlichen Lesen) durch angemessenes Untergliedern (Sequenzieren) eines Satzes aus. Dies erfolgt unter anderem durch das Zusammenziehen passender Satzteile zu Sequenzen. Darüber hinaus können Pausen, Betonungen, Tonhöhe und Lautstärke zur Sequenzierung eingesetzt werden. Gute Leserinnen und Leser ziehen beim Lesen semantisch und syntaktisch zusammengehörige Segmente sinnstiftend zusammen, wodurch die Erfassung der Bedeutung erleichtert wird. Auf niedrigster Stufe ist das Lesen von Texten also als Identifikation von Buchstaben und Sätzen aufzufassen. Dabei gilt die Vorstellung, dass einzelne Buchstaben nacheinander erfasst werden, ebenso als überholt wie die Mutmaßung, dass Wörter als ganzheitliche Muster identifiziert werden. Stattdessen geht man heute in der Regel davon aus, dass Buchstabeneinheiten, also bestimmte Kombinationen von Buchstaben, die Basis für den Verarbeitungsprozess bilden (vgl.

444

Zeynep Kalkavan-Aydin und Katja Winter

Richter & Christmann 2006: 28), sofern die Wörter bekannt sind. Unbekannte Wörter werden dagegen über das phonologische System oder die morphologische Struktur erfasst bzw. konstruiert (vgl. Christmann & Groeben 1999: 151). Auf der nächsthöheren Ebene werden Wortfolgen innerhalb eines Satzes auf der Grundlage ihrer semantischen Relationen aufeinander bezogen und zu Prädikat-Argument-Strukturen oder Propositionen integriert, also lokale Kohärenz gebildet (vgl. Artelt et al. 2007: 11).

Hierarchiehöhere Teilprozesse Hierarchiehöhere Prozesse umfassen die globale Kohärenzbildung, also die Herstellung des Zusammenhangs auf Textebene, die Bildung von Superstrukturen und das Erkennen von Darstellungsstrategien (vgl. Artelt et al. 2007: 11; Rosebrock & Nix 2014: 13–14). Dies erfordert über die basalen Lesefähigkeiten hinaus auch ein spezifisches inhaltliches Vorwissen und ein zielorientiert-strategisches Lesen (vgl. Richter & Christmann 2006: 33). Inhaltliches Vorwissen meint das themenspezifische Wissen einer Person. Dieses bezieht sich auf ein bestimmtes Thema, einen bestimmten Gegenstand oder eine Aufgabe innerhalb einer Wissensdomäne (vgl. Krause & Stark 2006: 39). Eine hohe themenspezifische Expertise kann – zumindest bei anspruchsvollen Texten – schlechte Lesefertigkeiten sogar teilweise ausgleichen (vgl. Artelt et al. 2007: 13), denn es erleichtert zum einen die Informationsaufnahme neuer Fakten und ist zum anderen hilfreich bei der Trennung relevanter von irrelevanten Informationen und führt somit zu einem tieferen Textverstehen (vgl. Heinen 2001: 36). Außerdem macht kein Text alle für das Verständnis erforderlichen Informationen explizit, so dass der Leser ständig gefordert ist, auf Basis seines Vorwissens Inferenzen vorzunehmen. Nach Rickheit & Strohner (1990: 533) gelten Inferenzen als „Bildung neuer semantischer Information in einem gegebenen Kontext“ (vgl. Schramm 2001: 69; vgl. auch Ehlers 1999). Schramm (2001: 70–71) differenziert in Anlehnung an Rickheit & Strohner (1990: 537– 539) zwischen intendierten und elaborativen Inferenzen. Erstere können auf Wort-, Satz- und Diskursebene gebildet werden: – Wortebene: Ein abstrakter Oberbegriff wie „Fisch“ kann in einem bestimmten Kontext wie „The fish attacked the swimmer.“ spezifiziert und als „Hai“ verstanden werden. – Satzebene: Bei einer genannten Tätigkeit (z. B. Fotografieren) werden die Werkzeuge (z. B. Kamera) inferiert. Ebenso können naheliegende Folgen (z. B. verbrennen) mitverstanden werden, wenn das Ereignis genannt wird (z. B. ins Feuer werfen). – Diskursebene: Situationen, die im Text erwähnt wurden (z. B. Gerichtsverhandlung), können so vollständig inferiert werden, dass für die Situation typische Personen, die im Text nicht vorkommen (z. B. Rechtsanwalt), hinzugedacht werden können (Beispiele aus Rickheit & Strohner 1990: 537–539, vgl. Schramm 2001: 70).

Lesen

445

Elaborative Inferenzen gehen im Gegensatz zu intendierten Inferenzen über den Text und über das einfache Textverstehen hinaus (vgl. Schramm 2001: 70; vgl. auch Hu 2013: 17–18). Sie werden nach dem Lesen erzeugt und nur kaum während des Lesens (vgl. Ehlers 1999: 189). Hier wird die Relevanz von kulturellem Wissen besonders deutlich, wenn Informationsgehalte vernetzt und in einen thematischen und kulturell geprägten Kontext eingebettet werden. Oakhill, Cain & Elbro (2014) gehen ähnlich vor und unterscheiden Inferenzen auf drei Ebenen: lokal (Satzverbindungen und Wortbedeutungen), global (Kohärenz in einem gesamten Text) und elaborativ (weiterführende Assoziationen) (vgl. auch Kalkavan-Aydın 2018: 227 ff.). Als weitere Grundvoraussetzung für das Verstehen von Texten wird die Anwendung von Lesestrategien benannt. Nach dem „Good-strategy-User“-Modell (vgl. Pressley, Borkowski & Schneider 1987) beruht eine gute Informationsverarbeitung vor allem auf der effektiven Nutzung von Lesestrategien, die die lokale Kohärenzbildung, also das Herstellen von semantischen Relationen zwischen einzelnen Propositionen, und die globale Kohärenzbildung, also die Erfassung übergeordneter schlüssiger Zusammenhänge, begleiten und unterstützen können. Diese kognitiven Faktoren der Lesekompetenz können relativ eindeutig diagnostiziert werden. Es liegen verschiedenste Diagnoseinstrumente vor, die einzeln oder in Kombination den Wortschatz, die Dekodierfähigkeit, den Automatisierungsgrad dieser, die Lesegeschwindigkeit, das Verstehen auf Wort-, Satz- und Textebene und die Fähigkeiten der lokalen und globalen Kohärenzbildung erfassen (vgl. Tabelle 6).

1.3 Metakognitive Faktoren Über die basalen Lesefertigkeiten, das Vorwissen und den adäquaten Einsatz von Lesestrategien hinaus ist es für das Textverstehen notwendig, dass Leserinnen und Leser die einzelnen kognitiven Teilprozesse auf einer übergeordneten Ebene überwachen und kontrollieren. Diese Vorgänge werden in der psychologischen Forschung unter dem Begriff der „Metakognition“ zusammengefasst (vgl. Christmann & Groeben 1999: 199) und gelten als zentrale Voraussetzung für den erfolgreichen Verstehensprozess (vgl. Artelt et al. 2007: 30). Die exekutiven Kontrollprozesse umfassen die Planung, die Überwachung (Monitoring) und die Regulation. Die Planung dient vor allem der Zielsetzung, der Feststellung der Verstehensanforderungen, der Aktivierung des relevanten Vorwissens und der Auswahl geeigneter kognitiver Strategien zur Erreichung dieses Ziels. Die Überwachung beinhaltet die Kontrolle der einzelnen kognitiven und metakognitiven Komponenten und des Textverstehens im Hinblick auf das jeweilige Ziel (vgl. Christmann & Groeben 1999). In enger Verbindung mit der Überwachung steht die Regulation, die der Anpassung der aktuellen Tätigkeit an die jeweiligen Anforderungen dient (vgl. Artelt et al. 2007). Nach dem „Good-strategy-User“-Modell unterscheiden sich gute und schlechte Leserinnen und Leser unter anderem durch ihre Fähigkeiten im Bereich des Monitorings. Es kann

446

Zeynep Kalkavan-Aydin und Katja Winter

z. B. belegt werden, dass schlechte Leserinnen und Leser weniger Inkonsistenzen in Texten und Verständnisschwierigkeiten erkennen als gute Leserinnen und Leser und somit auch weniger gut in der Lage sind, ihr Vorgehen zu regulieren (vgl. Christmann & Groeben 1999: 200). Grundlegend für zielgerichtete Planungs-, Überwachungs- und Regulationsprozesse ist ein ausreichendes metakognitives Wissen. Im Bereich des Textverstehens ist neben dem Wissen über die eigenen Fähigkeiten und die Anforderungen des Textes insbesondere das Lesestrategiewissen, das die Kenntnis verschiedener Lesestrategien und das Wissen darüber, wie und unter welchen Bedingungen welche Lesestrategie erfolgreich eingesetzt werden kann, beinhaltet, von entscheidender Bedeutung. Bei guten Leserinnen und Lesern ist dieses Wissen in weiten Teilen implizit, d. h. automatisiert und unbewusst aktivierbar, so dass kognitive Ressourcen für das Verstehen von Texten frei sind und genutzt werden können. Die große Bedeutung des metakognitiven Wissens zeigten die Ergebnisse der PISA-Studie, in der auch das Lesestrategiewissen der Schülerinnen und Schüler erhoben wurde. Dabei konnte ermittelt werden, dass neben den kognitiven Grundfähigkeiten der Schülerinnen und Schüler das Lesestrategiewissen zu den besten Prädiktoren der Lesekompetenz zählt (vgl. Artelt et al. 2002: 18).

2 Lesen und Textverstehen in der Zweitsprache Deutsch Aus kognitionspsychologischen Forschungsstudien (z. B. Kintsch 1998) wissen wir, dass Lesefähigkeiten mit anderen Bereichen der Sprachentwicklung eng verwoben sind (vgl. Kleinbub in diesem Band). Besonderheiten beim Lesen in DaZ hängen dabei – je nach Kontaktzeitpunkt, Kontaktlänge und Kontaktqualität mit der L2 ‒ sowohl von den Zweitsprachenkenntnissen als auch von der Lesekompetenz in der Erstsprache ab (Ehlers 2014: 220–221).2 So werden die Dekodierfähigkeit und die Lesegeschwindigkeit z. B. stark von Kenntnissen im Bereich des Wortschatzes und der Morphosyntax beeinflusst. Je besser also die sprachlichen Fähigkeiten insgesamt ausgebildet sind, umso besser scheinen auch die Lesefähigkeiten zu sein (u. a. Ehlers 2004). Bei Kindern mit Deutsch als L2 kann demzufolge ein mangelnder (Sicht-)Wortschatz bereits auf der basalen Ebene zu Leseschwierigkeiten führen (vgl. Ehlers 2004: 6), wenn sie stockend, in Wort-für-Wort-Schritten lesen und unpassende Satzteile zusammenfassen (vgl. Rosebrocket al. 2011: 19). Aufgrund der eingeschränkteren Wort- und Satzerkennung und den damit verbundenen längeren Fixationszeiten von Leserinnen und Lesern mit Deutsch als L2 kann die Lesegeschwindigkeit reduziert sein (vgl. Ehlers 2004: 6). Diese verringerte Leseflüssigkeit

2 Für eine zusammenfassende Übersicht siehe auch Kalkavan (2012) und Kalkavan-Aydın (2018).

Lesen

447

erweist sich auch im Hinblick auf das Textverstehen als problematisch. So zeigen Studien zur Leseforschung im L2-Kontext, dass „[d]ie Verlangsamung des Leseprozesses […] das Verstehen beeinträchtigen und sogar zu einem Zusammenbruch der Leseperformanz führen [kann]“ (Ehlers 1999: 185–186). Nach Ehlers (1999: 185) kann „[…] das verlangsamte Lesen in der Fremdsprache auf eine geringe Automatisierung von Basisfertigkeiten, auf eine eingeschränkte Arbeitsgedächtniskapazität oder auf die Trainingssituation zurückgeführt werden (transfer of training, Hervorhebung im Original). Bei hochkompetenten Bilingualen, die zwar langsamer in der Zweitsprache lesen als in der Erstsprache, deren zweitsprachige Leseflüssigkeit sich jedoch der eines kompetenten Muttersprachlers annähert, spielen nicht nur Transferleistungen von Lesestrategien von der Erst- auf die Zweitsprache eine Rolle […]“. Fehlendes sprachliches Wissen, fehlende Leseerfahrungen und mangelnde morphosyntaktische Fähigkeiten können Verstehensprozesse erschweren (vgl. Gantefort & Sánchez Oroquita 2015: 30). Grundsätzlich lesen schwache Leserinnen und Leser häufiger bedeutungsverändernd und korrigieren sich zudem seltener, wenn sie sich verlesen. Das hat zur Folge, dass nicht nur einzelne Wörter, sondern auch ganze Satz- und Textzusammenhänge sinnentstellt gelesen werden (vgl. Rosebrock et al. 2011: 15). Aufgrund von Unsicherheiten bezüglich sprachlicher Strukturen und der Bedeutungen benannter Inhalte können Leserinnen und Leser nicht zielsprachliche oder gar falsche Bezüge herstellen und diese Missverständnisse noch schwerer korrigieren (vgl. Benholz, Lipkowski & Iordanidou 2005: 249). Ähnlich wie Ehlers argumentieren auch Walter (2002; 2007: 14) und Weis (2000) in diesem Sinne, indem sie auf die Korrelation allgemeinsprachlicher Fähigkeiten mit Lesefähigkeiten hinweisen. Lernerinnen und Lerner können im Allgemeinen besser lesen, wenn sie nicht nur ausreichende sprachliche Kompetenzen mitbringen, sondern auch wissen, wie man mit Texten arbeitet oder Strategien3 anwendet, und zusätzlich über kulturelles Wissen verfügen. Im Zweitspracherwerbskontext würde dies bedeuteten, dass das Lesen in einer Zweitsprache vor allem dann gut funktioniert, wenn Wissensbereiche aus Erst- und Zweitsprache zusammenfließen. Die verschiedenen Teilfähigkeiten werden in Tabelle 1 nach Grabe (2009: 357) aufgelistet. An Tabelle 1 wird deutlich, dass Grabe (2009: 357) Teilfähigkeiten nennt, die u. a. im Rahmen der IGLU- und PISA-Studien in die Kompetenzniveaus einfließen. Da diese Teilfähigkeiten im Hinblick auf die Aufgabenformate in Diagnoseverfahren relevant sind, stellen wir im nächsten Abschnitt die Kompetenzstufen nach IGLU, PISA sowie im Kontext von Mehrsprachigkeit die Kann-Beschreibungen und Niveaustufen zum Textverstehen nach dem GER vor.

3 Zum Lesen in der Zweitsprache im Englischen gibt Grabe (2009; 2007) einen detaillierten Überblick über Strategien und „Verstehensleistungen“ bzw. „Verstehensfähigkeiten“ (Grabe 2009: Kap. III). Weitere Hinweise zu den einzelnen Studien s. u. a. in Schramm (2001).

448

Zeynep Kalkavan-Aydin und Katja Winter

Tab. 1: Teilfähigkeiten für Leseverstehen (aus Grabe 2009: 357).4 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14.

Fluency and reading speed Automaticity and rapid word recognition Search processes Vocabulary konwledge Morphological knowlegde Syntactic knowledge Text-structure awareness and discourse organization Main-ideas comprehension Recall of relevant details Inferences about text information Strategic-processing abilities Summarization abilities Synthesis skills Evaluation and critical reading

3 Textverstehen und Kompetenzniveaus Für den Kompetenzbereich Lesen gibt es zahlreiche Diagnosematerialien, die von nicht-standardisierten Lernstandserhebungen bis hin zu standardisierten psychometrisch ausgerichteten Lesetests, z. B. zur Leseflüssigkeit, reichen. Wie wir eingangs dargestellt haben, fokussieren wir in diesem Beitrag die Diagnose von Leseverstehen. Dass es sich im Vergleich zur Erfassung der Leseflüssigkeit dabei um ein durchaus schwierigeres Verfahren handelt, liegt vor allem daran, dass diese Kompetenzen nicht „direkt“ beobachtbar sind. So konstatiert Steck (2008: 56) in ihrer Arbeit zur Förderung des Leseverstehens in der Grundschule, dass [d]as Hauptproblem bei der Messung von Leseverstehen […] darin [besteht], dass etwas gemessen werden soll, was nicht direkt beobachtbar ist. Man kann die Augenbewegungen beim Lesen beobachten, das Mienenspiel und eine bestimmte Körperhaltung. Das Verstehen als Prozess entzieht sich jedoch unserer unmittelbaren Beobachtung. Es ist nur durch sprachproduktive Verfahren erschließbar, bei denen sich der Leser zum Gelesenen schriftlich oder mündlich äußert.

Dennoch wissen und sehen wir an diversen Erhebungsinstrumenten, dass die Diagnose von Leseverstehen, differenziert in Wort-, Satz- und Textverstehen, eine mindestens gleichbedeutende Rolle spielt wie die Diagnose von Leseflüssigkeit. Die Frage, die sich für uns an dieser Stelle stellt, ist, welche Aufgabentypen sich schließlich zur Erfassung des Leseverstehens eignen und entsprechende Teilfähigkeiten diagnostizieren. Grabe (2009: 358–359) betont die Relevanz der Auswahl von Aufgaben-

4 „Major components for reading comprehension” nach Grabe (2009: 357).

Lesen

449

konzepten und -formaten, die in standardisierten Tests genutzt werden. In Bezug auf das Lesen in der Zweitsprache hält er fest: It is important to look at the types of tasks developed for standardized reading tests, wonder how these major tests incorporate and reflect the reading construct, and how they engage L2 learners in fair and appropriate assessment tasks. […] Different reading tasks should help to provide information about many component reading abilities as well as reading comprehension more generally. (Grabe 2009: 358)

So plädiert Grabe für eine Zusammenstellung (s. Tabelle 2) verschiedener Aufgabenformate, die dazu dienen sollen, unterschiedliche (individuelle) Teilfähigkeiten überprüfen zu können. Tab. 2: Aufgabentypen in standardisierten Lesetests (aus Grabe 2009: 359).5 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20.

Cloze Gap-filling formats (rational cloze formats) C-tests (retain initial letters of words removed) Cloze elide (remove extra word) Text segment ordering Text gap Choosing from a “heading bank” for identified paragraphs Multiple-choice Sentence completion Matching (and multiple matching) techniques Classification into groups Dichotomous items (T/F/not stated, Y/N) Editing Short answer Free recall Summary (1 sentence, 2 sentences, 5–6 sentences) Information transfer (graphs, tables, flow charts, outlines, maps) Project performance Skimming Scanning

Diese Aufgabenformate sind auch in diversen deutschsprachigen Diagnoseverfahren für die Grundschule und die Sekundarstufen I und II vorzufinden; hier sind insbesondere Multiple-choice-Aufgaben, Antwortsätze zu Fragen oder Cloze-elide-Verfahren zu nennen, die meist kombiniert vertreten sind (vgl. Tabelle 5; Spalte Aufgabenformate und Textgrundlage). Trotz reichem Angebot an möglichen Aufgabenformaten sollten jene Aufgaben im Vordergrund stehen, die das Leseverständnis tatsächlich 5 Die Auflistung bezieht sich auf standardisierte Lesetests im angloamerikanischen Raum. Die Aufgabentypen jedoch sind als solche auch in deutschsprachigen Tests überwiegend in dieser Form zu finden. Auf Beispiele wird in Abschnitt 4.3 eingegangen.

450

Zeynep Kalkavan-Aydin und Katja Winter

erfassen und als „sprachproduktive Verfahren“ (Schmid-Barkow 2004: 117) die Leserin bzw. den Leser dazu anregen, sich zum Text und über den eigenen Verstehensprozess zu äußern. Zu diesen Verfahren würden (nach Grabe 2009: 359) folgende Aufgabentypen zählen: sentence completion, short answer, free recall, editing, summary, information transfer. Die Verteilung solcher Aufgabenformate ist in den einzelnen Verfahren sehr unterschiedlich. Sie reichen von Multiple-choice-Aufgaben, bei denen der eigene sprachproduktive Anteil gänzlich wegfällt, bis hin zu kurzen Zusammenfassungen.6 Darüber hinaus werden diese Aufgabenformate auch in der Erwachsenenbildung verwendet. So enthalten beispielsweise Vorbereitungsmaterialien auf die Sprachprüfung telc sowie die Prüfung telc selbst für den Hochschulzugang für die verschiedenen Niveaustufen Leseverstehensübungen und Übungstests für den Bereich Lesen in Deutsch als Fremdsprache (s. http://www.telc.net (17. 09. 2017). Im Idealfall könnten Aufgaben zum Leseverstehen in der Grundschule an den Kompetenzstufen der IGLU-Studie und in der Sekundarstufe an den Niveaus der PISA-Studie orientiert sein, so, wie es in vielen Lernstandserhebungen im Fach Deutsch auch gehandhabt wird. Im Rahmen der IGLU-Studie sind fünf Kompetenzstufen vorgesehen, die vom Dekodieren von Wörtern und Sätzen und rudimentärem Leseverständnis bis hin zu abstrahierenden und verallgemeinernden Fähigkeiten reichen. Das Kompetenzmodell nach Bos et al. (2011, Tabelle 3) veranschaulicht die wesentlichen Bereiche, die explizit und implizit für einen erfolgreichen Umgang mit Texten relevant sind (Kalkavan 2012: 12). Tab. 3: Lesekompetenzstufen nach Bos et al. (2011: 78). Kompetenzstufe

Beschreibung

I

Rudimentäres Leseverständnis

II

Explizit angegebene Einzelinformationen in Texten identifizieren und benachbarte Informationen miteinander verknüpfen

III

Verstreute Informationen miteinander verknüpfen

IV

Für die Herstellung von Kohärenz auf der Ebene des Textes relevante Aspekte erfassen und komplexe Schlüsse ziehen

V

Auf Textpassagen bzw. den Text als ganzen bezogene Aussagen selbstständig interpretierend und kombinierend begründen

Ähnlich verhält es sich mit Kompetenzbeschreibungen für die Sekundarstufe nach PISA. Das Kompetenzmodell der PISA-Studie (Baumert et. al. 2001: 83 und 89–90) basiert auf fünf Kompetenzniveaus, die im Bereich Leseverstehen anzusiedeln sind. 6 Gelingende Diagnoseaufgaben für informelle Verfahren, die die Diagnose des Leseverstehens in der Schuleingangsphase betreffen, wären Aufgaben, die in sinnvolle und handlungsorientierte Lesesituationen eingebettet sind. Sie sollten Leserinnen und Lesern ermöglichen, unterschiedliche Zugriffsweisen einzusetzen (vgl. Steck 2008: 68–69).

Lesen

451

Tab. 4: Kompetenzniveaus nach PISA (in Anlehnung an Grimm 2009; vgl. auch Klieme et al. 2010). Niveau

Beschreibung

Beispiel

I

Leseverstehen in Ansätzen

Einzelinformationen, die direkt im Text nachzuweisen sind; Gesamtverständnis des Textes nicht erforderlich

II

Einfaches Leseverstehen

Abbildungen in Beziehung zu Textabschnitten setzen, Informationen kurz zusammenfassen

III

Grundlegendes Leseverstehen

Reflexion sprachlicher Formen im Text

IV

Differenziertes Leseverstehen

Mehrdeutigkeiten in Texten erkennen, sie miteinander vergleichen und voneinander abgrenzen

V

Komplexes Leseverstehen

Komplexe Verstehenszusammenhänge, Allgemeines und Konkretes im Text in Beziehung zueinander setzen

Eine weitere Möglichkeit, sprachliche Kompetenzen und Lesefähigkeiten in einen DaZ-/DaF-Zusammenhang zu bringen, veranschaulichen die Skalen von A1 bis C2 nach dem GER (vgl. auch Efing 2008; Schramm 2001; Trim et al. 2001). Die so genannten Kann-Beschreibungen enthalten explizite Beschreibungen, die verständlichkeitsorientiert (vgl. Schramm 2001: 166–174) zu verstehen sind. Den einzelnen Stufen werden konkrete Aspekte zur Verständlichkeit der Texte zugeordnet, die bspw. die Länge der Texte oder die Auswahl des Wortschatzes betreffen (s. Tabelle 5).

Tab. 5: GER-Skala zum Leseverstehen (Trim et al. 2001: 74–75). Stufen Leseverstehen C2

Kann praktisch alle Arten geschriebener Texte verstehen und kritisch interpretieren (einschließlich abstrakte, strukturell komplexe oder stark umgangssprachliche literarische oder nicht-literarische Texte). Kann ein breites Spektrum langer und komplexer Texte verstehen und dabei feine stilistische Unterschiede und implizite Bedeutungen erfassen.

C1

Kann lange, komplexe Texte im Detail verstehen, auch wenn diese nicht dem eigenen Spezialgebiet angehören, sofern schwierige Passagen mehrmals gelesen werden können.

B2

Kann selbstständig lesen, Lesestil und -tempo verschiedenen Texten und Zwecken anpassen und geeignete Nachschlagewerke selektiv benutzen. Verfügt über einen großen Lesewortschatz, hat aber möglicherweise Schwierigkeiten mit seltener gebrauchten Wendungen.

B1

Kann unkomplizierte Sachtexte über Themen, die mit den eigenen Interessen und Fachgebieten in Zusammenhang stehen, mit befriedigendem Verständnis lesen.

A2

Kann kurze einfache Texte zu vertrauten, konkreten Themen verstehen, in denen gängige alltags- und berufsbezogene Sprache verwendet wird. Kann kurze, einfache Texte lesen und verstehen, die einen sehr frequenten Wortschatz und einen gewissen Anteil international bekannter Wörter enthalten.

A1

Kann sehr kurze, einfache Texte Satz für Satz lesen und verstehen, indem er/sie bekannte Namen, Wörter und einfache Wendungen heraussucht und, wenn nötig, den Text mehrmals liest.

452

Zeynep Kalkavan-Aydin und Katja Winter

Lesefähigkeiten werden direkt mit sprachlichen Fähigkeiten in einen Zusammenhang gebracht. Dies betrifft nicht nur den Bereich des Wortschatzes, der bereits in den Grundstufen eine wichtige Rolle spielt, sondern auch Korrelationen zwischen Umgangssprache und literarischen Kriterien, was zur höchsten Stufe (C2) und damit zu den komplexeren Teilfähigkeiten zählt. Inwieweit diese Kann-Beschreibungen auch für die Entwicklung von Diagnosematerial genutzt werden, wird in Abschnitt 4.2 („Baukasten Lesediagnose“) erläutert.

4 Diagnoseinstrumente Im Folgenden stellen wir nun zentrale Diagnoseinstrumente zum Kompetenzbereich Lesen unter Berücksichtigung der genannten Dimensionen von Lesekompetenz dar. Dabei differenzieren wir grob zwischen standardisierten Testverfahren (4.1.) und weiteren Diagnoseinstrumenten (4.2), wobei unsere Auswahl aus den vorliegenden Instrumenten vor allem auf diejenigen fiel, die sich auch für DaZ-Lerner anbieten. Anschließend werden wir einige Test- und Aufgabenformate genauer vorstellen (4.3).

4.1 Standardisierte Testverfahren In Tabelle 6 stellen wir eine Übersicht der Erhebungsinstrumente zum Kompetenzbereich Lesen vor. Wir gehen auf Diagnoseverfahren ein, die für die Grundschule sowie für die Sekundarstufe geeignet sind. Geordnet sind die Verfahren tabellarisch nach Jahrgängen (ab Klasse 1 aufwärts). Bei der Auswahl und Darstellung konzentrieren wir uns zunächst darauf, für welche Jahrgänge das jeweilige Instrument empfohlen und normiert ist. Wir überprüfen insbesondere, ob und inwiefern DaZ bzw. Mehrsprachigkeit berücksichtigt wird, bspw. ob die Verfahren für diese Schülergruppe geeicht sind oder gar Tests oder Aufgaben in den Erstsprachen vorhanden sind. Weitere Kriterien betreffen die Aufgabenformate und die Textgrundlage (Sachund/oder Erzähltext). Darüber hinaus vergleichen wir die eher „formalen“ Aspekte Normierung, Dauer der Durchführung und Auswertung.7

7 Aus Platzgründen stellen wir keine speziellen Diagnoseinstrumente, die bspw. bei Kindern mit Spezifischen Spracherwerbsstörungen eingesetzt würden, vor.

1–4

1–6

KNUSPEL Leseaufgaben

SLRT II (Salzburger Leseund Rechtschreibtest)

2014

1998

2011

neueste Aufl.

Bei der Normierung wurde Mono-/Bilingualität der Schüler erfasst, um der Bevölkerungszusammensetzung gerecht zu werden.

nein

DaZ / Mehrsprachigkeit

Lesegeschwindig- nein keit (und Rechtschreibung)

Rekodieren, Dekodieren (auf Wortebene) Hörverstehen, Leseverstehen (auf Satzebene)

Dekodiergeschwindigkeit

Was wird erhoben?

Normierung

Lautes Vorlesen von Wörtern u. Pseudowörter in einer Minute

Subtest 4: Leseverstehen: schriftlich gestellte Fragen zur Situation (Wochentag, …) und zu den Knuspel-Wesen

Normwerte für Klasse 1–6 (N = 1747)

Klassenstufenbezogene Normen zu den einzelnen Subtests

Wort-Bild-Zuordnung Klassenstufen(180 Items) bezogene Prozentrangnormen und TÄquivalenzwerte für die Klassen 1–4 (N = 2.333)

Aufgabenformate und Textgrundlage

8 Die ausführlichen Quellenangaben finden Sie im Literaturverzeichnis unter „Testverfahren“.

1–4

Jg.

WLLP-R (Würzburger Leise-Lese-Probe)

Instrumente

Kriterien

Tab. 6: Übersicht über Diagnoseinstrumente im Bereich Lesen.8

Einzeltest, Dauer 5 Minuten

Gruppen- und Einzeltest, Dauer ca. 35–50 Minuten

Gruppentest, Dauer ca. 15 Minuten

Art und Dauer der Durchführung

5 Minuten

Aufgrund der Zusammengehörigkeit der vier Subtests ist die Auswertung aufwändig.

Schablone

Auswertung

Lesen

453

Jg.

1–6

1–8

Kriterien

ELFE (Ein Leseverständnistest für Erst- bis Sechstklässler)

ZLT II (Züricher Leseverständnistest für das 1.–8. Schuljahr)

Tab. 6 (fortgesetzt)

2015

2006

neueste Aufl.

Lesefertigkeit (Lesegenauigkeit, Automatisierungsgrad, Gedächtnisleistung und phonologische Bewusstheit)

Wortverständnis (Dekodieren), Satzverständnis (syntaktische Fähigkeiten), Textverständnis (Auffinden von Informationen, satzübergreifendes Lesen, schlussfolgerndes Denken)

Was wird erhoben?

Ja, Herkunftsland: Schweiz. Da es keine signifikanten Unterschiede gab, existieren jedoch keine separaten Normwerte.

Auf dem Testbogen wird die Angabe der Erstsprache verlangt.

DaZ / Mehrsprachigkeit

Lesen von echten Wörtern, Pseudowörtern und Textabschnitten

Drei Subtests: Wortverstehen: passendes Wort zum Bild auswählen, Satzverstehen: Sätze vervollständigen (Auswahl vorgegeben), Textverstehen: kurze Texte (Sach- und literarische Texte) und Multiple-ChoiceFragen

Aufgabenformate und Textgrundlage

Klassenstufenbezogene Prozentränge und Prozentrangbänder sowie T-Werte (N = 1367)

Klassenstufenbezogene Z- und T-Äquivalenznormen, Prozentränge u. Prozentrangbänder (N = 4893)

Normierung

Gruppen- oder Einzeltest, Dauer 15–35 Minuten

Computerprogramm und stiftbasierte Version, Gruppenund Einzeltest, Dauer ca. 20 bis 30 Minuten

Art und Dauer der Durchführung

schnelle Auswertung der computer-basierten Version

Auswertung

454 Zeynep Kalkavan-Aydin und Katja Winter

2–9

3–4

5–6

6–7

SLS (Salzburger Lesescreening)

HAMLET (Hamburger Lesetest für 3. und 4. Klassen)

FLVT (Frankfurter Leseverständnistest)

LESEN 6–7

2012

2008

2006

2014

nein

nein

Auf dem Testbogen wird die Angabe der Erstsprache verlangt.

Basale Lesefertig- nein keiten sowie Satz- und Textverständnis

Textverständnis

Leseverständnis: Worterkennung, Textverstehen

Lesegeschwindigkeit, Leseverständnis auf Satzebene

Liste kurzer, einfacher Sätze lesen (3 Minuten) und zwei Texte (Sachund Erzähltext) mit jeweils 17 Fragen im Multiple-ChoiceVerfahren

zwei Texte (Sachund Erzähltext) mit jeweils 18 Fragen im Multiple-ChoiceVerfahren

40 Wortzuordnungen zu je vier Bildern und 10 Texte (Sach- und Erzähltexte) mit Fragen im Multiple-ChoiceVerfahren

Liste von Sätzen, Markierung, ob Aussage wahr oder falsch ist

klassenstufenbezogene Prozentrangnormen, T-Äquivalenzwerte (N = 1644)

Klassenstufen- und schulartspezifische Prozentrangnormen, Z- und T-Äquivalenzwerte (Form A: N = 1239; Form B: N = 1237)

klassenstufenbezogene Prozentrangwerte und -bänder (N = 3.474) u. kriteriumsorientierte Bestimmung des Leseverständnisniveaus

Klassenstufenbezogene Normwerte (Lesequotienten) (N = 11.900)

Gruppen- oder Einzeltest, Dauer 45 Minuten

Gruppen- oder Einzeltest, Dauer 45 Minuten

2 Schulstunden á 45 Minuten

Gruppen- und Einzeltest, Dauer ca. 15 Minuten

Schablone

Schablone

Schablone, 5 Min. je Testheft

Auswertung mit Hilfe einer Schablone, Dauer ca. 1–2 Minuten pro Test

Lesen

455

7–12 2007

8–9

WLST (Würzburger LesestrategieWissenstest)

LESEN 8–9

2012

6–12 2007

LGVT (Lesegeschwindigkeitsund Verständnistest)

neueste Aufl.

Jg.

Kriterien

Tab. 6 (fortgesetzt) DaZ / Mehrsprachigkeit

nein

Basale Lesefertig- nein keiten sowie Satz- und Textverständnis

Lesestrategiewissen

Lesegeschwindig- nein keit und Leseverständnis

Was wird erhoben?

Liste kurzer, einfacher Sätze lesen (3 Minuten) und zwei Texte (Sachund Erzähltext) mit jeweils 19 Fragen im Multiple-ChoiceVerfahren

Benotung der Effektivität aufgelisteter Lesestrategien bei vorgegebener Leseund Lernsituation

Auswahl passender Wörter aus jeweils 3 Alternativen an 23 Stellen in einem Erzähltext mit 1727 Wörtern

Aufgabenformate und Textgrundlage

Klassenstufenbezogene Prozentrangnormen, T-Äquivalenzwerte (N = 945)

Klassenstufen- und schulartbezogene Prozentrangnormen (N = 4490)

Klassenstufen- und schulartbezogene Prozentrangnormen (N = 2390)

Normierung

Gruppen- oder Einzeltest Dauer 39 Minuten

Gruppen- oder Einzeltest, Dauer ca. 20–35 Minuten

Gruppen- oder Einzeltest, Dauer 10 Minuten

Art und Dauer der Durchführung

Schablone

Auswertung relativ komplex, erfolgt über Paarvergleiche der Antworten

zeitökonomisch mit Hilfe eines Auswertungsbogens

Auswertung

456 Zeynep Kalkavan-Aydin und Katja Winter

Lesen

457

4.2 Weitere Diagnoseinstrumente In diesem Abschnitt stellen wir Diagnoseverfahren vor, die nicht in Tabelle 6 aufgeführt sind, aber oft Anwendung finden. Wir beginnen mit dem C-Test, der auch im DaZ/DaF-Kontext eingesetzt wird. C-Test Ein C-Test 9 besteht im Allgemeinen aus (vier oder fünf) kurzen Texten, in denen Wörter getilgt sind (z. B. Baur & Goggin 2017; Baur & Spettmann 2008; Grotjahn 2006, s. auch Grabe 2009: 359–360, vgl. Grotjahn in diesem Band). Die einzelnen Teiltests decken unterschiedliche Themen ab (z. B. Fachlexik). Die Wortanzahl in den Texten entspricht jeweils dem Tilgungsprinzip (so können je nach Untersuchungsziel z. B. Wörter getilgt werden, die eine grammatische Funktion erfüllen, Fachbegriffe sind, oder aber man erfüllt das Prinzip jedes zweite Wort im Text zu tilgen). Der C-Test gilt inzwischen insbesondere im Zweit- und Fremdsprachenkontext als validiert und zeigt Vorteile in der Durchführung sowie in der Auswertung und Vergleichbarkeit der Ergebnisse. Dennoch ist umstritten, ob der C-Test tatsächlich auch als Lesetest im engeren Sinne verstanden werden kann, da in erster Linie sprachliche Kompetenzen getestet werden und beispielsweise sprachliche Elemente primär nach morpho-syntaktischen Regeln getilgt werden. Die unterschiedlichen Gestaltungsmöglichkeiten erlauben jedoch, auch fachsprachlich spezifische Merkmale zu testen. Dies ist beispielsweise in C-Tests möglich, in denen ganze Fachwörter aus einem Fach-/Sachtext getilgt werden. Offensichtlich gibt es auch Übereinstimmung darüber, dass C-Test-Ergebnisse mit Ergebnissen anderer Sprachstandserhebungen korrelieren (u. a. Baur & Spettmann 2008; Baur & Goggin 2017; Eckes & Grotjahn 2006a/b), was für die Relevanz des C-Tests in lesediagnostischen Kontexten spricht. So werden CTests inzwischen auch in Diagnoseverfahren der Fremdsprachendidaktik berücksichtigt wird (vgl. Grotjahn 2010; Dürrstein 2013: 25).10 STOLLE (Stolperwörter-Lesetest) Der Stolperwörter-Lesetest, empfohlen für den Einsatz in den Jahrgängen 1–4, besteht aus einer Reihe von Sätzen, in denen jeweils ein Wort vorkommt, das nicht in den syntaktischen, wohl aber in den semantischen Kontext des Satzes passt, z. B. „Das Auto fährt bei warten Rot weiter.“ (vgl. STOLLE, Form C 2009: 3) Dieses Wort muss jeweils identifiziert und getilgt werden. Um diese Aufgabe lösen zu können,

9 Dem C-Test liegt der Cloze-Test zugrunde, bei dem ebenfalls Wörter getilgt werden (Zum C-Test s. auch http://www.c-test.de) (Zugriff am 16. 08. 2016). 10 So stellt bspw. Dürrstein (2013: 25) die Entwicklung eines C-Tests als Screening vor. Als Argument für den Einsatz eines C-Tests bei Jugendlichen in der Sekundarstufe I nennt sie, dass die vorhandenen standardisierten Sprachtests für Jugendliche in der Regel für den Schulkontext nur eingeschränkt geeignet seien.

458

Zeynep Kalkavan-Aydin und Katja Winter

ist es notwendig, dass zumindest ein Teil der Wörter richtig erlesen und das Abrufen der Einzelwörter und die vergleichende Verarbeitung dieser durch Aktivierung der grammatischen, syntaktischen und semantischen Lexika gelingt (vgl. Metze 2009a: 6). Brügelmann, der den STOLLE im Rahmen des Projekts LUST11 untersucht hat, kommt zu dem Schluss, dass „der Stolperwörter-Lesetest ungewöhnlich konstruiert ist, um die grundlegende Lesefähigkeit zu erfassen. Es geht um mehr als nur um rasches Worterkennen und um weniger als das Verständnis von Textzusammenhängen. Andererseits fordert der Test mehr als die reine Leseleistung. Das inhaltliche Satzverständnis muss in eine bewusste sprachformbezogene Entscheidung übersetzt werden.“ (Brügelmann 2003: 5, Hervorhebungen im Original) Möglichen Einwänden, z. B. dass unterschiedliche sprachliche Voraussetzungen, wie sie bei DaZLernern in besonderem Maße gegeben sein können, unreflektiert auf die Lesefähigkeit bezogen werden, begegnet Metze, indem er darauf verweist, dass „[j]eder Leseprozess, der über das bloße Rekodieren hinausgeht, […] Kenntnisse der zu lesenden Sprache im Wortschatz, in der Grammatik und im Satzbau [benötigt].“ (vgl. Metze 2009b: 6) Der STOLLE ist nicht repräsentativ normiert, trotzdem stehen Vergleichstabellen mit Prozentrangwerten zur Verfügung, die auf von Lehrerinnen und Lehrern freiwillig eingereichten Ergebnissen beruhen. Bergedorfer Screening zur Sprach- und Lesekompetenz Das „Bergedorfer Screening zur Sprach- und Lesekompetenz“ ist ein informelles Überprüfungsverfahren für das Fach Deutsch der Jahrgangsstufen 5–9. Es erfasst die sprachlichen Fähigkeiten und das Leseverstehen auf der Wort-, Satz- und Textebene „sowohl von deutsch-sprachigen Jugendlichen als auch von Schülern mit Deutsch als Zweitsprache […]“ (Bergedorfer Screening – Arbeitsgemeinschaft Anni-BraunSchule 2011: 13) in verschiedenen Subtests. Das komplexe Textverstehen z. B. wird durch offene Fragen zu einem Erzähltext erhoben. Die Konstruktion der Fragen orientiert sich, obwohl es sich um einen narrativen Text handelt, am Kompetenzbereich „Sach- und Gebrauchstexte verstehen und nutzen“ der Bildungsstandards: – Informationen zielgerichtet entnehmen, ordnen, prüfen und ergänzen, – nichtlineare Texte (auch im Zusammenhang mit linearen Texte) auswerten, – Intentionen eines Textes erkennen, – aus Sach- und Gebrauchstexte begründete Schlussfolgerungen ziehen, – Informationen und Wertung in Texten unterscheiden. (vgl. Bergedorfer Screening – Arbeitsgemeinschaft Anni-Braun-Schule 2011: 7) Über drei Anforderungsniveaus von „grundlegend“ bis „fortgeschritten“ werden die Antworten der Schüler anschließend bewertet, wobei ausdrücklich betont wird,

11 LUST (Lese-Untersuchung mit dem Stolperwörter-Lesetest) wurde in Kooperation mit Wilfried Metze und Erika Brinkmann durchgeführt.

Lesen

459

dass „bei einem schlechten Abschneiden [von Schülern mit Migrationshintergrund] zusätzlich geklärt werden [müsse], ob die niedrigen Leistungen auf allgemein geringe Deutschkenntnisse oder auf eine zugrunde liegende Sprachentwicklungsstörung zurückzuführen sind“ (Bergedorfer Screening – Arbeitsgemeinschaft Anni-BraunSchule 2011: 13). Niveaubeschreibungen DaZ für die Sek. I Die Niveaubeschreibungen DaZ sind kein Test-, sondern ein Beobachtungsverfahren zur Erfassung der Sprachkompetenz von Schülerinnen und Schülern mit DaZ. Die Informationen zum Sprachstand werden durch Unterrichtsbeobachtung zusammengetragen und kategorisiert (Niveaubeschreibungen DaZ – Döll & Reich 2009: 4). Insgesamt können die Kompetenzen der Schülerinnen und Schüler mithilfe der Niveaubeschreibungen in verschiedenen sprachlichen Teilbereichen beobachtet werden: Neben dem Wortschatz, der Aussprache, dem Schreiben und dem mündlichen wie schriftlichen Grammatikgebrauch wird auch die Lesekompetenz erhoben. Hier wird zwischen Vorlesen, Textverstehen und Einsatz von Lesestrategien unterschieden. Die Niveaubeschreibungen sind vierstufig angelegt, wobei die höchste Stufe den Zielvorgaben der KMK-Bildungsstandards im Fach Deutsch entspricht und die unterste Stufe die Minimalqualifikation abbildet, die es dem Schüler bzw. der Schülerin ermöglicht, einfache Informationen aus einem altersgemäßen Text zu entnehmen (Niveaubeschreibungen DaZ – Döll & Reich 2009: 4). Baukasten Lesediagnose Der GER bildete bei der Entwicklung des „Baukasten Lesediagnose“ (Baukasten Lesediagnose – Efing 2006) die Basis, auf der die individuelle und kontinuierliche Lesediagnose von Berufsschülerinnen und- schülern erfolgen soll. Anhand von linearen und nicht-linearen Texten kann die allgemeinsprachliche wie fachsprachliche Lesekompetenz auf verschiedenen Niveaustufen und in ihren einzelnen Teilprozessen (Wortverstehen, gezieltes Leseverstehen, globales Leseverstehen, detailliertes Leseverstehen) erhoben werden. Gemäß dem Baukastenprinzip wird dabei kein fertiger, für jeden Zweck und jede Lerngruppe adäquater Test präsentiert. Das Prinzip sieht eher vor, dass sich eine Lehrperson in einer konkreten Situation aus den Baukasten-Materialien einen Test individuell zusammenstellt. Die Auswertung und Interpretation der Ergebnisse erfolgt ebenfalls auf der Grundlage des GER (vgl. Efing 2008).

4.3 Nähere Beschreibung bestimmter Aufgabensettings in den vorliegenden Testverfahren im Hinblick auf das Leseverstehen Vor dem Hintergrund der Aufstellung diverser Aufgabentypen von Grabe (siehe Tabelle 2 in Abschnitt 3) und der Feststellung Schmid-Barkows (2004: 117), dass jene

460

Zeynep Kalkavan-Aydin und Katja Winter

Aufgaben im Vordergrund stehen sollten, die das Leseverständnis tatsächlich erfassen und über die der Leser sich zum Text und über den Verstehensprozess äußert, werden im Folgenden einzelne Aufgabenformate in den beschriebenen Tests erörtert. Dabei wird zwischen dem Wort-, dem Satz- und dem Textverständnis differenziert. Zur Erfassung des Wortverständnisses werden in den vorliegenden Tests häufig Text-Bild-Zuordnungen gewählt. So besteht der Wortverständnis-Teil des ELFE 1–6 aus verschiedenen Bildern, zu denen das passende Wort aus vier Möglichkeiten ausgewählt werden soll, während in der WLLP je ein Wort präsentiert wird, zu dem aus vier Bildern dasjenige auszuwählen ist, das dem Wort entspricht. Diese Vorgehensweise setzt nicht nur den entsprechenden Wortschatz voraus, sondern auch das Erkennen der bildlichen Repräsentationen, die z. T. kulturell geprägt sind (bspw. die Darstellung eines Ritters (ELFE, Form A – Lenhard & Schneider 2006: 3). Im HAMLET werden verschiedenen Untertests zur Erfassung des Wortverständnisses präsentiert. So müssen die Kinder aus mehreren ähnlichen Wörtern dasjenige herausfinden, das die Lehrkraft vorgelesen hat. In einem zweiten Untertest zum Wortverständnis wird die Fähigkeit der Synthese und Sinnentnahme bei Vergleich von Wörtern und Pseudowörtern erfasst. In den Aufgaben wird zwischen Wörtern differenziert, die allein vom Wortbild (z. B. der Buchstabenfolge) her erkannt werden können, und jenen, die eine Synthese und Sinnentnahme voraussetzen, weil die Pseudowörter den sinnvollen Wörtern z. B. in der Konsonant-Vokal-Folge entsprechen (vgl. May et al. 2006: 5). So können unterschiedliche Kompetenzstufen erfasst werden. Auch auf der Ebene des Satzverständnisses liegen verschiedene Aufgabensettings vor. Neben Cloze elide-Formaten wie im Stolperwörter-Lesetest (s. o.) oder C-Test-Formaten (s. o.), liegen z. B. auch Aufgabenformate vor, in denen Sätze vervollständigt werden (sentence completion) müssen. Im ELFE 1–6 z. B. werden verschiedene, kurze Sätze präsentiert, die an einer Stelle eine Lücke aufweisen. Diese Lücke soll unter Rückgriff auf eine Auswahl an Wörtern gefüllt werden. Dabei geht es teilweise um die richtige Verknüpfung von Sätzen, z. B. „Lea spielt, anstatt / nachdem / dass / bevor / damit zu lernen.“ (ELFE, Form A – Lenhard & Schneider 2006: 10), z. T. aber auch um die Wahl eines passenden Verbs oder Adjektivs. Darüber hinaus werden auch Sätze dargeboten, deren Analyse nach dem Late-ClosurePrinzip zu einer falschen syntaktischen Strukturierung führen kann, die im Nachhinein korrigiert werden muss, wie in dem Beispielsatz „Steffi verspricht Lea zu kommen.“ (ELFE, Form A – Lenhard & Schneider 2006: 15) Dieser Satz kann von jüngeren oder sprachschwächeren Kindern so verstanden werden, dass Lea kommt. Der SLS 2–9, der gleichermaßen die Lesegeschwindigkeit und das Satzverständnis erfasst, besteht aus einer Reihe von Sätzen, deren Aussage als wahr oder falsch beurteilt werden soll. Schwierig könnte die Interpretation der Ergebnisse dahingehend sein, dass die Beurteilung der Sätze thematisches und z. T. auch kulturelles Wissen voraussetzt. Die Beurteilung der Aussage „Nachdem sich der Igel im Herbst

Lesen

461

satt gefressen hat, sucht er sich einen Schlafplatz und bleibt dort den ganzen Winter“ (SLS 2–9, Form B2 – Mayringer & Wimmer 2014: 7) setzt zum Beispiel Allgemeinwissen über Igel voraus. Und ob die Aussage „In der Weihnachtszeit stellen viele Familien in ihrer Wohnung einen Christbaum auf.“ (SLS 2–9, Form A2 – Mayringer & Wimmer 2014: 5) wahr oder falsch ist, hängt vom kulturellen und auch religiösen Kontext ab. Zur Erfassung des Textverständnisses liegen Aufgabenformate in unterschiedlichen Ausprägungen vor. Der ELFE 1–6 präsentiert kurze Sach- und Erzähltexte mit jeweils einer oder mehreren (bis zu vier) Fragen im Muliple-Choice-Format. Die Fragen sind derart vielfältig, dass sie z. T. das einfache Entnehmen von Informationen und z. T. kurze Zusammenfassungen des jeweiligen Textes erfordern. In anderen Diagnoseinstrumenten bilden längere Texte die Grundlage. So umfasst der Text im LGVT 1727 Wörter. An 23 im Text verteilten Stellen werden je drei Wortalternativen präsentiert, aus denen jeweils das in den Textzusammenhang passende Wort ausgewählt werden muss (Cloze elide-Verfahren auf Satzebene); z. B.: „Die Giraffe ist eines der größten Säugetiere auf der Welt, sie kann bis zu sechs [Zentimeter, Meter, Kilometer] groß werden.“ (Übungsbeispiel des Tests) Um die richtige Alternative auszuwählen zu können, muss nicht nur der Satz, in dem die Lücke ist, sondern auch mindestens der lokale Kontext verarbeitet worden sein. Ein anderes Aufgabenformat verwendet der FLVT. Dieser besteht aus zwei Texten, einem Erzähltext und einem Sachtext, zu dem jeweils 18 Fragen im MultipleChoice-Verfahren beantwortet werden sollen. Die Konzeption des Tests basiert dabei dezidiert auf der Theorie der kognitiven Textverarbeitung von van Dijk & Kintsch (1983), die verschiedene Verstehenstiefen unterscheiden. In der Fragenkonstruktion wurden diese Verstehenstiefen insofern beachtet, dass pro Textart jeweils zur Hälfte Aufgaben formuliert wurden, die textbasierte Informationen abfragen, wie „Die Winde im Innern des Schlauches erreichen eine Geschwindigkeit von a) 80 km/h b) 400 km/h c) 500 km/h d) 900 km/h“ (FLVT – Souvignier et al. 2008: 118) und Aufgaben, die Schlussfolgerungen unter Heranziehen des Vorwissens erfordern, z. B. „Womit würdest Du einen Vulkan am ehesten vergleichen? a) Mit einem Feuervogel b) Mit einem Dinosaurier c) Mit einem Drachen d) Mit einem Feuersalamander“ (FLVT – Souvignier et al. 2008: 127). Neben diesen Testverfahren, die die mehr oder weniger komplexen Verstehensleistungen der Schülerinnen und Schüler erheben, liegt mit dem WLST ein Testformat vor, das das Lesestrategiewissen der Schülerinnen und Schüler erfasst. Hierbei werden den Schülerinnen und Schülern bestimmte Lese- und Lernsituationen und mögliche strategische Herangehensweisen vorgestellt, deren Effektivität sie auf einer Skala von 1–6 (Schulnoten) bewerten sollen, z. B.: „Im Deutschunterricht fragt die Lehrkraft die Schüler, was sie tun, um einen Text möglich gut zu verstehen. a) Ich lese zunächst den letzten Abschnitt des Textes und gehe den Text dann von vorne durch. b) Ich lese erst die Überschrift und frage mich, was ich zu diesem Thema schon weiß. Danach lese ich den Text von vorne bis hinten durch. […]“ (WLST, Testheft – Schlagmüller & Schneider 2007: 2)

462

Zeynep Kalkavan-Aydin und Katja Winter

Metakognitives Lesestrategiewissen gilt als wichtige Voraussetzung für den Umgang mit Lesestrategien und das Verstehen von Texten. Die Testergebnisse müssen jedoch vor dem Hintergrund interpretiert werden, dass das Wissen über Lesestrategien noch nichts über den tatsächlichen Umgang mit diesen aussagt. Ein umfassendes Aufgabenformat, durch das gleichzeitig das Leseverstehen, der Umgang mit Lesestrategien und der Sprachstand erhoben wird, bietet der „Baukasten Lesediagnose“ der sich – wie oben beschrieben – dezidiert an den Kompetenzstufen des GER orientiert.

5 Neueste Entwicklungen Neben dem GER wirkten sich auch die Kompetenzstufen der PISA-Studie auf die Entwicklung von Testinstrumenten aus. Artelt et al. (2009) entwickelten ein neues Instrument zur Erfassung des Strategiewissens beim Textverstehen. Dieses Testformat ist angelehnt an das Konstruktionsprinzip des WLST (s. Tabelle 5), wurde aber in Bezug auf Länge und Inhalt optimiert. Die Befunde der Untersuchung bestätigen, dass der Test das Strategiewissen abbilden kann, das hinsichtlich der Vorhersage von Lernerfolgen prädiktiv ist. Grimm (2009) untersucht die den verschiedenen Kompetenzniveaus des Leseverstehens entsprechenden Aufgaben der Lernstandserhebungen 2007 in NRW mit Blick auf die Auswertungsanleitung für Lehrkräfte und fragt nach der Eindeutigkeit der Abgrenzung von Kompetenzniveaus, nach der Validität bei offenen Aufgaben und Aufgaben mit Mehrfach-Negationen, dem Umgang mit Antworten über dem Erwartungshorizont und nach der Steuerung von Antworten bei Multiple-ChoiceVerfahren. Grimm kommt zu dem Schluss, dass die Tests zwar eine Vergleichbarkeit der Lesekompetenz zwischen Schülerinnen und Schülern verschiedener Schulen landesweit und Möglichkeiten zu individuellen Diagnosen zulassen, die Auswahl der überprüften Kompetenzen jedoch zufällig zu sein scheinen. Außerdem würden durch die Steuerung der Antworten lediglich kognitive Prozesse der Lesekompetenz erhoben, ästhetische, soziale und kulturelle Aspekte rückten in den Hintergrund (Grimm 2009: 186). Anders geht Hiller (2009) in seiner Studie vor. Er stellt die Bedeutung des sogenannten Schemawissens (Frames und Scripts) für das Textverstehen heraus, das als Unterstützung bei der Verknüpfung von Informationen aus dem Text mit den Informationen des Vorwissens der Leserinnen und Leser diene. Auf dieser Grundlage entwickelte Hiller (2009) ein Testinstrument, das die Verknüpfung der textinternen mit den textexternen Informationen erheben soll. Die Befunde der Studie bestätigen nicht nur den großen Einfluss des Schemawissens auf das Textverstehen, sondern belegen auch, dass es sich bei solchen Aufgabenformaten um geeignete Diagnose- und Förderinstrumente im Bereich des Textverstehens handelt. Hiller (2013) entwickelte ein Verfahren im Bereich des Leseverstehens, das die Lernvoraus-

Lesen

463

setzungen zwei- bzw. mehrsprachiger Lernerinnen und Lerner berücksichtigen soll. Er definiert für die Diagnose von Lesekompetenz folgende Elemente, die in eine Testkonstruktion einfließen sollten: – eine differenzierte Untersuchung des Leseverstehens analog zu den PISASubskalen und -Niveaustufen, – Multiple-Choice-Fragen und (halb-) offene Fragen als konkrete Aufgabeformate zur Untersuchung des Leseverstehens, – Untersuchung des Wortschatzes der Schülerinnen und Schüler (und somit eines Teils des Vorwissens), – Untersuchung zu Konnektoren (meist Konjunktionen) und Syntax, – Untersuchung der Strukturierungsfähigkeit der Schülerinnen und Schüler. Diese Merkmale sollten nach Hiller (2013: 137) im Sinne einer individuellen Diagnose und Förderung ergänzt werden. Seinen oben angeführten Überlegungen fügt er weitere Maßnahmen hinzu, die die Lesegeschwindigkeit, die Lesestrategien, die Lesemotivation und die Lesekompetenz in der Erstsprache betreffen. Auf diese Weise wäre es möglich, ein Leserprofil zu erstellen, das sowohl die individuellen Fähigkeiten berücksichtigen würde als auch die Möglichkeit bieten würde, ein Testverfahren für größere Gruppen zu entwickeln und zu standardisieren. Dass der häufig kritisierte und von Hiller (2013) selbst auch angemahnte Aufwand (Ressourcen etc.) für die Diagnostik in einem der sprachlichen Kompetenzbereiche dadurch potenziert würde, steht außer Frage. Richter et al. (2011) stellen zur Diagnostik von Lesefähigkeiten bei Grundschulkindern ein computergestütztes prozessorientiertes Diagnostikum für die Grundschule (ProDi-L: Prozessbezogene Diagnostik von Lesefähigkeiten in der Grundschule) vor. Statt der Qualität des Verstehensproduktes wird dabei die Effizienz gemessen, mit der Grundschülerinnen und -schüler kognitive Teilprozesse (phonologische Rekodierung, orthographische Vergleichsprozesse, Zugriff auf Wortbedeutungen, syntaktische Integration, semantische Integration, lokale Kohärenzbildung) bewältigen können. Ebenfalls die Möglichkeiten des Einsatzes einer computergestützten Maßnahme zur Lernverlaufsdiagnostik und die Auswirkung auf den Lernzuwachs leseschwacher Viertklässlerinnen und Viertklässler untersuchten Souvignier & Förster (2011). Die Testreihe besteht aus acht kurzen Tests (Sachtexte und literarische Texte) und soll differenzierte Informationen über die Lesegeschwindigkeit, die Lesegenauigkeit und das Leseverständnis im Sinne einer Identifikation textimmanenter Informationen und im Sinne textübergreifender, schlussfolgernder Leistungen zulassen. Der Lernzuwachs wurde anhand des ELFE 1–6 erhoben. Die Ergebnisse zeigen erstens, dass ein Lernzuwachs stattgefunden hat, und zweitens – erhoben durch einen Fragebogen ‒, dass den Lehrpersonen durch diese Verfahrensweise differenzierte Informationen über die Lesekompetenz ihrer Schülerinnen und Schüler bereitgestellt werden, die produktiv zur Förderung eingesetzt werden können. Abschließend lässt sich konstatieren, dass für die Sekundarstufe wenige geeigneten Verfahren im Bereich der Lesediagnostik vorliegen (vgl. Junk-Deppenmeier

464

Zeynep Kalkavan-Aydin und Katja Winter

2009; Dürrstein 2013: 25). Als gängiges Verfahren wird in der Sekundarstufe der C-Test verwendet. In „Praxismaterial Förderdiagnostik“ (Praxismaterial Förderdiagnostik – Junk-Deppenmeier & Jeuk 2015) gibt es neben einem C-Test als Screening und weiteren Verfahren zu sprachlichen Qualifikationen einen Lesetest auf der Grundlage eines literarischen Textes (Hiller 2015). In den Auswertungshinweisen und darauf aufbauenden Förderhinweisen wird explizit auf mehrsprachige Lernerinnen und Lerner (Klasse 5/6) eingegangen. In Mashkovskayas Untersuchung (2013) bildet der C-Test die Grundlage für die Analyse von Lesefähigkeiten bei Studierenden. Mashkovskaya (2013) untersucht, ob C-Tests die Lesefähigkeit von Studierenden messen können und ob die erhobenen Daten die Differenzierung der Lesekompetenz auf verschiedenen Prozessebenen zulassen. Die Ergebnisse ihrer Studie zeigen, dass mit dem Einsatz von C-Tests (im universitären Bereich) nicht nur Aussagen über die Sprach-, sondern auch differenzierte Aussagen über die Lesefähigkeit gemacht werden können.

6 Fazit Bei der Durchsicht der Aufgabenformate und -typen zu den einzelnen Verfahren fällt auf, dass einzelne Instrumente Aufgaben im Mulitple-Choice-Verfahren zu Sachtexten und fiktionalen Texten nach Kompetenzstufen differenzieren, wie z. B. der FLVT. Insbesondere in Diagnoseinstrumenten für die Sekundarstufe wird häufig mit Multiple-Choice-Aufgaben operiert. Daneben finden Aufgaben wie schriftliche Fragen, Cloze-elide-Verfahren, das Vervollständigen von Sätzen oder die nach Grabe (2009: 359) so genannten dichotomous items (also wahre bzw. falsche Aussagen beurteilen (wie im Salzburger Lesescreening)), in Verfahren für die Grundschule sowie für die Sekundarstufe häufig Verwendung. Im Hinblick auf das Kriterium DaZ und Mehrsprachigkeit haben die Analysen der Diagnoseinstrumente ergeben, dass nur wenige Verfahren vorliegen, die explizit für diese Lerngruppe konzipiert wurden bzw. entsprechende Aspekte berücksichtigen und kaum Normierungswerte für DaZ vorliegen. Lediglich der ZLT scheint als standardisiertes Verfahren auch im Mehrsprachigkeitskontext geeignet zu sein, auch wenn keine signifikanten Ergebnisse vorliegen. In ELFE und im SLS wird im Testbogen zwar auch die Angabe der Erstsprache verlangt, jedoch spielt diese im Rahmen der Diagnostik bzw. der Auswertung der Ergebnisse keine Rolle. Ebenso verhält es sich mit KNUSPEL-Leseaufgaben (KNUSPEL – Marx 1998) für die Klassen 1 bis 4. Insgesamt zeigt die Marktlage einen großen Bedarf an Diagnoseinstrumenten zum Lesen in der Zweitsprache Deutsch. Die vorgestellten Verfahren decken zwar alle den Bereich des Leseverstehens ab, sind jedoch nicht für Leserinnen und Leser mit DaZ geeicht. Diesbezüglich sollte auch vor dem Hintergrund der aktuellen bildungspolitischen Entwicklung und der Konsequenzen, die im Bereich Wissenschaft

Lesen

465

und Bildung gezogen werden sollten, darauf hingewiesen werden, dass der Bereich Lesen durchaus mehrfaktoriell zu betrachten und zu diagnostizieren wäre. So wäre eine Differenzierung nach der sprachlichen Progression für mehrsprachige Kinder unter Berücksichtigung des Zeitpunktes zum L2-Kontakt und der Kontaktdauer sicher sinnvoll. Fraglich ist zudem, inwieweit Lesekompetenz von der allgemeinen Sprachkompetenz getrennt werden und diagnostiziert werden kann. Alle Verfahren, so unterschiedlich sie auch konzipiert sind, haben dennoch gemeinsam, dass ohne Wortschatz- und Grammatikkenntnisse das Lösen der Aufgaben nicht möglich ist. Ebenso sollten Lesebiographien stärker berücksichtigt werden, in denen insbesondere interkulturelle Aspekte aufgegriffen werden sollten. Eine weitere Empfehlung, die wir uns an dieser Stelle erlauben, wäre, zu überlegen, ob und wie man zwei Diagnoseinstrumente zum Bereich Lesen differenziert gestalten könnte. So wäre eine Kombination aus Diagnosematerial zur Beurteilung des Sprachstandes einerseits und die Überprüfung der Lesekompetenzen im Bereich Textverständnis andererseits durchaus denkbar, so wie es der „Baukasten Lesediagnose“, der lediglich für die berufliche Bildung vorliegt, vorschlägt.

Literatur Testverfahren Baukasten Lesediagnose

Efing, Christian (2006): Baukasten Lesediagnose. Inklusive Arbeitsmaterialien auf CD-Rom. Hrsg. vom Hessischen Kultusministerium. Institut für Qualitätsentwicklung. Bergedorfer Arbeitsgemeinschaft der Anni-Braun-Schule (2011): Bergedorfer Screening. Screening Zur Sprach- und Lesekompetenz. Informelles Verfahren für das Fach Deutsch. Buxtehude: Persen Verlag. ELFE 1–6 Lenhard, Wolfgang & Wolfgang Schneider (2006): ELFE 1–6: Ein Leseverständnistest für Erst- bis Sechstklässler. Göttingen: Hogrefe. FLVT Souvignier, Elmar, Isabel Trenk-Hinterberger, Stefanie Adam-Schwebe & Andreas Gold (2008): FLVT 5–6. Frankfurter Leseverständnistest für 5. und 6. Klassen. Göttingen: Hogrefe. HAMLET 3–4 Lehmann, Rainer H., Rainer Peek & Jan Poerschke (2006): HAMLET 3–4. Hamburger Lesetest für 3. Und 4. Klassen. Göttingen: Hogrefe. Hörverstehen Hiller, Florian (2015): Hörverstehen. In: Junk-Deppenmeier, Alexandra & Stefan (Praxismaterial Jeuk (Hrsg.) (2015): Praxismaterial Förderdiagnostik, 31–50. Stuttgart: Förderdiagnostik) Fillibach bei Klett. KNUSPEL Marx, Harald (1998): KNUSPEL-L. Knuspels Leseaufgaben. Göttingen: Hogrefe. Leseaufgaben LESEN 6–7 Bäuerlein, Kerstin, Wolfgang Lenhard & Wolfgang Schneider (2012): LESEN 6– 7. Lesebatterie für die Klassenstufen 6–7. Verfahren zur Erfassung der basalen Lesekompetenz und des Textverständnisses. Göttingen: Hogrefe. LESEN 8–9 Bäuerlein, Kerstin, Lenhard, Wolfgang & Schneider, Wolfgang (2012): LESEN 8–9. Lesebatterie für die Klassenstufen 8–9. Verfahren zur Erfassung der basalen Lesekompetenz und des Textverständnisses. Göttingen: Hogrefe.

466

Zeynep Kalkavan-Aydin und Katja Winter

LGVT

Schneider, Wolfgang, Matthias Schlagmüller & Marco Ennemoser (2007): LGVT 6–12. Lesegeschwindigkeits- und -verständnistest für die Klassen 6–12. Göttingen: Hogrefe. NiveauDöll, Marion & Hans Reich (2009): Niveaubeschreibungen Deutsch als beschreibungen Zweitsprache in der Sekundarstufe I. Zur Beobachtung von Kompetenzzuwachs DaZ im Deutschen als Zweitsprache. Hrsg. vom Institut für Qualitätsentwicklung an Schulen Schleswig-Holstein, Kiel. Praxismaterial Junk-Deppenmeier, Alexandra & Stefan Jeuk (Hrsg.) (2015): Praxismaterial Förderdiagnostik Förderdiagnostik. Stuttgart: Fillibach bei Klett. SLRT-II Moll, Kristina & Karin Landerl (2014): SLRT-II. Weiterentwicklung des Salzburger Lese- und Rechtschreibtests (SLRT). 2. Aufl. Bern: Huber. SLS 2–9 Mayringer, Heinz & Heinz Wimmer (2014): SLS 2–9. Salzburger Lese-Screening für die Schulstufen 2–9. Göttingen: Hogrefe. STOLLE Metze, Wilfried (2009): Stolperwörter-Lesetest, http://www.wilfriedmetze.de/ html/stolper.html (13. 11. 2016). Telc http://www.telc.net (17. 09. 2017). WLLP-R Schneider, Wolfgang, Iris Blanke, Verena Faust & Petra Küspert (2011): WLLPR. Würzburger Leise-Leseprobe – Revision. Ein Gruppentest für die Grundschule. Göttingen: Hogrefe. WLST 7–12 Schlagmüller, Matthias & Wolfgang Schneider (2007): Würzburger Lesestrategie-Wissenstest für die Klassen 7–12 (WLST 7–12). Göttingen: Hogrefe. ZLT-II Petermann, Franz & Monika Daseking (2015): ZLT-II. Zürcher Lesetest – II. Weiterentwicklung des Zürcher Lesetests (ZLT) von Maria Linder und Hans Grissemann. 3. überarb. Aufl. mit erweiterten Normen. Bern: Huber.

Literatur Artelt, Cordula, Andrea Beinicke, Matthias Schlagmüller & Wolfgang Schneider (2009): Diagnose von Strategiewissen beim Textverstehen. Zeitschrift für Entwicklungspsychologie und Pädagogische Psychologie 41 (2), 96–103. Artelt, Cordula, Nele McElvany, Ursula Christmann, Tobias Richter, Norbert Groeben, Juliane Köster, Wolfgang Schneider, Petra Stanat, Christian Ostermeier, Ulrich Schiefele, Renate Valtin, Klaus Ring & Henrik Saalbach (2007): Förderung der Lesekompetenz. Expertise. Hrsg. vom Bundesministerium für Bildung und Forschung. Bonn, Berlin. Artelt, Cordula, Ulrich Schiefele, Wolfgang Schneider & Petra Stanat (2002): Leseleistungen deutscher Schülerinnen und Schüler im internationalen Vergleich (PISA): Ergebnisse und Erklärungsansätze. Zeitschrift für Erziehungswissenschaft, 44, 6–27. Baumert, Jürgen, Eckhard Klieme, Michael Neubrand, Manfred Prenzel, Ulrich Schiefele, Wolfgang Schneider, Petra Stanat, Klaus-Jürgen Tillmann & Manfred Weiß (Hrsg.) (2001): PISA 2000. Basiskompetenzen von Schülerinnen und Schülern im internationalen Vergleich. Opladen: Leske & Budrich. Baur, Rupprecht S. & Melanie Goggin (2017): Sprachstandsmessung und Sprachförderung mit dem C-Test. In Bernt Ahrenholz & Ingelore Oomen-Welke (Hrsg.), Deutsch als Zweitsprache. 4. vollst. überarb. und erw. Auflage, 560–576. Baltmannsweiler: Schneider Hohengehren. Baur, Rupprecht S. & Melanie Spettmann (2008): Screening-Diagnose-Förderung: Der C-Test im Bereich DaZ. In Bernt Ahrenholz (Hrsg.), Deutsch als Zweitsprache. Voraussetzungen und

Lesen

467

Konzepte für die Förderung von Kindern und Jugendlichen mit Migrationshintergrund, 22–28. Freiburg i. Br.: Fillibach. Benholz, Claudia, Eva Lipkowski & Charitini Iordanidou (2005): Bedingungen des Textverstehens. In Horst Bartnizky & Angelika Speck-Hamdan (Hrsg.), Deutsch als Zweitsprache lernen, Frankfurt a. M.: Grundschulverband – Arbeitskreis Grundschule. Bos, Wilfried, Irmela Tarelli, Albert Bremerich-Vos & Knut Schwippert (Hrsg.) (2011): IGLU 2011. Lesekompetenzen von Grundschulkindern in Deutschland im internationalen Vergleich. Münster: Waxmann. Brügelmann, Hans (2003): Lese-Untersuchung mit dem Stolperwörter-Test. Abschlussbericht des Projekts LUST-1. http://www2.agprim.uni-siegen.de/lust/stolper%5B1 %5D.03.bericht. schlussfassung.12–20.pdf (13. 11. 2016). Christmann, Ursula & Norbert Groeben (1999): Psychologie des Lesens. In Bodo Franzmann, Klaus Hasemann, Dietrich Löffler & Erich Schön (Hrsg.), Handbuch Lesen, 145–222. München: Schneider Hohengehren. Dijk, Teun A. van & Walter Kintsch (1983): Strategies of Discourse Comprehension. New York: Adademic Press. Dürrstein, Birgit (2013): Entwicklung eines C-Tests als Screening. In Stefan Jeuk (Hrsg.), Sprachförderung und Förderdiagnostik in der Sekundarstufe I, 25–71. Stuttgart: Fillibach bei Klett. Eckes, Thomas & Rüdiger Grotjahn (2006a): C-Tests als Anker für TestDaF: Rasch-Analysen mit dem kontinuierlichen Ratingskalen-Modell. In Rüdiger Grotjahn (Hrsg.), Der C-Test: Theorie, Empirie, Anwendung, 167–194. Frankfurt a. M.: Lang. Eckes, Thomas & Rüdiger Grotjahn (2006b): A closer look at the construct validity of C-Tests. Language Testing, 23 (3), 290–235. Efing, Christian (2006): Baukasten Lesediagnose. Hessisches Kultusministerium. Fuldatal: Institut für Qualitätsentwicklung. www.iq.hessen.de (12. 09. 2016). Efing, Christian (2008): Kontinuierliche und individuelle Diagnose der Lesekompetenz von BerufsschülerInnen mit dem „Baukasten Lesediagnose“. bwp@ Spezial 4. TU Darmstadt. http://www.bwpat.de/ht2008/ft17/efing_ft17-ht2008_spezial4.pdf (14. 10. 2016). Ehlers, Swantje (2016): Literaturdidaktik. Eine Einführung. Stuttgart: Reclam. Ehlers, Swantje (2014): Lesekompetenz in der Zweitsprache. In Bernt Ahrenholz & Ingelore Oomen-Welke (Hrsg.), Deutsch als Zweitsprache. 3. korrigierte Auflage, 215–227. Baltmannsweiler: Schneider Hohengehren. Ehlers, Swantje (2004): Lesen in der Zweitsprache und Fördermöglichkeiten. Deutschunterricht 4 (2004), 4–10. Ehlers, Swantje (1999): Zum Wandel in der Lesetheorie und seine Folgen für die Fremdsprachendidaktik. Zeitschrift für Fremdsprachenforschung 10 (2), 177–207. Fuchs, Carina (2005): Selbstwirksam Lernen im schulischen Kontext. Bad Heilbrunn: Klinkhardt. Gantefort, Christoph & Maria J. Sánchez Oroquita (2015): Translanguaging-Strategien im Sachunterricht der Primarstufe: Förderung des Leseverstehens auf Basis der Gesamtsprachlichkeit. transfer Forschung – Schule 1 (1), 24–37. Grabe, William (2009): Reading in a Second Language. Moving from Theory to Practice. USA: Cambridge. Grabe, William (2007): First- to second-language reading comprehension: not transfer, but access. International Journal of Applied Linguistics, 17 (1), 14–37. Grimm, Sieglinde (2009): Möglichkeiten von Diagnose und Förderung im Bereich Textverstehen. Die Lernstandserhebungen 2007 in NRW. In Stefan Jeuk & Ingrid Schmid-Barkow (Hrsg.), Differenzen diagnostizieren und Kompetenzen fördern im Deutschunterricht, 169–189. Freiburg i. Br.: Fillibach. Grotjahn, Rüdiger (2006): Der C-Test: Theorie, Empirie, Anwendung. Frankfurt a. M.: Lang.

468

Zeynep Kalkavan-Aydin und Katja Winter

Grotjahn, Rüdiger (2010): Der C-Test: Beiträge aus der aktuellen Forschung. The C-Test: Contributions from Current Research. Frankfurt a. M.: Lang. Heinen, Stefanie (2001): Der Einfluss von Vorwissen, Interesse und Arbeitsgedächtniskapazität auf die mentale Repräsentation von Texten. Universität Bielefeld: Dissertation (PUB). Hiller, Florian (2013): Konzeption eines Verfahrens im Bereich des Leseverstehens. In Stefan Jeuk (Hrsg.), Sprachförderung und Förderdiagnostik in der Sekundarstufe I, 72–145. Stuttgart: Fillibach bei Klett. Hiller, Florian (2009): Frames und Scripts als Instrumente zur Diagnose und Förderung von Lesekompetenz – Grundlagen der Testkonstruktion und Ergebnisse des Forschungsprojektes „Sachtexte erschließen“. In Stefan Jeuk & Ingrid Schmid-Barkow (Hrsg.), Differenzen diagnostizieren und Kompetenzen fördern im Deutschunterricht, 139–167. Freiburg i. Br.: Fillibach, Hu, Feng (2013): Lesestrategien im chinesischen DaF-Unterricht: Entwicklung eines Konzepts zur Verbesserung des Leseverstehens chinesischer Deutschlerner. Hamburg: disserta Verlag. Junk-Deppenmeier, Alexandra (2009): Sprachstandserhebungen bei Schülerinnen und Schülern mit Deutsch als Zweitsprache in der Sekundarstufe. In Stefan Jeuk & Ingrid Schmid-Barkow (Hrsg.), Differenzen diagnostizieren und Kompetenzen fördern im Deutschunterricht, 8–9. Freiburg i. Br.: Fillibach. Kalkavan-Aydın, Zeynep (2018): Lesen in der Zielsprache Deutsch. In Zeynep Kalkavan-Aydın (Hrsg.), DaZ/DaF Didaktik. Praxishandbuch Sekundarstufe I und II, 222–243. Berlin: Cornelsen. Kalkavan, Zeynep (2012): Leseverstehen in der Zweitsprache. Berlin: Cornelsen. Kintsch, Walter (1998): Comprehension. Cambridge: Cambridge University Press. Kintsch, Walter (1988): The role of knowledge in discourse comprehension. A constructionintegration-model. Psychological Review 95, 163–182. Klieme, Eckhardt, Cornelia Artelt, Johannes Hartig, Nina Jude, Olaf Köller, Manfred Prenzel, Wolfgang Schneider & Petra Stanat (Hrsg.) (2010): PISA 2009. Bilanz nach einem Jahrzehnt. Münster: Waxmann. Krause, Ulrike & Robin Stark (2006): Vorwissen aktivieren. In: Heinz Mandl & Helmut F. Friedrich (Hrsg.): Handbuch Lernstrategien, 38–49. Göttingen: Hogrefe. Lenhard, Wolfgang & Wolfgang Schneider (2009): Diagnostik und Förderung des Leseverständnisses. Göttingen: Hogrefe. Mashkovskaya, Anna (2013): Der C-Test als Lesetest bei Muttersprachlern. Universität DuisburgEssen: Dissertation. May, Peter, Mechthild Dehn, Petra Hüttis-Graf & Inge Büchner (2006): Hamburger Lesetest 1. http://www.peter-may.de/Komponenten/Dokumente/May_doc/HLT.pdf (13.11. 2016). Metze, Wilfried (2009a): Stolperwörter-Lesetest, Form C. http://www.erichkaestnerschule-idstein.de/images/Stolperworter_C_und_D.pdf (13. 11. 2016). Metze, Wilfried (2009b): Handanweisung. Stolperwörter-Lesetest. http://wilfriedmetze.de/ Handanweisung_2009.pdf (13. 11. 2016). Oakhill, Jane, Kate Cain & Carsten Elbro (2014): Understanding and Teaching Reading Comprehension: A Handbook. London: Taylor & Francis. Pressley, Michael, John G. Borkowski & Wolfgang Schneider (1987): Cognitive strategies: Good strategy users coordinate metacognition, and knowledge. In Ross Vasta & Grover Whitehurst (Hrsg.), Annals of Child Development, 4. Greenwich, CT: JAI Press, 89–129. Richter, Tobias, Johannes Naumann, Maj-Britt Isberner, Yvonne Kutzner (2011): Diagnostik von Lesefähigkeiten bei Grundschulkindern: Eine prozessorientierte Alternative zu produktorientierten Tests. Diskurs Kindheits- und Jugendforschung 4, 479–486. Richter, Tobias & Ursula Christmann (2006) Lesekompetenz: Prozessebenen und interindividuelle Unterschiede. In Norbert Groeben & Bettina Hurrelmann (Hrsg.), Lesekompetenz: Bedingungen, Dimensionen, Funktionen, 25–58. Weinheim: Beltz.

Lesen

469

Rickheit, Gert & Hans Strohner (1990): Inferenzen: Basis des Sprachverstehens. Die Neueren Sprachen, 89 (6), 532–545. Rosebrock, Cornelia & Daniel Nix (2014): Grundlagen der Lesedidaktik und der systematischen schulischen Leseförderung. Baltmannsweiler: Schneider Hohengehren. Rosebrock, Cornelia, Andreas Gold, Daniel Nix & Carola Rieckmann (2011): Leseflüssigkeit fördern. Lautleseverfahren für die Primar- und Sekundarstufe. Seelze: Kallmeyer/Klett. Rosebrock, Cornelia & Daniel Nix (2006): Forschungsüberblick: Leseflüssigkeit (Fluency) in der amerikanischen Leseforschung und -didaktik. Didaktik Deutsch, 20, 90–112. Schmid-Barkow, Ingrid (2004): Prozesse des Textverstehens und ihre Analyse. In: Monika Dräger, Hanne Gräser, Ulrich Hecker & Barbara Sengelhoff (Hrsg.), Lesen ist Verstehen. Schriften auf Wegen zu Kindern. Frankfurt a. M.: Deutsche Gesellschaft für Lesen und Schreiben, 115–126. Schramm, Karen (2001): L2-Leser in Aktion: der fremdsprachliche Leseprozeß als mentales Handeln. Münster: Waxmann. Souvignier, Elmar & Natalie Förster (2011): Effekte prozessorientierter Diagnostik auf die Entwicklung der Lesekompetenz leseschwacher Viertklässler. Empirische Sonderpädagogik 3, 243–255. Steck, Andrea (2008): Förderung des Leseverstehens in der Grundschule. Ein theoriegeleitetes Fortbildungskonzept zur Ausbildung und Weiterentwicklung der Sach- und Methodenkompetenz von Lehrkräften im Bereich Leseverstehen. Baltmannsweiler: Schneider Hohengehren. Trim, John, Brian North, Daniel Coste & Joseph Sheils (2001): Gemeinsamer europäischer Referenzrahmen für Sprachen: lernen, lehren, beurteilen. Europarat. Berlin/München: Langenscheidt. http://student.unifr.ch/pluriling/assets/files/Referenzrahmen2001.pdf (13. 10. 2016). Walter, Catherine (2002): Reading in a second language. Linguistics and Area Studies Good Practice Guide. https://www.llas.ac.uk/resources/gpg/1420 (24. 10. 2016). Walter, Catherine (2007): First- to second-language reading comprehension: not transfer, but access. International Journal of Applied Linguistics, 17 (1), 14–37. Weis, Uta (2000): Lesen in der Fremdsprache Deutsch. Eine empirische Studie zum Lesen linearer Texte im Vergleich zu Hypertexten. Hamburg: Books on Demand.

Joachim Schäfer

19 Schreiben 1 2 3 4 5 6

Einleitendes Die Schwierigkeit, die Schreibkompetenz zu „diagnostizieren“ Schreibkompetenz Verfahren zur Erfassung der Schreibkompetenz in der Zweitsprache Deutsch Fazit für den schulischen Bereich Anmerkungen zum außerschulischen Bereich

1 Einleitendes Dieser Beitrag setzt sich mit der Schreibkompetenz im Sinne der Produktion von Texten auseinander. Zunächst werden Verfahren für den schulischen Bereich dargestellt, anschließend wird die Situation für den außerschulischen Bereich skizziert. Ausführungen zur Erfassung der orthographischen Kompetenz finden sich bei Becker in diesem Band. Die Diagnose der Schreibkompetenz von Schülerinnen und Schülern, die sich Deutsch als Zweitsprache aneignen, ist ein relativ neues Arbeits- bzw. Forschungsgebiet. So zählt z. B. Ihssen (1980: 41) vor über 30 Jahren Bereiche der „Sprachentwicklungsdiagnose“ auf, die bei „Ausländerkindern“ erfasst werden sollen. Die Textproduktion fällt für Ihssen nicht darunter. Bis heute liegen kaum Verfahren vor, die zur Diagnose der Schreibkompetenz in der Zweitsprache Deutsch geeignet wären (vgl. Schäfer 2011: 311). Allerdings liegen auch nur wenige Verfahren zur Erfassung der Schreibkompetenz in der Erstsprache Deutsch vor. Einen standardisierten Test, der testtheoretischen Ansprüchen gerecht wird und genormte Vergleichswerte enthält, gibt es für diesen Kompetenzbereich bis heute weder für die Erst- noch die Zweitsprache Deutsch für den schulischen Bereich. Daneben wurden für „Deutsch als Fremdsprache“ einige Verfahren für Erwachsene entwickelt, die andere Schwerpunkte setzen.

2 Die Schwierigkeit, die Schreibkompetenz zu „diagnostizieren“ Dass es bislang kein standardisiertes Verfahren zur Lernstandserhebung für diese Kompetenz gibt, hat vermutlich verschiedene Ursachen. Knopp, Becker-Mrotzek & Grabowski (2013: 297) sehen vorrangig zwei Schwierigkeiten: Schreibkompetenz entzieht sich der direkten Beobachtung, es lassen sich allenfalls indirekt Rückschlüsse aus Schreibprodukten ziehen. Texte resultieren in der Regel aus komplehttps://doi.org/10.1515/9783110418712-019

472

Joachim Schäfer

xen Prozessen, die auf sehr unterschiedlichen Vorgehensweisen und Entscheidungen beruhen, die sich üblicherweise ebenfalls der direkten Beobachtung entziehen (vgl. Schründer-Lenzen & Henn 2009: 92). Bremerich-Vos & Possmayer (2013: 277) konstatieren zudem, dass die Verlässlichkeit der Beurteilung von Schülertexten erst in den letzten Jahren thematisiert wird. Es ist eine Herausforderung, nachvollziehbar anzugeben, welche Textqualität beim Schreiben erreicht wird. Diese Frage lässt sich nur mit großem Aufwand oder nicht verlässlich beantworten, teilweise sind auch unterschiedliche Definitionen von Textqualität vorhanden. Deswegen können die Ergebnisse von Studien zur Schreibkompetenz nur mit der gebotenen Vorsicht verglichen werden (vgl. Neumann 2017: 207). Die Zugänge zu Schülertexten lassen sich in Verfahren mit einer Globalbeurteilung und einer kriterienbezogenen Analyse unterscheiden. Bei der ersten wird anhand von internalisierten Kriterien der Gesamteindruck beurteilt, während bei der kriterienbezogenen Analyse verschiedene Aspekte des Textes einzeln analysiert werden (vgl. Neumann 2017: 209–2011). Nach Fix (2008: 201) eignet sich eine Kombination beider Verfahren, um Schülerleistungen angemessen einzuschätzen. Die Anforderungen für verlässliche Aussagen durch ein Rating sind aber sehr hoch. Philipp (2013: 79–82) erläutert, welche Schwierigkeiten es bereitet, die Schreibkompetenz verlässlich zu erheben. Der Aufwand für eine angemessene Beschreibung der individuellen Schreibkompetenz, die den Ansprüchen der Empirie genügt, ist enorm, wie im Folgenden erläutert wird. Da die relevanten Merkmale der Schreibkompetenz meistens nicht direkt beobachtbar sind, wird bei der Einschätzung zur Textqualität häufig auf Rating-Verfahren zurückgegriffen. Dazu schätzen eine oder mehrere Personen voneinander unabhängig die Qualität eines Schülertextes ein. Dies kann analytisch anhand von Kriterien oder holistisch erfolgen (vgl. Kürzinger & Pohlmann-Rother 2015: 62). Schoonen (2005) kommt in einer Studie mit niederländischen Schülerinnen und Schülern zur Verlässlichkeit solcher Ratings zu ernüchternden Erkenntnissen. Eine einzelne Person müsste sieben Schülertexte eines Schülers bzw. einer Schülerin einschätzen, um zu einem verlässlichen holistischen Urteil zur Sprachverwendung des Schülers bzw. der Schülerin zu kommen. Bei einer kriteriengeleiteten Analyse wären sogar zehn Texte erforderlich. Für ein holistisches Urteil zum Inhalt und zur Textorganisation würde eine einzige Raterin bzw. ein einziger Rater neun Schüleraufgaben benötigen und für ein analytisches Urteil zu diesem Bereich erreichen nicht einmal zehn Raterinnen bzw. Rater bei zehn Schüleraufgaben befriedigende Werte (vgl. Schoonen 2005: 29–30). Kürzinger & Pohlmann-Rother (2015: 68–70) berichten hingegen von einer hohen Interrater-Reliabilität, der aber eine sehr aufwändige Schulung der Raterinnen und Rater zugrunde liegt. Knopp, Becker-Mrotzek & Grabowski (2013: 308) konnten hingegen bei einem aus den USA übernommenen Instrument, einem naiven Rating und einem am Züricher Textanalyseraster angelehnten Verfahren, keine befriedigenden Werte bei der Interrater-Reliabilität erreichen. Den Einsatz mehrerer Raterinnen bzw. Rater im Schulalltag schätzt u. a. Haberzettl (2015: 63) als wenig praktikabel ein.

Schreiben

473

Marx (2017: 140) weist darauf hin, dass für das Schreiben in der Zweitsprache neben den oben genannten komplexen Anforderungen noch die Variable der „Zweitsprache“ mit bedacht werden muss. Generelle Schwierigkeiten bei Sprachstandsmessungen, die Kracht (2003: 39) nennt, zeigen sich bei Lernstandserhebungen beim Zweitspracherwerb in besonderem Maße: Es muss geklärt werden, welche sprachliche Normen für die Bestimmung des Lernstands festgelegt werden. Gerade beim Schreiben gibt es jedoch nur wenige Bereiche, in denen eindeutige und linguistisch plausible Textnormen vorliegen. Deshalb müssen diese begründet werden, bleiben angesichts der Vielfältigkeit der Lösungsmöglichkeiten für das Problem, einen Text zu verfassen, aber immer vage. Die genannten Sachverhalte tragen dazu bei, dass es für die Erfassung der Schreibkompetenz bislang kein standardisiertes Testverfahren gibt. Das MercatorInstitut für Sprachförderung und Deutsch als Zweitsprache (2016) kündigt aber ein entsprechendes Verfahren für die Klasse 4–9 an, das auch Kinder mit Deutsch als Zweitsprache berücksichtigen soll. Quasthoff & Domenech (2016: 38) sind zuversichtlich, das standardisierte Instrument TexQu-A für das schriftliche Argumentieren zu einem diagnostischen Verfahren für alle Schülerinnen und Schüler weiterentwickeln zu können.

3 Schreibkompetenz Das Fähigkeitskonzept „Schreibkompetenz“ ist historisch gesehen relativ jung (Becker-Mrotzek 2014: 51). Es kann normativ oder empirisch modelliert werden (vgl. Ossner 2006: 5). In der Schreibdidaktik wurden in den letzten Jahren verschiedene Kompetenzmodelle entwickelt (so z. B. Fix 2008: 26; Baurmann & Pohl 2009: 96 und Becker-Mrotzek 2014: 52–60), die sich im Detail unterscheiden, aber auch viele Gemeinsamkeiten aufweisen. Sie sind letzten Endes normativ, basieren aber auf empirischen Erkenntnissen. Alle basieren auf der Idee des Schreibprozesses. Diese stammt ursprünglich aus der nordamerikanischen Schreibforschung und hat sich in den letzten 40 Jahren auch in der deutschen Schreibdidaktik etabliert. Der Grundgedanke ist, dass Schreiben eine Art Problemlöseprozess ist, bei dem verschiedene Handlungen unter gegebenen Voraussetzungen geplant, durchgeführt und revidiert werden. Trotz aller Kritik im Detail ist dieser Gedanke prägend für den aktuellen schreibdidaktischen Diskurs (vgl. Becker-Mrotzek 2014: 52). Knopp, Becker-Mrotzek & Grabowksi (2013: 296) definieren Schreibkompetenz im Rahmen dieses Paradigmas: „Schreibkompetenz ist eine komplexe Fähigkeit, die der Herstellung funktional angemessener Texte dient und an der sehr unterschiedliche sprachliche, kognitive, motivationale und affektive Komponenten beteiligt sind.“ Das ursprüngliche, häufig rezipierte Scheibprozessmodell von Hayes und Flower aus dem Jahr 1980 wurde von Hayes 2012 modifiziert und um neuere Erkenntnisse der Schreibforschung ergänzt (vgl. Hayes 2012). In diesem Modell wird darge-

474

Joachim Schäfer

Motivation

Kontrollebene

Prozessebene

Zielsetzung (Planen, Aktueller Plan Schreiben und Schreibschemata Überarbeiten) Evaluation

Schreibprozess

Vorschlag (Plan) Übersetzung niedergeschriebener Text

Aufgabenumgebung

Ebene der Ressourcen

Mitwirkende und Kritiker Schreibtechnologien bzw. -strategien Schreibaufgaben und -materialien Schriftliche Pläne Aufmerksamkeit, Lesekompetenz

Arbeitsgedächtnis,

des

Vorschlags

der entstehende Text

Langzeitgedächtnis,

Abb. 1: Das revidierte Modell des Schreibprozesses – eigene Darstellung auf der Grundlage von Hayes (2012: 371).

stellt, dass Schreiben eine komplexe soziale Handlung darstellt, der Teilprozesse auf einer Kontrollebene, einer Prozessebene und einer Ebene der Ressourcen stattfindet. Die Kontrollebene umfasst neben der Schreibmotivation als zentrale Größe v. a. die metakognitiven Kontroll- und Steuerungsstrategien, die im ursprünglichen Modell als „Monitor“ zusammengefasst wurden (vgl. Hayes 2012: 375). Auf der Prozessebene sind die typischen Handlungsschritte beim Schreiben eines Textes und das Umfeld, in dem diese erfolgen, dargestellt (vgl. Becker-Mrotzek 2012: 60). Die Ebene der Ressourcen umfasst die „[…] sprachlichen und kognitiven Voraussetzungen […]“ für Schreibprozesse (Becker-Mrotzek 2014: 59). Das Modell lässt sich in übersetzter und vereinfachter Form folgendermaßen darstellen (s. Abb. 1). Auf die Darstellung der gegenseitigen Beeinflussung der einzelnen Ebenen wurde verzichtet. Nach Baurmann & Pohl (2009: 96) gibt es Teilkompetenzen, die sich auf den Schreibprozess beziehen, und Teilkompetenzen, die sich auf das Produkt, also den Text, beziehen. Die Prozessperspektive untergliedern sie in eine Planungs-, Formulierungs- und Überarbeitungskompetenz. Die Produktperspektive besteht aus der Ausdrucks-, der Kontextualisierungs-, der Antizipations- und Textgestaltungskompetenz. Die Schwierigkeit für diagnostische Verfahren besteht darin, dieses komplexe Kompetenzgefüge angemessen zu erfassen. Eine erste Annahme, die man treffen muss, um Schreibkompetenz zu beschreiben und zu analysieren, ist, dass die in Schreibhandlungen gezeigten Leistungen Rückschlüsse auf eine nicht direkt beobachtbare Schreibkompetenz ermöglichen (vgl. Kürzinger & Pohlmann-Rother 2015: 63). Dies ist nicht unproblematisch, da zwischen der realisierten Schreibkompetenz und der tatsächlich vorhandenen Schreibkompetenz Diskrepanzen vorhanden sein können (vgl. Ossner 2006: 7). Als

Schreiben

475

Erhebungsinstrumente, die solche Rückschlüsse erlauben, werden in der schreibdidaktischen Forschung häufig Analysen von Schülertexten, Fragebogen und Interviews verwendet; die Analysen von Schülertexten dominieren dabei (vgl. Schäfer 2009: 239–243). Gegenstand des fachdidaktischen Diskurses ist auch die Frage, ob Schreibkompetenz sich spezifisch in Textsorten äußert oder es eine übergreifende Schreibkompetenz gibt, die erfasst werden sollte (vgl. Knopp, Becker-Mrotzek & Grabowski 2013: 302). Die meisten der vorhandenen Verfahren orientieren sich vor allem an bestimmten Schreibanlässen, die auf eine Textsorte zielen. Alternativ zeigen Knopp, Becker-Mrotzek & Grabowski (2013: 303) anhand der Teilkomponenten Adressatenorientierung, Wortschatz und Kohärenz, wie eine übergreifende Schreibkompetenz ermittelt werden kann. Solche Elemente finden sich ebenfalls in einem Teil der Verfahren (z. B. „Schuldeutsch“, s. unten). Schmitt & Knopp (2017: 242–247) benennen verschiedene empirisch abgesicherte Prädikatoren, die sich für die Vorhersage der erreichten Schreibkompetenz eignen. Das Geschlecht spielt insoweit eine Rolle, dass Mädchen etwas bessere Leistungen erzielen (vgl. Schmitt & Knopp 2017: 242). Während das Arbeitsgedächtnis, die Lesefähigkeiten, die Perspektivenübernahme, die Schreibmotivation, die Selbstregulation, das Textmusterwissen, der Wortschatz und die Fähigkeit zur Kohärenzherstellung als Prädikatoren zur Vorhersage der Schreibkompetenz geeignet erscheinen, sind die Ergebnisse bei der allgemeinen Intelligenz, der verbalen Intelligenz sowie der Schreibflüssigkeit uneinheitlich (vgl. Schmitt & Knopp 2017: 243–247). Die Ein- oder Mehrsprachigkeit werden bei dieser exemplarischen Auswahl nicht als möglicher Prädikator genannt. Marx (2017: 141) stellt fest, dass nur wenige empirische Forschungsergebnisse zum Schreiben in der Zweitsprache vorliegen und der Erkenntnisbedarf in diesem Bereich noch groß ist. Nach Grießhaber (2006a: 309) unterscheidet sich der Schreibprozess in der Zweitsprache Deutsch nicht grundlegend vom Schreibprozess in der Erstsprache Deutsch. Allerdings können sich auf allen Ebenen des Schreibprozesses Besonderheiten zeigen, die auf der sprachlichen Ausgangssituation bzw. kulturellen Unterschieden beruhen. Marx (2017: 145) nennt z. B. auch verkürzte Planungs- und Überarbeitungsprozesse, die vermutlich auf die geringere Schreibflüssigkeit zurückzuführen sind. Allerdings weist Haberzettl (2015: 62) darauf hin, dass in aktuellen Studien kein andersartiger Förderbedarf bei mehrsprachigen Schülerinnen und Schülern im Vergleich zu einsprachigen Schülerinnen und Schülern ermittelt werden konnte.

4 Verfahren zur Erfassung der Schreibkompetenz in der Zweitsprache Deutsch Diese Verfahren lassen sich nach Ehlich (2007: 43–44), wie in anderen Kompetenzbereichen, in vier Kategorien einteilen: Beobachtungsverfahren, Schätzverfahren,

476

Joachim Schäfer

Profilanalysen sowie Tests. Einen standardisierten Test gibt es (s. oben) bislang nicht. Schätzverfahren spielen in der Fachliteratur keine Rolle. Auch Beobachtungsverfahren spielen eine untergeordnete Rolle. Die meisten in der Fachliteratur dokumentieren Verfahren lassen sich in die Kategorie der Profilanalysen einordnen. Leider liegen nicht alle Instrumente bis heute in einer publizierten Endversion vor, was vermutlich mit den eingangs beschriebenen Schwierigkeiten zusammenhängt. Die vorhandenen Verfahren werden im Folgenden knapp skizziert.

4.1 Beobachtungsverfahren Diese Verfahren weisen meistens ein geringes Maß der Standardisierung auf. Sie dienen dazu, das sprachliche Handeln während des Schreibprozesses zu beobachten. In der Regel sollen möglichst viele Aspekte durch die Beobachtung erfasst werden, um ein umfassendes Bild der vorhandenen Kompetenz zu gewinnen. Häufig wird vorgeschlagen, die Beobachtungen der Lehrkraft anhand von strukturierten Leitfragen festzuhalten und zu analysieren (vgl. Michalak 2012: 64). Das stellt aber nach Ehlich (2007: 43), wenn die Beobachtung stichhaltig sein soll, hohe Anforderungen an eine differenzierte und fachlich fundierte Beschreibungskompetenz bei den Lehrerinnen und Lehrern. Ein differenziertes und fundiertes Beobachtungsverfahren sind die Niveaubeschreibungen Deutsch als Zweitsprache, die in Fassungen für die Primar- und Sekundarstufe I für das Land Sachsen entwickelt wurden (Sächsisches Bildungsinstitut 2013a & 2013b). Es enthält keine profilanalytischen Raster, sondern soll durch Beobachtungen und Gespräche eine Einschätzung des Lernstandes ermöglichen (vgl. Döll 2009: 110). Das Verfahren möchte die sprachliche Kompetenz breit erfassen und beschreiben (vgl. Döll 2009: 111). Dieses Instrument umfasst die Schreibkompetenz als Teilaspekt und wurde im Rahmen des FörMig-Projekts, das unter „Profilanalytische Verfahren“ unten genauer vorgestellt wird, entwickelt. Jede Teilkompetenz ist an den Vorgaben der sächsischen Bildungsstandards der jeweiligen Schulart orientiert. Für die einzelnen Lernbereiche werden vier Niveaus formuliert, die Lehrkräften helfen sollen, den erreichten Lernstand der Schülerinnen und Schüler einzuschätzen. Mit dem Verfahren soll es möglich sein, unterschiedliche Lernstände und Voraussetzungen im Zweitspracherwerb zu erfassen (vgl. Reich 2013: 5). Durch die verwendeten, erprobten Deskriptoren wird eine möglichst verlässliche Einschätzung durch die Lehrkraft ermöglicht (vgl. Döll 2013: 11). Es wird empfohlen, das Instrument begleitend zum Lernprozess alle drei bis vier Monate einzusetzen (vgl. Döll 2013: 12). Das Verfahren wurde in den Jahren 2007 bis 2009 durch Lehrkräfte in Schleswig-Holstein sowie in Sachsen erprobt. Die danach entstandene Fassung wurde in den Jahren 2009 bis 2011 einer Evaluation unterzogen. Sowohl die Validität als auch die Reliabilität des Instruments konnten dadurch belegt werden (vgl. Döll 2013: 14). Es wurde aber auch deutlich, dass für die Verwendung des Verfahrens eine Schulung notwendig ist, um den Anforderungen an die Beurteilungs-

Schreiben

477

Tab. 1: Fehlerquellen bei der Lernbeobachtung nach Bundschuh & Winkler (2014: 155–156). Fehlerquelle

Beschreibung

Halo-Effekt

Einzelmerkmale oder der Gesamteindruck einer Schülerleistung werden auch auf die Ergebnisse übertragen.

Generosity error

Sympathie, Mitleid, Vergleiche zu bekannten Menschen, Kontaktfreude etc. können dazu führen, die Ergebnisse zu wohlwollend einzuschätzen.

Central tendency

Die Einschätzungen tendieren zu mittleren Ergebnissen, extreme Werte werden möglichst vermieden.

Wissenschaftliches Vorwissen

Auf der Grundlage des Vorwissens können Merkmale zu voreilig miteinander verknüpft werden, da sie gut zu den theoretischen Grundlagen passen.

fähigkeit gerecht werden zu können (vgl. Döll 2013: 14). Gerade die Verwendung von linguistischen Termini bereiteten Lehrkräften bei der Erprobung und Evaluation des Instruments Schwierigkeiten (vgl. Döll 2009: 113). Ausführlicher beschrieben wird das Verfahren von Döll in diesem Band. Rösch (2003 & 2004) präsentiert eine Liste mit sprachlichen Phänomenen der deutschen Sprache, die Kindern im Zweitspracherwerb Schwierigkeiten bereiten können, die sie als „Stolpersteine“ bezeichnet. Dirim erstellt auf dieser Grundlage Beobachtungsbogen für die Grundschule (2003) und die Sekundarstufe I (2004), die dazu dienen sollen, sprachliche Äußerungen von Schülerinnen und Schülern hinsichtlich dieser „Stolpersteine“ zu analysieren. Diese Stolpersteine sind nicht explizit auf die Textproduktion ausgerichtet, sollen diese aber einschließen. Ein Beispiel für eine Lernbeobachtung innerhalb des Scaffolding-Ansatzes beschreiben Kniffka & Siebert-Ott (2012: 112–113). Sie sehen eine regelmäßige und lernbegleitende Lernbeobachtung als grundlegend an, um entsprechende „Lerngerüste“ anbieten zu können. Die Beobachtungen können in eine Tabelle mit zwei Spalten eingetragen werden. In der ersten Spalte werden Beobachtungskriterien mit den für die Lernsituation relevanten Teilkompetenzen eingetragen, in der zweiten Spalte wird die Wahrnehmung der Lehrkraft notiert. Weitere Vorschläge finden sich auch in anderen Unterrichtsmaterialien. Wichtig ist, dass die Kriterien immer der jeweiligen Situation und der jeweiligen beobachteten Person angepasst werden, und die Beobachtungen fachlich fundiert sind. Bundschuh & Winkler (2014: 155–156) nennen einige Fehlerquellen, die bei Verhaltensbeobachtungen die Ergebnisse beeinträchtigen können (vgl. Tabelle 1).

4.2 Profilanalysen Wie bei den Beobachtungsverfahren werden Schreibproben in der Regel unter alltäglichen Bedingungen erhoben. Die Schülertexte werden anhand festgelegter Krite-

478

Joachim Schäfer

rien analysiert. Diese beruhen oft auf anerkannten Sprachstandsindikatoren (vgl. Ehlich 2007: 44; vgl. Kleinbub in diesem Band). Dadurch soll ein subjektives Urteil relativiert werden. Diese Vorgehensweise führt in der Regel zu differenzierten Ergebnissen, allerdings stellt sie hohe Ansprüche an die fachlichen Kompetenzen der Lehrkräfte, die das Verfahren anwenden (vgl. Michalak 2012: 65). Die meisten der vorhandenen Verfahren zum Schreiben lassen sich nach der Einteilung von Ehlich (2007) als profilanalytische Verfahren einordnen, da hauptsächlich Schülertexte nach vorgegebenen Kriterien analysiert und die Ergebnisse in einen bestimmten Entwicklungsstand eingeordnet werden. Beck, von Dewitz & Titz (2015) sehen die Einordnung der Ergebnisse in Normen, z. B. Altersnormen, als ein Gütekriterium für die Qualität von Erhebungsverfahren an. Wenn diese fehlen sollte, betrachten sie dies als „Kunstfehler“. Nicht alle Verfahren erfüllen den Anspruch von Normierung, sondern versuchen die individuelle Entwicklung der Lernenden in den Vordergrund zu stellen. Folgende Verfahren werden unten nach einer Beschreibung der Herausforderungen, die Profilanalysen zur Erfassung der Schreibkompetenz bewältigen müssen, kurz skizziert: die Profilanalyse nach Grießhaber (2010a), die Materialien aus dem FörMig-Programm (vgl. Kompetenzzentrum FörMig, o.J.), das Konzept „Schuldeutsch“ von Haberzettl (2015) sowie das Instrument zum Schreiben aus den FISAMaterialien von Schäfer (2015).

4.2.1 Herausforderungen bei Profilanalysen Die Verfahren stellen Annäherungen an das komplexe Konstrukt „Schreibkompetenz“ dar. Alle beruhen auf Analysen von Schülertexten, die als Indikator für die Schreibkompetenz dienen sollen. Es wäre bei allen vorgestellten Konzeptionen nach den oben genannten Anforderungen zum Rating sehr anspruchsvoll, verlässliche Aussagen treffen zu können. Es sind bislang nur plausible Einschätzungen möglich, die begründbar sind. Die meisten Instrumente, die vorgestellt werden, orientieren sich in ihren Grundzügen am Züricher Textanalyseraster (Nussbaumer 1995). Dieses für ein Forschungsprojekt entwickelte Textanalyseraster bietet die Möglichkeit für eine multiperspektivische Analyse, bei der die auswertenden Personen eine konstruktive Haltung einnehmen (vgl. Nussbaumer 1995: 101). In der Schreibdidaktik wird dieses Raster sehr häufig rezipiert (vgl. Baurmann 2002: 131). Bei allen Verfahren besteht das Problem, dass eine mehr oder weniger ausgeprägte Zielnorm, also eine Vorstellung, wie ein gelungener Text gestaltet sein sollte, erreicht werden soll. Diese Zielnorm ist den Schülerinnen und Schülern aber nicht explizit bekannt. Wegen dieser mangelnden Transparenz besteht für die Schülerinnen und Schüler keine Möglichkeit, sich an der Zielnorm des konkreten Verfahrens zu orientieren, die nicht der entsprechen muss, die bislang im schulischen Schreibunterricht üblich war. Auch der Entstehungskontext ist nur bedingt kontrollierbar (vgl. Schäfer 2009: 241).

Schreiben

479

Ein neuralgischer Punkt in allen diagnostischen Werkzeugen ist die Methode, mit der das Schreiben ausgelöst wird. In der Regel gibt es dazu einen Schreibanlass bzw. ein Schreibimpuls. Da in den Texten eine Performanz gezeigt werden soll, die mit der tatsächlichen Schreibkompetenz übereinstimmt, sollte der Schreibanlass so gestaltet sein, dass die Schülerinnen und Schüler zum authentischen Schreiben angeregt werden. Dabei kann man sich einerseits an den curricularen Vorgaben orientieren. Andererseits können auch Überlegungen zu schreibförderlichen Aufgabenstellungen berücksichtigt werden. Bachmann & Becker-Mrotzek (2010: 195) formulieren folgende Anforderungen an solche Aufgabenstellungen: Sie sollten eine plausible Funktion für die Schreibenden haben, die Schülerinnen und Schüler müssen sich das notwendige Wissen zur Bewältigung der Aufgabe besorgen können, in der Auseinandersetzung mit anderen den Text schreiben und die Wirkung des Textes auf andere erproben können. Die vorhanden Verfahren berücksichtigen solche Ansprüche nur in Ansätzen. Als Schreibanlässe werden verschieden Schreibaufgaben konstruiert, für narrative Texte sind dies oftmals Bildergeschichten oder Bildimpulse. Der Zugang über die Bildergeschichte bietet den Vorteil, dass die entstandenen Texte in der Regel gut vergleichbar sind und der Erwartungshorizont genauer definiert werden kann. Allerdings handelt es sich dabei im engeren Sinne um Nacherzählungen einer bereits vorgegebenen Erzählstruktur. Knapp (2001: 28) sieht darin eine Schwäche dieses Schreibanlasses: „Untersucht wird bei einer solchen Vorgabe nicht allgemein, wie Kinder erzählen, sondern eingeschränkt, wie Kinder eine bestimmte Form von Erzählungen, nämlich Höhepunkt-Erzählungen gestalten“. Der Schreibanlass „Bildergeschichte“ gibt Strukturen vor, wie z. B. sprachliche Lösungen, um die einzelnen Bilder zu verbinden, die beim Erzählen nicht in dieser Art erforderlich sind. Bildergeschichten verführen Kinder dazu, das zu beschreiben, was sie auf den Bildern sehen. Das kann sich ebenfalls auf die Texte auswirken: „Sie werden dazu verleitet, isolierte Elemente herauszugreifen und die Zusammenhänge zwischen ihnen unerwähnt zu lassen“ (Knapp 2001: 28). So räumen Gantefort & Roth (2008: 36) ein: „Freie Textproduktionen in natürlichem Rahmen sind in der individuellen Diagnose mit Sicherheit aussagekräftiger […]“. Die Auswahl des Schreibanlasses muss sorgfältig bedacht werden, da die Schreibprodukte dadurch beeinflusst werden.

4.2.2 Profilanalyse nach Grießhaber Entstehung und Zielsetzung Die vereinfachte, erweiterte Profilanalyse (Grießhaber 2010a) ist ein linguistisch fundiertes Instrument, um den Entwicklungsstand im Zweitspracherwerb relativ zuverlässig einzuschätzen (vgl. Grießhaber 2006b: 4). Sie baut auf der innerhalb des ZISA-Projekts aus den 1970er Jahren entstandenen Profilanalyse von Clahsen auf.

480

Joachim Schäfer

In diesem Projekt wurde herausgefunden, dass für den scheinbar instabilen individuellen Zweitspracherwerb typische Verläufe bei der Stellung der verbalen Teile sowie der Besetzung des Vorfelds des Satzes beobachtbar sind (vgl. Grießhaber 2010a: 18). Da diese linguistisch voraussetzungsreich und die Stufung im Detail umstritten ist, vereinfachte Grießhaber (2006b: 12) das Stufenmodell für die Verwendung durch Lehrkräfte. Dadurch können tieferliegende Sprachstrukturen und Erwerbsprozesse im Hinblick auf die Wortstellung erfasst werden (vgl. Grießhaber 2006b: 15–17). Die Profilstufe kann auch als Indikator für den Wortschatz und die Kohäsionsleistung dienen (vgl. Grießhaber 2006b: 42).

Beschreibung Das Verfahren kann bei mündlichen und schriftlichen Äußerungen eingesetzt werden (vgl. Grießhaber 2010a: 19.) Die Äußerungen können sieben Erwerbsstufen zugeordnet werden (Grießhaber 2010b: 19) (vgl. Tab. 2). Tab. 2: Erwerbsstufen der vereinfachten, erweiterten Profilanalyse nach Grießhaber 2010a. Erwerbsstufe

Merkmale

6

Insertion eines erweiterten Partizipialattributs

5

Insertion eines Nebensatzes

4

Nebensätze mit finitem Verb in Endstellung

3

Subjekt nach finitem Verb nach vorangestellten Adverbialien

2

Separierung finiter und infiniter Verbteile

1

Finites Verb in einfachen Äußerungen

0

Bruchstückhafte Äußerungen ohne finites Verb

Schülerinnen und Schüler, die sich Deutsch als Zweitsprache aneignen, sollten nach Grießhaber (2010b: 170) am Ende der Grundschule die Profilstufe 4 erreichen. Die Profilstufe 3 stellt insbesondere für das Erzählen einen wichtigen Meilenstein dar, da sie für typische Satzverbindungen in narrativen Texten notwendig ist (vgl. Grießhaber 2010b: 237). Eine vertiefte Darstellung des Verfahrens findet sich bei Grießhaber in diesem Band.

4.2.3 Materialien aus dem FörMig-Programm Das Programm „Förderung von Kindern und Jugendlichen mit Migrationshintergrund“ (FörMiG) der „Bund-Länder-Kommission für Bildungsplanung und Forschungsförderung“ (BLK) hat während der Laufzeit von 2004 bis 2009 in zehn Bundesländern

Schreiben

481

verschiedene Projekte zur Sprachdiagnose und Sprachförderung unterstützt. An der Universität Hamburg existiert seit 2010 das FörMig-Kompetenzzentrum, das als Forschungstransferzentrum konzipiert ist. Einer der Schwerpunkte liegt auf einer durchgängigen Sprachbildung insbesondere beim Erwerb bildungssprachlicher Elemente. In diesem Rahmen entstanden auch mehre diagnostische Instrumente, mit denen die Schreibkompetenz mehrsprachiger Schülerinnen und Schüler erfasst werden soll (vgl. Kompetenzzentrum FörMig o. J.). Ein Teil der Verfahren liegt in mehreren Sprachen vor. Schründer-Lenzen (2012: 176) bezweifelt aber, dass alleine durch die Durchführung in mehreren Sprachen die mehrsprachigen Kompetenzen der Lernenden plausibel erfasst werden, da z. B. Merkmale von Lernersprachen dadurch nicht berücksichtigt werden. 4.2.3.1 „Das Tulpenbeet“ Entstehung und Zielsetzung Die Schreibaufgabe „Tulpenbeet“ soll helfen, den Stand der Schreibkompetenz am Übergang in die Sekundarstufe I einzuschätzen (vgl. Gantefort & Roth 2008: 29). Das Verfahren soll folgenden Zweck erfüllen: Einerseits soll es ein förderdiagnostisches Instrument für die Hand der Lehrkräfte sein, um diese darin zu unterstützen, den Sprachstand vor allem von Schülerinnen und Schülern mit Migrationshintergrund nach Teilkompetenzen differenziert sowohl in der Erst- und Zweitsprache zu bestimmen und auf dieser Grundlage sprachliche Förderung auf die individuellen Lernbedürfnisse der Schülerinnen und Schüler bezogen durchführen zu können. Andererseits dient das Instrument dazu, die im Programm erprobten Fördermaßnahmen im Rahmen der Gesamtevaluation auf Wirksamkeit hin zu untersuchen. (Gantefort & Roth 2008: 30)

Wie im ganzen FörMig-Projekt üblich, soll das Verfahren besonders auf bildungssprachliche Aspekte fokussieren. Dieser Fokus soll Informationen liefern, inwieweit die Schülerinnen und Schüler in der Lage sind schulische Anforderungen beim Schreiben zu bewältigen (vgl. Gantefort & Roth 2010: 575). Neben der deutschsprachigen Fassung des Instruments liegen Adaptionen für Türkisch und Russisch vor (vgl. Gantefort & Roth 2008: 31). Dadurch kann z. B. die Qualität der Textbewältigung in verschiedenen Sprachen verglichen werden, was häufig gefordert wird (vgl. Michalak 2012: 62). Das Verfahren berücksichtigt die Basisqualifikationen nach Ehlich (vgl. Gantefort & Roth 2010: 583). Bis heute ist das Instrument nicht vollständig publiziert. Eine vorläufige Version findet sich bei Gantefort & Roth (2008). Beschreibung Die Schülerinnen und Schüler erhalten eine Bildergeschichte als Schreibanlass, die sie nacherzählen sollen. Das dritte Bild, das den Planbruch enthält, wird durch ein Fragezeichen ersetzt. Es handelt sich um ein lebensnahes Setting, bei dem ein Mann

482

Joachim Schäfer

Tab. 3: Analysekategorien für Tulpenbeet. Merkmale

Teilaspekte

Textbewältigung

Aufgabenbewältigung, literarische Elemente, Semantisches und Anzahl der Bilder

Wortschatz

Übliche und besondere Verben, Nomen und Adjektive

Bildungssprachliche Elemente

Nominalisierungen, Komposita, adjektivische Attribute, Passiv und Konjunktiv

Satzverbindungen

Konjunktionen und Adverbien

zwei Kinder fotografieren möchte und dabei in ein Tulpenbeet fällt. Für die Analyse werden verschiedene Raster und Kategorien zur Verfügung gestellt (siehe Tab. 3). Beim Wortschatz wird besonders auf expressive Verben und Nomina sowie evaluative Adjektive geachtet (vgl. Gantefort & Roth 2008: 31). Vermutlich sind diese Kategorien aber nicht sehr trennscharf zu fassen. Das schriftliche Erzählen wurde ausgewählt, da es an bereits in der Schule gemachte Schreiberfahrungen anschließt. Die Auswertungskategorien orientieren sich an einem erzähltheoretischen Modell. Die Bildergeschichte wurde wegen der Anforderungen der Testgütekriterien für ein standardisiertes Verfahren gewählt, um einen einheitlichen Impuls und eine einheitliche Auswertung zu garantieren. In einer Evaluationsstudie wurde einer Zufallsstichprobe von 84 Schülerinnen und Schülern aus Nordrhein-Westfallen der Schreibanlass im Abstand von einem Jahr zweimal gestellt (vgl. Gantefort & Roth 2008: 29). Die Studie zeigt, dass es nicht gelang, in vielen der untersuchten Kategorien Lernfortschritte zu beschreiben, „[…] z. T. waren durchaus auch signifikante Rückschritte festzustellen – bzw. konnten nicht alle Lernfortschritte der Schülerinnen und Schüler erfasst werden“ (Gantefort & Roth 2008: 29). Verbesserungen konnten v. a. bei den Schülerinnen und Schülern festgestellt werden, die bei der ersten Erhebung schwach abgeschnitten haben. Bei den besseren Schülerinnen und Schülern gab es eine Stagnation bzw. sogar Rückschritte (vgl. Gantefort & Roth 2008: 49). In der Evaluationsstudie wurde zudem ermittelt, dass grammatische und orthografische Leistungen in den Schülertexten keinen signifikanten Zusammenhang mit den textuellen Fähigkeiten aufweisen (vgl. Gantefort & Roth 2008: 49). Die Umsetzung in der Schulpraxis bereitet Schwierigkeiten, da sich die Lehrkräfte nicht an die Durchführungsanweisungen halten und dadurch die Ergebnisse nicht mehr vergleichbar sind. Gantefort & Roth (2008: 33) nehmen an, dass die in den Texten gezeigte Performanz nicht mit der möglichen Kompetenz der teilnehmenden Schülerinnen und Schüler übereinstimmt. Dieses Problem lässt sich, wie eingangs beschrieben, aber vermutlich nicht vollständig vermeiden.

Schreiben

483

4.2.3.2 Tulpe L2 Entstehung und Zielsetzung Für die Auswertung des Instruments „Tulpenbeet“ wurde für das Bundesland Brandenburg in der Erprobungsphase eine computergestützte Auswertung mit dem Titel „Tulpe L“ entwickelt. Diese soll auf der Grundlage des Auswertungsrasters für „Tulpenbeet“ und Erfahrungen mit rasch-skalierten Auswertungen von Schülertexten in der Schweiz automatisiert einige Elemente der Textqualität bestimmen (vgl. Schründer-Lenzen & Henn 2009: 94–96). Es sollen zu den Bereichen „Reichhaltigkeit des Wortschatzes“, „grammatische Korrektheit sowie Satz- und Sprachkomplexität“ und „Fähigkeit, Geschichten bzw. Erzählungen textsortenspezifisch zu strukturieren“ standardisiert Aussagen gewonnen werden (vgl. Schründer-Lenzen & Henn 2009: 99). Allerdings ist bislang nur eine Testversion aus dem Jahr 2008 verfügbar (vgl. Gnutiez 2008).

Beschreibung In den oben genannten Bereichen können durch das Programm automatisiert die Reichhaltigkeit des Wortschatzes, die Profilstufen nach ZISA bzw. Grießhaber sowie Referenzen im Text und die story grammar mehr oder weniger automatisiert erkannt werden (vgl. Schründer-Lenzen & Henn 2009: 99–104). Eine solche automatisierte Auswertung von schriftlichen Erzählungen könnte die Auswertung der Texte vermutlich solide unterstützen und erleichtern.

4.2.3.3 „Bumerang“ Entstehung und Zielsetzung Bei diesem Verfahren steht der Übergang von der Schule in den Beruf im Mittelpunkt. Es ist ebenfalls mehrsprachig (es liegt in den Sprachen Deutsch, Türkisch und Russisch vor) und förderdiagnostisch aufgebaut. Wie alle FörMig-Verfahren soll es vor allem auch bildungssprachliche Elemente erfassen. Es besteht aus zwei Schreibaufgaben, die zu einem Schreibanlass zusammengefügt sind: einem Bewerbungsschreiben sowie einer Bastelanleitung für einen Bumerang (vgl. Dirim & Döll 2009: 139–141). Das Verfahren ist in einem Sammelband vollständig abgedruckt (vgl. Reich, Roth & Döll 2009).

Beschreibung Für das Verfahren wird ein konstruierter Schreibanlass gewählt: Die Jugendlichen sollen ein Bewerbungsschreiben für ein Praktikum bei einem Jugendmagazin formulieren und als Arbeitsprobe eine Bauanleitung für einen Bumerang verfassen Der Prozess der Herstellung des Bumerangs wird als eine Folge von Fotografien zur Verfügung gestellt. Die Handlung soll verbalisiert werden, so dass die Leserinnen und

484

Joachim Schäfer

Leser den Bumerang ohne Bilder nur anhand des Anleitungstextes basteln können. Die Texte werden danach mit jeweils eigenen Kriterien rastern ausgewertet. Dabei spielen besonders die bildungssprachlichen Elemente eine große Rolle (vgl. Dirim & Döll 2009: 139–140). Beim Bewerbungsschreiben werden die formale und die inhaltliche Gestaltung, der Wortschatz und die Kohäsionsmittel untersucht. Die Bauanleitung wird nach den Merkmalen Aufgabenbewältigung, Adressierung, Bildungssprache, Textstrukturierung, Wortschatz und Satzverbindungen untersucht (vgl. Reich, Roth & Döll 2009). Die Evaluation des Instruments zeigt, dass der Schreibimpuls zur Bastelanleitung geschlechtsneutral ist (vgl. Dirim & Döll 2009: 140).1 Das Verfahren ist so ausgelegt, dass man die Schülerleistung mit andern Leistungen vergleichen könnte. Bislang liegen aber keine Vergleichswerte vor und auch die Ergebnisse der Evaluation sind bislang nicht publiziert. 4.2.3.4 Prozessbegleitende Diagnose der Schreibentwicklung Entstehung und Zielsetzung Innerhalb des FörMig-Projekts entwickelt eine Arbeitsgruppe für die Sekundarstufe I ein Kompetenzraster, das es erlauben soll, prozessorientiert den Entwicklungsstand bei unterschiedlichen Schreibhandlungen einzuschätzen, um auf diese Weise den Lernstand und den Förderbedarf einzuschätzen (vgl. Lengyel et al. 2009: 129). Dazu wurden aus den Curricula der beteiligten Länder die wesentlichen Schreibhandlungen extrahiert. Theoretisch fundiert sollte dann eine stufenförmige Entwicklung anhand von Schülertexten entwickelt werden, diese Stufen sollten empirisch überprüft werden (vgl. Lengyel et al. 2009: 130). Leider sind bislang nur Auszüge des Verfahrens publiziert. Beschreibung Für jede Schreibhandlung soll es einen einseitigen Bogen geben, der Teilkompetenzen in den Bereichen Lexik/Semantik, Syntax und Text enthält. Verstöße gegen orthographische, syntaktische oder morphologische Konventionen werden nicht erfasst. Für das Raster zum „Erklären“ wurde die Teilkompetenz „Kognition“ aufgenommen. In jedem Bereich werden sechs Stufen benannt, die erreicht werden können. Dabei benennt die Stufe 1 die geringste Schreibkompetenz. Die Stufe 5 soll den Regelstandard am Ende der Klasse 10 beschreiben Die Autorinnen und Autoren sind sich bewusst, dass es vermutlich keine linear aufsteigende Entwicklung geben wird, sondern auch u-förmige Verläufe zu erwarten sind (vgl. Lengyel et al. 2009: 132). Andere Kompetenzraster berücksichtigen solche Überlegungen leider nicht (vgl. Schäfer & Jeuk 2014: 36). Diese u-förmige Lernentwicklung macht die Anwendung von ent-

1 Allerdings zeigte sich bei eigenen Erprobungen mit Lehramtsstudierenden, dass bei diesen häufig der Fachwortschatz nicht vorhanden war.

Schreiben

485

wicklungsorientierten Kompetenzraster schwierig. Als alternative Beobachtungsmöglichkeit sollte ein übergreifendes Beobachtungsraster, das sich nicht nur auf die einzelnen Schreibhandlungen bezieht, für die Textproduktion entwickelt werden (vgl. Lengyel et al. 2009: 137).

4.2.4 Schuldeutsch Entstehung und Zielsetzung „Schuldeutsch“ (SD) ist nach Haberzettl (2015: 47) ein Diagnoseinstrument zur Erfassung der Schreibkompetenz, das seit 2006 entwickelt wird. Es wurde ursprünglich für den von der Universität Bremen mit der Stiftung Mercator durchgeführten Förderunterricht in der Sekundarstufe I entwickelt. Die Entwicklung wurde durch das BMBF gefördert. Das Instrument soll insbesondere der Eingangsdiagnose für Fördermaßnahmen dienen. Es sollen Informationen für die Planung einer individuellen Förderung gewonnen werden (vgl. Cantone & Haberzettl 2009: 43). SD erfasst nun einerseits, ob eine von der jeweiligen Aufgabenstellung initiierte Sprachhandlung unabhängig von der Qualität der Realisierung umgesetzt wird (,inhaltliche Aufgabenbewältigung‘), andererseits aber auch textsortenübergreifende und textsortenspezifische Merkmale konzeptioneller Schriftlichkeit, die sich in den Pre-Tests als geeignet, d. h. als aussagekräftig in Bezug auf eine Einordnung der Schüler in unterschiedliche Niveaustufen und als gut einschätzbar erwiesen haben. (Haberzettl 2015: 50)

Es ist besonders für die 7. Klasse geeignet. „Schuldeutsch“ ist bis heute nur in Auszügen publiziert. Es wurde für mehrere Studien verwendet, um herauszufinden, ob mehrsprachige Schülerinnen und Schüler einen besonderen Förderbedarf haben. Ein solcher abweichender Förderbedarf konnte in diesen Studien nicht ermittelt werden (vgl. Haberzettl 2015: 49). An der Studie zur Untersuchung der Textkompetenz von saarländischen Schülerinnen und Schülern nahmen 351 Schülerinnen und Schülern aus den siebten Klassen von sechs Gemeinschaftsschulen teil, 51,6 % war einsprachig deutsch und 48,8 % waren mehrsprachig. Die meisten mehrsprachigen Jugendlichen waren in Deutschland aufgewachsen (vgl. Haberzettl 2015: 59). Die Texte zu den Schreibaufgaben wurden nach Kriterien zur Aufgabenbewältigung und zur Textkompetenz ausgewertet. Die Aussagen beruhen auf einem Vergleich der Mittelwerte zwischen den genannten Gruppen (vgl. Haberzettl 2015: 59–62).

Beschreibung Die Schülerinnen und Schüler müssen drei Schreibaufgaben bearbeiten: einen Brief, einen argumentativen Text und einen Bericht zu einer Bildergeschichte verfassen. Die Texte werden dann mit Rastern zu den oben genannten Bereichen analysiert. Für beiden Typen von Merkmalen gibt es ein Raster. Den einzelnen Kriterien werden Punktwerte zwischen 0 und 2 zugeordnet, die das Maß der gelungenen Auf-

486

Joachim Schäfer

gabenerfüllung angeben. Für die inhaltliche Aufgabenbewältigung gibt es für jede Schreibaufgabe jeweils vier Kriterien. Man kann also je Schreibaufgabe max. 8 Punkte und insgesamt 24 Punkte erreichen (vgl. Haberzettl 2015: 54). Für die Bewältigung der textbezogenen Aufgaben gibt es ebenfalls Raster mit verschiedenen Kriterien, für die wieder bis zu 2 Punkte vergeben werden können. An dieser Stelle erfolgt eine Einteilung in „kein Förderbedarf“, „eingeschränkter Förderbedarf“ und „starker Förderbedarf“ (vgl. Haberzettl 2015: 55). Dies gilt auch für das Raster „Allgemeine Textkompetenz“, in dem Kohäsionsmittel, der Wortschatz sowie die Bildung von Nominalphrasen analysiert werden. Hier findet sich auch noch die Kategorie „nicht bewertbar“ (vgl. Haberzettl 2015: 58). Es liegt zudem ein sprachbiographischer Fragebogen vor, der helfen soll, die sprachliche Sozialisation der Jugendlichen einzuschätzen (vgl. Haberzettl 2015: 67). Die Durchführung soll zeitlich überschaubar sein und die Aufgaben sollen sich an der Lebenswelt der Jugendlichen orientieren. Eine Vergleichbarkeit der Texte und Möglichkeiten zur eigenen Gestaltung sollen gewährleistet werden (vgl. Cantone & Haberzettl 2008: 96).

4.2.5 Praxismaterial Förderdiagnostik (FISA-Materialien) Entstehung und Zielsetzung Das Instrument zum Schreiben ist Bestandteil des Praxismaterials Förderdiagnostik, das im Projekt „Förderung sprachlicher Entwicklung im Schulalter“ (FISA) am Sprachdidaktischen Zentrum der Pädagogischen Hochschule entstand. Dieses Material ist als „Werkzeugkoffer“ und förderdiagnostisches Verfahren konzipiert (vgl. Schäfer 2012: 301). Es hat das Ziel, Lehrkräften verschiedene Instrumente an die Hand zu geben, um den Sprachstand und den Förderbedarf von Schülerinnen und Schülern mit nichtdeutscher Herkunftssprache zu Beginn der Sekundarstufe I einzuschätzen. Dazu stehen ein sprachbiographischer Fragebogen, ein C-Test sowie Verfahren zum Hörverstehen, zum Lesen, zum mündlichen und schriftlichen Erzählen zur Verfügung (vgl. Junk-Deppenmeier & Jeuk 2015: 4). Die Verfahren wurden mit 56 mehrsprachigen Schülerinnen und Schülern, die an Fördergruppen teilnahmen, erprobt und ausgewertet (vgl. Junk-Deppenmeier & Jeuk 2015: 5), sind aber nicht normiert (vgl. Schäfer 2015: 107).

Beschreibung Es stehen zwei Teilverfahren für das Schreiben zur Verfügung: Ein Schreibanlass, um eine fantastische Erzählung zu elizitieren, und ein Gesprächsanlass, um die Vorstellungen zur Textqualität und zu den bekannten Schreibstrategien einzuschätzen (vgl. Schäfer 2015: 107). Die Ergebnisse der beiden Verfahren sollen aufeinander bezogen werden. Das Verfahren erfasst nur die Kompetenzen in der deutschen Sprache. Die Auswertung soll sich an den Maximen des Züricher Textanalyserasters orientieren (vgl. Schäfer 2015: 108).

Schreiben

487

Die Erzählung soll in einem gestuften Verfahren beschrieben und analysiert werden. Welche Werkzeuge verwendet werden, müssen die Lehrkräfte entscheiden. Es gibt verschiedene Möglichkeiten, mit den Materialien umzugehen. Das idealtypische Vorgehen gliedert sich aber folgendermaßen: In einem ersten Schritt soll anhand von Leitfragen eine Charakterisierung des Textes hinsichtlich der Textsorte und der Textstruktur vorgenommen werden. Dadurch soll der entstandene Text zunächst wahrgenommen und rekonstruiert werden (vgl. Schäfer 2015: 114–115). Anschließend soll der vorliegende Text einer globalen Einschätzung unterzogen werden, um zu einer holistisch begründeten Aussage kommen zu können. Dazu stehen Leitfragen und Hilfen zur Interpretation der Ergebnisse zur Verfügung (vgl. Schäfer 2015: 115–117). Eine feinere Analyse wird vorgeschlagen, wenn bei der globalen Einschätzung Auffälligkeiten erkannt werden, die genauer untersucht werden sollen. Sieben Raster, je eins zur Erzählstruktur, zum Erzählstil, zur Textstruktur, zur Satzstellung bzw. dem Satzbau inklusive der Profilanalyse nach Grießhaber (vgl. Grießhaber in diesem Band), dem Wortschatz, der Flexion sowie der Rechtschreibung, stehen hierfür zur Verfügung (vgl. Schäfer 2015: 117–131). Die Lehrkräfte sollen anhand ihrer Fragestellung und ihrer Ressourcen entscheiden, welche Bereiche sie genauer betrachten möchten. Als Einordungshilfen für die Ergebnisse dienen das Erzählmodell nach Augst (2010) und die Stufen der Profilanalyse nach Grießhaber (2010a). Das Erzählmodell von Augst wurde für die Studie „Text-Sorten-Kompetenz“ entwickelt (vgl. Augst 2010: 65). Es besteht aus vier Stufen, die eine Entwicklung beim schriftlichen Erzählen abbilden soll. Das Modell entstand in der kritischen Auseinandersetzung mit dem Erzählmodell von Boueke et. al aus den 90er Jahren (vgl. Boueke & Schülein 1991: 25–27). Es ist für Fantasieerzählungen besonders geeignet (vgl. Augst 2010: 65). Man geht davon aus, dass in Fantasieerzählungen typischer Weise die Elemente „[…] Einleitung – Planbruch – Spannung – Pointe – Schluss“ (Augst 20100: 65) enthalten sind. Außerdem zeichnen sich Erzählungen durch eine emotionale Qualifizierung aus, die sich durch den ganzen Text zieht (vgl. Augst 2015: 65). Das Schreibgespräch soll die Produktanalyse unterstützen und Rückschlüsse auf den Schreibprozess ermöglichen. Vor allem soll im Gespräch ermittelt werden, über welche Vorstellungen zur Textqualität die Schülerinnen und Schüler verfügen (vgl. Schäfer 2015: 108). Dazu soll ein Einzelgespräch mit der Schülerin bzw. dem Schüler geführt werden. Es wird ein leicht modifizierter Schülertext zu einem Bildimpuls vorgelegt, der diskussionswürdige Merkmale enthält. Die Schülerinnen und Schüler sollen sich zunächst dazu äußern, ob ihnen der Text gefällt. Anschließend sollen sie Stellen benennen, die sie nicht als gelungen betrachten. Abschließend sollen sie Vorschläge zur Überarbeitung des Textes formulieren (vgl. Schäfer 2015: 156). Die Äußerungen können in ein Raster, das die diskussionswürdigen Stellen enthält, eingetragen werden. Diese Äußerungen können dann mit den Ergebnissen der Textanalyse abgeglichen werden: Hat die Schülerin bzw. der Schüler evtl. abweichende Vorstellungen von Textqualität und hat innerhalb seiner Prämissen einen

488

Joachim Schäfer

Text verfasst? Kennt die Schülerin bzw. der Schüler funktionale Überarbeitungsstrategien, kann sie aber nicht anwenden oder kennt sie bzw. er solche Strategien nicht? Dies kann helfen, die bei der Textanalyse ermittelten Lernaufgaben auf den Schreibprozess bezogen zu interpretieren (vgl. Schäfer 2015: 157–158). Auch die Informationen aus dem sprachbiographischen Fragebogen sowie aus dem C-Test sollen für die Förderung beachtet werden. Für die einzelnen durch das Raster ermittelbaren Teilkompetenzen sowie für den gesamten Schreibprozess werden Vorschläge zur Förderung der Schülerinnen und Schüler präsentiert (vgl. Schäfer 2015: 133–140).

5 Fazit für den schulischen Bereich Es zeigt sich, dass nur wenige Verfahren zur Diagnostik des Schreibprozesses vorhanden sind und diese teilweise nur in Teilen veröffentlicht sind. Eine Übertragung und ggf. die Modifikation der sächsischen Niveaubeschreibungen könnten einen wichtigen Beitrag leisten, die Alltagsdiagnostik von Lehrkräften mit wenig Aufwand zu unterstützen. Auch ein Abschluss der entwickelten profilanalytischen Verfahren wäre für die schulische Praxis sehr sinnvoll, um eine Auswahl verschiedener Verfahren im Angebot zu haben. Eine Entwicklung und Veröffentlichung weiterer Verfahren ist insgesamt dringend geboten. In den letzten Jahren sind verschiedene Projekte entstanden, die diesen Mangel beheben wollen, die aber alle Lösungen für die oben beschriebenen komplexen Anforderungen finden müssen. Es wäre wünschenswert, wenn bei der Entwicklung von standardisierten Verfahren die Kompetenzen von mehrsprachigen Schülerinnen und Schülern berücksichtigt würden.

6 Anmerkungen zum außerschulischen Bereich Die Situation hinsichtlich der Schreibkompetenz von Erwachsenen in der Zweit- bzw. Fremdsprache Deutsch ist ähnlich wie im schulischen Bereich. Steinig & Huneke (2010: 143) beschreiben beispielsweise, dass die Schreibkompetenz innerhalb der didaktischen Konzeptionen für Deutsch als Fremdsprache lange Zeit eine untergeordnete Rolle spielte. Seit einigen Jahren findet das Thema „Schreiben“ mehr Beachtung. Die Diagnose der Schreibkompetenz bei Erwachsenen in der Zweit- bzw. Fremdsprache Deutsch muss ein breites Spektrum, das von primären und funktonalen Analphabetinnen und Analphabeten bis zum Schreiben im Studium oder in akademischen Berufen reicht, berücksichtigen. Die diagnostische Ausrichtung ist aber häufig eine andere als im schulischen Kontext. Nicht nur in Integrationskursen spielt bei erwachsenen Lernenden die Orientierung an Prüfungen eine große Rolle,

Schreiben

489

die Förderung von Lernprozessen wird hingegen kaum berücksichtigt (vgl. Noack, Peuschel & Feldmeier 2013: 143). Auch die Termini unterscheiden sich. In der Didaktik des DaF-Unterrichts wird häufig von der „Fertigkeit Schreiben“ als eine der sprachlichen Fertigkeiten (Sprechen, Hören, Lesen und Schreiben) gesprochen. Dabei wird zwischen einer Zielfertigkeit und einer Mittelfertigkeit unterschieden. Bei der Zielfertigkeit geht es um die Schreibkompetenz, wie sie unter Punkt 2 vorgestellt wurde. Die Mittelfertigkeit betrachtet Schreiben als ein Lernmedium, um damit andere Kompetenzen zu erwerben (vgl. Kast 1999: 8). In der Regel wird bei diagnostischen Verfahren in diesem Bereich nur die Zielfertigkeit untersucht. Die Auseinandersetzung mit der Fertigkeit Schreiben orientiert sich an den Schreibprozessmodellen (vgl. Steinig & Huneke 2010: 146). Die vorhandenen Verfahren zur Einschätzung des Lernstandes richtet sich meistens am Gemeinsamen Europäischen Referenzrahmen (GER) für Sprachen und der dort vorgesehenen gestuften Kompetenzentwicklung aus (vgl. Europarat 2001). Welcher Stufe nach dem GER die sprachlichen Leistungen von Lernenden zugeordnet werden können, wird durch unterschiedliche Zugänge überprüft. Man unterscheidet zwischen Verfahren nach dem Multi-Level bzw. dem Uni-Level Ansatz. Während beim Multi-Level Ansatz nur eine Schreibaufgabe bearbeitet werden muss und der entstandene Text den verschiedenen Stufen zugeordnet wird, müssen beim UniLevel Ansatz verschiedene Aufgaben, die jeweils die Kompetenz für eine Stufe abbilden sollen, bearbeitet werden. Beide Formen finden sich in Verfahren zur Überprüfung des Sprachstands in einer Fremdsprache (vgl. Porsch & Tesch 2010: 159–161). Die genannten Ansätze eignen sich zur Überprüfung des Sprachstands und führen zu ähnlichen Ergebnissen (vgl. Porsch & Tesch 2010: 161). Ein weiteres Unterscheidungsmerkmal stellt die Art der Einbettung der untersuchten Kompetenz in sprachliche Handlungen dar. Traditionell werden sprachliche Testaufgaben konstruiert, in denen versucht wird, nur die angezielte Kompetenz zu erfassen und andere Kompetenzen auszuschließen, z. B. die Lesekompetenz bei der Erfassung der Schreibkompetenz. Inzwischen gibt es aber auch Testaufgaben, die versuchen integrierte Aufgaben zu stellen, für die verschiedene sprachliche Teilkompetenzen benötigt werden, um die Aufgabe zu lösen (vgl. Grotjahn & Kleppin 2015: 93.) Wie im schulischen Bereich kann zwischen holistischen und kriterienorientierten Analysen der Texte unterschieden werden. Für die Auswerterinnen und Auswerter werden teilweise so genannte Benchmark-Texte zur Verfügung gestellt, die typisch für eine erreichte Kompetenzstufe sein sollen (vgl. Porsch & Tesch 2010: 164).

6.1 Diagnose im Bereich der Alphabetisierung Die Diagnose im Bereich der Alphabetisierung von Menschen, die Deutsch als Zweitoder Fremdsprache erwerben, wird als bedeutsam angesehen. Verlässliche Verfah-

490

Joachim Schäfer

ren hierzu gibt es bislang aber nur in Ansätzen (vgl. Noack, Peuschel & Feldmeier 2013: 142). Zwar steht der basale Schriftspracherwerb im engeren Sinne bei Konzeptionen für die Alphabetisierung im Vordergrund, aber auch die Schreibkompetenz soll angebahnt werden (vgl. Noack, Peuschel & Feldmeier 2013: 144). Zur Einschätzung des Leistungsstandes werden die geschriebenen Texte analysiert und mit einem Vergleichsmaßstab analysiert (vgl. Noack, Peuschel & Feldmeier 2013: 150). Diese Texte können neben weiteren Informationen, wie mehrsprachige Kompetenzen, persönliche Ziele etc., in einem Alpha-Portfolio gesammelt werden (vgl. Noack, Peuschel & Feldmeier 2013: 142). Ein möglicher Vergleichsmaßstab findet sich im „Konzept für einen bundesweiten Integrationskurs“ (BAMF 2015: 16) in dem der schriftliche Sprachgebrauch bzw. ein Alpha-Baustein vorgesehen sind. Das für die Alphabetisierung entwickelte Schreibkompetenzmodell „lea Alpha-Levels“ bietet ebenfalls Kriterien, um die Entwicklung der Schreibkompetenz einzuschätzen (Grotlüschen et al. 2009). Eine weitere Möglichkeit bieten die förderdiagnostischen Materialien zum Lesen und Schreiben (vgl. Backhaus & Rackwitz o. J.), die ebenfalls geeignet sind, das eigene Schreiben anhand von kurzen kommunikativ orientierten Schreibaufgaben zu analysieren.

6.2 Diagnose im Rahmen des GER Grotjahn & Kleppin (2015: 92–93) sehen geschriebene Texte als geeignete Grundlage für die Bestimmung der Schreibkompetenz in der Zweit- bzw. Fremdsprache Deutsch an. Entsprechende Aufgabenformate müssen auf das jeweilige Erkenntnisinteresse abgestimmt werden, um eine Einschätzung des Lernstands zu ermöglichen. Häufig erfolgt die Einschätzung anhand der Deskriptoren, die für eine summative Beurteilung entwickelt wurden (vgl. Europarat 2001: 180–181). Für diagnostische Zwecke sollte innerhalb des GER auf das DIALANG-Sprachbeurteilungssystem zurückgegriffen werden. „Die Zielgruppe von DIALANG sind Erwachsene, die das Niveau ihrer Sprachkompetenz wissen wollen und Feedback in Bezug auf die Stärken und Schwächen ihrer Sprachkompetenz erhalten möchten“ (Europarat 2001: 218). Dazu können sie Aufgaben u. a. zum Schreiben bearbeiten und ihre eigene Sprachkompetenz einschätzen. Sie erhalten anschließend eine vorläufige Rückmeldung zu den Fähigkeiten und bekommen einen Vorschlag, welche Aufgaben sie bearbeiten sollen. Zu den Lösungen dieser Aufgaben erhalten sie Rückmeldungen (vgl. Europarat 2001: 218– 219). Die Beschreibungen der Kriterien für die Selbsteinschätzung sind relativ knapp gefasst. Die Rückmeldungen sind ausführlicher formuliert und sollen helfen, den erreichten Lernstand einzuschätzen und Hinweise für das weitere Lernen zu geben (vgl. Europarat 2001: 221). Inzwischen liegt eine kostenlose webbasierte Version vor (vgl. Lancaster University 2017). In einem ersten Schritt wird anhand eines Wortschatztests, bei dem entschieden werden muss, ob präsentierte Verben deutsche Wörter sind, eine Einschätzung des Sprachstandes vorgenommen. Dieser wird mit den Deskriptoren des GER abgeglichen. Im zweiten Schritt soll selbst eingeschätzt

Schreiben

491

werden, welche vorgegebenen Aussagen zur Schreibkompetenz auf einen zutreffen. Anschließend müssen in vorgegebenen Texten Lücken vervollständigt, Fehler gefunden und Texte mit vorgegebenen Sätzen vervollständigt werden. Abschließend erhält man eine Rückmeldung, ob die Selbsteinschätzung mit dem vom Programm ermittelten Ergebnissen übereinstimmt oder abweicht (Lancaster University 2017). Das Verfahren kann selbständig und zügig durchgeführt werden. Es gibt bei den Auswahlaufgaben nur eine richtige Lösung. Die Zuordnung ist nicht immer nachvollziehbar. Auffällig ist auch, dass in der deutschen Version an der Rechtschreibung vor dem Jahr 1998 festgehalten wird und als Währungseinheit die Deutsche Mark genannt wird. Eine Aktualisierung wäre sicherlich sinnvoll. Die Aufgaben testen, inwieweit einzelne Wörter pragmatisch und morphosyntaktisch passend und einzelne Sätze pragmatisch adäquat eingesetzt werden können. Dadurch werden nur wenige Aspekte einer umfassenden Schreibkompetenz berücksichtigt. Innerhalb des Modells verfügen die Items aber über eine gesicherte Aussagekraft (vgl. Europarat 2001: 219– 220). Daneben sind in vielen Fremdsprachentests, die als standardisierte Vorlagen vorhanden sind, Schreibaufgaben als Subtests enthalten. Diese sind in der Regel nach dem Uni-Level-Prinzip gestaltet (vgl. Grotjahn & Kleppin 2015: 93). So werden beispielsweise für das Zertifikat des Goethe Instituts (2015: 24) für Jugendliche für das Level B1 drei Schreibaufgaben gestellt. Bei der ersten soll in einer E-Mail von einem Fest berichtet werden, bei der zweiten soll zu einem Forenbeitrag argumentiert werden und bei der dritten soll eine E-Mail mit einer Entschuldigung verfasst werden. Der fiktive Adressat wird bei den Aufgaben 1 und 3 genannt, bei der Aufgabe 2 bleibt unklar, an wen sich der Text richtet. Die Auswertung wird anhand eines Kriterienrasters, das aus den Kategorien „Erfüllung“ (darunter fallen die Textfunktion, die Textsorte sowie das Register/die soziokulturelle Angemessenheit), „Kohärenz“, „Wortschatz“ und „Strukturen“(damit sind v. a. sprachformale Aspekte gemeint) besteht. Die Einschätzung soll sich auf den Levels „A–D“ bewegen, das Level E soll bei der Nichterfüllung eines Kriteriums vergeben werden (Goethe Institut 2015: 42). Zur besseren Einschätzung werden Benchmark-Texte zur Verfügung gestellt (Goethe Institut 2015: 44). Porsch (2010: 283) nennt einige Probleme, die bei der Verwendung der Stufen des GER als Vergleichsmaßstab für die Entwicklung der Schreibkompetenz bestehen: Die individuellen Lernprozesse und die Schwerpunktsetzungen im Unterricht müssen nicht dem Stufenmodell entsprechen. Die Schreibentwicklung, die in den genannten Stufen dargestellt wird, beruht nicht auf einer empirischen Grundlage. Die Leistung im Test wird zudem durch die Durchführungsbedingungen und die Art und Qualität der Auswertung beeinflusst. „Kritisiert wird am GER ferner, dass einzelne Deskriptoren in ihrer Wortwahl nicht konsistent oder eindeutig genug für die Entwicklung von Tests sind (Porsch 2010: 283). Porsch (2010: 284) empfiehlt, verschiedene Aufgaben und Textsorten bearbeiten zu lassen, um einen differenzierten Einblick in die Schreibentwicklung zu erhalten und entsprechenden Förderbedarf herausarbeiten zu können.

492

Joachim Schäfer

Literatur Augst, Gerhard (2010): Zur Ontogenese der Erzählkompetenz in der Primar- und Sekundarstufe. In Thorsten Pohl & Torsten Steinhoff (Hrsg.), Textformen als Lernformen. KöBeS 7, 63–95. Köln: Gilles Francke. http://koebes.phil-fak.uni-koeln.de/sites/koebes/user_upload/koebes_07_ 2010.pdf (15. 09. 2016). Bachmann, Thomas & Michael Becker-Mrotzek (2010): Schreibaufgaben situieren und profilieren. In Thorsten Pohl & Torsten Steinhoff (Hrsg.), Textformen als Lernformen. KöBeS 7, 191–209. Köln: Gilles Francke. http://koebes.phil-fak.uni-koeln.de/sites/koebes/user_upload/koebes_ 07_2010.pdf (15. 09. 2016). Backhaus Axel & Rackwitz Rüdiger-Philipp (o. J.): Lesen & Schreiben. Ein Verfahren zur dialogischen Förderdiagnostik in der Alphabetisierung Jugendlicher und Erwachsener. Handreichung. Siegen: Universität Siegen. Baurman, Jürgen & Thorsten Pohl (2009): Schreiben – Texte verfassen. In Albert Bremerich-Vos, Dietlinde Granzer, Behrens Ulrike & Olaf Köller (Hrsg.), Bildungsstandards für die Grundschule: Deutsch konkret, 75–103. Berlin: Cornelsen Scriptor. Baurmann, Jürgen (2002): Schreiben – Überarbeiten – Beurteilen. Seelze: Kallmeyer. Beck, Luna, Nora von Dewitz & Cora Titz (2015): Sprachliche Entwicklungsstände, Lernpotenziale und Lernfortschritte erkennen. http://www.mercator-institut sprachfoerderung.de/ themenportal/thema/sprachliche-entwicklungsstaende-lernpotenziale-und-lernfortschritteerkennen/ (30. 01. 2017). Becker-Mrotzek, Michael (2014): Schreibkompetenz. In Joachim Grabowski (Hrsg.), Sinn und Unsinn von Kompetenzen: Fähigkeitskonzepte im Bereich von Sprache, Medien und Kultur, 51–71. Opladen: Budrich. Boueke, Dietrich & Frieder Schülein (1991): Kindliches Erzählen als Realisierung eines narrativen Schemas. In Ewers, Hans-Heino (Hrsg.): Kindliches Erzählen, Erzählen für Kinder, 13–41. Weinheim: Beltz. Bremerich-Vos, Albert & Miriam Possmayer (2013): Zur Überprüfung eines textsortenübergreifenden Modells der Entwicklung von Schreibkompetenz in der Grundschule. In Angelika Redder & Sabine Weinert (Hrsg.), Sprachförderung und Sprachdiagnostik. Interdisziplinäre Perspektiven, 277–295. Münster: Waxmann. Bundesamt für Migration und Flüchtlinge (BAMF) (Hrsg.) (2015): Konzept für einen bundesweiten Integrationskurs.https://www.bamf.de/SharedDocs/Anlagen/DE/Downloads/Infothek/ Integrationskurse/Kurstraeger/KonzepteLeitfaeden/konz-f-bundesw-integrationskurs.pdf?__ blob=publicationFile (09. 08. 2017). Bundschuh, Konrad & Christoph Winkler (2014): Einführung in die sonderpädagogische Diagnostik. 8. A. München: Ernst Reinhardt. Cantone, Francesca & Stefanie Haberzettl (2008): Zielsprache „Schuldeutsch“: Entwicklung eines Sprachdiagnose-Instruments für mehrsprachige Schüler der Sekundarstufe I – ein Werkstattbericht. In Bernt Ahrenholz (Hrsg.), Zweitspracherwerb: Diagnosen, Verläufe, Voraussetzungen, 93–113. Freiburg i. Br.: Fillibach. Cantone, Francesca & Stefanie Haberzettl (2009): „Ich bin dagegen warum sollte man da kein Handy nehmen“ – zur Bewertung argumentativer Texte bei Schülern mit Deutsch als Zweitsprache. In Karen Schramm & Christoph Schroeder (Hrsg.), Empirische Zugänge zu Spracherwerb und Sprachförderung in Deutsch als Zweitsprache, 43–65. Münster: Waxmann. Dirim, İnci & Marion Döll (2009): ‚Bumerang‘ – Erfassung der Sprachkompetenzen im Übergang von der Schule in den Beruf – vergleichende Beobachtungen zum Türkischen und Deutschen am Beispiel einer Schülerin. In Dorit Lengyel, Hans J. Reich, Hans-Joachim Roth & Marion Döll (Hrsg.), Von der Sprachdiagnose zur Sprachförderung. FörMig Edtion Band 5, 139–146. Münster: Waxmann.

Schreiben

493

Dirim, İnci (2003): Beobachtungsbogen für die gezielte Sprachförderung im Hinblick auf die Stolpersteine der deutschen Sprache. In Heidi Rösch (Hrsg.), Deutsch als Zweitsprache. Sprachförderung: Grundlagen, Übungsideen, Kopiervorlagen, KV 38 – KV41. Braunschweig: Schroedel. Dirim, İnci (2004): Beobachtungsbogen für die gezielte Sprachförderung im Hinblick auf die Stolpersteine der deutschen Sprache. In Heidi Rösch (Hrsg.), Deutsch als Zweitsprache. Sprachförderung in der Sekundarstufe I: Grundlagen, Übungsideen, Kopiervorlagen, KV31– KV34. Braunschweig: Schroedel. Döll, Marion (2009): Beobachtung und Dokumentation von Kompetenzund Kompetenzzuwachs im Deutschen als Zweitsprache mit den Niveaubeschreibungen DaZ. In Dorit Lengyel, Hans J. Reich, Hans-Joachim Roth & Marion Döll (Hrsg.), Von der Sprachdiagnose zur Sprachförderung. FörMig Edtion Band 5, 139–146. Münster: Waxmann. Döll, Marion (2013): Das Instrument „Niveaubeschreibungen Deutsch als Zweitsprache für die Sekundarstufe I“. In Sächsisches Bildungsinstitut (Hrsg.), Niveaubeschreibungen Deutsch als Zweitsprache Sekundarstufe I, 11–15. Radebeul: Sächsisches Bildungsinstitut. Ehlich, Konrad (2007): Sprachstandserhebungsverfahren. In Bundesministerium für Bildung und Forschung (BMBF) (Hrsg.), Anforderungen an Verfahren der regelmäßigen Sprachstandsfeststellung als Grundlage für die frühe und individuelle Förderung von Kindern mit und ohne Migrationshintergrund. Bildungsforschung Band 11, 42–63. Bonn, Berlin: BMBF. Europarat (Hrsg.) (2001): Gemeinsamer europäischer Referenzrahmen für Sprachen: lernen, lehren, beurteilen. Berlin u. a.: Langenscheidt. Fix, Martin (2008): Texte schreiben – Schreibprozesse im Deutschunterricht. 2. A. Paderborn: Schöningh. Gantefort, Christoph & Hans-Joachim Roth (2008): Ein Sturz und seine Folgen. Zur Evaluation von Textkompetenz im narrativen Schreiben mit dem FÖRMIG-Instrument ‚Tulpenbeet’. In Klinger, Thorsten, Karl Schwippert & Birgit Leibler (Hrsg.): Evaluation im Modellprogramm FÖRMIG. Planung und Realisierung eines Evaluationskonzeptes. FÖRMIG Edition Band 4, 29–50. Münster: Waxmann. Gantefort, Christoph & Hans-Joachim Roth (2010): Sprachdiagnostische Grundlagen für die Förderung bildungssprachlicher Fähigkeiten. Zeitschrift für Erziehungswissenschaft. 13 (4), 573–591. Gnutiez (2008): Tulpe L2. http://gnutiez.de/TulpeL2/index.php (14. 09. 2016). Goethe Institut e.V. (Hrsg.) (2015): Materialien zur Prüfung Goethe-Zertifikat B1. Modellsatz Jugendliche. http://www.goethe.de/lrn/prf/pro/b1_modellsatz_jugendliche_neu.pdf (09. 08. 2017). Grießhaber, Wilhelm (2006a): Schreiben mit ausländischen Kindern. In Johannes Berning, Nicola Keßler & Helmut Koch (Hrsg.), Schreiben im Kontext von Schule, Universität, Beruf und Lebensalltag, 306–333. Berlin: LIT-Verlag. Grießhaber, Wilhelm (2006b): Sprachstandsdiagnose im kindlichen Zweitspracherwerb: Funktional-pragmatische Fundierung der Profilanalyse. https://spzwww.uni-muenster.de/ griesha/pub/tprofilanalyse-azm-05.pdf (21. 12. 2018). Grießhaber, Wilhelm (2010a): Linguistische Grundlagen und Lernermerkmale bei der Profilanalyse. In Martina Rost-Roth (Hrsg.) DaZ-Spracherwerb und Sprachförderung Deutsch als Zweitsprache, 17–31. Freiburg i. Br.: Fillibach. Grießhaber, Wilhelm (2010b): Spracherwerbsprozesse in Erst- und Zweitsprache. Duisburg: Universitätsverlag Rhein-Ruhr. Grotjahn, Rüdiger & Karin Kleppin (2015): Prüfen, Testen, Evaluieren. München: KlettLangenscheidt.

494

Joachim Schäfer

Grotlüschen, Anke, Yvonne Dessinger, Claudia Schepers & Alisha Heinemann (2009): Alpha-Levels Schreiben. http://blogs.epb.uni-hamburg.de/lea/files/2009/09/Alpha-Levels-Schreiben2.pdf (09. 08. 2017). Haberzettl, Stefanie (2015): Schreibkompetenz bei Kindern mit DaZ und DaM. In Hanna Klages & Guido Pagonis (Hrsg.): Linguistisch fundierte Sprachförderung und Sprachdidaktik, 47–69. Berlin, München, Boston: de Gruyter. Hayes, John R. (2012): Modeling and Remodeling Writing. Written Communication 29 (3), 369–388. Ihssen, Wolf B. (1980): Probleme der Sprachentwicklungsdiagnose bei Ausländerkindern. In Kurt Meiers, (Hrsg.), Deutsch als Zweitsprache. Praxis Deutsch Sonderheft, 40–42. Seelze: Friedrich. Junk-Deppenmeier Alexandra & Stefan Jeuk (Hrsg.) (2015): Praxismaterial Förderdiagnostik. Werkzeuge für den Sprachunterricht in der Sekundarstufe I. Stuttgart: Fillibach bei Klett. Kast, Bernd (1999): Fertigkeit Schreiben. Fernstudieneinheit 12. München: Goethe-Institut. Klinger, Kurt Schwippert & Birgit Leibler (Hrsg.): Evaluation im Modellprogramm FÖRMIG. Planung und Realisierung eines Evalutionskonzeptes. FÖRMIG − Edition Bd. 4, 29–50. Münster: Waxmann. Knapp, Werner (2001): Erzähltheorie und Erzählerwerb. Zur Diskussion neuerer Forschungsergebnisse. Didaktik Deutsch 6 (10), 26–48. Kniffka, Gabriele & Gesa Siebert-Ott (2012): Deutsch als Zweitsprache: Lehren und Lernen. 3. A. Paderborn: Schöningh. Knopp, Matthias, Michael Becker-Mrotzek & Joachim Grabowski (2013): Diagnose und Förderung von Teilkomponenten der Schreibkompetenz. In Angelika Redder & Sabine Weinert (Hrsg.), Sprachförderung und Sprachdiagnostik: Interdisziplinäre Perspektiven, 296–315. Münster: Waxmann. Kompetenzzentrum FörMig (Hrsg.) (o.J.): Kompetenzzentrum. Bildungssprache. https:// www.foermig.uni-hamburg.de/kompetenzzentrum.html (15. 09. 2016). Kracht, Annette (2003): Sprachliche Normen und Zielsetzungen von Sprachstandserhebungen – einige kritische Anmerkungen. In Beauftragte der Bundesregierung für Migration, Flüchtlinge und Integration (Hrsg.), Förderung von Migranten und Migrantinnen im Elementar- und Primarbereich. Fachtagung am 7. März 2003 in Berlin. Dokumentation, 37–43. Berlin, Bonn. Kürzinger, Anja & Sanna Pohlmann-Rother (2015): Möglichkeiten einer objektiven und reliablen Bestimmung von Textqualität im Anfangsunterricht. Methodisches Vorgehen und deskriptive Befunde aus dem Projekt NaSch1. Didaktik Deutsch 20 (38), 61–79. Lancaster University (Hrsg.) (2017): DIALANG. http://www.lancaster.ac.uk/researchenterprise/ dialang/about.htm (Stand: 05. 09. 2017). Lengyel, Dorit, Andreas Heintze, Hans J. Reich, Hans-Joachim Roth & Heidi Scheinhardt-Stettner (2009): Prozessbegleitende Diagnose zur Schreibentwicklung: Beobachtung schriftlicher Sprachhandlungen in der Sekundarstufe I. In Dorti Lengyel, Hans J. Reich, Hans-Joachim Roth & Marion Döll (Hrsg.), Von der Sprachdiagnose zur Sprachförderung. FörMig Edition Band 5, 129–138. Münster: Waxmann. Marx, Nicole (2017): Schreibende mit nichtdeutscher Familiensprache. In Michael Becker-Mrotzek, Joachim Grabowski & Torsten Steinhoff (Hrsg), Forschungshandbuch empirische Schreibdidaktik, 139–152. Münster: Waxmann. Mercator-Institut für Sprachförderung und Deutsch als Zweitsprache (Hrsg.) (2016): Schreibkompetenz testen und fördern. http://www.mercator-institut-sprachfoerderung.de/ aktuelles/meldung/2016/schreibkompetenz-testen-und-foerdern/ (Stand: 09. 09. 2016). Michalak, Magdalena (2012): Von der Sprachstandsdiagnose zur sprachlichen Förderung. In: Magdalena Michalak & Michaela Kuchenreuther (Hrsg.), Grundlagen der Sprachdidaktik Deutsch als Zweitsprache, 57–84. Baltmannsweiler: Schneider Hohengehren.

Schreiben

495

Neumann, Astrid (2017): Zugänge zur Bestimmung von Textqualität. In Michael Becker-Mrotzek, Joachim Grabowski & Torsten Steinhoff (Hrsg.), Forschungshandbuch empirische Schreibdidaktik, 203–219. Münster: Waxmann. Noack, Christina, Kristina Peuschel & Alexis Feldmeier (2013): Lernabenteuer Lernprozess. In Diana Feick, Anja Pietzuch & Karen Schramm (Hrsg.), Alphabetisierung für Erwachsene. 142–157. München: Klett-Langenscheidt. Nussbaumer, Markus (1995): Lernerorientierte Textanalyse – Eine Hilfe zum Textverfassen? In Helmuth Feilke & Paul Portmann (Hrsg.), Schreiben im Umbruch. 96–111. Stuttgart: Klett. Ossner, Jacob (2006): Kompetenzen und Kompetenzmodelle im Deutschunterricht. Didaktik Deutsch, 11 (21), 5–19. Philipp, Maik (2013): Lese- und Schreibunterricht. Tübingen, Basel: A. Francke. Porsch, Raphaela & Bernd Tesch (2010): Messung der Schreibkompetenz im Fach Französisch. In Raphaela Porsch, Bernd Tesch & Olaf Köller (Hrsg.), Standardbasierte Testentwicklung und Leistungsmessung Französisch in der Sekundarstufe I. 151–176. Münster: Waxmann. Porsch, Raphaela (2010): Die Erprobung eines Kodierschemas zur Messung der Schreibkompetenz im Fach Französisisch. In Raphaela Porsch, Bernd Tesch & Olaf Köller (Hrsg.), Standardbasierte Testentwicklung und Leistungsmessung Französisch in der Sekundarstufe I. 265–285. Münster: Waxmann. Quasthoff, Uta & Madeleine Domenech (2016): Theoriegeleitete Entwicklung und Überprüfung eines Verfahrens zur Erfassung von Textqualität (TexQu) am Beispiel argumentativer Briefe in der Sekundarstufe I. Didaktik Deutsch, 21 (41), 21–43. Reich, Hans J., Hans-Joachim Roth & Marion Döll (2009): Auswertungshinweise „Fast Catch Bumerang“ (Deutsch). In Dorit Lengyel, Hans J. Reich, Hans-Joachim Roth & Marion Döll (Hrsg.), Von der Sprachdiagnose zur Sprachförderung. FörMig Edtion Band 5, 209–241. Münster: Waxmann. Reich, Hans. J (2013): Zur Einführung in die „Niveaubeschreibungen Deutsch als Zweitsprache für die Sekundarstufe I“ In Sächsisches Bildungsinstitut (Hrsg.), Niveaubeschreibungen Deutsch als Zweitsprache Sekundarstufe I, 5–10. Radebeul: Sächsisches Bildungsinstitut. Rösch, Heidi (Hrsg.) (2003): Deutsch als Zweitsprache. Sprachförderung: Grundlagen, Übungsideen, Kopiervorlagen. Braunschweig: Schroedel. Rösch, Heidi (Hrsg.) (2004): Deutsch als Zweitsprache. Sprachförderung in der Sekundarstufe I: Grundlagen, Übungsideen, Kopiervorlagen. Braunschweig: Schroedel. Sächsisches Bildungsinstitut (Hrsg.) (2013a): Niveaubeschreibungen Deutsch als Zweitsprache für die Primarstufe. Radebeul: Sächsisches Bildungsinstitut. Sächsisches Bildungsinstitut (Hrsg.) (2013b): Niveaubeschreibungen Deutsch als Zweitsprache für die Sekundarstufe I. Radebeul: Sächsisches Bildungsinstitut. Schäfer, Joachim & Stefan Jeuk (2014): Kompetenzraster im Fach Deutsch – ein sinnvolles Instrument? Lehren & Lernen 40 (10), 35–39. Schäfer, Joachim (2009): Die Schwierigkeit, Schreibschwierigkeiten zu erfassen. In Stefan Jeuk & Ingrid Schmid-Barkow (Hrsg.), Differenzieren diagnostizieren und Kompetenzen fördern im Deutschunterricht, 229–247. Freiburg i. Br.: Fillibach. Schäfer, Joachim (2012): Sprachstandsbeobachtung im Kompetenzbereich Schreiben – Ein Teilbereich des FISA-Projekts. In Stefan Jeuk & Joachim Schäfer (Hrsg.), Deutsch als Zweitsprache in Kindertageseinrichtungen und Schulen, 301–325. Stuttgart: Fillibach bei Klett. Schäfer, Joachim (2015): Werkzeug 6: Schriftliches Erzählen und Schreibgespräch. In Alexandra Junk-Deppenmeier & Stefan Jeuk (Hrsg.), Praxismaterial Förderdiagnostik. Werkzeuge für den Sprachunterricht in der Sekundarstufe I, 107–156. Stuttgart: Fillibach bei Klett. Schmitt, Markus & Matthias Knopp (2017): Prädikatoren der Schreibkompetenz. In Michael Becker-Mrotzek, Joachim Grabowski & Torsten Steinhoff (Hrsg.), Forschungshandbuch empirische Schreibdidaktik, 239–252. Münster: Waxmann.

496

Joachim Schäfer

Schoonen, Rob (2005): Generalizability of writing scores: an application of structural equation modeling. Language Testing 22 (1), 1–30. Schründer-Lenzen, Agi & Dominik Henn (2009): Entwicklung eines Computerprogramms zur Analyse der schriftlichen Erzählfähigkeit. In Dorit Lengyel, Hans J. Reich, Hans-Joachim Roth & Marion Döll (Hrsg.), Von der Sprachdiagnose zur Sprachförderung. FörMig Edtion Band 5, 91–107. Münster: Waxmann. Schründer-Lenzen, Agi (2012): Diagnose und Förderung der sprachlichen Entwicklung von Schülerinnen und Schülern mit Migrationshintergrund. In Michael Matzner (Hrsg.), Handbuch Migration und Bildung, 167–180. Weinheim, Basel: Beltz. Steinig, Wolfgang & Hans-Werner Huneke (2010): Deutsch als Fremdsprache. 5. A. Berlin: Erich Schmidt.

Sarah L. Fornol und Britta Hövelbrinks

20 Bildungssprache 1 2 3 4 5

Einleitung Zur Bedeutung von Bildungssprache für schulischen Erfolg Zur Konzeptualisierung von Bildungssprache Diagnostik bildungssprachlicher Kompetenzen Zusammenfassung und Ausblick

1 Einleitung Sprachkompetenz ist im Hinblick auf Schule und Unterricht aufgrund der engen Verzahnung von sprachlichem und fachlichem Lernen von besonderer Bedeutung (vgl. u. a. Reich & Roth 2002; Ahrenholz 2010; Leisen 2011; Lange 2012). Fachliche Inhalte werden in allen Schulfächern durch Sprache als Medium vermittelt – gleichzeitig sind spezifische sprachliche Mittel und Handlungen Teil fachlichen Lernens, weshalb Schüler/-innen sowohl über rezeptive als auch produktive sprachliche Kompetenzen verfügen müssen, um schulisch erfolgreich zu sein. Konsens ist, dass dafür jedoch nicht nur alltagssprachliche, sondern vor allem auch sogenannte bildungssprachliche Kompetenzen erforderlich sind, über die nicht alle Lernenden gleichermaßen verfügen (vgl. Redder et al. 2011). Dies kann in besonderem Maße Kinder und Jugendliche mit Deutsch als Zweitsprache betreffen, wenn sie im privaten Umfeld wenig deutschsprachigem Input ausgesetzt sind und bildungssprachliche Fähigkeiten dann lediglich aus ihren erstsprachlichen Kompetenzen übertragen können (vgl. Kleinbub in diesem Band). Möglich ist außerdem, dass die sprachlichen Anforderungen im schulischen Lernen für sie nicht ausreichend transparent gemacht werden oder sie zu wenig Unterstützung beim Erwerb des erforderlichen Sprachregisters erfahren (vgl. Feilke 2012: 4; Schleppegrell 2004: 2). Die aktuelle Debatte um Sprache als Schlüsselqualifikation für Bildungserfolg und spezifischer um das Register der Bildungssprache trägt dazu bei, nicht mehr lediglich die fachlichen Lerninhalte für verschiedene Lernniveaus anzupassen und zu differenzieren, sondern die Lernenden vielmehr von Anfang an, d. h. bereits im Elementarbereich, auf die steigenden sprachlichen Anforderungen im Sinne einer Durchgängigen Sprachbildung (Gogolin & Lange 2011) vorzubereiten. Trotz der bestehenden Relevanz, welche Sprachbildung und Bildungssprache bereits in der Schulpraxis einnehmen, befindet sich die notwendige Grundlagenforschung aber nach wie vor am Anfang, da es bislang an einer einschlägigen Definition von Bildungssprache als Basis für interdisziplinäre Forschung, an ihrer empirischen Fundierung sowie in der Folge an förderdiagnostischen Instrumenten mangelt. Der vorliegende Beitrag gibt einen Überblick zur Bedeutung des Konstrukts Bildungssprache, über den bisherigen Forschungsstand im angloamerikanischen und deutschsprachigen Raum und über erste Instrumente zur Diagnose bildungssprachlicher Fähigkeiten. https://doi.org/10.1515/9783110418712-020

498

Sarah L. Fornol und Britta Hövelbrinks

2 Zur Bedeutung von Bildungssprache für schulischen Erfolg Die konstitutive Funktion sprachlicher Kompetenzen für die Aneignung fachlichen Wissens lässt sich durch zahlreiche empirische Studien bestätigen (vgl. u. a. Leutner et al. 2004; Kölbl, Tiedemann & Billmann-Mahecha 2006; Bos & Pietsch 2006; Merkens 2007; Heinze, Herwartz-Emden & Reiss 2007; Gürsoy et al. 2013). Während damit die Bedeutung des allgemeinen Sprachstands bzw. der Lesekompetenz für fachliches – bisher v. a. mathematisch-naturwissenschaftliches – Lernen im Primarsowie Sekundarbereich als empirisch abgesichert bezeichnet werden kann, ist die Befundlage hinsichtlich des Zusammenhangs bildungssprachlicher und fachlicher Kompetenzen bislang weniger ausgeprägt – was z. T. mit Schwierigkeiten hinsichtlich einer trennscharfen Abgrenzung alltags- und bildungssprachlicher Fähigkeiten zu begründen ist (s. Abschnitt 4 in diesem Beitrag). Dennoch liegen vor allem aus der angloamerikanischen Forschung Ergebnisse zur Vorhersagekraft bildungssprachlicher Kompetenzen für schulische Leistungen vor – üblicherweise unter der Bezeichnung Academic Language (s. Abschnitt 3 in diesem Beitrag). So erbrachten Townsend et al. (2012) mit einem Subtest des The Academic Word Level of the Vocabulary Levels Test (Schmitt, Schmitt & Clapham 2001) den Nachweis der Bedeutung des bildungssprachlichen Wortschatzes für schulischen Erfolg (n = 339, 7./8. Klasse). Die Ergebnisse wurden mit dem sprachlichen und sozialen Hintergrund, dem allgemeinen Wortschatz (The Vocabulary Subtest of the Gates-MacGinitie Reading Test (MacGinitie et al. 2000)) sowie mathematischen, sozial- und naturwissenschaftlichen Fähigkeiten und der Lesekompetenz (The Iowa Test of Basic Skills (Hoover, Dubar & Frisbie 2001)) abgeglichen – mit folgendem Hauptergebnis: [A]cademic vocabulary knowledge explains unique, significant variance in achievement after controlling for the variance explained by language background, SES [d. i. socio-economic status], and general vocabulary knowledge. Although the explained variance was small, ranging from 2 % to 7 % across disciplines, the additional variance was significant and consistent across the standardized outcome measures and disciplines. (Townsend et al. 2012: 511–512)

Obwohl die kognitiven Fähigkeiten der Schüler/-innen innerhalb der Studie nicht kontrolliert wurden und damit offen bleibt, inwieweit diese zur Varianzaufklärung beitragen, sieht die Forschergruppe ihr Ergebnis als wichtigen ersten empirischen Beleg für das Zusammenspiel von bildungssprachlichen Kompetenzen und schulischem Erfolg. Ebenfalls den bildungssprachlichen Wortschatz und darüber hinaus weitere bildungssprachliche Teilfähigkeiten erfassten Uccelli et al. (2015) mit dem von ihnen entwickelten Core Academic Language Skills-Instrument (CALS-I) (n = 235, 4.–8. Klasse). Zusätzlich wurden Tests zur Erfassung des Leseverstehens sowie der Leseflüssigkeit durchgeführt, erhoben wurden außerdem der sprachliche Hintergrund und der sozioökonomische Status der Schüler/-innen. Die Auswertung der Testergebnisse mittels hierarchischer Regressionsanalysen zeigt, dass CALS sich

Bildungssprache

499

bei Kontrolle des sprachlichen Hintergrunds, des sozioökonomischen Status, der Leseflüssigkeit sowie des bildungssprachlichen Wortschatzes signifikant auf die Kompetenzen im Leseverstehen auswirken (vgl. Uccelli et al. 2015: 25–26.). Die Forschergruppe weist jedoch darauf hin, dass die Befunde mit einer größeren Stichprobenzahl sowie im Rahmen einer Längsschnittstudie überprüft werden sollten. In diesem Zusammenhang sollten auch kognitive Grundfähigkeiten Berücksichtigung finden (vgl. Heppt 2016: 47). Einen empirischen Beleg für den Zusammenhang bildungssprachlicher und fachlicher Fähigkeiten im deutschsprachigen Raum liefert zum einen die Studie von Kotzerke et al. (2013). Ermittelt wurden die bildungssprachlichen Kompetenzen von Zweitklässer/-innen durch einen Hörverstehenstest (vgl. Adamczak & Limbach in diesem Band). Dieser umfasste zehn kurze Geschichten mit je einem Set von drei Aussagen, welche von den Lernenden auf Grundlage der gehörten Geschichten auf ihren Wahrheitsgehalt zu überprüfen waren. Die fachlichen Leistungen der Kinder in den Fächern Deutsch, Mathematik und Sachunterricht wurden durch Einschätzungen der Lehrkräfte erhoben. Die Analyse der Daten zeigte unter Kontrolle des Alters sowie der kognitiven Grundfähigkeiten der Lernenden eine Korrelation von r = −.27 zwischen den rezeptiv-bildungssprachlichen und den mathematischen Leistungen sowie r = −.45 zwischen den rezeptiv-bildungssprachlichen Fähigkeiten und der Leistungseinschätzung im Fach Sachunterricht (vgl. Kotzerke et al. 2013: 126– 128). Einen weiteren Beleg für den Zusammenhang bildungssprachlicher Fähigkeiten und fachlicher Leistungen liefern die Studien von Heppt, Henschel & Haag (2016). Auf Basis der Daten des IQB-Ländervergleichs für die Primarstufe aus dem Jahr 2011 (Stanat et al. 2012) wird aufgezeigt, „dass das Verständnis von Bildungssprache höher mit schulischen Leistungen – operationalisiert über die mathematischen Kompetenzen – korreliert […] als das Verständnis von Alltagssprache“ (Heppt 2016: 6). Zwar war der Effekt mit einer Effektstärke von Ø = 0.23 sehr klein und das festgelegte Signifikanzniveau (p = .05) wurde nur knapp erreicht, was sich jedoch mit den Ergebnissen von Townsend et al. (2012) deckt (vgl. Heppt, Henschel & Haag 2016: 248). Insgesamt deuten die bisherigen Befunde sowohl der angloamerikanischen als auch der deutschsprachigen Forschung darauf hin, dass bildungssprachliche Kompetenzen im Vergleich zu alltagssprachlichen Fähigkeiten als bedeutsamer für schulischen Erfolg zu erachten sind.

3 Zur Konzeptualisierung von Bildungssprache 3.1 Theoretische Charakterisierung und begriffliche Abgrenzungen Der Begriff bzw. das Konstrukt der Bildungssprache existierte bereits vor der aktuellen, durch das BLK-Programm Förderung von Kindern und Jugendlichen mit Migra-

500

Sarah L. Fornol und Britta Hövelbrinks

tionshintergrund (FörMig) angestoßenen Debatte, wenn auch nicht immer im Sinne des heutigen Verständnisses (für einen Überblick s. Berendes et al. 2013 sowie Roth 2015). Die heutige Konzeptualisierung von Bildungssprache lässt sich auf verschiedene theoretische Strömungen aus der Soziolinguistik, Linguistik und Erziehungswissenschaft zurückführen, die zusammenfassend u. a. bei Berendes et al. (2013), Hövelbrinks (2014) und Juska-Bacher & Beckert (2015) nachzulesen sind. Trotz der derzeitigen Popularität des Konstrukts existiert bislang noch keine interdisziplinär anerkannte Definition von Bildungssprache. Bisheriger Konsens häufig angeführter Definitionen ist die Nähe zur konzeptionellen Schriftlichkeit, die als eines der zentralen Merkmale von Bildungssprache erachtet wird (vgl. u. a. Gellert 2011; Gogolin & Roth 2007; Riebling 2013; Vollmer & Thürmann 2013), „und zwar auch dann, wenn sie [die schulische Kommunikation; SF/BH] sich mündlich vollzieht“ (Gogolin & Roth 2007: 41). Nicht einheitlich erscheint dabei jedoch das Verständnis des Verhältnisses von Bildungssprache und konzeptioneller Schriftlichkeit. Die Konzepte werden teilweise als synonym betrachtet (vgl. Dehn 2011), als zwei nebeneinander existierende Konstrukte (vgl. Redder et al. 2011), als Konzepte mit gemeinsamen Schnittmengen (vgl. Feilke 2012) oder konzeptionelle Schriftlichkeit wird als „konzeptuelle Klammer“ (Kleinschmidt 2017: 122) unterschiedlicher Ansätze von Bildungssprache verstanden. Die häufig angeführte Nähe zwischen Bildungssprache und konzeptioneller Schriftlichkeit führt gleichzeitig zu einer Abgrenzung zum Register der Alltagssprache: „Zusammenfassend weist also ‚Bildungssprache‘ tendenziell die Merkmale formeller, monologischer, schriftförmiger Kommunikation auf, während Alltagssprachgebrauch eher dialogisch gestaltet ist und die Merkmale informeller mündlicher Kommunikation aufweist“ (Gogolin 2009: 270, vgl. auch Ehlich 1994). Somit besteht ein zentraler Unterschied zwischen den Registern in ihrem Kontextbezug. Die Alltagssprache vollzieht sich „ausgehend vom Objekt der Anschauung“ (Rincke 2010: 246) und ermöglicht einen Austausch von segmentär organisiertem Erfahrungswissen, das aus der Lebenswelt des Alltags der Sprecher/-innen stammt (vgl. Riebling 2013: 116). Aus diesem Grund sind sowohl paralinguistische Mittel, aber auch ein verkürzter Satzbau oder die Verwendung deiktischer Mittel sowie von Passe-Partout-Wörtern als funktional für die jeweilige Kommunikationssituation zu erachten. Bildungssprache funktioniert hingegen (auch) dekontextualisiert und ist durch eine vergleichsweise hohe Explizitheit und Informationsdichte gekennzeichnet (vgl. Koch & Oesterreicher 1985: 22–23; Feilke 2012: 8). Eine kontext- und entwicklungsbezogene Betrachtung bildungssprachlicher Kompetenz ermöglicht jedoch einen Einblick dahingehend, dass auch nähesprachlichen Mitteln eine bildungssprachliche Funktion zukommen kann. So kann beispielsweise das häufig im Hinblick auf bildungssprachliche Merkmale angeführte Kriterium der Allgemeingültigkeit von Äußerungen nicht nur durch Entpersonalisierungen unter Rückgriff auf das Passiv oder die Passiversatzform man erzeugt werden (s. Abschnitt 3.2 in diesem Beitrag). Vielmehr greifen Grundschüler/-innen teilweise auf Formulierungen wie die folgende zurück, die sich im Übrigen auch in

Bildungssprache

501

Lehrwerken finden lässt: „Das nennen wir Rotation.“ Sie zeigen dadurch auf, dass ihnen bewusst ist, dass eine allgemeingültige Einigung auf einen bestimmten Begriff stattgefunden hat. Dementsprechend sollte von einer normativen Zuschreibung von Bildungssprache als ausschließlich durch Merkmale konzeptioneller Schriftlichkeit geprägt abgesehen werden (vgl. Fornol 2016). Eine kontrastive Gegenüberstellung von Alltags- und Bildungssprache ist darüber hinaus dadurch erschwert, dass fließende Übergänge zwischen allen sprachlichen Registern bestehen (vgl. Ahrenholz 2010) und Bildungssprache zudem auf alltagssprachlichen Kompetenzen aufzubauen scheint (Rösch 2009). Schon die Gegenüberstellung konzeptioneller Mündlichkeit und Schriftlichkeit bei Koch & Oesterreicher (1985: 23) ist als Kontinuum gemeint, und in Bezug auf Alltags- und Bildungssprache sprechen Berendes et al. (2013) daher in Anlehnung an das Quadrantenmodell von Cummins (1984) von einer relativen Kategorisierung entlang eines Kontinuums, auf dem Alltags- und Bildungssprache unter Berücksichtigung der inhaltlichen, kontextuellen, textuellen und sprachkomponenten-bezogenen Ebene anzusiedeln sind. Eine dichotome Gegenüberstellung wird zudem dadurch erschwert, dass sich alltagssprachliche Wortbestandteile auch in den Registern der Fach- und Bildungssprache wiederfinden lassen. Ebenso besteht die Möglichkeit, dass alltagssprachliche Begriffe in einem bildungssprachlichen bzw. fachlichen Kontext eine Bedeutungsveränderung erfahren. Dementsprechend ist der ausschließliche Erwerb einzelner bildungssprachlicher Ausdrücke nicht zielführend, sondern es Bedarf gleichzeitig des Wissens um ihre angemessene kontextuelle Verwendung (vgl. Ortner 2006: 19; Koch & Oesterreicher 1994). Ein Versuch der Abgrenzung von Alltags- und Bildungssprache kann jedoch im Hinblick auf ihre Verwendungszusammenhänge und ihre Funktion(en) erfolgen. Bildungssprache wird vornehmlich innerhalb von Bildungsinstitutionen bzw. Bildungskontexten verortet und erfüllt verschiedene Funktionen. Vielfach angeführt wird die kommunikative Funktion des Registers, das demzufolge als Medium des Wissenstransfers fungiert und eine Vermittlung kognitiv anspruchsvoller (fachlicher) Inhalte in dekontextualisierten Kommunikationssituationen ermöglicht (vgl. Morek & Heller 2012). Dementsprechend sollten bildungssprachliche Oberflächenmerkmale „nicht nur als abrufbares sprachliches Repertoire verschiedener Sprechergruppen analysiert werden, sondern auch in funktionaler Verbindung mit den dadurch vollzogenen Sprachhandlungen“ (Hövelbrinks 2014: 110) oder auch Diskursfunktionen (vgl. Vollmer/Thürmann 2013). Dabei ist zu bedenken, dass (bildungs-) sprachliche Kompetenz entwicklungsbezogen unter Berücksichtigung vielfacher Faktoren (Alter, sprachlicher Hintergrund, Fachwissen, fachlicher Kontext, …) beschrieben werden sollte, weshalb nicht von einer Bildungssprache als zielsprachlichem Register, sondern vielmehr von Stufen oder Ausprägungen mehrerer Bildungssprachen die Rede sein sollte (vgl. Fornol 2017). Bildungssprachliche Kompetenz zeigt sich bereits im Elementarbereich (vgl. Tietze, Rank & Wildemann 2016; s. Abschnitt 3.2 in diesem Beitrag), ist aber nicht mit derjenigen von Lernen-

502

Sarah L. Fornol und Britta Hövelbrinks

den des Primar- oder Sekundarbereichs oder erwachsenen Lernenden gleichzusetzen. Wie bedeutsam ein möglichst früher Erwerb bildungssprachlicher Kompetenzen ist, impliziert die epistemische bzw. kognitive Funktion von Bildungssprache. Demnach ermöglichen bildungssprachliche Kompetenzen nicht nur das Sprechen über komplexe Inhalte, sondern sie sind gleichzeitig konstitutiv für die Aneignung anspruchsvoller kognitiver Operationen und unterstützen damit die Erkenntnisleistung (vgl. u. a. Scarcella 2003; Nagy & Townsend 2012; Morek & Heller 2012; Feilke 2012). Bislang weniger Beachtung gefunden hat die sozial-symbolische Funktion von Bildungssprache, also ihre Verwendung zu Distinktionszwecken innerhalb einer sozialen Gemeinschaft. Laut Morek & Heller fungiert das Register demnach als „Eintritts- und Visitenkarte“ und führt im schulischen Kontext zur Ungleichheitsreproduktion, wenn seine Anforderungen nicht explizit gemacht und sein Erwerb nicht systematisch unterstützt werden (vgl. Morek & Heller 2012: 77–79). Im Gegensatz dazu wird das Register der Alltagssprache vornehmlich in der Familie und dessen Umfeld verortet, wobei eine funktional angemessene Verwendung des Registers insbesondere im Primarbereich auch innerhalb des schulischen Kontexts existiert (z. B. im Rahmen von persönlichen Gesprächen zwischen Lehrkräften und Schüler/-innen, in der Pause oder in Gruppenarbeitsphasen). Eine Abgrenzung von Fach- und Bildungssprache lässt sich insofern vornehmen, als dass Bildungssprache als domänenübergreifend zu charakterisieren ist, während jedes Fach eine eigene Fachsprache besitzt und diese damit als domänenspezifisch zu bezeichnen ist. Dabei hat Fachsprache „keine eigene Syntax und außerhalb der eng begrenzten Fachlexik keine eigene Lexik, sondern nutzt die in der Sprache vorhandenen Formen (wie komplexe Wörter, Nominalisierungen, Passiv etc.) und Bedeutungen in spezifischer Weise“ (Rösch 2013: 22). Das Register der Bildungssprache wiederum bildet das „gemeinsame Fundament des fachunterrichtlichen Sprachgebrauchs“ (Thürmann 2013: 137), wodurch erneut Schnittmengen zwischen den sprachlichen Registern deutlich werden. Eine weitere Abgrenzung innerhalb des Bildungssystems als kommunikatives Handlungsfeld erfolgt zum Konzept der Schulsprache. Nach Feilke (2012: 5–7) ist damit eine für Unterrichtszwecke entstandene Sprache der Wissensvermittlung gemeint (enge Definition), die jedoch Bildungssprache als sprachliches Lernziel und -medium beinhalten kann (weite Definition). Zusammenfassend kann bildungssprachliche Kompetenz definiert werden als domänenübergreifende rezeptive wie produktive Anwendung lexikalisch-semantischer und grammatischer Mittel in funktionaler Verbindung mit fachlich angemessenen Diskursfunktionen innerhalb dekontextualisierter Bildungskontexte zur Kommunikation über und Aneignung von fachlich komplexe(n) Inhalte(n).

Bildungssprache

503

3.2 Forschungsstand: Empirische Beschreibung von Bildungssprache und bildungssprachlichen Kompetenzen von Zweitsprachlernenden Empirisch fundierte Beschreibungen bildungssprachlicher Merkmale und deren Gebrauch in Bildungskontexten stammten bislang vorwiegend aus der angloamerikanischen Forschung, d. h. zunächst für die englische Bildungssprache. So analysierte Schleppegrell (2001; 2004) Schulbuchtexte sowie schriftliche, von Schüler/-innen verfasste Texte und Transkripte von Alltagsgesprächen. Sie stellte fest, dass die schulbezogenen Texte mehr spezifische und fachliche Begriffe enthielten und vornehmlich durch einen Nominalstil geprägt waren, was zu einer Verdichtung der Informationen führte. Einen weiteren Versuch zur Beschreibung bildungssprachlicher Merkmale unternahm die Forschergruppe Bailey et al. (2007) des National Center for Research on Evaluation, Standards, and Student Testing (CRESST). Auf der Grundlage der Ergebnisse früherer Studien entwickelten sie ein Kodierschema (vgl. Bailey et al. 2007: 127–130), mit dem sie ausgewählte Lehrwerkstexte (Klassenstufe 5) analysierten und feststellten: „Comparing academic vocabulary usage across subjects, we found that mathematics word problems contain fewer academic words than science and social studies passages overall, whereas science and social studies have comparable percentages of academic vocabulary“ (Bailey et al. 2007: 137). Sprachliche Mittel wie Nominalisierungen sowie Passiv- und Partizipialkonstruktionen fanden dagegen in den Schulbüchern aller drei Fächer eher selten Verwendung (vgl. Bailey et al. 2007: 138–139), was die Forschergruppe vermuten lässt, dass diese zunehmend in höheren Jahrgangsstufen realisiert werden. Sie identifizierten darüber hinaus fächerübergreifende Diskursfunktionen als Teil der Academic Language, wie das Vergleichen, Beschreiben, Aufzählen, Umschreiben und Sequenzieren. Gleichzeitig stellten sie fest, dass solche Sprachhandlungen verschiedene Funktionen übernehmen können, worin sie insbesondere für Zweitsprachlernende eine besondere Herausforderung sehen. Weitere Studien aus dem angloamerikanischen Raum, wie die bereits angeführte von Townsend et al. (2012), belegten den Zusammenhang zwischen bildungssprachlichen Fähigkeiten und schulischer Leistungsfähigkeit oder zeigten Effekte von Interventionen zur Förderung bildungssprachlicher Kompetenzen auf (vgl. z. B. Townsend & Collins 2009; Snow, Lawrence & White 2009). Die in der angloamerikanischen Forschung empirisch ermittelten sprachlichen Oberflächenphänomene werden vielfach auch für das Deutsche im Hinblick auf die Beschreibung von Bildungssprache diskutiert (vgl. u. a. Reich 2008; Gogolin & Lange 2011; Morek & Heller 2012). Da es bislang jedoch im deutschsprachigen Raum an einer umfangreichen empirischen Fundierung hinsichtlich der Charakterisierung von Bildungssprache nach Jahrgangsstufen und Schulfächern mangelt, dienen die angloamerikanischen Forschungsbefunde vornehmlich einer ersten Orientierung, obschon sie teilweise mit einer erschreckenden Selbstverständlichkeit Einzug in die deutschsprachige Debatte um Bildungssprache erhalten haben. Bedenkt man die

504

Sarah L. Fornol und Britta Hövelbrinks

Popularität, welche das Register der Bildungssprache derzeit im Forschungsdiskurs einnimmt, befindet sich die empirische Forschung erheblich im Rückstand. Unklar ist immer noch, durch welche sprachlichen Mittel bildungssprachlich kompetentes Handeln charakterisiert und operationalisiert werden kann und welche Herausforderungen sich beim Erwerb von Bildungssprache nach Alter, sozialer Herkunft, sprachlichem Hintergrund usw. ergeben (vgl. u. a. Redder et al. 2011; Gantefort 2013; Berendes et al. 2013; Beckert & Juska-Bacher 2015). Darüber hinaus ist in der Forschung noch immer eine zu einseitige Fokussierung auf sprachliche Oberflächenmerkmale zu erkennen, die sich in mehr oder weniger differenzierten Listen an sprachlichen Mitteln widerspiegelt (für eine Übersicht vgl. Hövelbrinks 2014: 104– 109). Die linguistisch-pragmatische Seite von Bildungssprache wird dagegen bislang zu wenig berücksichtigt; so ist Bildungssprache in Bildungskontexten – auch im Sinne der o. g. Definition – doch das, was man mit bestimmten sprachlichen Mitteln zum Zwecke des Lehrens und Lernens tut. Hier müssten also die sprachlichen Handlungen stärker beschrieben werden, wie es mittlerweile in vereinzelten Forschungsprojekten geschieht (s. unten). Diese Befundlage ist umso bedeutsamer, als dass im schulischen Alltag erfreulicherweise – aber eben ohne ausreichende Grundlagenforschung – bereits zahlreiche Versuche bestehen, bildungssprachliche Kompetenzen zu fördern (z. B. im Sinne einer Durchgängigen Sprachbildung nach FörMig). Dementsprechend widmen sich weitere Forschungsprojekte derzeit der Frage, wie ein bildungssprachförderlicher bzw. sprachsensibler Unterricht gestaltet sein sollte und wie ertragreich eine solche Unterrichtsgestaltung mit Blick auf den Erwerb bzw. die Weiterentwicklung bildungssprachlicher Kompetenzen sein kann (vgl. u. a. Jeuk et al. 2014 (FörBis); Michalak, Lemke & Goeke 2015 (SPRAAK); Marx, Ehrig & Weiß 2016 sowie das Projekt ProSach1). Erste Hinweise zur „Näherung an Phänomene der schulischen Bildungssprache“ (Gogolin, Neumann & Roth 2007: 6) lieferte das Projekt Bilinguale Grundschule in Hamburg. Dafür wurden mündliche und schriftliche Sprachproben von Grundschüler/-innen im Hinblick auf ausgewählte sprachliche Mittel untersucht, die in einer anschließenden Faktorenanalyse u. a. den Akademischen Modus abbildeten (vgl. Gogolin, Neumann & Roth 2007: 59). Es zeigte sich, dass dieser Modus innerhalb der im Projekt gebildeten Sprachgruppen am häufigsten von der Gruppe verwendet wurde, welche die einsprachig deutschen Kinder (n = 53) umfasste.2 Schüler/-innen, die einsprachig italienisch, portugiesisch, spanisch oder türkisch eingeschult worden waren (n = 17), verwendeten dagegen häufiger den ebenfalls identifizierten umgangssprachlichen Modus. Die Forschergruppe führte diese Unterschiede auf die noch nicht abgeschlossene Zweisprachigkeit zurück, da keine Zusammenhänge zwi-

1 Das Projekt „Professionalisierungsmaßnahmen zur bedeutungsfokussierten Sprachförderung im Sachunterricht der Grundschule“ läuft unter der Leitung von Henschel, Stanat & Hardy; für nähere Informationen s. Gabler, Heppt & Henschel (2017). 2 Es werden jeweils die Bezeichnungen der Fallgruppen aus den Studien verwendet.

Bildungssprache

505

schen dem Bildungshintergrund bzw. dem sozioökonomischen Status und den Modi ausgemacht werden konnten. Signifikante Zusammenhänge konnten jedoch zwischen dem akademischen Modus und der Lesekompetenz der Schüler/-innen (r = .32, p < 0.01) sowie den mathematischen Fähigkeiten (r = .33, p < 0.01) ermittelt werden, während keine Zusammenhänge zwischen den fachlichen Leistungen und dem umgangssprachlichen Modus festgestellt wurden. Aufgrund der geringen Stichprobengröße sind die Ergebnisse nur als Tendenzen zu interpretieren (vgl. Gogolin, Neumann & Roth 2007: 61), sie stellen jedoch u. a. im deutschsprachigen Raum die Grundlage für die Annahme dar, dass Schüler/-innen mit Deutsch als Zweitsprache beim Erwerb bildungssprachlicher Kompetenzen benachteiligt sein könnten bzw. ihnen spezifische Hürden bei ihrer Aneignung begegnen. Einen ersten Versuch zur Aufklärung dieser Fragen unternahm Eckhardt (2008) im Rahmen ihrer Dissertationsstudie. Sie führte mehrere quasi-experimentelle Studien zum Hörverstehen durch und entwickelte dafür Stimulustexte unterschiedlicher sprachlicher und inhaltlicher Komplexität, die von Schüler/-innen deutscher (n = 66) und nichtdeutscher (n = 124) Herkunftssprache nacherzählt wurden. Eckhardt konnte auf Grundlage dieser mündlichen und schriftlichen Sprachleistungen nicht nachweisen, dass sich bei komplexeren Texten ein größerer Leistungsnachteil für Kinder nichtdeutscher Herkunftssprache ergibt – wenn man den sozioökonomischen Hintergrund kontrolliert. Die Forschergruppe des Projektes Bildungssprachliche Kompetenzen: Anforderungen, Sprachverarbeitung und Diagnostik (BiSpra)3 knüpfte an Eckhardts Studien an und untersuchte u. a. ebenfalls, ob größere Leistungseinschränkungen bei Zweitund Drittklässler/-innen nicht-deutscher Familiensprache bei der Verarbeitung von Bildungssprache im Vergleich zu Zweit- und Drittklässler/-innen mit deutscher Familiensprache bestehen (vgl. Berendes et al. 2013; Heppt et al. 2014). Aufgezeigt wurde, dass lexikalisch anspruchsvolle Texte im Vergleich zu grammatikalisch anspruchsvollen Texten für alle Schüler/-innen eine besondere Hürde darstellten (vgl. Heppt 2016: 69). Eine sich anschließende differenzierte Betrachtung der Leistungen verschiedener Sprachgruppen lieferte ebenfalls keine eindeutigen Hinweise für einen ausgeprägten Leistungsunterschied zwischen Zweitsprachlernenden sowie Schüler/-innen mit deutscher Familiensprache: Vielmehr scheinen bildungssprachlich anspruchsvolle Texte Grundschulkindern unabhängig von ihrem jeweiligen sprachlichen und sozialen Hintergrund größere Schwierigkeiten zu bereiten als alltagssprachliche Texte. Zwar blieben Kinder mit nicht-monolingual deutscher Familiensprache in ihrem Verständnis von Bildungssprache hinter ihren monolingual deutschspra-

3 Innerhalb von BiSpra I (vgl. Weinert et al. 2014) wurden bildungssprachliche Merkmale sowie damit verbundene sprachliche Hürden für Kinder mit unterschiedlichem familiären Hintergrund identifiziert. Das Ziel von BiSpra II war die Entwicklung und Validierung eines linguistisch und (sprach-)entwicklungspsychologisch fundierten Instrumentes zur Erfassung bildungssprachlicher Kompetenzen sowie die empirische Überprüfung der Bedeutung dieser sprachlichen Fähigkeiten für den Schulerfolg (vgl. Weinert et al. 2016).

506

Sarah L. Fornol und Britta Hövelbrinks

chigen Mitschülerinnen und Mitschülern zurück, jedoch verfügte zumindest ein Teil von ihnen auch über geringere alltagssprachliche Kompetenzen, sodass sich ein Interaktionseffekt zwischen Sprachhintergrund und sprachlichen Anforderungen nicht […] bzw. nur in der Tendenz […] zeigte. (Heppt 2016: 71)

Eine bildungssprachlich anspruchsvolle Lexik wirkte sich signifikant auf das Hörverstehen der Lernenden aus, während ein solcher Effekt für komplexe morphosyntaktische Strukturen nicht festgestellt werden konnte, was sich mit einem Teilergebnis von Eckhardt (2008) deckt, jedoch nicht mit den bisherigen theoretischen Annahmen einer besonderen Hürde durch komplexe syntaktische Strukturen (vgl. Dehn 2011; Gogolin 2004; 2006). Im Hinblick auf die mündliche bildungssprachliche Kompetenz ein- und mehrsprachiger Schüler/-innen der ersten Jahrgangsstufe liefert Hövelbrinks (2014) erste Erkenntnisse. Auf der Grundlage von zwölf videografisch aufgezeichneten Unterrichtsstunden zu naturwissenschaftlichen Themen aus der Optik identifizierte sie die verwendeten bildungssprachlichen Mittel zweier Fallgruppen: Fallgruppe 1 (n = 20) bestand aus mehrsprachigen Lernenden mit Migrationshintergrund und diagnostiziertem Sprachförderbedarf, die eine Schule in einem sozial schwachen Stadtquartier besuchten. Fallgruppe 2 (n = 23) umfasste 17 einsprachig deutsche und sechs mehrsprachige Kinder ohne Sprachförderbedarf, die zudem auf eine Schule in einem sozial besser gestellten Quartier gingen (vgl. Hövelbrinks 2014: 122–124). Die Auswertung bildungssprachlicher Merkmale mittels eines deduktiv entwickelten Kategoriensystems zeigte, dass die Lernenden der Fallgruppe 1 einige sprachliche Mittel, wie z. B. Hauptsatzkonnektoren, Anschluss durch Relativ- und Fragepronomen, trennbare und untrennbare Verben sowie Komposita, signifikant seltener verwenden als diejenigen der Fallgruppe 2. In beiden Fallgruppen nicht realisiert wurden Partizipialergänzungen, Verben im Konjunktiv I sowie Genitivattribute, während Konnektoren, Komposita, trennbare Verben und Präpositionen am häufigsten verwendet wurden (vgl. Hövelbrinks 2014: 165–171). Durch eine sich anschließende induktive Analyse gelang es Hövelbrinks zudem, die Diskursfunktionen des Berichtens, Beschreibens und Erklärens neben dem Explorieren „für beide Fallgruppen als zentrale naturwissenschaftliche Sprachhandlungen der Naturwissenschaftsdidaktik“ (Hövelbrinks 2014: 324) zu bestätigen. Darüber hinaus konnte aufgezeigt werden, dass innerhalb der Diskursfunktionen verstärkt auf syntaktische bildungssprachliche Mittel im Vergleich zu lexikalischen bildungssprachlichen Mitteln zurückgegriffen wurde. Die lexikalischen Mittel wurden zudem sicherer von Fallgruppe 2 eingesetzt und daher von Hövelbrinks als schwieriger interpretiert (vgl. Hövelbrinks 2014: 325–326). Ebenfalls über die sprachlichen Oberflächenmerkmale hinaus wurden im Projekt Wortschatz und Wortlesen. Aneignung im frühen Schulalter (WuW) die medial mündlichen bildungssprachlichen Kompetenzen von Lernenden der Primarstufe analysiert. Die Schweizer Forschergruppe operationalisierte Bildungssprache auf drei Ebenen: sprachliche Dimension (Syntax, Morphologie, Lexik), kognitiv-reflexive

Bildungssprache

507

Dimension (schriftlich-konzeptuale Fähigkeiten, Sprachreflexion) sowie entwicklungspsychologische Dimension (Einstellung gegenüber und Wertschätzung von Schriftlichkeit). Erhebungsinstrument zur Erfassung der sprachlichen Dimension waren bildgestützte, mündliche Nacherzählungen des Kurzfilms Der Auftrag aus der Reihe Lars, der kleine Eisbär, deren Transkriptionen hinsichtlich der Verwendung bildungssprachlicher Indikatoren4 analysiert wurden. Zunächst wurde im Rahmen der quantitativen Teilstudie5 der Zusammenhang der einzelnen bildungssprachlich relevanten Bereiche anhand der Daten einer Teilstichprobe (n = 24) untersucht. Dabei zeigten sich starke positive Korrelationen zwischen den Bereichen Morphologie und Syntax (r = .779, p < .001) sowie Morphologie und Reflexion (r = .696, p < .001). Im Rahmen einer Typenbildung wurden anschließend vier Kompetenzprofile ermittelt: der ausgewogene Typ, der lexikalische Typ, der morphologische Typ sowie der Reflexionstyp. Die Tatsache, dass kein Typ mit dem Schwerpunkt auf dem Bereich Syntax ermittelt werden konnte, führt die Forschergruppe auf die medial mündliche Erhebungssituation und die Wahl der Nacherzählung als Erhebungsinstrument zurück. Bei der sich an die Typenbildung anschließenden Darstellung von Fallbeispielen wurden auch die kognitive-reflexive sowie entwicklungspsychologische Dimensionen mit aufgegriffen (s. Juska-Bacher & Beckert 2015: 79–121). Für die medial schriftliche Realisierung bildungssprachlicher Mittel im Primarbereich liegen erste Ergebnisse der Studie von Fornol (2015; 2016; i. Vorb.) vor. Eine erste Auswertung von 474 Schülertexten aus dem Sachunterricht in Anlehnung an das deduktive Kategoriensystem von Hövelbrinks (2014) weist darauf hin, dass die Lernenden insbesondere nominale und verbale Fachbegriffe, Komposita, kohäsive Mittel und Präpositionalphrasen in ihren Texten verwenden. Eine besonders niedrige Frequenz besteht dagegen bei Nominalisierungen, Infinitiv- und Partizipialergänzungen, Funktionsverbgefügen und Genitivattributen. Signifikante Unterschiede hinsichtlich des sprachlichen Hintergrunds der Lernenden konnten nicht festgestellt werden (vgl. Fornol 2017: 290–291). Neben den Analysen im Primarbereich werden inzwischen auch in anderen Alters- und Schulstufen bildungssprachliche Kompetenzen und Anforderungen untersucht. So wurde im Forschungsprojekt Early Steps Into Science and Literacy (EASI Science-L) die mündliche Sprachkompetenz von Kindern aus dem Elementarbereich analysiert (vgl. Wildemann et al. 2016; Tietze, Rank & Wildemann 2016; Rank 2016). Dafür wurde eine naturwissenschaftliche Experimentiereinheit zum Thema Schwimmen und Sinken unter standardisierten Bedingungen mit 222 Kindern durchgeführt

4 Das dafür verwendete Kategoriensystem umfasste: Komplementsatz, Relativsatz, Partizipialkonstruktion, adverbiale Ergänzung, Partizipialattribut, Konjunktiv, Präteritum, differenzierende Verben, Komposita, Kollokationen, Routineformeln und Konnektoren (vgl. Juska-Bacher & Beckert 2015: 63). 5 Ergebnisse des quantitativen Teils der Studie WuW, in dem Wortschatz-, Vorläufer- und Lesekompetenzen auf Zusammenhänge ausgewertet wurden, können bei Juska-Bacher et al. (2015) nachgelesen werden.

508

Sarah L. Fornol und Britta Hövelbrinks

und videografisch aufgezeichnet. Mittels einer Ratingskala zur Erfassung bildungssprachlicher Kompetenzen von Kindern im Vorschulalter (RaBi-Skala) wurden die mündlichen Äußerungen der Kinder anschließend auf den Dimensionen Lexikon, Morphosyntax sowie Sprachhandlungen jeweils auf einem Niveau von 0 bis 3 eingestuft. Die bildungssprachliche Kompetenz der Gesamtstichprobe lag im Durchschnitt auf dem Niveau 1 (alltagssprachliches Niveau), jedoch wurden auch die Niveaustufen 2 und 3 (bildungssprachliches Niveau) von einigen Kindern erreicht. Ersichtlich wurde, dass mit steigenden lexikalischen Kompetenzen auch steigende morphosyntaktische Kompetenzen einhergehen und umgekehrt. Zudem besteht ein Zusammenhang zwischen komplexeren Sprachhandlungen wie Erklären/Begründen und den anderen beiden Dimensionen (Lexikon: r = .557, p = .000; Morphosyntax: r = .443, p = .000) (vgl. Tietze, Rank & Wildemann 2016: 24–25). Deutlich wurde im Rahmen der Studie jedoch auch, dass die sprachlichen Leistungen der Kinder sehr stark von der Gestaltung der Lehr-Lern-Situation sowie der Anregungsqualität der pädagogischen Fachkräfte abhängig sind (vgl. Wildemann et al. 2016: 77). Für die Sekundarstufe sind exemplarisch die Ergebnisse aus Hees Analysen von Schülerkommunikation in Gruppenarbeitsphasen im Fach Geschichte (5., 8. und 11. Klasse) von Interesse. Sie untersuchte, wie sich distanzsprachliche Strukturen als Ausdruck konzeptioneller Schriftlichkeit 6 in Gruppenarbeitsphasen bis hin zur Präsentation im Plenargespräch entwickeln (Hee 2017). Als konzeptionell schriftlich gelten dabei integrative, komplexe, geplante und differenzierte Versprachlichungsstrategien, die z. B. durch Nominalisierungen, Partizipial-Adjektive oder Kompositionen realisiert werden. Hee zeigt, dass Lernende bereits ab der fünften Klasse eigenständig komprimierte, integrierte Strukturen (z. B. Nominalisierungen, komplexe Präpositionalphrasen oder mehrgliedrige Komposita) in der Gruppenarbeit erproben, die aber – vermutlich im Sinne einer Vermeidungsstrategie – noch nicht in die Ergebnispräsentation übernommen werden (Hee 2017: 220–221). Größer angelegte Studien zum bildungssprachlichen Register im Sekundarbereich fehlen bislang.7 Ersichtlich wird, dass mittlerweile zahlreiche Ansätze einer empirisch fundierten Beschreibung bildungssprachlicher Charakteristika und Kompetenzen bestehen. Zudem finden derzeit vielfältige Bemühungen innerhalb der deutschsprachigen Forschung zur Beschreibung von (bildungs)sprachlichem Input in schulischen Lehrwerken statt, die als ein Ausdruck sprachlicher Erwartungen im Schulkontext gelten (vgl. u. a. Oleschko & Moraitis 2012; Obermayer 2013; Busch-Lauer 2016; Ahrenholz 2013 sowie Ahrenholz, Hövelbrinks & Neumann 2017). So gelingt es allmählich, das

6 Sie übernimmt zwar nicht den Begriff Bildungssprache; ihre Analyse folgt aber dem Ansatz der konzeptionellen Schriftlichkeit nach Koch & Oesterreicher (s. Abschnitt 3.1 in diesem Beitrag) und ist daher für den hier beschriebenen Forschungsstand zur bildungssprachlichen Kompetenz relevant. 7 D. h. zum Entstehungszeitpunkt dieses Kapitels.

Bildungssprache

509

Konstrukt Bildungssprache empirisch zu fundieren und davon ausgehend didaktische Implikationen für die Praxis zu entwickeln.

4 Diagnostik bildungssprachlicher Kompetenzen Da bislang insbesondere für den deutschsprachigen Raum noch keine umfassenden und differenzierten empirischen Belege für Charakteristika der Bildungssprache bestehen, stellen sich bei der Entwicklung diagnostischer Instrumente zur Erfassung bildungssprachlicher Kompetenzen besondere Herausforderungen. Insbesondere in den letzten Jahren sind jedoch bedeutsame erste Instrumente entwickelt worden – mit bisherigem Schwerpunkt in der Primarstufe. Als eine der ersten widmete sich die Forschergruppe des Modellprogramms FörMig der Entwicklung sprachdiagnostischer Instrumente für den Bereich Deutsch als Zweitsprache. Bei den entwickelten förderdiagnostischen Instrumenten handelt es sich jedoch um Verfahren, die nicht explizit auf die Erfassung bildungssprachlicher Fähigkeiten ausgerichtet sind, sondern vielmehr „Aspekte bildungssprachlicher Kompetenz“ (Gantefort & Roth 2010: 574) erfassen, wie z. B. das Verfahren Der Sturz ins Tulpenbeet für Schüler/-innen am Übergang von der Grundschule zur Sekundarstufe, bei dem die schriftliche Erzählkompetenz fokussiert (vgl. Schäfer in diesem Band) und u. a. mit Blick auf ausgewählte bildungssprachliche Oberflächenmerkmale ausgewertet wird (vgl. Reich, Roth & Gantefort 2008). Gleiches gilt für das Verfahren Fast Catch Bumerang, das für Lernende, die sich im Übergang von der Sekundarstufe bis zur Klasse 10 in die Berufsausbildung befinden, entwickelt wurde und Textsortenspezifik sowie Fachsprachlichkeit in den Fokus nimmt (vgl. Reich, Roth & Döll 2009). Darüber hinaus wurde im Rahmen von FörMig ein Beobachtungsinstrument mit Kompetenzrastern zu schulisch relevanten, schriftlichen Sprachhandlungen wie Berichten, Erklären u. a. entwickelt, das von der fünften bis zur zehnten Jahrgangsstufe eingesetzt werden kann und bildungssprachlichem Handeln damit nahe kommt (Prozessbegleitende Diagnose der Schreibentwicklung, vgl. Lengyel et al. 2009). Ausdrücklich mit dem Ziel der Erfassung bildungssprachlicher Kompetenzen von Vorschulkindern wurde die in Abschnitt 3.2 bereits erwähnte RaBi-Skala aus dem Projekt EASI Science-L entwickelt (vgl. Tietze, Rank & Wildemann 2016). Die drei Hauptdimensionen Lexikon, Morphosyntax sowie Sprachhandlungen wurden durch Merkmale definiert, die auf bisherigen Erkenntnissen zur Bildungssprache sowie entwicklungsdiagnostischen Grundlagen zur kindlichen Sprachentwicklung basieren. Nach zwei Probedurchläufen und anschließenden Überarbeitungen der Items wurde die Skala für die Gesamtstichprobe (n = 222) angewendet. Für die Dimension Lexikon erfolgte mit Hilfe der Skala eine Einschätzung der Fachbegriffe sowie der sprachlichen Varietät:

510

Sarah L. Fornol und Britta Hövelbrinks

Allgemeine, unspezifische, rudimentäre Äußerungen wurden auf der Stufe 0 kodiert; alltagssprachliche Verwendung des Wortes ohne Fachbezug wurde auf der Stufe 1 eingeordnet. Wenn differenzierte Wörter passend zum Fachkontext oder alltagssprachliche Komposita gebraucht wurden, dann war die Äußerung in Stufe 2 anzusiedeln, und die bildungssprachliche Verwendung von Wörtern wurde auf Stufe 3 kodiert. (Wildemann et al. 2016: 72)

Im Bereich Morphosyntax wurden für explizite Markierungen der Kohäsion, Satzgefüge, unpersönliche Konstruktionen und komplexe Verbkonstruktionen ebenfalls Zuordnungen auf den Stufen 0 bis 3 vorgenommen. Hinsichtlich der Dimension Sprachhandlungen wurden das Benennen und Beschreiben als weniger bildungssprachlich komplex definiert. Eine höhere Einstufung fand beim fachlichen Widersprechen, Bestätigen, Nachfragen oder Vorschlagen statt, und das Erklären, Begründen und Vermuten wurden als anspruchsvolle bildungssprachliche Sprachhandlungen angesehen. Auf der Grundlage der Einschätzungen konnten die Kinder anschließend einer insgesamt erreichten Niveaustufe pro Dimension zugeordnet werden (vgl. Wildemann et al. 2016: 74). Im Hinblick auf die Objektivität wurden sowohl für die Durchführung als auch für die Interpretation Kodierleitfäden entwickelt. Die Berechnung der Interrater-Reliabilität auf der Grundlage von 23 Auswertungen zweier Rater zeigt darüber hinaus ein gutes Maß (Lexikon: κ = .758; Morphosyntax: κ = .807; Sprachhandlungen: κ = .757). Auch die Berechnung von Cronbachs Alpha sowie den Trennschärfen ergab zufriedenstellende Werte (Lexikon: drei Items, mittlere Trennschärfe = .585, α = .675; Morphosyntax: vier Items, mittlere Trennschärfe = .752, α = .739; Sprachhandlungen: zwei Items, mittlere Trennschärfe = .702, α = .419). Durch die bereits angesprochene Anbindung an bisherige Erkenntnisse zur Bildungssprache sowie entwicklungsdiagnostische Grundlagen zur kindlichen Sprachentwicklung ist auch die Inhaltsvalidität der Skala gegeben. Bzgl. der Kriteriumsvalidität zeigte sich, „dass Intelligenz kein entscheidenderes [sic!] Kriterium für eine gleichermaßen hohe bildungssprachliche Kompetenz darstellt. Ein entscheidenderes Kriterium scheint der Bildungsstand der Eltern zu sein“ (Tietze, Rank & Wildemann 2016: 23). Darüber hinaus wurde zur Überprüfung der Konstruktvalidität mangels vergleichbarer Instrumente das Verfahren Linguistische Sprachstandserhebung – Deutsch als Zweitsprache (LiSe-DaZ ®) (vgl. Schulz & Tracy 2011) herangezogen, wobei signifikante Korrelationen für einzelne Dimensionen nachgewiesen werden konnten.8 Mittels einer explorativen Faktorenanalyse ließ sich darüber hinaus bestätigen, dass die beiden unteren Niveaustufen der RaBi-Skala alltags-

8 Da LiSe-DaZ® allgemeine Sprachkompetenzen entlang spezifischer grammatischer Kategorien testet, während die RaBi-Skala über diese basalen Sprachkompetenzen hinausgeht und auf den oberen Niveaustufen als bildungssprachlich geltende Sprachkompetenzen testet, wurden erwartungsgemäß geringe Korrelationen festgestellt. Es zeigten sich signifikante Korrelationen mit dem Item Präpositionen (Dimension Sprachproduktion) des LiSe-DaZ® und den Items Nomen (r = −182, p = .007) sowie Kohäsion (r = .180, p = .007) der RaBi-Skala. Zudem korreliert das Item Nomen (Dimension Lexikon) der RaBi-Skala signifikant mit der Dimension Verstehen der Verbbedeutung (r = .145, p = .031) (vgl. Tietze, Rank & Wildemann 2016: 22–23).

Bildungssprache

511

sprachliche Kompetenz und die beiden oberen Stufen bildungssprachliche Kompetenz abbilden. Gleichzeitig wurde jedoch durch die Faktorenanalyse ersichtlich, dass die bildungssprachlichen Niveaus komplexes Verbgefüge sowie Verben zu einfach angesetzt waren, um eine komplexe Sprachverwendung im Sinne bildungssprachlicher Kompetenz abzubilden, weshalb eine Revision und Überprüfung der Skala perspektivisch angestrebt wird (vgl. Tietze, Rank & Wildemann 2016: 20–22). Ein linguistisch und entwicklungspsychologisch fundiertes Verfahren zur Erfassung bildungssprachlicher Kompetenzen von Lernenden im Primarbereich legt die Forschergruppe des ebenfalls bereits angesprochenen Projekts BiSpra bzw. des Anschlussprojekts BiSpra II vor (vgl. Schuth et al. 2015; Köhne et al. 2015). Entwickelt wurden drei verschiedene Skalen: 1. Aufgaben zur Erfassung des funktional integrativen Hörverstehens, 2. Aufgaben zum Verständnis von Satzverbindungen (mit Konnektoren) und 3. Aufgaben zum Verständnis eines fachübergreifenden bildungssprachlichen Wortschatzes. (Schuth et al. 2015: 96) In Anlehnung an die Studie von Eckhardt (2008) (s. Abschnitt 3.2 in diesem Beitrag) wurden zunächst Hörverstehenstexte entwickelt, welche Pseudowörter beinhalten, die sich die Lernenden der zweiten bis vierten Jahrgangstufe aus dem Kontext erschließen müssen. Damit die Hörverstehensfähigkeiten unabhängig von der Lesefähigkeit erfasst werden, wurden den Schüler/-innen sowohl die Texte als auch die dazugehörigen Aufgaben (Ja-Nein-Antwortformat) auditiv präsentiert. Basierend auf der Annahme, dass die bildungssprachlichen Anforderungen an die Lernenden im Verlaufe der Schulzeit ansteigen, wurde der Umfang bildungssprachlicher Mittel in den Hörverstehenstexten je nach Jahrgangsstufe variiert – die Texte für die zweite Jahrgangsstufe enthalten dementsprechend die wenigsten bildungssprachlichen Mittel wie z. B. Nominalisierungen, Passivkonstruktionen, Konnektoren, Nebensatzkonstruktionen und Attribute. Aufgegriffen wurden diejenigen sprachlichen Ausdrücke, die innerhalb der Testaufgaben der Vergleichsarbeiten VERA-3 (Kuhl, Harych & Vogt 2010) sowie dem IQB-Ländervergleich 2011 (Stanat et al. 2012) als bildungssprachlich identifiziert wurden (z. B. erkennen, sich handeln um, fortfahren) (vgl. Schuth et al. 2015: 97–98). Für den Satzverbindungstest wurden Konnektoren ausgewählt, die in dem Korpus DLex2 (Erwachsene) mit höherer Frequenz vorkamen als im Korpus ChildLex3 (Kinder). Der Test enthält entweder aus zwei Sätzen oder einem Satz mit zwei nachfolgenden Teilsätzen bestehende Lückensatzaufgaben. Bei jedem Item müssen die Schüler/-innen aus vier vorgegebenen Konnektoren den passenden auswählen, wobei von den drei Distraktoren je einer semantisch, aber nicht syntaktisch passend ist, während die beiden weiteren syntaktisch passend, aber semantisch unpassend sind. Konzipiert wurden insgesamt 24 Lückensatzaufgaben, bei denen systematisch zwischen der Stellung des Konnektors im Satz, der Wortart des Konnektors sowie der resultierenden Wortstellung variiert wurde. Auch die Aufgaben zu den Satzverbindungen werden den Lernen-

512

Sarah L. Fornol und Britta Hövelbrinks

den auditiv präsentiert, zusätzlich in Form von Aufgabenheften aber auch abgedruckt vorgelegt. Als Grundlage für die Entwicklung des Tests zum fächerübergreifenden bildungssprachlichen Wortschatz wurde das knapp 700.000 Tokens und 30.000 Types umfassende Hamburg-Bamberger Korpus herangezogen. Mittels sechs Kriterien wurde aus diesem u. a. aus Unterrichtsvideos bestehenden Datenkorpus die Hamburg-Bamberger BiSpra-Liste erstellt, welche insgesamt 118 Inhaltswörter umfasst (für eine Übersicht der Korpusbasis und Erstellung sowie eine Einsicht in die BiSpra-Liste s. Köhne et al. 2015). Als Aufgabenformat wurden Lückensätze mit Einsatz-Wahlmöglichkeiten ausgewählt. Jedes Item besteht demnach aus einem Satz mit einer Lücke, in die ein Wort aus drei vorgegebenen eingesetzt werden soll, sodass ein sinnvoller Satz entsteht. Alle einzusetzenden Wörter entstammen der BiSpra-Liste. Die insgesamt 63 konzipierten Items wurden innerhalb einer Großpilotierung erprobt und anschließend überarbeitet. Die Ergebnisse der im Juni 2014 sowie Juni 2015 durchgeführten Messwiederholungsstudie (Validierungsstudie) im Kohortensequenzdesign werden derzeit im Rahmen des Anschlussprojekts BiSpra-Aufgaben analysiert.9 Ein weiteres Verfahren zur Erfassung von Fördereffekten in Bezug auf mündliche bildungssprachliche Kompetenzen wurde von Webersik (2015) entwickelt. Eine Erprobung erfolgte anhand einer zufällig ausgewählten Stichprobe (n = 150) aus dem Projekt Bedeutung und Form. Fachbezogene und systematische Förderung in der Zweitsprache (BeFo I) sowie der Folgestudie Vertiefende Analysen zu Bedingungen der Wirksamkeit sprachsystematischer und fachbezogener Sprachförderung bei Grundschulkindern nicht-deutscher Herkunftssprache (BeFo II) (vgl. Darsow, Paetsch & Felbrich 2012). Ziel war die Elizitierung spontansprachlicher Daten und deren Analyse im Hinblick auf Merkmale der Schulsprache.10 Dafür wurden Einzelinterviews in einem Umfang von 20 bis 30 Minuten durchgeführt und videografisch aufgezeichnet. Die teilnehmenden Drittklässler/-innen erhielten die Aufgabe, den Inhalt dreier kurzer, tonlos präsentierter Filmsequenzen mit unterschiedlichem Grad an Dekontextualisierung nachzuerzählen. Die aufgezeichneten Daten wurden transkribiert und hinsichtlich Indikatoren schulsprachlicher Kompetenz (z. B. Präfixverben, Präpositionen und Konjunktionen, Attribute, Nebensätze, komplexe Nominalphrasen und Passivstrukturen) sowie „Stolpersteinen“ und Indikatoren des Deutsch-alsZweitsprache-Erwerbs fortgeschrittener Lerner/-innen (z. B. Verbklammer, Inversion, Subjekt-Verb-Kongruenz und Adjektivkomparation) in einem vierschrittigen Verfahren kodiert. Dabei wurde sowohl deduktiv als auch induktiv vorgegangen, wodurch insgesamt 83 sprachliche Phänomene identifiziert werden konnten. Zur Ermittlung der Auswertungsobjektivität wurden 30 Transkripte von drei unabhängi-

9 D. h. zum Entstehungszeitpunkt des vorliegenden Kapitels; vorläufige Befunde finden sich bei Weinert et al. (2016). 10 Der von Webersik im Rahmen ihrer Studie verwendete Begriff der Schulsprache kann als synonym zum Konstrukt Bildungssprache angesehen werden (vgl. Webersik 2015: 12).

Bildungssprache

513

gen Ratern kodiert. Durch die Berechnung des Intraklassenkorrelationskoeffizienten wurde für den Großteil der Variablen eine gute Reliabilität nachgewiesen (> 0.7). Für einige sehr selten vorgekommenen Variablen (z. B. fehlerhafte Markierung der Komparation am Adjektiv) konnte keine Intraklassenkorrelation berechnet werden, andere Variablen wurden teilweise kombiniert, da vermutlich unscharfe Differenzierungen zu einer niedrigen Intraklassenkorrelation führten (vgl. Webersik 2015: 279–285). Anschließend wurde mittels explorativer Faktorenanalysen die Zusammenhangsstruktur der verbleibenden 47 Variablen untersucht. Vierzehn dieser Merkmale (wie z. B. differenzierter Wortschatz, Funktionswörter, Präpositionen und Satzgefüge) konnten dabei dem Faktor 1 (Elaborierte Sprachverwendung) zugeordnet werden. Anschließend erfolgte auf der Grundlage der drei Hauptkomponenten der Faktorenanalyse die Konstruktion verschiedener Skalen: Elaborierte Sprachverwendung, Lexikalisch-semantische Unsicherheiten, Fehlerschwerpunkte der Nominalflexion und formalsprachliche Abweichungen (Grammatik). Die Berechnung der Testwerte lieferte für alle Skalen ein theoriekonformes Ergebnis, zudem konnte für die Skala der Elaborierten Sprachverwendung eine sehr hohe Reliabilität von α = .83 nachgewiesen werden (vgl. Webersik 2015: 338). Untersucht wurde auch die kriteriale und inhaltliche Validität der Skalen durch den Abgleich mit Ergebnissen anderer im Rahmen der BeFo-Studie eingesetzter Testverfahren: Wie erwartet konnte für die sprachlichen Testverfahren konvergente Validität und für den nicht-sprachlichen Test zum mathematischen Verständnis (DEMAT) divergente Validität nachgewiesen werden. Die Korrelationen mit den sprachlichen Testverfahren fallen aufgrund der z. T. sehr unterschiedlichen sprachlichen Bereiche und Realisierungsformen (mündlich vs. schriftlich, rezeptiv vs. produktiv) sowie verschiedenen Testformaten erwartungsgemäß niedrig aus und bewegen sich in den meisten Fällen zwischen r = (−).22** und r = (−).33**. (Webersik 2015: 340).

Insgesamt gelingt es Webersik, ein Verfahren vorzulegen, mit dem Teilbereiche schulsprachlicher Kompetenz bzw. entsprechende Defizite erfasst und durch vier Testbereiche berechnet werden können, womit sie einen wichtigen Beitrag zur Diagnostik bildungssprachlicher Kompetenzen leistet. Insbesondere für die Sekundarstufe steht die Entwicklung sprachdiagnostischer Instrumente für bildungssprachliche Kompetenz noch ganz am Anfang; dies hat sich seit einer entsprechenden Expertinneneinschätzung durch Junk-Deppenmeier (2009) kaum geändert. Zwar existieren Verfahren wie z. B. das Beobachtungsverfahren Niveaubeschreibungen Deutsch als Zweitsprache für die Sekundarstufe 1 (vgl. Sächsisches Bildungsinstitut 2013), bei dem die Erfassung von Bildungssprache – sinnvollerweise – als explizites Ziel des Verfahrens genannt wird (Sächsisches Bildungsinstitut 2013: 5–6). Bildungssprache wird dort aber nicht systematisch in den Teilbereichen operationalisiert, sondern lediglich in Skala B (Wortschatz) in den höheren Stufen mit „Bildungswortschatz“ und „Fachbegriffe“ bzw. „Fachwortschatz“ angedeutet (Sächsisches Bildungsinstitut 2013: 19–20). Auch in den bereits angesprochenen FörMig-Verfahren zur Erfassung bildungssprachlicher Kompeten-

514

Sarah L. Fornol und Britta Hövelbrinks

zen in der Sekundarstufe wird der Bildungswortschatz nicht differenzierter erhoben. Spezifisch auf Bildungssprache zugeschnittene und empirisch fundierte Verfahren – seien es Tests, Profilanalysen oder Beobachtungsinstrumente – liegen für die Sekundarstufe bisher nicht vor. Die Entwicklung diagnostischer Instrumente wird durch die in Abschnitt 3.1 diskutierten Abgrenzungsprobleme zu alltagssprachlichen Kompetenzbereichen sicherlich erschwert. Insbesondere die Modellierung eines Kontinuums von alltags- zu bildungssprachlichen Kompetenzen und die Annahme, dass letztere auf alltagssprachlichen Kompetenzen aufbauen, machen eine trennscharfe Messung bildungssprachlicher Kompetenzen schwierig.

5 Zusammenfassung und Ausblick Sprachliche Kompetenzen stellen eine entscheidende Voraussetzung für fachliche Leistungen in institutionalisierten Bildungskontexten dar, wie verschiedenste Studien belegen konnten (s. Abschnitt 2). Darunter sind insbesondere fortgeschrittene, an die Schriftsprache angelehnte sprachliche Teilkompetenzen relevant, die hier unter dem Konzept Bildungssprache auf aktuellem theoretischen und empirischen Forschungsstand diskutiert wurden (s. Abschnitt 3.1). Um Bildungssprache für diagnostische Instrumente und damit zur Optimierung schulischer Unterstützungsangebote operationalisieren zu können, muss zunächst auf breiter empirischer Grundlage geklärt werden, welche charakteristischen Merkmale dieses Register in welchen Verwendungssituationen trägt. Es wurde ersichtlich, dass in der deutschsprachigen Forschungsliteratur v. a. morphologisch-syntaktische und lexikalisch-semantische Merkmale als bildungssprachliche Oberflächenmerkmale genannt werden – zum Teil nicht mit „eigener“ empirischer Fundierung, sondern als Resultat der Übertragung angloamerikanischer Forschungsbefunde. Aus eher funktionaler Perspektive, bisher jedoch zu selten, werden auch spezifische Sprachhandlungstypen oder Diskursfunktionen – zumindest in qualitativen Teilstudien – als typisch für den schulisch relevanten bildungssprachlichen Gebrauch mitgedacht. Nichtsdestotrotz hat sich der bisherige empirische Rückstand im deutschsprachigen Raum hinsichtlich der Operationalisierung von Bildungssprache durch zahlreiche Forschungsprojekte erheblich verringert. Sowohl für verschiedene Formen der Realisierung (mündlich und schriftlich sowie rezeptiv und produktiv) als auch für verschiedene Altersklassen und Fächer liegen mittlerweile erste Forschungsergebnisse zur Beschreibung bildungssprachlicher Kompetenz vor, die sich – insbesondere im Falle von BiSpra – auch einer größeren Datenbasis bedienen und den schulisch relevanten Ausschnitt von Bildungssprachlichkeit damit authentisch abbilden. Dabei stehen die Projekte vor der Herausforderung, Bildungssprache einerseits objektiv zu beschreiben, gleichzeitig aber bereits Aussagen über die Verwendung durch unterschiedliche Sprechergruppen – beispielsweise Lernende des Deutschen als Zweitsprache – zu treffen (s. Abschnitt 3.2).

Bildungssprache

515

Parallel zur Grundlagenforschung werden außerdem bereits diagnostische Instrumente entwickelt, die wegen des beschriebenen Forschungsdesiderates zum Teil gleichzeitig die grundlegende Beschreibung von Bildungssprache angehen (müssen), z. B. im Falle von Easy-Science-L für den Elementarbereich oder der Testverfahren von Webersik (2015) und BiSpra II für den Primarbereich (s. Abschnitt 4). Dabei ist ein deutlicher Schwerpunkt im Primarbereich zu beobachten, v. a. im Bereich halb-standardisierter bis standardisierter Test- und Ratingverfahren (vgl. GültekinKarakoç in diesem Band zu sprachdiagnostischen Grundverfahren), während für die Sekundarstufe, in der die bildungssprachlichen Anforderungen sich kontinuierlich ausdifferenzieren, kaum etwas vorliegt. Darüber hinaus wird unter dem aus der schulischen Praxis kommenden Handlungsdruck auch schon der nächste Schritt, die Förderung bildungssprachlicher Kompetenzen, angegangen, die größtenteils wiederum ohne bewährte diagnostische Instrumente auskommen muss. Dafür ist es erforderlich, dass die Bildungspolitik weiterhin für entsprechend ausgestattete Forschungsprojekte im Bereich der Grundlagenforschung sorgt.

Literatur Ahrenholz, Bernt (2010): Bildungssprache im Sachunterricht der Grundschule. In Bernt Ahrenholz (Hrsg.), Fachunterricht und Deutsch als Zweitsprache, 15–35. Tübingen: Narr. Ahrenholz, Bernt (2013): Sprache im Fachunterricht untersuchen. In Charlotte Röhner & Britta Hövelbrinks (Hrsg.), Fachbezogene Sprachförderung in Deutsch als Zweitsprache. Theoretische Konzepte und empirische Befunde zum Erwerb bildungssprachlicher Kompetenzen, 75–86. Weinheim: Juventa. Ahrenholz, Bernt, Britta Hövelbrinks & Jessica Neumann (2017): Verben und Verbhaltiges in Schulbuchtexten der Sekundarstufe 1 (Biologie und Geographie). In Bernt Ahrenholz, Britta Hövelbrinks & Claudia Schmellentin (Hrsg.), Fachunterricht und Sprache in schulischen Lehr-/Lernprozessen, 15–36. Tübingen: Narr. Bailey, Alison L., Frances A. Butler, Robin Stevens & Carol Lord (2007): Further Specifying the Language Demands of School. In Alison L. Bailey (Hrsg.), The Language Demands of School. Putting Academic English to the Test, 103–156. New Haven, London: Yale University Press. Beckert, Christine & Britta Juska-Bacher (2015): Bildungssprachliche Kompetenzen bei Schulbeginn: Modellierung – Operationalisierung – Ergebnisse. Zeitschrift für Literaturwissenschaft und Linguistik 45 (178), 71–89. Berendes, Karin, Nina Dragon, Sabine Weinert, Birgit Heppt & Petra Stanat (2013): Hürde Bildungssprache? Eine Annäherung an das Konzept „Bildungssprache“ unter Einbezug aktueller empirischer Forschungsergebnisse. In Angelika Redder & Sabine Weinert (Hrsg.), Sprachförderung und Sprachdiagnostik. Interdisziplinäre Perspektiven, 17–41. Münster u. a.: Waxmann. Bos, Wilfried & Marcus Pietsch (Hrsg.) (2006): KESS 4: Kompetenzen und Einstellungen von Schülerinnen und Schülern. Jahrgangsstufe 4. Freie und Hansestadt Hamburg: Behörde für Bildung und Sport. Busch-Lauer, Ines (2016): Wie manifestiert sich Bildungssprache in deutschen Sach- und Lehrbuchtexten? Eine exemplarische diskursiv-textuelle Betrachtung. In Erwin Tschirner, Olaf Bärenfänger & Jupp Möhring (Hrsg.), Deutsch als fremde Bildungssprache. Das Spannungsfeld von Fachwissen, sprachlicher Kompetenz, Diagnostik und Didaktik,

516

Sarah L. Fornol und Britta Hövelbrinks

81–95. Reihe: Deutsch als Fremd- und Zweitsprache. Schriften des Herder-Instituts, Bd. 7. Tübingen: Stauffenburg. Cummins, Jim (1984): Bilingual Education and Special Education: Issues in Assessment and Pedagogy. San Diego: College Hill. Darsow, Annkathrin, Jennifer Paetsch & Anja Felbrich (2012): Konzeption und Umsetzung der fachbezogenen Sprachförderung im BeFo-Projekt. In Stefan Jeuk & Joachim Schäfer (Hrsg.), Deutsch als Zweitsprache in Kindertageseinrichtungen und Schulen, 215–234. Stuttgart: Fillibach bei Klett. Dehn, Mechthild (2011): Elementare Schriftkultur und Bildungssprache. In Sara Fürstenau & Mechtild Gomolla (Hrsg.), Migration und schulischer Wandel: Mehrsprachigkeit, 129–151. Wiesbaden: VS Verlag für Sozialwissenschaften. Eckhardt, Andrea G. (2008): Sprache als Barriere für den schulischen Erfolg. Potenzielle Schwierigkeiten beim Erwerb schulbezogener Sprache für Kinder mit Migrationshintergrund. Münster: Waxmann Verlag. Ehlich, Konrad (1994): Funktion und Struktur schriftlicher Kommunikation. In Günther Kartmut & Otto Ludwig (Hrsg.), Schrift und Schriftlichkeit. Writing and its use, 18–41. Bd. 1. Berlin, New York: de Gruyter. Feilke, Helmuth (2012): Bildungssprachliche Kompetenzen – fördern und entwickeln. Praxis Deutsch 233, 4–13. Fornol, Sarah (2015): Die Bedeutung sprachsensibler Unterrichtsgestaltung im Fachunterricht für bildungssprachliche Kompetenzentwicklung im Primarbereich. In İnci Dirim & Anke Wegner (Hrsg.), Mehrsprachigkeit und Bildungsgerechtigkeit, 86–99. Opladen: Budrich. Fornol, Sarah L. (2016): Bildungssprache – mehr als konzeptionelle Schriftlichkeit? In Friederike Heinzel & Katja Koch (Hrsg.), Individualisierung von Unterricht. Transformation – Wirkungen – Reflexionen. Jahrbuch Grundschulforschung, Bd. 21, 179–183. Wiesbaden: Springer. Fornol, Sarah (2017): Bildungssprachliche Kompetenzen in der Primarstufe im Medium der Schrift. In Bernt Ahrenholz, Britta Hövelbrinks & Claudia Schmellentin (Hrsg.), Fachunterricht und Sprache in schulischen Lehr-/Lernprozessen, 258–305. Tübingen: Narr. Fornol, Sarah L. (i. Vorb.): Bildungssprachliche Mittel in Schülertexten aus dem Sachunterricht der Primarstufe. Zeitschrift für Erziehungswissenschaften 13, 573–591. Gabler, Katrin, Birgit Heppt & Sofie Henschel (2017): Konzeption und Erprobung eines Fortbildungsansatzes zur fachintegrierten Sprachförderung im Sachunterricht. Poster, präsentiert auf der Tagung zum Projektabschluss: „Neue Perspektiven für die Lehrkräftebildung: Ergebnisse aus dem Projekt Sprachen – Bilden – Chancen“, Berlin. Gantefort, Christoph (2013): ‚Bildungssprache‘ – Merkmale und Fähigkeiten im sprachtheoretischen Kontext. In Ingrid Gogolin, Imke Lange, Ute Michel & Hans H. Reich (Hrsg.), Herausforderung Bildungssprache – und wie man sie meistert, 71–105. Münster u. a.: Waxmann. Gantefort, Christoph & Hans-Joachim Roth (2010): Sprachdiagnostische Grundlagen für die Förderung bildungssprachlicher Fähigkeiten. Zeitschrift für Erziehungswissenschaft 13 (4), 573–591. Gellert, Uwe (2011): Mediale Mündlichkeit und Dekontextualisierung. Zur Bedeutung und Spezifik von Bildungssprache im Mathematikunterricht der Grundschule. In Susanne Prediger & Erkan Özdil (Hrsg.), Mathematiklernen unter Bedingungen der Mehrsprachigkeit. Stand und Perspektiven der Forschung und Entwicklung in Deutschland, 97–116. Münster u. a.: Waxmann. Gogolin, Ingrid (2004): Zum Problem der Entwicklung von „Literalität“ durch die Schule. Eine Skizze interkultureller Bildungsforschung im Anschluss an PISA. Zeitschrift für Erziehungswissenschaft 7 (3), 101–111.

Bildungssprache

517

Gogolin, Ingrid (2006): Chancen und Risiken nach PISA – über die Bildungsbeteiligung von Migrantenkindern und Reformvorschläge. In Georg Auernheimer (Hrsg.), Schieflagen im Bildungssystem. Die Benachteiligung der Migrantenkinder. Bd. 2, 33–50. Wiesbaden: VS Verlag für Sozialwissenschaften. Gogolin, Ingrid; Neumann, Ursula & Hans-Joachim Roth (2007): Schulversuch bilinguale Grundschulklassen in Hamburg – Wissenschaftliche Begleitung. Bericht 2007. Abschlussbericht über die italienisch-deutschen, portugiesisch-deutschen und spanischdeutschen Modellklassen. Unter Mitarbeit von Annette Grevé & Thorsten Klinger. Hamburg. https://www.ew.uni-hamburg.de/ueber-die-fakultaet/personen/neumann/files/bericht-20070.pdf (30. 11. 2018). Gogolin, Ingrid & Hans-Joachim Roth (2007): Bilinguale Grundschule: Ein Beitrag zur Förderung der Mehrsprachigkeit. In Tanja Anstatt (Hrsg.), Mehrsprachigkeit bei Kindern und Erwachsenen – Erwerb – Formen – Förderung, 31–45. Tübingen: Attempto. Gogolin, Ingrid (2009): Zweisprachigkeit und die Entwicklung bildungssprachlicher Fähigkeiten. In Ingrid Gogolin & Ursula Neumann (Hrsg.), Streitfall Zweisprachigkeit – The Bilingualism Controversy, 263–280. Wiesbaden: VS Verlag für Sozialwissenschaften. Gogolin. Ingrid & Imke Lange (2011): Bildungssprache und Durchgängige Sprachbildung. In Sara Fürstenau & Mechtild Gomolla (Hrsg.), Migration und schulischer Wandel: Mehrsprachigkeit, 107–129. Wiesbaden: Springer. Gürsoy, Erkan, Claudia Benholz, Nadine Renk, Susanne Prediger & Andreas Büchter (2013): Erlös = Erlösung? Sprachliche und konzeptuelle Hürden in Prüfungsaufgaben zur Mathematik. Deutsch als Zweitsprache 1, 14–24. Hee, Katrin (2017): Schülerkommunikation zwischen Nähe und Distanz. Entwicklungsaspekte in Plenar- und Gruppenphasen des Geschichtsunterrichts. In Bernt Ahrenholz, Britta Hövelbrinks & Claudia Schmellentin (Hrsg.), Fachunterricht und Sprache in schulischen Lehr-/Lernprozessen, 205–224. Tübingen: Narr. Heinze, Aiso, Leonie Herwartz-Emden & Kristina Reiss (2007): Mathematikkenntnisse und sprachliche Kompetenz bei Kindern mit Migrationshintergrund zu Beginn der Grundschulzeit. Zeitschrift für Pädagogik 53 (4), 562–581. Heppt, Birgit, Petra Stanat, Nina Dragon, Karin Berendes & Sabine Weinert (2014): Bildungssprachliche Anforderungen und Hörverstehen bei Kindern mit deutscher und nichtdeutscher Familiensprache. Zeitschrift für Pädagogische Psychologie 28 (3), 139–149. Heppt, Birgit (2016): Verständnis von Bildungssprache bei Kindern mit deutscher und nichtdeutscher Familiensprache. http://edoc.hu-berlin.de/dissertationen/heppt-birgit-2016-05-23/ PDF/heppt.pdf (30. 11. 2018). Heppt, Birgit, Sofie Henschel & Nicole Haag (2016): Everyday and academic language comprehension: Investigating their relationships with school success and challenges for language minority learners. Learning and Individual Differences 47, 244–251. Hoover, Herbert D., Steven B. Dunbar & David A. Frisbie (2001): Iowa Test of Basic Skills. Itasca, IL: Riverside. Hövelbrinks, Britta (2014): Bildungssprachliche Kompetenz von einsprachig und mehrsprachig aufwachsenden Kindern. Eine vergleichende Studie in naturwissenschaftlicher Lernumgebung des ersten Schuljahres. Weinheim: Juventa. Jeuk, Stefan, Bescherer, Christine, Iris Kleinbub & Florian Hiller (2014): Förderung der Bildungssprache Deutsch im Deutsch im Deutsch- und Fachunterricht in der Sekundarstufe I auf der Grundlage förderdiagnostischer Verfahren. Projektposter. https://www.phludwigsburg.de/fileadmin/subsites/2b-spze-t-01/user_files/Forschung/mi-daz-Plakate-05Ludwigsburg.pdf (30. 11. 2018). Junk-Deppenmeier, Alexandra (2009): Sprachstandserhebungen bei Schülerinnen und Schülern mit Deutsch als Zweitsprache in der Sekundarstufe. In Stefan Jeuk & Ingrid Schmid-Barkow

518

Sarah L. Fornol und Britta Hövelbrinks

(Hrsg.), Differenzen diagnostizieren und Kompetenzen fördern im Deutschunterricht, 83–91. Freiburg/Br.: Fillibach. Juska-Bacher, Britta & Christine Beckert (2015): Bildungssprache am Schulanfang. Theoretische Herausforderungen – empirische Erkenntnisse – Förderperspektiven. Baltmannsweiler: Schneider Verlag Hohengehren. Juska-Bacher, Britta, Christine Beckert, Mathile Gyger, Sabrina Jakob & Hansjakob Schneider (2015): Leserelevante Kompetenzen an der Schwelle vom Kindergarten zur Schule. Zeitschrift für Literaturwissenschaft und Linguistik (45) 178, 28–42. Kleinschmidt, Katrin (2017): Die an die SchülerInnen gerichtete Sprache als Spiegel transitorischer schulsprachlicher Normen. In Bernt Ahrenholz, Britta Hövelbrinks & Claudia Schmellentin (Hrsg.), Fachunterricht und Sprache in schulischen Lehr-/Lernprozessen, 117–137. Tübingen: Narr. Koch, Peter & Wulf Oesterreicher (1985): Sprache der Nähe – Sprache der Distanz. Mündlichkeit und Schriftlichkeit im Spannungsfeld von Sprachtheorie und Sprachgeschichte. Romanistisches Jahrbuch 36, 15–43. Koch, Peter & Wulf Oesterreicher (1994): Schriftlichkeit und Sprache. In Günther Hartmut & Otto Ludwig (Hrsg.), Schrift und Schriftlichkeit. Writing and Its Use. Ein interdisziplinäres Handbuch internationaler Forschung. An Interdisciplinary Handbook of International Research, 587–604. Berlin, New York: de Gruyter. Köhne, Judith, Sibylle Kronenwerth, Angelika Redder, Elisabeth Schuth & Sabine Weinert (2015): Bildungssprachlicher Wortschatz – linguistische und psychologische Fundierung und Itementwicklung. In Angelika Redder, Johannes Naumann & Rosemarie Tracy (Hrsg.), Forschungsinitiative Sprachdiagnostik und Sprachförderung – Ergebnisse, 67–89. Münster u. a.: Waxmann. Kölbl, Carlos, Joachim Tiedemann & Elfriede Billmann-Mahecha (2006): Die Bedeutung der Lesekompetenz für Sachfächer. Psychologie in Erziehung und Unterricht 3, 201–212. Kotzerke, Marei, Vanessa Röhricht, Sabine Weinert & Susanne Ebert (2013): Sprachlich-kognitive Kompetenzunterschiede bei Schulanfängern und deren Auswirkungen bis Ende der Klassenstufe 2. In Gabriele Faust (Hrsg.), Einschulung. Ergebnisse aus der Studie „Bildungsprozesse, Kompetenzentwicklung und Selektionsentscheidungen im Vorschul- und Schulalter (BiKS)“, 111–135. Münster: Waxmann. Kuhl, Poldi, Peter Harych & Annette Vogt (2010): VERA 3: Vergleichsarbeiten in der Jahrgangsstufe 3 im Schuljahr 2009/2010. Länderbericht Berlin. Berlin: ISQ. Lange, Imke (2012): Von ‚Schülerisch‘ zu Bildungssprache. Übergänge zwischen Mündlichkeit und Schriftlichkeit im Konzept der Durchgängigen Sprachbildung. In Sara Fürstenau (Hrsg.), Interkulturelle Pädagogik und Sprachliche Bildung, 123–142. Wiesbaden: VS Verlag für Sozialwissenschaften. Leisen, Jürgen (2011): Sprachsensibler Fachunterricht. Ein Ansatz zur Sprachförderung im mathematisch-naturwissenschaftlichen Unterricht. In Susanne Prediger & Erkan Özdil (Hrsg.), Mathematiklernen unter Bedingungen der Mehrsprachigkeit. Stand und Perspektiven der Forschung und Entwicklung in Deutschland, 143–162. Münster u. a.: Waxmann. Lengyel, Drorit, Andreas Heintze, Hans H. Reich, Hans Joachim Roth & Heidi Scheinhardt-Stettner (2009): Prozessbegleitende Diagnose zur Schreibentwicklung: Beobachtung schriftlicher Sprachhandlungen in der Sekundarstufe I. In Drorit Lengyel, Hans H. Reich, Hans-Joachim Roth & Marion Döll (Hrsg.), Von der Sprachdiagnose zur Sprachförderung, 129–138. Münster u. a.: Waxmann. Leutner, Detlev, Eckhard Klieme, Katja Meyer & Joachim Wirth (2004): Problemlösen. In PISAKonsortium Deutschland (Hrsg.), PISA 2003. Der Bildungsstand der Jugendlichen in Deutschland − Ergebnisse des zweiten internationalen Vergleichs, 147–175. Münster: Waxmann.

Bildungssprache

519

MacGinitie, Walter H., Ruth K. MacGinitie, Maria, Katherine, Lois G. Dreyer & Kay E. Hughes (2000): Gates-MacGinitie Reading Test. 4. Aufl. Itasca, IL: Riverside. Marx, Nicole, Britta Ehrig & Linda Weiß (2016): Deutsch (stets) als fremde Bildungssprache. Bildungssprachliche Aufgabenprofilierung in der Sekundarstufe II. In Erwin Tschirner, Olaf Bärenfänger & Jupp Möhring (Hrsg.), Deutsch als fremde Bildungssprache. Das Spannungsfeld von Fachwissen, sprachlicher Kompetenz, Diagnostik und Didaktik, 201–222. Reihe: Deutsch als Fremd- und Zweitsprache. Schriften des Herder-Instituts, Bd. 7. Tübingen: Stauffenburg. Merkens, Hans (2007): Schulkarrieren von Kindern mit Migrationshintergrund in den ersten drei Jahren der Grundschule. Ergebnisse aus dem Projekt BeLesen: Berliner Längsschnittstudie zur Lesekompetenzentwicklung von Grundschulkindern. Berichte aus der Arbeit des Arbeitsbereiches Empirische Erziehungswissenschaft der Freien Universität Berlin, hrsg. von Hans Merkens & Folker Schmidt, Nr. 43. 3. Aufl. Berlin: Freie Universität Berlin. Michalak, Magdalena, Valerie Lemke & Marius Goeke (2015): Sprache im Fachunterricht. Eine Einführung in DaZ und sprachsensiblen Unterricht. Tübingen: Narr. Morek, Miriam & Vivien Heller (2012): Bildungssprache − Kommunikative, epistemische, soziale und interaktive Aspekte ihres Gebrauchs. Zeitschrift für angewandte Linguistik, 67–101. Nagy, William & Diana Townsend (2012): Words as Tools: Learning Academic Vocabulary as Language Acquisition. Reading Research Quarterly 47 (1), 91–108. Obermayer, Annika (2013): Bildungssprache im grafisch designten Schulbuch. Eine Analyse von Schulbüchern des Heimat- und Sachunterrichts. Bad Heilbrunn: Klinkhardt. Oleschko, Sven & Anastasia Moraitis (2012): Die Sprache im Schulbuch. Erste Überlegungen zur Entwicklung von Geschichts- und Politikschulbüchern unter Berücksichtigung sprachlicher Besonderheiten. Bildungsforschung 9 (1), 11–46. Ortner, Hanspeter (2006): Einige kognitive Probleme mit der Bildungssprache. Tribüne: Zeitschrift für Sprache und Schreibung 1, 12–27. Rank, Astrid (2016): Förderung der Bildungssprache bei Vor- und Grundschulkindern. In Elke Unckemann & Richard Sigel (Hrsg.), Diagnose und Förderung von bildungsbenachteiligten Kindern, 37–48. Bad Heilbrunn: Klinkhardt. Reich, Hans H. & Hans-Joachim Roth (2002): Spracherwerb zweisprachig aufwachsender Kinder und Jugendlicher. Ein Überblick über den Stand der nationalen und internationalen Forschung. https://www.foermig.uni-hamburg.de/pdf-dokumente/spracherwerb.pdf (30. 11. 2018). Reich, Hans H. (2008): Materialien zum Workshop „Bildungssprache“. Unveröffentlichtes Schulungsmaterial für die FörMig-Weiterqualifizierung „Berater(in) für sprachliche Bildung, Deutsch als Zweitsprache“. Hamburg: Universität. Reich, Hans H., Hans-Joachim Roth & Christoph Gantefort (2008): Der Sturz ins Tulpenbeet. Deutsche Sprachversion. Auswertungsbogen und Auswertungshinweise. In Thorsten Klinger, Knut Schwippert & Birgit Leiblein (Hrsg.), Evaluation im Modellprogramm FörMig, 209–237. Münster u. a.: Waxmann. Reich, Hans H., Hans-Joachim Roth & Marion Döll (2009): Fast Catch Bumerang. Deutsche Sprachversion. Auswertungsbogen und Auswertungshinweise. In Drorit Lengyel, Hans H. Reich, Hans-Joachim Roth & Marion Döll (Hrsg.), Von der Sprachdiagnose zur Sprachförderung, 209–241. Münster u. a.: Waxmann. Redder, Angelika, Knut Schwippert, Marcus Hasselhorn, Sabine Forschner, Detlef Fickermann, Konrad Ehlich, Michael Becker-Mrotzek, Marianne Krüger-Potratz, Hans-Günther Rossbach, Petra Stanat & Sabine Weinert (2011): Bilanz und Konzeptualisierung von strukturierter Forschung zu „Sprachdiagnostik und Sprachförderung“ ZUSE, Bd. 2. Hamburg. http:// epub.sub.uni-hamburg.de/epub/volltexte/2011/9874/pdf/zuse_berichte_02.pdf (30. 11. 2018).

520

Sarah L. Fornol und Britta Hövelbrinks

Riebling, Linda (2013): Sprachbildung im naturwissenschaftlichen Unterricht. Eine Studie im Kontext migrationsbedingter sprachlicher Heterogenität. Münster u. a.: Waxmann. Rincke, Karsten (2010): Alltagssprache, Fachsprache und ihre besonderen Bedeutungen für das Lernen. Zeitschrift für Didaktik der Naturwissenschaften 16, 235–260. Roth, Hans-Joachim (2015): Die Karriere der „Bildungssprache“ – kursorische Beobachtungen in historisch-systematischer Anmutung. In İnci Dirim, Ingrid Gogolin, Dagmar Knorr, Marianne Krüger-Potratz, Drorit Lengyel, Hans H. Reich & Wolfram Weiße (Hrsg.), Impulse für die Migrationsgesellschaft. Bildung, Politik und Religion, epub.sub.uni-hamburg.de/epub/ volltexte/2011/9874/pdf/zuse_berichte_02.pdf. Münster u. a.: Waxmann. Rösch, Heidi (2009): German as a Second Language. Linguistic and Didactic Foundations. In: Tanja Tajmel & Klaus Starl (Hrsg.), Science education unlimited. Approaches to equal opportunities in learning science, 149–168. Münster: Waxmann. Rösch, Heidi (2013): Integrative Sprachbildung im Bereich Deutsch als Zweitsprache. In Charlotte Röhner & Britta Hövelbrinks (Hrsg.), Fachbezogene Sprachförderung in Deutsch als Zweitsprache. Theoretische Konzepte und empirische Befunde zum Erwerb bildungssprachlicher Kompetenzen, 18–36. Weinheim: Juventa. Sächsisches Bildungsinstitut (2013): Niveaubeschreibungen Deutsch als Zweitsprache für die Sekundarstufe 1. Radebeul. https://publikationen.sachsen.de/bdb/artikel/14477/documents/ 26554 (30. 11. 2018). Scarcella, Robin (2003): Academic English: A Conceptual Framework. Irvine: University of California. Schleppegrell, Mary J. (2001): Linguistic Features of the Language of Schooling. Linguistics and Education 12 (4), 431–459. Schleppegrell, Mary J. (2004): The Language of Schooling. A Functional Linguistics Perspective. London: Erlbaum. Schmitt, Norbert, Diane Schmitt & Caroline Clapham (2001): Developing and exploring the behaviour of two new versions of the Vocabulary Levels Test. Language Testing 18, 55–88. Schulz, Petra & Rosemarie Tracy (2011): Linguistische Sprachstandserhebung – Deutsch als Zweitsprache (LiSe-DaZ). Göttingen: Hogrefe. Schuth, Elisabeth, Birgit Heppt, Judith Köhne, Sabine Weinert & Petra Stanat (2015): Die Erfassung schulisch relevanter Sprachkompetenzen bei Grundschulkindern. Entwicklung eines Testinstruments. In Angelika Redder, Johannes Naumann & Rosemarie Tracy (Hrsg.), Forschungsinitiative Sprachdiagnostik und Sprachförderung – Ergebnisse, 93–112. Münster u. a.: Waxmann. Snow, Catherine E., Joshua F. Lawrence & Claire White (2009): Generating Knowledge of Academic Language Among Urban Middle School Students. Journal of Research on Educational Effectiveness 2, 325–344. Stanat, Petra, Hans A. Pant, Katrin Böhme & Dirk Richter (2012): Kompetenzen von Schülerinnen und Schülern am Ende der vierten Jahrgangsstufe in den Fächern Deutsch und Mathematik. Ergebnisse des IQB-Ländervergleichs 2011. Münster: Waxmann. Thürmann, Eike (2013): Deutsch in allen Fächern: Überlegungen zur Förderung bildungssprachlicher Kompetenzen. In Silvia-Iris Beutel, Wilfried Bos & Raphaela Porsch (Hrsg.), Lernen in Vielfalt. Chance und Herausforderung für Schul- und Unterrichtsentwicklung, 133– 156. Münster u. a.: Waxmann. Tietze, Sabrina, Astrid Rank & Anja Wildemann (2016): Erfassung bildungssprachlicher Kompetenzen von Kindern im Vorschulalter. Grundlagen und Entwicklung einer Ratingskala (RaBi). http://www.pedocs.de/volltexte/2016/12076/pdf/Tietze_Rank_Wildemann_2016_ Erfassung_bildungssprachlicher_Kompetenzen.pdf (30. 11. 2018). Townsend, Dianna & Penny Collins (2009): Academic vocabulary and middle school English learners: an intervention study. Reading and Writing 22 (9), 993–1019.

Bildungssprache

521

Townsend, Dianna, Alexis Filippini, Penelope Collins & Gina Biancarosa (2012): Evidence for the importance of academic word knowledge for the academic achievement of diverse middle school students. The Elementary School Journal 112 (3), 497–518. Uccelli, Paola, Christopher D. Barr, Christina L. Dobbs, Emily P. Galloway, Alejandra Meneses & Emilio Sanchez (2015): Core Academic Language Skills (CALS): An expanded operational construct and a novel instrument to chart school-relevant language proficiency in preadolescent and adolescent learners. Applied Psycholinguistics 36, 1077–1109. Vollmer, Helmut Johannes & Eike Thürmann (2013): Sprachbildung und Bildungssprache als Aufgabe aller Fächer der Regelschule. In Michael Becker-Mrotzek, Karen Schramm, Eike Thürmann & Helmut Johannes Vollmer (Hrsg.), Sprache im Fach. Sprachlichkeit und fachliches Lernen, 41–57. Münster u. a.: Waxmann. Webersik, Julia (2015): Gesprochene Schulsprache in der Primarstufe. Ein empirisches Verfahren zur Evaluation von Fördereffekten im Bereich Deutsch als Zweitsprache. Reihe: DaZForschung, Bd. 9. Berlin u. a.: De Gruyter Mouton. Weinert, Sabine, Petra Stanat, Angelika Redder, Nina Dragon, Birgit Heppt & Stella Uesseler (2014): Verbundvorhaben: Bildungssprachliche Kompetenzen (BiSpra): Anforderungen, Sprachverarbeitung und Diagnostik. Schlussbericht 2013. Bamberg u. a.: Otto-Friedrich Universität Bamberg u. a. http://edok01.tib.uni-hannover.de/edoks/e01fb14/797960236.pdf (30. 11. 2018). Weinert, Sabine, Petra Stanat, Birgit Heppt & Elisabeth Schuth (2016): Bildungssprachliche Kompetenzen (BiSpra): Anforderungen, Sprachverarbeitung und Diagnostik (Verbundvorhaben). Schlussbericht 2016. Bamberg u. a.: Otto-Friedrich Universität Bamberg u. a. Wildemann, Anja, Astrid Rank, Andreas Hartinger & Sabrina Sutter (2016): Bildungssprachliche im Kontext kindlicher Entwicklung. Eine Studie zur Erfassung früher bildungssprachlicher Fähigkeiten. DDS – Die Deutsche Schule 13, 65–81.

IV Ausgewählte diagnostische Verfahrensgruppen

Jennifer Paetsch

21 Psychometrische Testverfahren 1 2 3 4 5

Einleitung Kriterien pädagogisch-psychologischer Diagnostik Messtheoretische Grundlagen von Testverfahren Besonderheiten der Sprachdiagnostik bei mehrsprachigen Kindern Psychometrische Testverfahren zur Erfassung sprachlicher Fähigkeiten

1 Einleitung Bei einem Teil der Kinder und Jugendlichen, die in Deutschland mehrsprachig aufwachsen, scheint die Aneignung des Deutschen als Zweitsprache mit Schwierigkeiten verbunden zu sein; viele Kinder kommen mit nicht ausreichenden Kenntnissen der deutschen Sprache in die Schule. Das betrifft nicht nur Kinder und Jugendliche, die selbst eingewandert sind, sondern auch solche, die aus unterschiedlichen Gründen wenig Spracherfahrung in der deutschen Sprache aufweisen (z. B. Dubowy et al. 2008: 128). Es ist unumstritten, dass diese Kinder Unterstützungsmaßnahmen in Form von Förderangeboten erhalten müssen, damit sie Bildungsprozesse erfolgreich bewältigen können. Um Heranwachsende in ihrem Aneignungsprozess der Instruktionssprache gezielt zu unterstützen, müssen die Förderangebote nicht nur an sprachlichen Zielen, sondern auch an dem jeweiligen Sprachstand der Lernenden ausgerichtet werden (z. B. Kniffka & Siebert-Ott 2009: 117). Der Einsatz geeigneter diagnostischer Verfahren zur Erfassung der individuellen Voraussetzungen ist dabei von großer Bedeutung für den Erfolg pädagogischen Handelns (z. B. Ingenkamp & Lissmann 2005: 21). In der Forschung zu diagnostischer Kompetenz von Lehrkräften wird argumentiert, dass Unterricht nur dann erfolgreich sein kann, wenn eine Passung zwischen den Voraussetzungen der Schülerinnen und Schüler und der Unterrichtsgestaltung vorliegt (z. B. Südkamp, Möller & Pohlmann 2008: 743–744). Den Ausgangspunkt für Maßnahmen zur Förderung sprachlicher Kompetenzen sollte demzufolge der präzise erhobene und dokumentierte (sprachliche) Entwicklungsstand der Lernenden bilden. Standardisierten Testverfahren, die psychometrischen Gütekriterien entsprechen, kommt hierbei eine zentrale Rolle zu, da sie ermöglichen, sprachliche Kompetenzen objektiv, reliabel und valide zu erfassen. Aber nicht nur die präzise (d. h. wenig messfehlerbehaftete) Bestimmung des Entwicklungsstandes in verschiedenen sprachlichen Bereichen, sondern auch der Vergleich der Kompetenzen eines Schülers oder einer Schülerin mit denen anderer Kinder und Jugendlichen gleichen Alters wird durch den Einsatz psychometrischer Testverfahren möglich. Der folgende Beitrag verfolgt das Ziel, Möglichkeiten und Grenzen des Einsatzes psychometrischer Testverfahren zur Diagnostik von Kompetenzen in der Zweitsprache https://doi.org/10.1515/9783110418712-021

526

Jennifer Paetsch

aufzuzeigen. Im Folgenden werden zunächst allgemeine Kriterien pädagogischpsychologischer Diagnostik dargestellt, da sie die theoretische Grundlage für den Einsatz von Testverfahren bilden. Im Anschluss werden Qualitätskriterien psychometrischer Testverfahren aufgeführt und erläutert. Darauffolgend wird auf einige Besonderheiten bzgl. der Sprachdiagnostik bei mehrsprachigen Kindern eingegangen. Abschließend werden einige ausgewählte psychometrische Verfahren für den Einsatz im Schulalter und ihre Gütekriterien vorgestellt.

2 Kriterien pädagogisch-psychologischer Diagnostik Testverfahren, die psychometrischen Kriterien (vgl. Abschnitt 3 in diesem Beitrag) genügen, sind ein wichtiges Instrument pädagogisch-psychologischer Diagnostik, deren Grundprinzipien deshalb im Folgenden erläutert werden. Im Vergleich zur informellen Diagnostik, die in der Regel implizit, beiläufig und unsystematisch erfolgt, zeichnet sich pädagogisch-psychologische Diagnostik durch einen reflektierten, methodisch kontrollierten Prozess aus, bei dem wissenschaftlich erprobte Verfahren zur Anwendung kommen (Ingenkamp & Lissmann 2005: 13–14; Schrader 2001: 102). Pädagogisch-psychologische Diagnostik beruht dabei auf einem theoretisch begründbaren System von Regeln und verfolgt das Ziel, Daten zur Beantwortung der diagnostischen Fragestellung zu generieren. Dass pädagogisch-psychologische Diagnostik für die pädagogische Praxis bedeutsam ist, wird durch Forschungsbefunde gestützt, die zeigen, dass Lehrerurteile vielfach nicht objektiv, nicht reliabel und nicht valide sind; zudem scheint es Lehrkräften schwer zu fallen, Leistungen klassenübergreifend zu beurteilen (vgl. Ingenkamp & Lissmann 2005: 137–155). Pädagogisch-psychologische Diagnostik zeichnet sich dabei durch einige zentrale allgemeine Kriterien aus, die es zu berücksichtigen gilt. Nach Hesse & Latzko (2009: 60; hier am Beispiel der Diagnostik von Lesekompetenz veranschaulicht) sind dies: – Die zu messenden Merkmale sollen theoretisch präzisiert sein. (z. B.: Was versteht man unter Lesekompetenz? Wie grenzt sich Lesekompetenz von anderen sprachlichen Kompetenzbereichen ab?) – Die messtheoretischen Annahmen sollen geklärt sein. (z. B.: Wie wird Lesekompetenz in den ausgewählten diagnostischen Verfahren, dies kann z. B. ein bestimmter Test oder ein Beobachtungsverfahren sein, operationalisiert, d. h. erfasst? Welche Einschränkungen sind mit der Operationalisierung, auch vor dem Hintergrund der Zielgruppe, verbunden?) – Die konkreten Messoperationen sollen expliziert und standardisiert sein. (z. B.: Die Bedingungen des diagnostischen Prozesses zur Erfassung der Lesekompetenz sollten für alle Schülerinnen und Schüler gleich sein.) – Es soll eine Orientierung an den Gütekriterien (und im besten Fall deren Erfüllung) gewährleistet sein. (z. B.: Wie ist die Objektivität, Reliabilität und Validität

Psychometrische Testverfahren

–

–

–

527

des eingesetzten diagnostischen Verfahrens zur Erfassung der Lesekompetenz zu beurteilen?) (vgl. Abschnitt 3) Es sollten Maßstäbe zur Beurteilung individueller Messergebnisse bereitgestellt werden. (z. B.: Die Ausprägung der Lesekompetenz eines Schülers oder einer Schülerin kann aufgrund eines vorher definierten Maßstabes, d. h. einer kriterialen oder sozialen Bezugsnorm, interpretiert werden. Die soziale Bezugsnorm dient dem Vergleich eines getesteten Schülers mit einer Gruppe vergleichbarer Schülerinnen und Schüler, wohingegen die kriteriale Bezugsnorm dem Vergleich mit einem festgesetzten Kriterium dient, welches einer bestimmten Fähigkeitsausprägung der Lesekompetenz entspricht.) Die Kontextbedingungen werden im diagnostischen Prozess mitberücksichtigt. (z. B.: Der Gesamtzusammenhang, in dem die Lesekompetenz diagnostiziert wurde, wird bei der Interpretation des Ergebnisses eines Lernenden berücksichtigt. Hierzu zählen beispielsweise auch individuelle Spracherwerbsbedingungen.) Diagnostische Aussagen werden verifiziert. (z. B.: Die Richtigkeit der diagnostizierten Lesekompetenz wird durch das Beschaffen von weiteren Informationen beurteilt. Hier wird die Prozesshaftigkeit pädagogisch-psychologischer Diagnostik deutlich.)

Die hier aufgeführten Kriterien (Hesse & Latzko 2009: 60) lassen erkennen, dass umfangreiches Wissen über wissenschaftlich fundierte diagnostische Verfahren eine notwendige Voraussetzung für professionelles pädagogisches Handeln darstellt. Kritisch anzumerken ist jedoch, dass in der Praxis sicherlich nicht immer alle Kriterien erfüllt werden können und auch informelle Urteile und Verfahren für die Steuerung des pädagogischen Handelns unverzichtbar sind. Informelle Urteile können dabei von den Lehrkräften als diagnostische Hypothesen betrachtet werden, die der Absicherung und Korrektur formaler Diagnosen bedürfen. In der pädagogischen Praxis ist es also von großer Bedeutung informelle und formelle Diagnoseprozesse miteinander zu verbinden (Schrader 2001: 107). Inwieweit ein bestimmtes diagnostisches Verfahren geeignet ist, Lehrkräfte oder andere pädagogische Fachkräfte zu einem fachlich-kompetenten Handeln zu befähigen, hängt von seiner Qualität ab. Diese lässt sich mit Hilfe von Standards bestimmen (vgl. Abschnitte 3 und 4 in diesem Beitrag). Ein wichtiger Aspekt pädagogisch-psychologischer Diagnostik ist die Berücksichtigung der Zielsetzung bzw. der verfolgten Strategie (vgl. Ingenkamp & Lissmann 2005: 37–38). So dient eine Diagnostik sprachlicher Kompetenzen von Heranwachsenden, die mehrsprachig aufwachsen, in der Regel nicht nur dazu, den Sprachstand der Lernenden möglichst zutreffend zu bestimmen. Vielmehr steht häufig eine förderdiagnostische Zielsetzung, d. h. die Frage, wie Schülerinnen und Schüler bestmöglich in ihrem Spracherwerbsprozess unterstützt werden können, im Fokus. Im Gegensatz zur Selektionsdiagnostik, deren Ziel es ist, Kinder und Jugend-

528

Jennifer Paetsch

liche, die eine Sprachförderung benötigen, überhaupt erst einmal zu identifizieren, hat die Förderdiagnostik zur Aufgabe, Lernumgebungen passend zu gestalten. Lehrkräfte und andere pädagogische Fachkräfte erfassen, analysieren und interpretieren die im diagnostischen Prozess gewonnenen Erkenntnisse demzufolge, um Entscheidungen für die Ausgestaltung ihres pädagogischen Handelns begründet treffen zu können. Um Anhaltspunkte gewinnen zu können, wie eine individuelle Förderung gestaltet werden sollte, z. B. um bestimmte sprachliche Kompetenzbereiche für die Förderung auswählen zu können und um Lernziele festzulegen, müssen vielfältige Informationen berücksichtigt werden. Ergebnisse aus standardisierten Testverfahren können hier Hinweise geben, werden jedoch idealerweise durch qualitative diagnostische Verfahren oder Auswertungen ergänzt, da letztere wesentliche Aspekte des Entwicklungsverlaufes aufdecken können, denn „ohne eine qualitative Analyse von Fehlern oder zumindest eine transparente Liste von sprachlichen Fehlhandlungen des Kindes ist eine seriöse Förderplanung nur schwer umzusetzen“ (Bredel 2007: 90). Auch innerhalb psychometrischer Verfahren gibt es manchmal die Möglichkeit qualitativer Auswertungen (z. B. May 2002). Lehrkräfte und andere pädagogische Fachkräfte, die den förderdiagnostischen Prozess gestalten, müssen hierfür über umfangreiches Wissen zum Sprachaneignungsprozess verfügen, und zwar nicht nur, um zu entscheiden, welche Testverfahren sinnvoll eingesetzt werden können, sondern auch, um die Ergebnisse angemessen interpretieren und Hinweise für die Gestaltung der Förderung ableiten zu können (vgl. Jeuk 2009: 62–65).

3 Messtheoretische Grundlagen von Testverfahren Im wissenschaftlichen Sprachgebrauch wird unter einem Test ein nach festgelegten Methoden und nach bestimmten Regeln durchzuführendes Untersuchungsverfahren verstanden, mit dem Informationen über die Ausprägung eines individuellen Merkmals gewonnen werden und dessen Ergebnis in der Regel in Zahlenwerten ausgedrückt wird (Lienert & Ratz 1998: 1). Für den pädagogischen Kontext definieren Ingenkamp & Lissman (2005) Tests als Verfahren der Pädagogischen Diagnostik, mit deren Hilfe eine Verhaltensstichprobe, die Voraussetzungen für oder Ergebnisse von Lernprozessen repräsentieren soll, möglichst vergleichbar, objektiv, zuverlässig und gültig gemessen und durch Lehrer oder Erzieher ausgewertet, interpretiert und für ihr pädagogisches Handeln nutzbar gemacht werden kann. (Ingenkamp & Lissmann 2005: 105)

In ihrer Definition beziehen Ingenkamp & Lismann (2005) die Erfüllung der Gütekriterien bereits mit ein. Im Unterschied zu einem informellen Test zeichnet sich ein psychometrischer Test dadurch aus, dass er hinsichtlich der Erfüllung dieser Testgütekriterien empirisch überprüft wurde (Moosbrugger & Kelava 2012: 8; Rost 2004: 17).

Psychometrische Testverfahren

529

Die theoretische Grundlage der Kriterien, mit denen die Güte von Testverfahren bestimmt werden kann, bildet die Klassische Testtheorie (Lienert & Raatz 1998). Eine Grundannahme dieser ist es, dass beim Messen von Konstrukten (z. B. Lesekompetenz, Wortschatzkenntnis, Intelligenz) der wahre Wert der Ausprägung einer Person nicht direkt erfasst werden kann, sondern über den beobachteten Wert erschlossen werden muss. Dabei gilt, dass Messungen immer fehlerbehaftet sind, sodass sich der beobachtete Wert aus dem wahren Wert und dem Messfehler additiv zusammensetzt. Fehlerquellen müssen dementsprechend minimiert werden, z. B. durch Standardisierung des Messvorgangs. Fehler beim Messen von sprachlichen Kompetenzen können vielfältig auftreten, beispielsweise wenn das Ergebnis eines Beobachtungsbogens zur Erfassung des Sprachstandes stark von der Quantität der Sprachproduktion eines Kinds abhängt oder wenn während der Untersuchungssituation einigen Schülerinnen und Schülern Hilfen gegeben werden, anderen hingegen nicht. Zu berücksichtigen ist weiterhin, dass fehlende Motivation oder Aufmerksamkeit von Schülerinnen und Schülern eine Quelle für Fehler im diagnostischen Prozess sein können (z. B. Brown & Walberg 1993). Um die Qualität eines Testverfahrens einschätzen zu können, sind Informationen über die Gütekriterien des Verfahrens heranzuziehen. Psychometrische Testverfahren sind dadurch gekennzeichnet, dass ihre Gütekriterien systematisch überprüft wurden, d. h. der Fehleranteil der Messwerte kann beziffert werden (z. B. Hesse & Latzko 2009: 70). Dabei gilt, dass ein Instrument immer nur in Abhängigkeit vom Untersuchungszweck, für den es eingesetzt werden soll, beurteilt werden kann. So hängt es maßgeblich von den aus der Diagnostik resultierenden Entscheidungen und weiteren Konsequenzen ab, wie viel Unsicherheit aufgrund von messfehlerbehafteten Werten als akzeptabel angenommen wird. Neben den Hauptgütekriterien Objektivität, Reliabilität und Validität existieren eine Reihe von Nebengütekriterien zur Beurteilung psychologischer Testverfahren (eine ausführliche Beschreibung findet sich beispielsweise bei Amelang & SchmidtAtzert 2006; Bühner 2010; Moosbrugger & Kelava 2012). Die Beurteilung der Nebengütekriterien erfordert den Einbezug von Kontextbedingungen, womit eine gewisse Flexibilität eingeräumt wird. Bei den Hauptgütekriterien, die von zentraler Bedeutung für die Qualität von Tests sind, orientiert sich die Beurteilung hingegen an strengen Maßstäben. Diese Kriterien betreffen überwiegend technische Eigenschaften, welche die Instrumente mehr oder weniger unabhängig von den Rahmenbedingungen ihres Einsatzes kennzeichnen und die im Testmanual ausführlich dargelegt werden (Amelang & Schmidt-Atzert 2006: 137–138). Im Folgenden werden zunächst die Hauptgütekriterien und anschließend einige zentrale Nebengütekriterien überblicksartig dargestellt. Unter dem Hauptgütekriterium der Objektivität versteht man die Unabhängigkeit der Untersuchungsergebnisse von der Person, die eine Untersuchung vorgenommen hat. Dies gilt für die Durchführung, Auswertung und Interpretation der Ergebnisse eines Verfahrens. Ein Verfahren ist also dann objektiv, wenn zwei ver-

530

Jennifer Paetsch

schiedene Lehrkräfte zu dem gleichen Ergebnis kommen und dieses auch gleich interpretieren. Wenn ein Test standardisiert ist, d. h. wenn die Durchführungs-, Auswertungs- und Interpretationsbedingungen von den Testautoren festgelegt und im Testmanual beschrieben sind (z. B. durch schriftliche Instruktionen, eindeutige Auswertungsrichtlinien, Schablonen), dann steigt die Wahrscheinlichkeit für eine hohe Objektivität (Moosbrugger & Kelava 2012: 8–10). Ein weiteres Hauptgütekriterium ist die Reliabilität, d. h. die Messgenauigkeit oder Zuverlässigkeit eines Verfahrens. Messungen sind dann zuverlässig, wenn die Ergebnisse möglichst wenig mit Messfehlern behaftet sind. Die Reliabilität eines Tests wird über den sog. Reliabilitätskoeffizienten angegeben, der einen Wert zwischen Null und Eins annehmen kann. Es gibt verschiedene Methoden der Bestimmung der Reliabilität (z. B. Messwiederholungsreliabilität, Testhalbierungsreliabilität, interne Konsistenz). Allgemein gilt, dass der Reliabilitätskoeffizient eines guten Tests 0.7 nicht unterschreiten sollte (vgl. Schermelleh-Engel & Werner 2012: 129– 131). Das Gütekriterium der Validität (Gültigkeit) betrifft die Frage, ob das Merkmal, das man messen will, mit dem durch den Test tatsächlich gemessenen Merkmal übereinstimmt. Messungen sind dann valide, wenn der Test das zu messende Merkmal repräsentiert. Zur Beurteilung der Validität werden verschiedene Aspekte herangezogen, z. B. wie das Merkmal durch die Testaufgaben operationalisiert wurde. Für Lesekompetenz wäre beispielsweise zu prüfen, ob die Testaufgaben das Merkmal Lesekompetenz inhaltlich repräsentativ abbilden und bspw. nicht vielmehr das Vorwissen der Schülerinnen und Schüler erfassen (sog. Inhaltsvalidität). Bei einem Sprachstandsfeststellungsverfahren wäre zu prüfen, ob die Aufgaben des Tests die zentralen sprachlichen Teilkompetenzen angemessen abdecken. Bei einem Test, der vorgibt Grammatikkompetenz zu erfassen, sollte gewährleistet sein, dass das Ergebnis nicht durch die Lesekompetenzen der Kinder beeinflusst wird. Mit der sog. prognostischen Validität wird geprüft, ob die Testergebnisse in zutreffender Weise Aussagen über die weitere Sprachentwicklung erlauben. Weiterhin werden zur Validitätsüberprüfung Übereinstimmungen mit Ergebnissen aus anderen verfügbaren Tests für gleiche oder ähnliche Merkmale oder mit relevanten Außenkriterien (z. B. Schulnoten, Lehrkräfteeinschätzungen) ermittelt. Zur Quantifizierung der Übereinstimmung werden die Zusammenhänge der Verfahren mittels Korrelationen berechnet und als Hinweise für die Kriteriumsvalidität interpretiert. Die Konstruktvalidität gibt Auskunft darüber, ob die Testaufgaben das theoretische Konstrukt (z. B. Lesekompetenz, Wortschatzkenntnis) abbilden und betrifft somit die theoretische Einordnung und Fundierung des von einem Test gemessenen Merkmals (vgl. Bortz & Döring 2003: 201–202; Lienert & Raatz 1998: 226; Hartig, Frey & Jude 2012: 145). Wichtige Nebengütekriterien sind unter anderem Ökonomie, Nützlichkeit, Testfairness und Normierung. So ist ein Testverfahren ökonomisch, wenn die benötigte Zeit und die benötigten Ressourcen für dessen Einsatz möglichst gering sind. Ausschlaggebend für die Beurteilung der Ökonomie ist zudem, ob das Verfahren auch

Psychometrische Testverfahren

531

in der Gruppe anzuwenden ist und wie viel Aufwand das Einarbeiten für den Testanwender ist. Das Nebengütekriterium der Nützlichkeit bezieht sich auf die Frage, inwieweit das gemessene Merkmal von praktischer Relevanz ist. Nützlichkeit sollte deshalb vor dem Hintergrund des konkreten Anwendungsfalls beurteilt werden. Als fair kann ein Test dann angesehen werden, wenn keine systematische Benachteiligung bestimmter Personen erfolgt. Dabei können Nachteile beispielsweise im Hinblick auf den soziokulturellen, ethnischen oder geschlechtsspezifischen Hintergrund einer Person entstehen. Allerdings handelt es sich „bei Fairness nicht um eine technische Qualität, die einem Instrument zu eigen ist oder nicht. Es gibt nicht den fairen Test oder das faire Selektionsverfahren, sondern nur Fairness im Hinblick auf Handlungs- und Entscheidungsaspekte (die expliziert werden müssen)“ (Amelang & Schmidt-Atzert 2006: 167). Unter der Normierung oder Eichung eines Tests versteht man das Erstellen eines Bezugssystems, mit dessen Hilfe die Ergebnisse einer Testperson im Vergleich zu denen anderer Personen (eine größere und meist repräsentative Stichprobe) eingeordnet und interpretiert werden können. Zur Beurteilung einer Testleistung ist immer ein Bezugssystem notwendig. So ist eine Testleistung von 45 Punkten (von max. 50 zu erreichenden Punkten) allem Anschein nach als gut zu bewerten. Wissen wir jedoch, dass der Test sehr leicht war und 90 % der Personen mehr als 45 Aufgaben richtig gelöst haben, kommen wir zu einer anderen Interpretation. Die Rohwerte eines Tests sind für sich genommen also nur wenig informativ (z. B. Krohne & Hock 2015: 75–76). Notwendig ist vielmehr ein Bezugsrahmen, der Auskunft darüber gibt, was die im Test ermittelten Rohpunktwerte bedeuten. Ziel einer Normierung ist es, möglichst aussagekräftige Vergleichswerte von solchen Personen zu erhalten, die der Testperson hinsichtlich relevanter Merkmale (z. B. Alter, Geschlecht, Schulform) ähnlich sind. Die für die Normierung erhobene Vergleichsstichprobe (sog. Normierungs- oder Eichstichprobe) muss möglichst repräsentativ für die Grundgesamtheit von Personen sein, für die der Test anwendbar sein soll. Die Verteilung der Rohwerte in der Normierungsstichprobe liefert die Grundlage für die Normen, die an individuelle Testwerte angelegt werden (z. B. Krohne & Hock 2015: 76). Anhand von Normtabellen kann dann die Leistung eines Schülers oder einer Schülerin mit ihrer Bezugsgruppe (z. B. Alters- oder Geschlechtergruppe) in Beziehung gesetzt werden. Soll beispielsweise der Sprachstand eines Kindes beurteilt werden, dann können seine Leistungen mit denen der Altersgruppe verglichen werden. Es bestehen verschiedene Formen, in denen Normen vorliegen können. Am häufigsten sind Standardnormen und Prozentrangwerte. Standardnormen liefern Werte auf einer Skala, aus der die Position einer Person relativ zum Mittelwert und der Streuung der Vergleichsgruppe direkt zu erkennen ist. Das bekannteste Beispiel ist die IQ-Skala, deren Mittelwert bei 100 und deren Standardabweichung1 bei 15 liegt. In Kompetenz1 Die Standardabweichung ist ein statistisches Maß für die Variabilität/Streuung von Messwerten. Sie gibt an, wie stark die Messwerte durchschnittlich vom arithmetischen Mittel (Mittelwert) abweichen (Rost 2013: 57).

532

Jennifer Paetsch

tests findet häufig die T-Skala Verwendung, mit einem Mittelwert von 50 und einer Standardabweichung von 10. Zusätzlich zur Information, welche Standardnormwerte den möglichen Rohwerten zuzuordnen sind, erhält man in den Testmanualen Informationen über das Ausmaß des Messfehlers. Zu den Testergebnissen lassen sich somit Konfidenz- bzw. Vertrauensintervalle angeben; in der Regel wird ein 90- oder 95-Prozent-Intervall verwendet. Dadurch lassen sich Aussagen formulieren wie: Das Testergebnis liegt mit einer 95 %-Wahrscheinlichkeit zwischen T = 36 und T = 44 (was einer unterdurchschnittlichen bis durchschnittlichen Leistung entspricht, z. B. Krohne & Hock 2015: 78). Alternativ zu den Standardnormen werden in psychometrischen Tests häufig auch Prozentränge verwendet. Sie geben an, wie viel Prozent der Personen in der Referenzgruppe geringere oder gleiche Merkmalsausprägungen aufweisen. Hat ein Kind beispielsweise einen Prozentrang von 60 bedeutet dies, dass 60 % der Referenzgruppe niedrigere Ausprägungen auf dem untersuchten Merkmal haben und 40 % höhere Ausprägungen aufweisen (z. B. Krohne & Hock 2015: 79; Rost 2013: 57). Zu beachten gilt, dass Normen aktuell sein müssen, da das Leistungsniveau durch gesellschaftlichen Wandel beeinflusst wird. Standardisierte Verfahren werden deshalb in angemessenen Zeitabständen neu normiert (z. B. Moosbrugger & Kelava 2012: 20). Normen sind zudem immer nur für einen bestimmten definierten Personenkreis gültig (z. B. Schülerinnen und Schüler zu Beginn der fünften Jahrgangsstufe eines Gymnasiums) und können nur einen Bezugsrahmen in Hinblick auf genau diese Population bilden. Zusammenfassend lässt sich feststellen, dass die Gütekriterien eines Testverfahrens wichtige Informationen im Hinblick auf seine generelle Eignung (vgl. Abschnitt 2 in diesem Beitrag) liefern (z. B. angemessene Testdauer, einfache und standardisierte Durchführung, ausreichend hohe Reliabilität und Validität, Normierung an einer geeigneten Referenzstichprobe). Im Rahmen der Diagnostik sprachlicher Kompetenzen bei mehrsprachigen Kindern und Jugendlichen kommen weitere wichtige Aspekte zum Tragen, die im Folgenden erläutert werden.

4 Besonderheiten der Sprachdiagnostik bei mehrsprachigen Kindern Die Frage, wie sprachliche Kompetenzen von mehrsprachigen Schülerinnen und Schülern möglichst fair und valide diagnostiziert werden können, ist von enormer Bedeutung für den förderdiagnostischen Prozess (z. B. Bredel 2007). Zur Beurteilung der Frage, ob ein Test zur Erfassung sprachlicher Kompetenzen auch für mehrsprachig aufwachsende Kinder und Jugendliche geeignet ist, müssen über die Gütekriterien hinaus weitere Aspekte berücksichtigt werden. Um Informationen für die Gestaltung einer optimalen Lernumgebung zur Förderung sprachlicher Kompetenzen

Psychometrische Testverfahren

533

aus den diagnostischen Ergebnissen ableiten zu können, darf die Aufmerksamkeit nicht nur auf die sprachlichen Defizite eines Kindes gerichtet werden, sondern muss gerade auch individuelle Stärken und Ressourcen aufdecken (vgl. Ingenkamp & Lissmann 2005: 16; Knauer 2003). Dies gilt es bei dem Einsatz psychometrischer Testverfahren zu berücksichtigen. In der Vergangenheit wurde bereits mehrfach darauf hingewiesen, dass Testverfahren, die für den Einsatz bei monolingual deutschsprachigen Schülerinnen und Schülern entwickelt wurden, nicht ohne weiteres auf mehrsprachige Schülerinnen und Schüler übertragen werden können (z. B. Jeuk 2009: 64–65). Ein Grund hierfür sind Unterschiede in den Erwerbsbedingungen, die nicht nur zwischen ein- und mehrsprachigen Kindern, sondern auch innerhalb der Gruppe der mehrsprachigen Schülerinnen und Schüler bestehen. Deshalb wird zunehmend gefordert, dass bei der Entwicklung diagnostischer Instrumente die heterogenen Erwerbsbedingungen von mehrsprachigen Kindern und Jugendlichen berücksichtigt werden sollten. So ist davon auszugehen, dass sich ein- und mehrsprachige Kinder in ihrem kulturell geprägten Erfahrungs- und Weltwissen voneinander unterscheiden (z. B. Schulz 2013: 192–193). Um eine faire Messung sprachlicher Fähigkeiten zu gewährleisten, müssen die Inhalte eines Testes jedoch allen Schülerinnen und Schülern gleichermaßen bekannt oder unbekannt sein. Deshalb sollten beispielsweise keine kulturspezifischen Alltags- oder Feiertagsroutinen in einem Test vorkommen (vgl. z. B. Schölmerich & Leyendecker 2009: 433–435). Weiterhin gilt es zu berücksichtigen, dass die Inhalte eines Testverfahrens die Motivation der Kinder und Jugendlichen beeinflussen können. Die Frage, ob die Inhalte eines Tests, der in erster Linie für monolingual aufgewachsene Kinder im deutschen Kulturkreis entwickelt wurde, auch mehrsprachige Kinder ansprechen, ist in der Praxis häufig schwierig zu beurteilen. Testentwickler orientieren sich bislang vielfach an Oberflächenmerkmalen, wie z. B. die Verwendung von Namen verschiedener Herkunftssprachen.

4.1 Die Wahl der Bezugsgruppe Beim Einsatz normierter Verfahren zur Erfassung sprachlicher Kompetenzen bei mehrsprachigen Kindern und Jugendlichen stellt sich die Frage nach der angemessenen Bezugsgruppe (vgl. Kany & Schöler 2010: 90–91). Standardisierte Tests enthalten in der Regel Normen für verschiedene Altersgruppen oder Jahrgangsstufen sowie getrennte Normen für Mädchen und Jungen. Häufig werden diese Normen auch als Vergleichs- und Bewertungsmaßstab für Zweitsprachenlernende eingesetzt, was bedeutet, dass Zweitsprachenlernende mit den sprachlichen Kompetenzen von einsprachigen Kindern verglichen werden. In der Folge werden die sprachlichen Kompetenzen von mehrsprachigen Kindern und Jugendlichen im Vergleich zu den Kompetenzen der einsprachig Heranwachsenden gleichen Alters eingestuft, ohne die jeweiligen Erwerbsbedingungen zu berücksichtigen. Wird eine Vergleichsmöglichkeit mit anderen mehrsprachig aufgewachsenen Lernenden angestrebt,

534

Jennifer Paetsch

muss dies bei der Wahl des Testinstrumentes berücksichtigt werden; es müssen Normen für mehrsprachig aufgewachsene Schülerinnen und Schüler zur Verfügung stehen. Ist dies der Fall, wäre prinzipiell ein Vergleich mit beiden Bezugsgruppen möglich. Hintergrund für die Bereitstellung von speziellen Normen, die sich auf die Population von Kindern mit Deutsch als Zweitsprache beziehen, ist die Erkenntnis, dass die Bewertung eines mehrsprachig aufgewachsenen Kindes hinsichtlich seiner sprachlichen Kompetenzen im Deutschen anhand eines Vergleiches mit Ergebnissen einsprachig aufgewachsener Schülerinnen und Schülerinnen gleichen Alters unangemessen ist (z. B. Jeuk 2009: 64–65). Aus verschiedenen Gründen ist jedoch auch die Bezugsgruppe der mehrsprachig aufgewachsenen Kinder und Jugendlichen nur bedingt als Maßstab geeignet. Zu berücksichtigen sind nämlich wichtige Merkmale der Spracherwerbsbiographie mehrsprachiger Schülerinnen und Schüler. Solche Merkmale sind z. B. das Alter bei Erwerbsbeginn (Age of Onset) und die Kontaktdauer mit der deutschen Sprache (vgl. Schulz 2013: 192–193). Auch die Qualität der Lerngelegenheiten, die durch den Kontakt zur deutschen Sprache erzeugt werden, stellt einen wichtigen Faktor dar (vgl. Paetsch et al. 2014). Je nachdem, in welchem Alter der Erwerb begann oder welche Herkunftssprache die Kinder und Jugendlichen sprechen, ergeben sich unterschiedliche Verläufe der Sprachaneignung (Jeuk 2009: 64–65). Um zu beurteilen, ob ein mehrsprachiges Kind eine für sein Erwerbsalter erwartungsgemäße sprachliche Entwicklung zeigt oder ob möglicherweise eine Sprachentwicklungsstörung besteht, müsste es deshalb eigentlich mit einer Referenzstichprobe von Kindern mit ähnlicher Spracherwerbsbiographie verglichen werden. Zwar steht das Lebensalter generell in engem Zusammenhang mit den Lernmöglichkeiten in der Zweitsprache, gleichzeitig gibt es aber viele weitere Einflussfaktoren (vgl. Jeuk 2015: 87–88). Die Sprachkompetenzen in der Zweitsprache unterscheiden sich je nach Erwerbsbiographie (des Deutschen) und in Abhängigkeit der Herkunftssprache, auch unter gleichaltrigen Schülerinnen und Schülern, erheblich. Beispielsweise verringert sich mit der Dauer des Kindergartenbesuchs von mehrsprachig aufwachsenden Kindern (was mit einem vermehrten Kontakt zur deutschen Sprache verbunden ist) die Wahrscheinlichkeit, dass bei der Schuleingangsuntersuchung ein Förderbedarf diagnostiziert wird (Becker & Biedinger 2006). Auch scheint der Grad der Sprachverwandtschaft zwischen Herkunftssprache und Zweitsprache eine wichtige Einflussgröße der Zweitsprachentwicklung zu sein (vgl. Chiswick & Miller 2001). Die Wahl der angemessenen Bezugsgruppe für die Beurteilung sprachlicher Kompetenzen ist also ein schwieriges Unterfangen. Hilfreich hierfür ist es, das Ziel des diagnostischen Prozesses in die Überlegungen einzubeziehen. Grundsätzlich verfolgen diagnostische und unterstützende pädagogische Maßnahmen das Ziel, mehrsprachige Kinder und Jugendliche in die Lage zu versetzen, erfolgreich am Unterricht teilnehmen können. Hierfür müssen sie über ausreichende Sprachkenntnisse im Deutschen verfügen. Die Frage, ob ein Kind einer Förderung in der Instruktionssprache bedarf, kann dabei jedoch nicht sinnvoll aus einem Ver-

Psychometrische Testverfahren

535

gleich mit Kindern vergleichbarer Entwicklungsbedingungen, d. h. durch den Vergleich mit der Population möglichst ähnlicher mehrsprachiger Lernenden, abgeleitet werden. Gleichzeitig besteht bei der Orientierung an Normen, die auf den Leistungen einsprachiger Kinder beruhen, die Gefahr, Normabweichungen als Sprachentwicklungsverzögerung zu deuten, was den Voraussetzungen und Kompetenzen mehrsprachiger Kinder und Jugendliche nicht gerecht wird (Jeuk 2015: 83). Zusammenfassend ist festzustellen, dass getrennte Normen für einsprachige und mehrsprachige Kinder und Jugendliche in standardisierten Verfahren eigentlich erforderlich für eine angemessene psychologisch-pädagogische Diagnostik sind. Dann könnten zwei verschiedene Informationen für die Bewertung eines Testergebnisses herangezogen werden. Es sind jedoch auch zusätzliche Maßstäbe in Form von kriterialen Normen,2 die sich an den Anforderungen der für erfolgreiches schulisches Lernen erforderlichen Bildungssprache orientieren, notwendig (vgl. Ehlich 2005: 12; Jeuk 2009: 64; Kany & Schöler 2010: 91). Insbesondere für Sprachstandserhebungsverfahren wurde bereits mehrfach ein kriterienorientiertes Vorgehen vorgeschlagen (z. B. Reich 2010: 915). Leider fehlt es bislang an standardisierten Verfahren, die (auch) eine kriterienbasierte Beurteilung sprachlicher Qualifikationen ermöglichen (Jeuk 2015: 88). Grundsätzlich sollten Fragen danach, welches diagnostische Verfahren sinnvoll eingesetzt werden kann, welche Bezugsgruppe für einen Vergleich herangezogen wird und wie letztendlich die Testwerte interpretiert werden können, vor dem Hintergrund der Zielsetzung des diagnostischen Prozesses beantwortet werden. Beispielsweise kann die Frage nach der angemessenen Bezugsgruppe bei einer Sprachstandserhebung, die im Sinne eines Screeningverfahrens das Ziel verfolgt herauszufinden, wie groß der Bedarf an Förderung insgesamt ist, anders beantwortet werden als bei einem diagnostischen Prozess mit dem Ziel der Leistungsbewertung oder Förderplanung (vgl. die Unterscheidung zwischen Selektionsdiagnostik und Förderdiagnostik in Abschnitt 2; Jeuk 2015: 86). In der praktischen Umsetzung ergibt sich das Problem, dass bislang nur sehr wenige Verfahren zur Verfügung stehen, die getrennte Normen für ein- und mehrsprachige Kinder enthalten. Angesichts der Heterogenität mehrsprachiger Schülerinnen und Schüler sollte zudem sichergestellt sein, dass die Normstichproben (je Bezugsgruppe) ausreichend groß sind, damit die Normwerte zuverlässig interpretiert werden können (N ≥ 200; Neugebauer & Becker-Mrotzek 2013: 36). Wünschenswert wäre zudem die Möglichkeit, weitere Differenzierungen vorzunehmen, z. B. nach Age of Onset, Kontaktdauer oder verschiedenen Erstsprachen; dies würde die Interpretation des Vergleichs eines Schülers bzw. einer Schülerin mit der Norm erleichtern. Die Erstellung getrennter Normen für unterschiedliche Sprachgruppen ist angesichts der Vielzahl unterschiedlicher Herkunftssprachen, die Schülerinnen und

2 Die kriteriale Norm ermöglicht einen Vergleich mit einem festgesetzten Kriterium, welches einer bestimmten Fähigkeitsausprägung entspricht (vgl. Abschnitt 2).

536

Jennifer Paetsch

Schüler mit Deutsch als Zweitsprache sprechen, allerdings sicherlich auch zukünftig nur in sehr begrenztem Umfang möglich und wird sich fast zwangsläufig auf die größten Minoritätensprachen (z. B. Türkisch, Russisch, Polnisch) beschränken.

5 Psychometrische Testverfahren zur Erfassung sprachlicher Fähigkeiten Psychometrische Testverfahren zur Erfassung sprachlicher Fähigkeiten lassen sich unterschiedlich klassifizieren. Grundsätzlich unterscheiden sich Verfahren, die für den Einsatz im vorschulischen Bereich entwickelt wurden, von Verfahren, die sich für den schulischen Bereich eignen, da letztere auch auf schriftsprachliche bzw. literale Qualifikationen (vgl. Ehlich 2005: 12) oder auf sog. bildungssprachliche Kompetenzen (vgl. Heppt 2016; Köhne et al. 2015) abzielen (oder diese voraussetzen). Eine weitere Möglichkeit ist die Gruppierung von Verfahren nach sprachlichen Leistungsbereichen bzw. Teilkompetenzen (z. B. Wortschatz, Grammatik, Lesekompetenz). Viele vorliegende Instrumente beinhalten jedoch mehrere Leistungsbereiche, weshalb häufig allgemeine Sprachentwicklungstests und spezielle Sprachleistungstests voneinander unterschieden werden (z. B. Fried 2004: 50–69), wobei letztere auch Elemente von Intelligenztests sein können (z. B. Weinert 2010: 235–236). Allgemeine Sprachentwicklungstests zielen darauf ab, die allgemeine Sprachkompetenz zu bestimmen. Sie umfassen daher in der Regel mehrere Untertests, mit denen verschiedene Teilaspekte sprachlicher Fähigkeiten erfasst werden können. Spezielle Sprachleistungstests fokussieren hingegen auf einzelne sprachliche Teilkomponenten, wie etwa lexikalische oder morphologisch-syntaktische Kompetenzen (z. B. Metz, Fröhlich & Petermann 2009). Je nach Testverfahren können rezeptive und/oder produktive Fähigkeiten erfasst werden. Darüber hinaus unterscheiden sich Testinstrumente darin, ob sie eine Durchführung im Einzelsetting erfordern oder ob die Durchführung in der Gruppe (z. B. für den Einsatz in der Klasse) möglich ist. Es liegt eine ganze Reihe von Verfahren vor, mit denen die Sprachentwicklung von Kindergartenkindern bzw. Schulanfängern erfasst werden kann. Diese Sprachstandserhebungsverfahren bzw. Sprachentwicklungstests sind häufig dadurch gekennzeichnet, dass sie mehrere sprachliche Bereiche abdecken und darauf abzielen, Risikokinder für die Ausbildung einer Sprachentwicklungsstörung zu identifizieren (z. B. SETK 3–5, Grimm 2001; MSVK, Elben & Lohaus 2000). Explizit an Kinder mit Deutsch als Zweitsprache richten sich nur sehr wenige Verfahren, z. B. Linguistische Sprachstandserhebung – Deutsch als Zweitsprache (LiSe-DaZ, Schulz & Tracy 2011). Eine Übersicht über standardisierte Verfahren für den Einsatz im Vorschulalter bzw. in der Schuleingangsphase findet sich beispielsweise bei Kany & Schöler (2010), Weinert (2010), Jeuk (2009) und Fried (2004). Auf den Webseiten des Forschungs-

Psychometrische Testverfahren

537

und Entwicklungsprogramms Bildung durch Sprache und Schrift (BiSS, http://www. biss-sprachbildung.de) werden Verfahren für den vorschulischen und den schulischen Bereich aufgeführt. Tabelle 1 (übernommen aus Heppt & Paetsch 2018: 122– 126) gibt einen Überblick über ausgewählte standardisierte Testverfahren und ihre psychometrischen Eigenschaften (Objektivität, Reliabilität, Validität, Normierung) zur Erfassung sprachlicher Kompetenzen aus den Bereichen Allgemeine Sprachentwicklung, Wortschatz und Grammatik, die für den Einsatz im Schulbereich bestimmt sind. Zur Erfassung sprachlicher Fähigkeiten werden in den Testverfahren typische Aufgabenstellungen verwendet (Heppt & Paetsch 2018; Weinert 2010: 243–251), deren Kenntnis zur Beurteilung und Auswahl von Verfahren für eine bestimmte Zielgruppe (z. B. Lernende mit Deutsch als Zweitsprache) oder einen bestimmten Zweck hilfreich ist. Beispielsweise werden zur Bestimmung des produktiven Wortschatzes in der Regel Bilder verwendet, die Schülerinnen und Schüler korrekt benennen sollen (z. B. WWTexpressiv des WWT 6–10, Glück 2007; Untertest Bildbenennung des SET 5–10, Petermann, Fröhlich & Metz 2010). Die Erfassung des rezeptiven Wortschatzes erfolgt standardmäßig mit Multiple-Choice-Aufgaben: Bei bildbasierten Verfahren soll aus mehreren vorgegebenen Bildern dasjenige ausgewählt werden, das zu einem vorher genannten Begriff passt (z. B. PPVT, Dunnet al. 2003; WWTrezeptiv des WWT 6–10, Glück 2007; Untertest Wortschatz des SFD, Hobusch, Lutz & Wiest 2002). Andere Verfahren geben die Begriffe und Distraktoren schriftlich vor (z. B. Subtest Wortschatz des KFT 4–12+R, Heller & Perleth 2000; Wortschatztest des CFT 20, Weiß 1998). Die Aufgabe in diesen Tests besteht darin, aus einer Reihe von Wörtern das Synonym zu einem vorgegebenen Zielwort auszuwählen. Die Erfassung rezeptiver grammatischer Kompetenzen erfolgt zumeist über das Satzverständnis. Um dieses zu überprüfen, werden z. B. Multiple-Choice-Aufgaben verwendet, bei denen die Lernenden aus einer Reihe von Bildern dasjenige auswählen sollen, das am besten zu einem vorgegebenen Satz passt (z. B. TROG-D, Fox 2007). In anderen Tests sollen Kinder vorgegebene Sätze mithilfe von Spielfiguren sinngemäß wiedergeben (z. B. Untertest Handlungssequenzen des SET 5–10, Petermann, Fröhlich & Metz 2010). In Gruppenverfahren werden häufig Sätze vorgegeben, die in Hinblick auf ihre grammatikalische Korrektheit eingeschätzt werden müssen (Segerer, Marx & Schneider 2009). Um zu verhindern, dass das Satzverständnis der Schülerinnen und Schüler durch Wortschatzunkenntnis beeinträchtigt wird, wird in der Regel Wortschatz verwendet, der im Alltag der Kinder häufig vorkommt.

Erfasste sprachliche Kompetenzbereiche

Einzeltest

Petermann, Fröhlich & Metz (2010)

SET 5–10 Sprachstandserhebungstest für Kinder im Alter zwischen 5 und 10 Jahren

Allgemeiner Sprachtest, der 10 Untertests umfasst, mit denen sieben Sprachbereiche erfasst werden können (Wortschatz, semantische Relationen, Verarbeitungsgeschwindigkeit, Sprachverständnis, Sprachproduktion, Morphologie, auditive Merkfähigkeit)

Allgemeine Sprachentwicklungstests

Testverfahren Autor(innen) & Testsetting

standardisiertes Verfahren mit genauen Vorgaben zur Durchführung, Auswertung und Interpretation

Objektivität

Gütekriterien

Angaben zu Cronbach’s Alpha liegen lediglich für die Gesamtstichprobe vor und variieren für die einzelnen Subtests zwischen .61 (Fragen zum Text) und .91 (Bildbenennung)

Reliabilität

Angaben zur Validität fehlen im Manual; Metz, Rißling, Karpinski und Petermann (2011) berichten für einzelne Untertests des SET 5– 10 Korrelationen mit lexikalischen und grammatischen Kriteriumsvariablen zwischen r = .39 und r = .76.

Validität

Normierungsstichprobe von N = 1.052 Kindern im Alter von 5;0 bis 10;11 Jahren; die Teilstichproben für die verschiedenen Altersgruppen liegen zwischen n = 83 und n = 241 Kindern. Zwar beansprucht der Test, auch für die Sprachdiagnostik bei Kindern mit Migrationshintergrund geeignet zu sein, jedoch basiert die Substichprobe mehrsprachiger Kinder (über alle Altersstufen hinweg) auf lediglich n = 143. Weitere Differenzierungen in Bezug auf Erstsprachen und Kontaktdauer mit dem Deutschen gibt es nicht (vgl. auch BeckerMrotzek & Weinert 2011).

Normierung

Tab. 1: Übersicht über eine Auswahl verschiedener standardisierter Testverfahren für den Einsatz im Schulbereich, die von ihnen erfassten sprachlichen Kompetenzbereiche und ihre Gütekriterien (Tabelle unverändert übernommen aus: Heppt & Paetsch 2018:122–126).

538 Jennifer Paetsch

Einzeltest

Glück (2007)

WWT 6–10 Wortschatz- und Wortfindungstest für 6- bis 10-Jährige

Wortschatztests

Durchführung im Einzeltest in der 1. Jahrgangsstufe, in den Jahrgangsstufen 2–4 Gruppentestung möglich

Hobusch, Lutz & Wiest (2002)

SFD Sprachstandsüberprüfung und Förderdiagnostik für Ausländerund Aussiedlerkinder

Cronbach’s Alpha zwischen .85 (Kurzform für den Altersbereich von 10;0–10;11 Jahren) und .96 (Langform für die Gesamtstichprobe)

Testdurchführung, Angaben zur internen -auswertung und Konsistenz fehlen im -interpretation werden Manual im Testmanual nicht beschrieben, aber aufgrund der Verwendung von Mehrfachwahlaufgaben und Auswertungsschablonen als gegeben angenommen

expressive und rezeptive standardisiertes semantisch-lexikalische Verfahren mit genauen Fähigkeiten Vorgaben zur Durchführung, Auswertung neben einer Langform und Interpretation mit 95 Items liegen auch drei altersspezifische Kurzformen mit je 40 Items vor

Überprüfung des passiven Wortschatzes in 15 weiteren Erstsprachen (u. a. Arabisch, Englisch, Russisch, Türkisch)

Überprüfung u. a. des passiven Wortschatzes, des Gebrauchs von Präpositionen und Artikeln sowie des Textverständnisses im Deutschen

divergente & konvergente Validität: Korrelation mit dem IQ bei max. r = .34, mit dem phonologischen Arbeitsgedächtnis bei r = .41; keine Überprüfung des Zusammenhangs mit anderen Wortschatztests

Inhaltsvalidität: kann aufgrund der differenzierten Beschreibung der Wortauswahl als gegeben betrachtet werden

Angaben zur Validität fehlen im Manual

Normierungsstichprobe von N = 880 Kindern in Bayern im Alter von 5;6 bis 10;11 Jahren; die Normen für die verschiedenen Altersgruppen und Klassenstufen basieren auf n = 73 bis n = 161 Kindern.

Normierungsstichprobe von N = 1.048 Kindern aus den Klassenstufen 1–4, davon 572 mit einer anderen Erstsprache als Deutsch; bei Differenzierung zwischen den vier Klassenstufen und des Sprachhintergrunds liegen die Stichprobengrößen zwischen n = 40 und n = 194.

Psychometrische Testverfahren

539

Gruppentest

Heller & Perleth (2000)

KFT 4–12+R (V1) Subtest Wortschatz des Kognitiven Fähigkeitstests für 4.–12. Klassen (Revision)

Durchführung als Einzeltest und Gruppentest möglich

Erfassung des rezeptiven Wortschatzes mit 2 Parallelformen mit je 25 Items

Erfassung des rezeptiven Wortschatzes mit 2 Parallelformen

PPVT Peabody Picture Vocabulary Test

Dunn, Dunn, Bullheller & Häcker (2003)

Erfasste sprachliche Kompetenzbereiche

Testverfahren Autor(innen) & Testsetting

Tab. 1 (fortgesetzt)

Reliabilität

standardisiertes Verfahren mit genauen Vorgaben zur Durchführung, Auswertung und Interpretation

Cronbach’s Alpha liegt für die beiden Testformen über alle Altersgruppen hinweg zwischen .75 und .77; die Re- und Paralleltest-Reliabilität beträgt .79.

standardisiertes Cronbach’s Alpha für die Verfahren mit genauen beiden Testformen von Vorgaben zur Durchjeweils .93 führung, Auswertung und Interpretation

Objektivität

Gütekriterien

divergente & konvergente Validität: Korrelation mit der Mathenote variiert je nach Klassenstufe und Schulform zwischen r = .06 und r = .51; mit der Deutschnote zwischen r = .06 und r = .53;

Inhaltsvalidität: eine Beschreibung des Rationals für die Auswahl der Wörter fehlt im Manual;

bildungsabhängiger Leistungsanstieg

divergente & konvergente Validität: laut Handbuch belegen zahlreiche Studien die Validität, z. B. bei Jugendlichen höhere Korrelationen mit der kristallinen Intelligenz als mit der fluiden Intelligenz;

Validität

Es liegen getrennte Normen für die verschiedenen Jahrgangsstufen und Schulformen vor, die auf Stichprobenumfängen von n = 72 (Klasse 12/13) bis n = 1.775 Schülerinnen und Schülern (Klasse 5) basieren.

Normierungsstichprobe von N = 1.261 bzw. N = 1.266 Personen je Testform im Alter von 14 bis 60 Jahren

Normierung

540 Jennifer Paetsch

Erfassung produktiver grammatischer Fähigkeiten, geeignet für die 3. und 4. Jahrgangsstufe. Bereiche: Relativpronomen, Konjugation, Wortstellung, Deklination, Personalpronomen, Satzverbindungen

Überprüfung des Verständnisses verschiedener syntaktischer Strukturen (z. B. Perfekt, Plural, Präpositionen, Relativsätze, Topikalisierungen)

standardisiertes Verfahren mit genauen Vorgaben zur Durchführung, Auswertung und Interpretation

Cronbach’s Alpha variiert zwischen den einzelnen Subtests zwischen .72 (Satzverbindungen) und .85 (Deklination). Für den Gesamttest liegt Cronbach‘s Alpha zwischen .92 (einsprachige Viertklässler) und .94 (mehrsprachige Viertklässler).

standardisiertes Cronbach’s Alpha von Verfahren mit genauen .86, TesthalbierungsVorgaben zur DurchReliabilität von .87 führung, Auswertung und Interpretation

Anmerkungen: Test in zufälliger Reihenfolge angeordnet.

Gruppentest

Paetsch, Darsow, Felbrich & Stanat (eingereicht)

INGA 3–4 Instrument zur Erfassung grammatischer Fähigkeiten in der 3. und 4. Jahrgangsstufe

Einzeltest

(Fox, 2006)

TROG-D Test zur Überprüfung des Grammatikverständnisses

Grammatiktests

divergente & konvergente Validität: Korrelation mit Einzeltestung im Bereich Grammatik r = .70; Korrelation mit anderen Gruppenverfahren im Bereich Grammatik r = .84-.85; Korrelation mit Leseverständnis r = .56-.62; Korrelation mit dem IQ r = .40-.43; Korrelation mit mathematischen Kompetenzen r = .24.43;

Inhaltsvalidität: Die Aufgabenkonstruktion erfolgte theoriegeleitet auf der Grundlage von Entwicklungsstufen bestimmter grammatischer Bereiche.

konvergente Validität: Korrelation mit dem Subtest Sätze verstehen des SETK 3–5 von r = .72

Normierungsstichprobe von n = 1.357 Schülerinnen und Schülern der 3. Jahrgangsstufe und n = 1.396 Schülerinnen und Schülern der 4. Jahrgangsstufe; davon 666 Kinder mit Deutsch als Zweitsprache. Es liegen getrennte Normen für die Jahrgangsstufen (3./4.) und für Kinder mit Deutsch als Erstbzw. Zweitsprache vor.

Normierungsstichprobe von N = 870 Kindern im Alter von 3;0 bis 9;11 Jahren, wobei die Substichproben für die Altersbereiche zwischen 7;0 und 9;11 Jahren auf lediglich n = 24 bis n = 40 Kindern basieren.

Psychometrische Testverfahren

541

542

Jennifer Paetsch

Auch produktive grammatische Kompetenzen sind Bestandteil verschiedener standardisierter Testverfahren (vgl. Tabelle 1). Die dabei eingesetzten Aufgabenformate lassen sich danach unterscheiden, ob vorgegebene Sätze korrekt vervollständigt werden müssen (z. B. SFD, Hobusch, Lutz & Wiest 2002; INGA 3–4, Paetsch et al. eingereicht) oder ob Sätze produziert werden sollen (z. B. Untertest Satzbildung des SET 5–10, Petermann, Fröhlich & Metz 2010). Während bei der Vervollständigung von Lückensätzen ausgewählte Sprachstrukturen fokussiert werden (z. B. Pluralbildung, Relativpronomen, Deklination), ermöglicht die Produktion von Sätzen die gleichzeitige Betrachtung mehrerer morphosyntaktischer Strukturen. Bei dem Einsatz von Lückentexten ist zu beachten, dass Kinder die Texte in einer angemessenen Geschwindigkeit und sinnverstehend lesen können müssen. Anderenfalls werden nicht nur grammatische Kompetenzen, sondern auch Lesefähigkeiten durch den Test erfasst. Dies würde zu einer Unterschätzung der grammatischen Kompetenzen der leseschwachen Schülerinnen und Schüler führen. Um diesem Problem zu entgegnen, können Testaufgaben entweder vorgelesen (z. B. INGA 3–4, Paetsch et al. eingereicht) oder von einem Tonträger abgespielt werden. Zusammenfassend lässt sich feststellen, dass eine Vielzahl an standardisierten diagnostischen Verfahren zur Erfassung sprachlicher Fähigkeiten vorliegt. Bedarf besteht jedoch weiterhin an Verfahren, bei deren Entwicklung die Besonderheiten der Sprachentwicklung mehrsprachiger Heranwachsender berücksichtigt werden. Insbesondere fehlt es an Normen, die an geeigneten Vergleichsstichproben ermittelt wurden. Die Auswahl und Anwendung psychometrischer Verfahren, deren Gütekriterien überprüft wurden und deren Durchführung in einem Testmanual in der Regel gut beschrieben ist, erfordert vom Testanwender bzw. von der -anwenderin ausreichend diagnostische Kompetenzen. Eine gründliche Einarbeitung in den ausgewählten Test und seine zugrundeliegende Theorie ist zudem eine wichtige Voraussetzung für den sachgerechten Einsatz und für die Interpretation der Ergebnisse.

Literatur Amelang, Manfred, & Lothar Schmidt-Atzert (2006): Psychologische Diagnostik und Intervention. Berlin, Heidelberg: Springer. Becker, Birgit & Nicole Biedinger (2006): Ethnische Bildungsungleichheit zu Schulbeginn. Kölner Zeitschrift für Soziologie und Sozialpsychologie, 58(4), 660–684. Bortz, Jürgen & Döring, Nicola (2003): Forschungsmethoden und Evaluation. Berlin, Heidelberg: Springer. Bredel, Ursula (2007): Sprachstandsmessung- Eine verlassene Landschaft. In Bundesministerium für Bildung und Forschung (Hrsg.), Anforderungen an Verfahren der regelmäßigen Sprachstandsfeststellung als Grundlage für die frühe und individuelle Förderung von Kindern mit und ohne Migrationshintergrund, 78–119. Bildungsforschung Band 11. Bonn, Berlin: Bundesministerium für Bildung und Forschung. Brown, Steven M. & Herbert J. Walberg (1993): Motivational effects on test scores of elementary students. The Journal of Educational Research 86 (3), 133–136.

Psychometrische Testverfahren

543

Bühner, Markus (2010): Einführung in die Test- und Fragebogenkonstruktion (3. Aufl.). München u. a.: Pearson Studium. Chiswick, Barry R. & Paul W. Miller (2001): A model of destination-language acquisition: Application to male immigrants in Canada. Demography, 38(3), 391–409. Dubowy, Minja, Susanne Ebert, Jutta von Maurice & Sabine Weinert (2008): Sprachlich-kognitive Kompetenzen beim Eintritt in den Kindergarten: Ein Vergleich von Kindern mit und ohne Migrationshintergrund. Zeitschrift für Entwicklungspsychologie und Pädagogische Psychologie, 40(3), 124–134. Dunn, Loyd M., Leota M. Dunn, Stephan Bulheller & Hartmut O. Häcker (2003): Peabody Picture Vocabulary Test (PPVT) – Deutschsprachige Fassung des PPVT-III für Jugendliche und Erwachsene. Frankfurt am Main: Swets Test Services. Ehlich, Konrad (2005): Sprachaneignung und deren Feststellung bei Kindern mit und ohne Migrationshintergrund: Was man weiß, was man braucht, was man erwarten kann. In Bundesministerium für Bildung und Forschung (Hrsg.), Anforderungen an Verfahren der regelmäßigen Sprachstandsfestellung als Grundlage für die frühe und individuelle Förderung von Kindern mit und ohne Migrationshintergrund, 11–63. Bildungsforschung Band 11. Bonn, Berlin: Bundesministerium für Bildung und Forschung. Elben, Cornelia E. & Arnold Lohaus (2000), Marburger Sprachverständnistest für Kinder: MSVK. Göttingen: Hogrefe, Verlag für Psychologie. Fox, Annette V. (2007): TROG-D. Test zur Überprüfung des Grammatikverständnisses. Idstein: Schulz-Kirchner. Fried, Lilian (2004): Expertise zu Sprachstandserhebungen für Kindergartenkinder und Schulanfänger. Eine kritische Betrachtung. München: DIJ. Glück, Christian W (2007): Wortschatz- und Wortfindungstest für 6- bis 10-Jährige (WWT 6–10). München: Urban & Fischer. Grimm, Hannelore (2001): Sprachentwicklungstest für drei-bis fünfjährige Kinder: SETK 3–5; Diagnose von Sprachverarbeitungsfähigkeiten und auditiven Gedächtnisleistungen. Göttingen: Hogrefe, Verlag für Psychologie. Hartig, Johannes, Frey, Andreas & Jude, Nina (2012): Validität. In Helfried Moosbrugger & Augustin Kevala (Hrsg.), Testtheorie und Fragebogenkonstruktion (2. Aufl.), 143–171. Berlin, Heidelberg: Springer. Heller, Kurt A. & Christoph Perleth (2000): KFT 4–12+R – Kognitiver Fähigkeitstest für 4. bis 12. Klassen, Revision. Göttingen: Beltz. Heppt, Birgit & Jennifer Paetsch (2018). Diagnostik sprachlicher Kompetenzen im Schulbereich. In Cora Titz, Sabrina Geyer, Hanna Wagner, Susanne Weber & Michael Hasselhorn (Hrsg), Konzepte zur Sprach- und Schriftsprachförderung entwickeln, 117–137 Stuttgart: Kohlhammer. Heppt, Birgit (2016): Verständnis von Bildungssprache bei Kindern mit deutscher und nichtdeutscher Familiensprache. Dissertation, Humboldt-Universität zu Berlin. http://edoc. hu-berlin.de/dissertationen/heppt-birgit-2016-05-23/PDF/heppt.pdf (12. 10. 2017). Hesse, Ingrid & Brigitte Latzko (2009): Diagnostik für Lehrkräfte (1. Aufl.). Opladen: Barbara Budrich. Hobusch, Anna, Nevin Lutz & Uwe Wiest (2002): Sprachstandsüberprüfung und Förderdiagnostik für Ausländer und Aussiedlerkinder (SFD). Hamburg-Bergedorf: Persen. Ingenkamp, Karl-Heinz & Urban Lissmann (2005): Lehrbuch der Pädagogischen Diagnostik (5. Aufl.). Langensalza: Beltz UTB. Jeuk, Stefan (2009): Aktuelle Verfahren zur Einschätzung des Stands der Sprachaneignung im Grundschulalter. In Stefan Jeuk& Ingrid Schmid-Barkow (Hrsg.), Differenzen diagnostizieren und Kompetenzen fördern im Deutschunterricht, 61–81. Freiburg: Fillibach. Jeuk, Stefan (2015): Deutsch als Zweitsprache in der Schule: Grundlagen-Diagnose-Förderung (3. Aufl.). Stuttgart: Kohlhammer Verlag.

544

Jennifer Paetsch

Kany, Werner & Hermann Schöler (2010): Fokus: Sprachdiagnostik: Leitfaden zur Sprachstandsbestimmung im Kindergarten (2. Aufl.). Berlin: Cornelsen Scriptor. Knauer, Sabine (2003): Zum Problem des Diagnostikbegriffs im Zusammenhang pädagogischer Handlungsfelder. In Hans Eberwein & Sabine Knauer (Hrsg.), Handbuch Lernprozesse verstehen (2. Aufl.), 54–65. Weinheim, Basel: Beltz. Kniffka, Gabriele & Gesa Siebert-Ott (2009): Deutsch als Zweitsprache (2. Aufl.). Paderborn: Ferdinand Schöningh. Köhne, Judith, Sibylle Kronenwerth, Angelika Redder, Elisabeth Schuth & Sabine Weinert (2015): Bildungssprachlicher Wortschatz – linguistische und psychologische Fundierung und Itementwicklung. In Angelika Redder, Johannes Naumann & Rosemarie Tracy (Hrsg.), Forschungsinitiative Sprachdiagnostik und Sprachförderung (FiSS) – Ergebnisse, 67–92. Münster: Waxmann. Krohne, Heinz W. & Michael Hock (2015): Psychologische Diagnostik: Grundlagen und Anwendungsfelder (2. Aufl.). Stuttgart: Kohlhammer. Lienert, Gustav Adolf & Ulrich Raatz, (1998): Testaufbau und Testanalyse (6. Aufl.). Weinheim: Psychologische Verlagsunion Beltz. May, Peter (2002): HSP 1–9. Hamburger Schreibprobe. Diagnose orthographischer Kompetenz zur Erfassung der grundlegenden Rechtschreibstrategien. Hamburg: VPM. Metz, Dorothee, Julia-Katharine, Norbert Karpinski & Franz Petermann (2011): Erste Analysen zur Kriteriumsvalidität des Sprachstandserhebungstest für Kinder im Alter zwischen 5 und 10 Jahren (SET 5–10). Sprache – Stimme – Gehör 35, 216–221. Metz, Dorothee, Linda Paulina Fröhlich & Franz Petermann (2009): Diagnostik Sprachstandserhebungsverfahren für Fünf- bis Zehnjährige (SET 5–10). Konstruktion und Analyse. Kindheit und Entwicklung, 18 (4), 194–203. Moosbrugger, Helfried & Augustin Kelava (Hrsg.) (2012): Testtheorie und Fragebogenkonstruktion. Berlin, Heidelberg: Springer. Moosbrugger, Helfried & Augustin Kelava (2012): Qualitätsanforderungen an einen psychologischen Test (Testgütekriterien). In Helfried Moosbrugger & Augustin Kevala (Hrsg.), Testtheorie und Fragebogenkonstruktion (2. Aufl.), 7–26. Berlin, Heidelberg: Springer. Neugebauer, Uwe & Michael Becker-Mrotzek (2013): Die Qualität von Sprachstandsverfahren im Elementarbereich. Eine Analyse und Bewertung. Köln: Mercator – Institut für Sprachförderung und Deutsch als Zweitsprache. http://www.mercator-institutsprachfoerderung.de/fileadmin/user_upload/MercatorInstitut_Qualitaet_ Sprachstandsverfahren_Web_03.pdf (12. 10. 2017). Paetsch, Jennifer, Annkathrin Darsow, Anja Felbrich & Petra Stanat (eingereicht): INGA 3‐4: Instrument zur Erfassung grammatischer Fähigkeiten in der 3. und 4. Jahrgangsstufe. Münster: Waxmann. Paetsch, Jennifer, Katrin M. Wolf, Petra Stanat, & Annkathrin Darsow (2014): Sprachförderung von Kindern und Jugendlichen aus Zuwandererfamilien. Zeitschrift für Erziehungswissenschaft, 17 (2), 315–347. Petermann, Franz, Linda P. Fröhlich & Dorothee Metz (2010): Sprachstandserhebungstest für Kinder im Alter zwischen 5 und 10 Jahren (SET 5–10). Göttingen: Hogrefe. Reich, Hans H. (2010): Sprachstandserhebung, ein- und mehrsprachig. In Bernt Ahrenholz & Ingelore Oomen-Welke (Hrsg.), (2010). Deutsch als Zweitsprache (2. Aufl.), 420–429. Baltmannsweiler: Schneider Hohengehren. Rost, Detlef H. (2013): Interpretation und Bewertung pädagogisch-psychologischer Studien. Bad Heilbrunn: Klinkhardt. Rost, Jürgen (2004): Lehrbuch Testtheorie-Testkonstruktion (2. Aufl.). Bern: Huber. Schermelleh-Engel, Karin & Christina Werner (2012): Methoden der Reliabilitätsbestimmung. In Helfried Moosbrugger & Augustin Kevala (Hrsg.), Testtheorie und Fragebogenkonstruktion (2. Aufl.), 76–102. Berlin, Heidelberg: Springer.

Psychometrische Testverfahren

545

Schölmerich, Axel & Birgit Leyendecker (2009): Psychologische Diagnostik bei Kindern aus zugewanderten Familien. In Dieter Irblich, D. & Gerolf Renner (Hrsg.) Diagnostik in der Klinischen Kinderpsychologie. Die ersten sieben Lebensjahre, 430–442. Göttingen: Hogrefe. Schrader, Friedrich-Wilhelm (2001): Diagnostische Kompetenz von Eltern und Lehrern. In Detlef H. Rost (Hrsg.), Handwörterbuch Pädagogische Psychologie (2. Aufl.), 102–108. Weinheim: Psychologie Verlags Union. Schulz, Petra & Rosemarie Tracy (2011): Linguistische Sprachstandserhebung-Deutsch als Zweitsprache: LiSe-DaZ; Manual. Göttingen: Hogrefe. Schulz, Petra (2013): Sprachdiagnostik bei mehrsprachigen Kindern. Sprache-Stimme-Gehör, 37 (04), 191–195. Segerer, Robin, Peter Marx, & Wolfgang Schneider (2009): Test zur Erfassung sprachstruktureller Kompetenzen bei Jugendlichen. Julius-Maximilians-Universität Würzburg. Südkamp, Anna, Jens Möller & Britta Pohlmann (2008): Der simulierte Klassenraum. Zeitschrift für pädagogische Psychologie 22, 261–276. Weinert, Sabine (2010): Erfassung sprachlicher Fähigkeiten. In Eva Walther, Franzis Preckel, & Silvia Mecklenbräuer (Hrsg.), Befragung von Kindern und Jugendlichen (1. Aufl.), 227–262. Göttingen: Hofgrefe. Weiß, Rudolf H. (1998): Wortschatztest (WS) und Zahlenfolgetest (ZF). Ergänzungstests zum Grundintelligenztest CFT 20. Handanweisung. Göttingen: Hogrefe.

Wilhelm Grießhaber

22 Profilanalysen 1 2 3 4 5

Grundbegriffe und Überblick Historische Entwicklungen Kritischer Überblick und Einsatzmöglichkeiten Fragen, Probleme und Diskussion Aktuelle Forschungsprojekte

1 Grundbegriffe und Überblick Profilanalytische Diagnoseverfahren zielen auf eine differenzierte Beschreibung und Beurteilung von Lerneräußerungen. Die verschiedenen Werte der analysierten Äußerungen bilden das Profil. Crystal, Fletcher & Garman (1984: 84) auf die der Terminus zurückgeht, verwenden den Begriff ohne explizite Definition im Sinne einer „Classification Chart“, Clahsen (1986: 4) benutzt dafür den Begriff „Profilbogen“.1 Sie sind primär ressourcen- und nicht defizitorientiert, d. h., sie erfassen die verwendeten Mittel. Diese bilden das Profil. Das Profil besteht in der Regel aus der Anzahl der untersuchten Mittel. Bei der Wahl der untersuchten Mittel und der Gestaltung der Profile unterscheiden sich die verschiedenen Verfahren teilweise sehr voneinander. Die einen berücksichtigen ein möglichst breites Spektrum an Mitteln, während andere nur wenige oder sogar nur einen Aspekt erfassen. In jedem Fall erfordert die Sprachstandsbestimmung (linguistische) Kenntnisse seitens der Durchführenden für die Bestimmung und Beurteilung des Profils. Die Profile dienen mit ihren Stärken und Schwächen der Planung von gezielten Fördermaßnahmen. Im Unterschied zu psychometrischen Testverfahren (vgl. Paetsch in diesem Band), die auf möglichst reproduzierbare Erhebungen und eine maximale Vergleichbarkeit und Exaktheit der Ergebnisse setzen, stützen sich profilanalytische Verfahren zur Erfassung möglichst authentischen sprachlichen Handelns in der Regel auf Spontanäußerungen (vgl. Ricart Brede und Döll in diesem Band). Um dennoch vergleichbare Ergebnisse zu erhalten, werden oft verbale und/oder visuelle Stimuli zur Elizitierung eingesetzt, auf die die Probanden frei reagieren. Die Erhebung und Aufbereitung der meist in Einzelgesprächen erhobenen Daten führt in der Regel zu einem hohen Zeitaufwand bei mündlichen Erhebungen. Dagegen sind die in einigen Verfahren praktizierten in Gruppen durchgeführten schriftlichen Erhebungen wesentlich ökonomischer.

1 In der Testtheorie wird unter einem Profil im engeren Sinn „eine graphische Darstellung der Ergebnisse mehrerer Einzeltests“ (Lienert & Raatz 1998: 14.1.1) verstanden. Als Profil im weiteren Sinne gilt eine Kombination mehrerer Einzeltests. https://doi.org/10.1515/9783110418712-022

548

Wilhelm Grießhaber

Tab. 1: Satzmuster des Deutschen (Profilstufen); * = Subjekt. Stellungsmuster

Vorfeld

Finitum / Konjunktion

Mittelfeld

Nachfeld / Partikel

6 Integration 5 Insertion 4 Nebensatz 3 Inversion 2 Separation 1 Finitum 0 Bruchstücke

Sie* Sie* …, Danach Maria* Maria* Danke!

will hat weil geht will/muss geht

den [von Hans empfohlenen] Roman den Krimi [, der* ihr so gut gefällt,] sie* ins Theater Maria* nach Hause. ins Theater ins Kino.

kaufen. gelesen. geht. gehen.

Andererseits unterscheiden sich profilanalytische Verfahren untereinander. Die größten Differenzen zeigen sich bezüglich des Profils. Ein weites Profilverständnis zielt auf die Erfassung eines möglichst breiten Informationsspektrums (vgl. Abschnitt 2.1 in diesem Beitrag), während ein enges, linguistisch fokussiertes, sich zumeist auf grammatische Aspekte beschränkt (vgl. Abschnitt 2.2 in diesem Beitrag). Ein weites Profil enthält einerseits Informationen zur Sprachbiografie und zum sprachlich-kommunikativen Verhalten im Unterricht bezüglich des Verstehens und Sprechens auch gegenüber MitschülerInnen. Andererseits werden Informationen zu sprachlichen Merkmalen der Lernersprache, u. a. meist lexikalische, morphologische und syntaktische Kenntnisse, erhoben. Verfahren mit weitem Profilverständnis (u. a. HAVAS 5, Reich & Roth 2007) beziehen darüber hinaus oft die Familiensprache(n) der Probanden mit ein, zum einen als Hilfsmittel zur Sicherstellung der Kommunikation während der Erhebung, zum anderen zur Erstellung eines familiensprachlichen Profils. Verfahren mit einem engen Profilverständnis (u. a. Profilanalyse nach Grießhaber 2014) konzentrieren sich auf einige wenige Wortstellungsmuster, die in der Zweitspracherwerbsforschung als sukzessiv zu durchlaufende Stadien im Zweitspracherwerb identifiziert wurden (dazu Meisel, Clahsen & Pienemann 1978). Den Lerneräußerungen wird jeweils ein Wortstellungsmuster, die Profilstufe, zugewiesen. Tabelle 1 zeigt die Erwerbsstufen nach Grießhaber (2014: 3), die mit den Stufen eins bis vier die zentralen Satzmuster und mit den Stufen fünf und sechs zwei weitere enthalten (näheres in Abschnitt 2.2 in diesem Beitrag). Die höchste erreichte Profilstufe entspricht dem in der Sprachprobe erreichten Erwerbsstand.

2 Historische Entwicklungen Die linguistischen Grundlagen für die meisten Verfahren mit engem Profilverständnis wurden im ZISA-Projekt gelegt (Meisel, Clahsen & Pienemann 1978), das sich strikt auf die Ermittlung des stufenbasierten Erwerbs sprachlicher Mittel konzent-

Profilanalysen

549

rierte. Mit Bezug auf Querschnittsdaten immigrierter Arbeiter („Gastarbeiter“, ZISAProjekt) und auf Längsschnittdaten von drei italienischen Mädchen (Pienemann 1981, Erhebungen zwischen 1976 und 1978) wurden die im Zweitspracherwerb invarianten Wortstellungsregeln und die Reihenfolge ihres Erwerbs identifiziert (Meisel, Clahsen & Pienemann 1978). Eine entscheidende Rolle spielte die Verwendung der generativen Transformationsgrammatik (Chomsky 1965) und die damit verbundene Fokussierung auf die Syntax. Damit rückten die zahlreichen und bei vielen weiten Verfahren erhobenen Abweichungen im morphologischen Bereich der Lerneräußerungen in den Hintergrund. Der Blick richtete sich auf die Analyse von Wortstellungsmustern. Dabei wurde unterschieden zwischen solchen Wortstellungsmustern, die von Lerner zu Lerner variieren, z. B. die Stellung von Präpositionalphrasen, und Verbstellungsmustern, die allgemein in einer bestimmten Reihenfolge erworben werden. Letztere repräsentieren die Stufen im Erwerb des Deutschen als Zweitsprache, während die variierenden Muster keine Rückschlüsse auf allgemeine Erwerbsschritte zulassen.

2.1 Weite Verfahren Bei den weiten Verfahren lassen sich drei zeitliche Phasen mit unterschiedlichen Schwerpunkten erkennen: die frühe zu Beginn der 1980er Jahre, die mittlere zu Beginn der Zweitausender Jahre und die aktuelle seit der massiven Zuwanderung von Flüchtlingen seit etwa 2015. Die profilanalytisch weiten Verfahren sind vornehmlich in pädagogischen und schulnahen Projekten in der frühen Phase entstanden. Ein Grund dafür sind wohl Migrationsbewegungen im Zusammenhang mit der Ausländerpolitik. So behielt die konservativ-liberale Bundesregierung 1982 den Anwerbestopp bei und förderte die Heimkehr von Arbeitsmigranten. Dies hatte den unerwarteten Effekt, dass viele Migranten mit Aufenthaltsrecht ihre Familienangehörigen nachholten und so viele Kinder und Jugendliche als SeiteneinsteigerInnen nach Deutschland kamen. Die großen Herausforderungen führten zu zahlreichen Sprachstandseinschätzungsverfahren, auf die nicht im Einzelnen eingegangen werden kann. Exemplarisch werden unten die Verfahren von Luchtenberg, Neumann & Wespel (1982) und das „Projektive Linguistische Analyseverfahren“ (PLAV) (BrucheSchulz, Heß & Steinmüller 1983) kurz vorgestellt. Eine Übersicht über einige Verfahren mit allgemeinen Einschätzungen stellt Luchtenberg (1984: tabellarischer Überblick, 28–29) vor. Viele der aufgeführten Verfahren verwenden Bildimpulse zur lexikalisch und grammatisch kontrollierten und vergleichbaren Anregung der Sprachproduktion. Einige verwenden Grundlisten und grammatische Strukturensammlungen zur Erhebung der Grammatikkenntnisse. Insgesamt scheinen die Verfahren eher auf Defizite zu zielen als auf die schon erreichten Kenntnisse als Basis der Förderung. Sie berücksichtigen u. a. recht unsystematische Bereiche, z. B. die deutsche Pluralbildung, die Verbkonjugation oder die Verwendung der (Wechsel-)Präpositionen. Insgesamt stellt Luchtenberg bei den

550

Wilhelm Grießhaber

Verfahren große Verbesserungspotentiale fest. Konstruktion und Auswertung der Daten entsprechen einem weiten Profilverständnis. Das Ziel ist die Erhebung vieler, auch lernerbiografischer Daten, um ein möglichst umfassendes Bild der Probanden, ihrer Sprachlernbedingungen und ihrer Sprachkenntnisse zu erhalten. In diesem Sinne kommt dies dem Deskriptivitätskriterium von Crystal, Fletcher & Garman (1984) nahe. Im Unterschied zum Profilverständnis von Crystal, Fletcher & Garman liegt jedoch ein anderes Verständnis von Entwicklung zu Grunde, das vornehmlich an den zielsprachlichen Regeln des Deutschen statt an zweitsprachlichen Entwicklungsverläufen orientiert ist. Im informellen Test von Luchtenberg, Neumann & Wespel (1982) werden mit visuellen Impulsen Äußerungen elizitiert und u. a. der richtige Kasusgebrauch und die richtige Satzstellung getestet. So sollen die Probanden z. B. zur Überprüfung der Struktur S – P – Edat – Eakk folgenden Satz zu einem Bild äußern: „Die Mutter wäscht dem Mädchen die Haare.“ Die mit richtigen Äußerungen erzielten Punkte werden nach verschiedenen Rubriken aufsummiert und in einem Gesamtwert zusammengefasst. Die tabellarische Darstellung der Ergebnisse kann als Profil verstanden werden, auch wenn der Begriff nicht verwendet wird. Das „Projektive Linguistische Analyseverfahren“ (‚PLAV‘) wurde im Auftrag des Berliner Senats für Schulanfänger und für SchülerInnen der 4. Klasse entwickelt (Bruche-Schulz, Heß & Steinmüller 1983). Es soll den Wortschatz und die Normnähe verschiedener Merkmale erfassen sowie Hinweise auf die Förderung geben. Die Erhebung erfolgt als Beobachtung und in (Einzel-)Gesprächen mit Bildimpulsen. Die Wortschatzlisten enthalten manchmal auch türkische Entsprechungen, z. B. bei Obst für Banane muz. Die Gespräche sollen auditiv aufgezeichnet und anschließend ausgewertet werden. Die Auswertung verzichtet auf Quantifizierungen und strebt die Projektion eines Gesamtbildes an. Verbale Zusammenfassungen werden als Profil der sprachlichen Ausdrucksfähigkeit bezeichnet. Das sehr aufwendige Verfahren setzt grammatische Kenntnisse voraus, erscheint jedoch wenig aussagekräftig. In der mittleren Phase zu Beginn der 2000er Jahre wurden verschiedene profilorientierte Sprachstandserhebungsverfahren veröffentlicht, von denen exemplarisch „Bärenstark“, „HAVAS 5“ und „Tulpenbeet“ vorgestellt werden. Das Berliner Projekt „Bärenstark“ (Senatsverwaltung 2002) kann in einem sehr weiten Sinn als profilorientiert verstanden werden. Es zielt im Vorschulbereich auf die Erhebung eines Sprachstandsprofils in verschiedenen Bereichen. Sie reichen von der Rezeption bis zu einzelnen grammatischen Aspekten, z. B. Nomen oder Präpositionen. Für jeden Teilbereich wird mit Bezug auf grammatische Korrektheit ein möglicher Förderbedarf festgestellt. Am Ende wird nach der Bearbeitung eines vierseitigen Auswertungsbogens ein Gesamtscore gebildet. Bei der Erhebung 2002 erreichten deutschsprachige Kinder durchschnittlich 78 Punkte, nichtdeutschsprachige 53 Punkte. Große Aufmerksamkeit wird der Sprechmotivation mit Bildimpulsen und einem Teddybär gewidmet. Reich (2003) lobt die motivierende Gestaltung und die praktische Handhabbarkeit, kritisiert jedoch die unklaren Maßstäbe für die Zu-

Profilanalysen

551

weisung von Punkten. Das Verfahren beruht wie das Vorgängerprojekt „PLAV“ nicht auf empirisch ermittelten Entwicklungsstufen und wurde nur kurze Zeit eingesetzt. „HAVAS 5“ (Reich & Roth 2007) dient im Vorschulbereich der differenzierten Ermittlung des Sprachförderbedarfs und von individuell zugeschnittenen Fördermaßnahmen. Als Besonderheit ist der mehrsprachige Ansatz hervorzuheben. Zusätzlich zur deutschen Version gibt es solche für Türkisch, Russisch, Polnisch, Italienisch, Spanisch und Portugiesisch. Für das Deutsche dient als Bezugsnorm die Sprache gleichaltriger deutscher Kinder. Das Konzept konzentriert sich auf Indikatoren zur Charakterisierung des Sprachstands von Fünf- bis Siebenjährigen und von frühen Zweitspracherwerbsstadien. Es besteht aus fünf Bereichen: Aufgabenbewältigung, Gesprächsverhalten, Wortschatz, Verbstellung und Satzverbindung. Die Wortschatzliste enthält in alphabetischer Reihenfolge 44 Verben. Bei der Verbstellung und Satzverbindung wird das umfassende Profilkonzept von Clahsen (1985, vgl. Abschnitt 2.2 in diesem Beitrag) in reduzierter und modifizierter Form aufgegriffen. Als Basis dient die Bilderfolge „Katze und Vogel“. Eine Weiterführung von HAVAS mit narrativen Äußerungen im Grundschulbereich ist „der die das – Klasse 1/2“ (Jeuk 2013b). Das im BLK-Programm FörMig entwickelte Diagnoseinstrument „Tulpenbeet“ (Reich, Roth & Gantefort 2008, vgl. Schäfer in diesem Band) soll Lehrkräften die differenzierte Ermittlung des Sprachstands von mehrsprachigen SchülerInnen ermöglichen und die Wirksamkeit von Fördermaßnahmen untersuchen. Die standardisierte Erhebung rückt es in die Nähe von Tests, es wird jedoch als Analyseverfahren bezeichnet. Es erfasst detailliert verschiedene Aspekte der narrativen Kompetenz im Schriftlichen und des Sprachstands. Als Indikatoren für den Sprachstand werden der Wortschatz, bildungssprachliche Elemente, die Verbindung von Sätzen und syntaktische Muster erhoben und ausgewertet. Die allgemeine Lage mehrsprachiger SchülerInnen und die aktuell stark angestiegene Zahl von Flüchtlingen haben zu einem hohen Bedarf an sprachdiagnostischen Verfahren geführt. Einige Projekte sind angekündigt oder in der Entwicklung. Die „Förderdiagnostik sprachlicher Entwicklung im Schulalter“ (‚FISA‘) (Junk-Deppenmeier & Jeuk 2015) hat einen weiten Ansatz mit klar ausgeprägten linguistischen Bereichen. Es soll insbesondere auch rechtlichen Ansprüchen an die Zuweisung zu Fördermaßnahmen genügen.

2.2 Enge, linguistisch fokussierte Verfahren Die zentralen, invariant erworbenen Verbstellungsregeln sind in aufsteigender Reihenfolge (Meisel, Clahsen & Pienemann 1978: 35): (1) PARTICLE: Separation finiter und infiniter Verbteile, u. a. bei Modalverben und Auxiliaren, (2) (Subjekt-Verb-) INVERSION nach Fragepronomen, Adverbialen und einer vorangestellten NP und (3) V → END: Verbendstellung nach Subjunktoren, in indirekten Fragesätzen und in Relativsätzen. Zusammen mit dem Einstieg in den Erwerb ohne eines der drei

552

Wilhelm Grießhaber

Muster bilden die vier Stufen den Kern der syntaktisch basierten Profilanalyse des DaZ-Erwerbs. Die Gruppe nennt als mögliche Anwendungsbereiche die Bestimmung der Position im Erwerbsprozess in placement tests und die Verwendung für eine psychologisch plausible Sequenzierung von Lehrmaterialien. Clahsen (1985) führt die Idee mit der Sprachstandsbestimmung aus, integriert die ZISA-Ergebnisse in das von Crystal, Fletcher & Garman (1984) entwickelte „Language Assessment, Remediation and Screening Procedure“ (LARSP) zur Beurteilung von Sprachentwicklungsstörungen und entwickelt einen umfangreichen Profilbogen für Deutsch. Er ergänzt die syntaktischen Erwerbsreihenfolgen um Stellungsmuster für Adverbien und die Negationspartikel. Pienemann (1986) legt einen verschlankten profilanalytischen Entwurf auf der Basis der ZISA-Ergebnisse und seiner eigenen Untersuchungen vor. Ähnlich wie Clahsen schiebt er nach der Separation eine Zwischenphase ein, in der in Inversionsstrukturen, z. B. nach einem Temporaladverb, das Finitum in normaler Reihenfolge nach dem Subjekt positioniert wird, z. B. da kinder spielen. Die zunächst vor allem in Querschnittstudien gewonnenen Erwerbsreihenfolgen wurden in der Folge auch empirisch in Längsschnittstudien bestätigt, so von Clahsen (1984) in einer Längsschnittstudie von drei Probanden der ZISA-Querschnittstudie. Die Anwendung des Verfahrens auf die Analyse narrativer schriftlicher Lernertexte führt zur Erweiterung der klassischen vier Erwerbsstufen um zwei weitere (Grießhaber 2012, vgl. Tabelle 1 in diesem Beitrag). Auf die Verbendstellung in Nebensätzen folgt die Insertion (Stufe 5), bei der ein Nebensatz in den Satz eingeschoben wird. Es liegen dann zwei minimale satzwertige Einheiten (MSE) vor: Der einbettende Matrixsatz entspricht der Stufe 5 und der eingebettete Nebensatz der Stufe 4. Bei der nachfolgenden Stufe, der Integration, wird ein Partizipialattribut verwendet, das in einen Relativsatz überführt werden kann. Die entsprechenden MSE erhalten die Stufe 6. Derart komplexe Muster hatten die Lernenden im ZISAProjekt zu den Erhebungszeitpunkten (noch) nicht erworben. Für die praktische Arbeit mit der Profilanalyse wurde eine terminologische Trennung zwischen der Profilstufe der einzelnen MSE und der in einer Sprachprobe erreichten Erwerbsstufe eingeführt (Grießhaber 2013). Die Erwerbsstufe charakterisiert die in einer Sprachprobe erreichten Kenntnisse. Es ist die höchste mindestens dreimal realisierte Profilstufe. Damit wird die von Clahsen abgelehnte einzelne Kenngröße für den Sprachstand eingeführt. Dies hat sich als nützlich erwiesen, um z. B. die SchülerInnen in einer Klasse nach ihren Kenntnissen für Fördermaßnahmen zu gruppieren oder um die Entwicklung einzelner SchülerInnen im Laufe der Zeit beobachten zu können. Dafür sind weite Profile mit Informationen zu verschiedenen Bereichen zu komplex. Grießhaber (2006) wählt als grammatische Analysebasis die funktional-pragmatische Diskursanalyse (vgl. Ehlich 1986/2007). Damit können Wortstellungsregeln

Profilanalysen

553

mit satzübergreifenden Bezügen verbunden werden. Die Inversion eröffnet ein Stellungsfeld, in dem die Vorfeldmittel vor allem zur Steuerung des Hörerwissens verwendet werden. Die für kindliche Erzählungen typischen Verknüpfungen mittels Und dann … stellen mit der Konjunktion und lediglich irgendeine Beziehung zwischen dem vorhergehenden und dem aktuellen Satz her. Erst mit dem dann wird diese Beziehung zeitlich spezifiziert. Temporaladverbiale Vorfeldausdrücke wie Nach der Schule … betten das folgende Geschehen in einen Tagesablauf ein, ohne dies an ein vorher verbalisiertes Wissen anzuknüpfen. Diese Bestimmungen der auf den Erwerbsstufen funktional verfügbaren Mittel ermöglichen eine feinere Justierung der Fördermaßnahmen. Weitere Quer- und Längsschnittstudien z. B. im Rahmen von „Deutsch & PC“ zeigen, dass die Erwerbsstufen auch mit der morphologischen Korrektheit korrespondieren. Der Wortschatz wird längsschnittlich über die Grundschulzeit hinweg mit steigenden Erwerbsstufen differenzierter und genauer (vgl. Abschnitt 5.1 in diesem Beitrag). Querschnittanalysen innerhalb einer Jahrgangsstufe zeigen, dass der Wortschatz nach Erwerbsstufen unterschiedlich differenziert ist. Auch wenn mit der Profilanalyse nur Wortstellungsmuster erfasst werden, geben diese auch Einblicke in den Wortschatz, ohne dass er direkt untersucht wird.

3 Kritischer Überblick und Einsatzmöglichkeiten Die folgenden Ausführungen berücksichtigen vornehmlich Aspekte im Zusammenhang mit den linguistisch fokussierten Verfahren, u. a. Bärenstark, Clahsen, Grießhaber, HAVAS 5, PLAV, ‚Tulpenbeet‘. Erläuterungen zur Erhebung, Aufbereitung und Auswertung von sprachbiographischen Daten würde den Rahmen der Ausführungen sprengen. Im Einzelnen werden folgende Aspekte behandelt.

3.1 Erhebung, Aufbereitung und Analyse mündlicher Daten Die in sehr vielen Verfahren gegebene Ausrichtung auf mündliche Äußerungen wirft zahlreiche Fragen auf. In den frühen Forschungsprojekten, z. B. ZISA, waren die Aufnahme von Probandenäußerungen, die anschließende genaue Transkription und die folgende Analyse selbstverständliche Arbeitsschritte. Im Interesse möglichst genauer Daten und Analysen lag deshalb die Übertragung dieser Methoden auf die Profilanalyse nahe. Die teilweise sehr detaillierten Bestimmungen der linguistischen Merkmale der Äußerungen lassen sich nicht mit einmaligem Abhören durchführen. Dies gilt noch mehr, wenn eine Äußerung auf mehrere Aspekte hin beurteilt werden soll, z. B. auf die Verben, die Substantivdeklination und eventuell weitere Bestandteile, z. B. Präpositionen und die Wortstellung. Deshalb sind Verfahren, die mehrere Aspekte der Lerneräußerungen untersuchen, fast zwangsläufig mit zeitraubenden Erhebungs-, Aufbereitung- und Analyseschritten verbunden.

554

Wilhelm Grießhaber

Diesen Aufwand gibt es bei weiten (u. a. PLAV, HAVAS 5) und engen Profilverfahren (z. B. Clahsen 1985). In der Regel sind auch zeitintensive Einzelgespräche erforderlich. Der Zeitaufwand bei HAVAS 5 wird unterschiedlich eingeschätzt. Schründer-Lenzen (2012) bezeichnet das Verfahren als aufwendig und anspruchsvoll und im Kindergarten ohne Vorbereitung der ErzieherInnen nicht leistbar. Angesichts der in Kindertageseinrichtungen und Schulen knappen Zeit besteht eine Lösung in der Reduzierung der Zahl der Probanden. Jeuk (2013a) hält die Gesprächsdauer mit ca. 5 Minuten für gering, dafür die Aufbereitung und Auswertung für zeitaufwendig. Aus dem Dilemma zwischen Analysegenauigkeit und Zeitaufwand scheinen nur wenige Wege hinauszuführen. Der Verzicht auf die zeitaufwendige Transkription führt zu einer Reduzierung der Analysegenauigkeit. Statt der schriftlichen Fixierung werden die Aufnahmen nach Bedarf zwei- oder dreimal angehört und analysiert. Eine weitere Aufwandreduzierung ist durch eine Verringerung der zu analysierenden Merkmale möglich. Im Prinzip muss die Aufnahme für jedes Merkmal eigens durchgehört werden, da die Analyse sonst deutlich an Zuverlässigkeit verliert. Eine weitere Aufwandverringerung besteht in der Protokollierung von ausgewählten Äußerungen statt der Kompletttranskription. Eine radikale Lösung der Problematik ist die Konzentration auf eine Dimension, wie sie bei der engen Profilanalyse mit der Fokussierung auf die Wortstellung gegeben ist (vgl. Grießhaber 2013). Bei entsprechender Schulung kann die Kodierung unmittelbar während des Gesprächs erfolgen.

3.2 Verbale Kodierung von Äußerungen In zahlreichen weiten Verfahren werden verbale Beschreibungen zur Profilerstellung verwendet. Die kürzeste Variante stellen Ja- oder Nein-Antworten auf Alternativfragen dar. Die Alternative kann auch als Hinweis auf eine Zuspitzung und Beschleunigung der Bewertung betrachtet werden. Für das Profil kann dann die Anzahl der Zustimmungen bzw. Ablehnungen aufsummiert werden, so dass sich klare Konturen abzeichnen. Im Förderprojekt „Deutsch & PC“ wurden solche Alternativfragen bei den diagnostischen Leitfragen (Knapp 2001) im Grammatikbereich meist mit einer freien Formulierung beantwortet. Auf die Frage „Dekliniert das Kind Nomen korrekt?“ wird statt „ja“/„nein“ immer „Mehrzahlbildung“ bzw. „Mehrzahlformen“, teilweise mit Attributen wie „falsche Mehrzahlbildung“, eingetragen, da dies den Lehrkräften aussagekräftiger erschien. So fallen die Beobachtungen zwar differenziert aus, erschweren aber umgekehrt die Bildung und Beurteilung eines Profils.

3.3 Merkmalskodierung und Reliabilität Ein typischer Auswertungsschritt besteht in der Bewertung von Äußerungen nach Kategorien und der Zuweisung einer Kategorie. Diese aufsummierten Werte bilden

Profilanalysen

555

Tab. 2: Kodierungsbeispiel für die sprachliche Ebene in „Bärenstark“ (Senatsverwaltung 2002: 18–19). Punkte

Bewertungsmaßstab

Äußerung

4

Sätze mit grammatisch richtigem Subjekt, Prädikat und Objekt Vollständiger Satz mit einem Mangel Fehlerfreier Satz aus Subjekt und Prädikat Vollständiger Satz mit zwei Fehlern / ein Fehler in einem Satz mit Subjekt und Prädikat Einwort-Satz

Sie spielen mit einem Ball. Sie spielen mit die Ball. Sie spielen. Es spielen mit die Ball. / Es spielen. spielen

3 2 1 0

dann das Profil. „Bärenstark“ arbeitet für die sprachliche Ebene mit fünf Kategorien, die je nach Realisierung mit einer Ziffer zwischen 0 und 4 kodiert wird (s. Tabelle 2). Bei der Kodierung werden zwei Ebenen miteinander verknüpft: Die Komplexität des Satzes und die Zahl der Fehler im Satz. So erhält ein „langer“ Satz mit einem Fehler mehr Punkte als ein „kurzer“ fehlerfreier Satz, und ein „langer“ Satz mit zwei Fehlern erhält ebenso viele Punkte wie ein „kurzer“ Satz mit einem Fehler. Reich (2003) kritisiert unklare Maßstäbe, da die Begründung für die Zuweisung von Punkten im Dunkeln bleibt. Es ist fraglich, was das Profil aus diesen Teilsummen über die erworbenen Sprachmittel aussagt. Ein wichtiger Aspekt der Kodierung ist deren Zuverlässigkeit. Generell nehmen mit den Differenzierungen und der Zahl der zu berücksichtigenden Merkmale die erforderlichen linguistischen Kenntnisse zu. Gleichzeitig erhöht sich die Wahrscheinlichkeit von Ungenauigkeiten bei der Kodierung. Eine Reduzierung der Merkmale kann zu einer besseren Genauigkeit führen. Für die Profilanalyse (nach Grießhaber 2014) ermittelt Domenech (2016: 151) auf der Basis detaillierter Kodierhinweise und einer Raterschulung für argumentative schriftliche Texte der 5. Klassenstufe eine recht hohe durchschnittliche Interraterreliabilität von 98,32.

3.4 Datenjustierung Im Vorschulbereich und in der frühen Grundschule befindet sich die Sprachkompetenz noch in einer schnellen Entwicklung. Deshalb müssen die erhobenen Rohdaten für die Bewertung nach dem Alter der Probanden justiert werden. In „SISMIK“ (Ulich & Mayr 2006) werden die aufsummierten Rohdaten in sechs verschiedene Gruppen eingeteilt, die in Abhängigkeit vom Alter unterschiedliche Sprachniveaus repräsentieren. Z. B. bedeutet ein Rohwert von 42 in der Altersgruppe bis 4 Jahre einen Platz in der zweitbesten Gruppe, in der Altersgruppe von 6 bis 7 Jahren aber einen Platz in der zweitschlechtesten Gruppe. Für eine effektive Nutzung des Instruments sind ErzieherInnen in Kindertagesstätten auf diese Justierung besonders vorzubereiten.

556

Wilhelm Grießhaber

3.5 Einsatzmöglichkeiten Die Art der Datenerhebung hat entscheidenden Einfluss auf die Einsatzmöglichkeiten der Erhebungsverfahren. Verfahren, die mit standardisierten Impulsen und/oder mit Einzelgesprächen arbeiten, können mit den entsprechenden Materialien nur punktuell eingesetzt werden. Verfahren, die mit mündlichen Spontandaten oder schriftlich produzierten Texten arbeiten, sind auch unterrichtsbegleitend einsetzbar. So werden z. B. Clahsen, „Bärenstark“, „HAVAS 5“ oder „PLAV“ interaktiv im Einzelgespräch realisiert, das aufgezeichnet wird. Insofern sich bei den letzten dreien die Auswertungskategorien explizit auf die eingesetzten Bildimpulse beziehen, können die Verfahren mit den vorgegebenen Auswertungsbögen nur mit diesen Bildimpulsen genutzt werden. Das schränkt die Verwendung deutlich ein, da sie nicht unterrichtsbegleitend nutzbar sind. Die mit den Bildimpulsen erzielte Vergleichbarkeit der Erhebung und der ermittelten Kenntnisse reduziert die Nutzbarkeit. Sie sind typischerweise für die Schuleingangsphase vorgesehen. Bei „Tulpenbeet“ ist demgegenüber die im Klassenrahmen realisierbare schriftliche Datenerhebung vorteilhaft. Andererseits schließen die auf den Bildimpuls bezogenen Auswertungsbögen die Anwendung auf andere Daten praktisch aus. Enge profilanalytische Verfahren, z. B. Grießhaber (2014) oder Pienemann (1986), sehen keine spezifischen Impulse vor und sind grundsätzlich auch unterrichtsbegleitend nutzbar, soweit Datenerfassung und Kodierung dies ermöglichen. Das Verfahren nach Grießhaber kann auf mündliche und schriftliche Lerneräußerungen angewendet werden. Es empfiehlt zwar klassenstufenbezogene Bildimpulse, die sich als motivierend bewährt haben, ist aber auch auf andere narrative Texte zur Sprachstandsermittlung anwendbar. Das Verfahren nach Grießhaber kann auch zur Analyse der Sprache in bestimmten Unterrichtsphasen genutzt werden, z. B. bei der Gruppenarbeit im Deutsch- oder Fachunterricht. Allerdings ist es dann nur sehr eingeschränkt zur Sprachstandsbestimmung geeignet. Es lassen sich damit jedoch die in bestimmten Unterrichtsdiskursen funktional verwendeten sprachlichen Mittel bestimmen, so dass diese Diskurse wiederum für die Förderung der in ihnen besonders verwendeten Mittel genutzt werden können. Eine weitere Möglichkeit besteht in der Bestimmung der sprachlichen Komplexität von Lehr- und Lernmaterialien, so dass sie gezielt zur erwerbsbasierten Förderung ausgewählt werden können.

4 Fragen, Probleme und Diskussion 4.1 Analyse der Daten Ein wichtiges Kriterium für Profilanalysen ist nach Crystal, Fletcher & Garman (1984) die Deskriptivität des Verfahrens, d. h. die vollständige und genaue Erfassung

Profilanalysen

557

und Analyse der Lernersprache. Die genaue Befolgung erfordert für mündliche Daten zunächst deren Aufnahme und Transkription. Bei der Bewertung sind alle Äußerungen der Probanden zu berücksichtigen. Clahsen (1985) und Pienemann (1986) erreichen dies durch ein zweistufiges Vorgehen. Im ersten Durchgang werden bestimmte Äußerungen nur gezählt und dann bei der weiteren Analyse nicht mehr analysiert. Ausgesondert werden (akustisch) unverständliche Äußerungen sowie Imitationen und elliptische Antworten. Beispiele 1.1 und 1.2 zeigen den Ausschnitt eines Rohtranskripts (Pienemann 1981: 116) und der für die weitere Analyse bereinigten Äußerungen (Pienemann 1981: 126). (1.1) Lerneräußerungen beim Gespräch über ein Micky-Maus-Heft; Rohtranskript; links: Interviewer, rechts: Concetta (Pienemann 1981: 116) ja. und da (guck ma da) . . was m= ja

=mhm wo ist dieser ((see))? ja. so ein ganz kleiner mann is das ne mhm. und was hat der jez gemacht. der goofy ↑ =mhm un jez sieht man noch besser mhm. guck mal. was siehst du hier?

in der . . in der meer =w was machen mick-maus? schlafen. und die da gucken die da=gucken. die gucken von (xx) (kleine is eine goofe) mhm

der hat geh weg gemacht= hier iste mhm. un jez guck (under

(1.2) Lerneräußerungen für die Analyse bereinigt (Pienemann 1981: 126) cue 14 360 in der meer cs 14 361 was machen mick-maus? cue 14 362 schlafen cs 14 363 und die da gucken cs 4 364 der hat geh weg gemacht cs 14 365 un jez guck Legende: cs: concetta produktive (eigenständige) Äußerung; cue: concetta übliche Ellipse Die Beispiele zeigen, dass Selbstreparaturen in der ersten Zeile bereinigt und doppelte Äußerungen nur einmal erfasst werden. Die Aussonderung von „hier iste“ wird nicht erläutert. Es könnte sich um eine umgangssprachliche Form für „hier ist er“ handeln. Das Beispiel zeigt exemplarisch die Probleme bei der Erfassung und Analyse mündlicher Spontandaten. Clahsen (1985) und Pienemann (1986) führen

558

Wilhelm Grießhaber

vor der Profilanalyse eine Bereinigung durch. Grießhaber schlägt die Erfassung und Analyse aller Äußerungen vor und nimmt die damit verbundene hohe Zahl bruchstückhafter Äußerungen in Kauf (Beispiel 2). Der Vorteil ist darin zu sehen, dass die Analyse in einem Zug erfolgt. Lediglich bei Selbstverbesserungen werden die Kernäußerungen erfasst und analysiert. Die grammatische Wohlgeformtheit der Äußerungen spielt bei der Bestimmung der Wortstellungsmuster keine entscheidende Rolle, wie Beispiel 1.1 und Beispiel 1.2 zeigen. Falsche Kasusendungen, z. B. „in der meer“, werden ignoriert, solange die Bedeutung und die Funktion erschließbar sind. In Beispiel 2 stellt sich die Schülerin NELA einem Gast vor, der sie noch nicht kennt. Insofern handelt es sich um eine authentische Interaktion im Unterricht. Es lassen sich zwei Phasen unterscheiden. Zu Beginn spricht NELA in den Segmenten 02 bis 05 ohne Unterbrechung, während die späteren Äußerungen durch längere Unterbrechungen der Gesprächspartner gekennzeichnet sind. Bei der Analyse nach Grießhaber werden die Äußerungen zunächst in MSE aufgeteilt. Komplexe Satzgefüge werden aufgeteilt und getrennt gewertet. Jeder MSE wird dann die nach Tabelle 1 passende Profilstufe zugeordnet. Anschließend werden auf der Basis des Profils der Anteil komplexer Muster und die Erwerbsstufe bestimmt. (2) Selbstvorstellung, 1. Klasse, L1 Kroatisch, 2 Monate in Deutschland, „Deutsch & PC“. Segment

Äußerungen der Schülerin

02 03 04 05 11 14 17

Ich heiße NELA. Ich bin acht Jahre alt. Ich komme aus Kroatien. Meine Hobbys sind • mit Hunde spielen. Jessie. Jessie. Und Mama liebt sie/ • • Mama liebt des nicht. Nein. Weiß ich nicht. Weil ich (immer sie eh so) • streichel … … und dann hört nicht. Weiß ich nicht.

19 21 22 22 28

PS 4

PS 2

PS 1

PS 0

x x x x x x x x x x x x

Profil:

1

Anteil komplexer und einfacher Muster:

25 %

Erwerbsstufe:

PS 3

2

1

4

4

75 % 1

Legende: nur Äußerungen von NELA; Äußerungen der Lehrerin und der MitschülerInnen sind an den Segmentnummern erkennbar.

Die ersten drei MSE sind grammatisch wohlgeformte einfache Äußerungen. Es handelt sich wohl um ganzheitlich erworbene Chunks mit festen Strukturelementen

Profilanalysen

559

und variablen Werten. Bei den Hobbys passt das genannte Hobby nicht mehr zu dem ganzheitlich erworbenen Strukturmuster. Die kurze Pause nach dem musterförmigen Teil zeigt eine Unsicherheit an. Die morphologisch abweichende Äußerung wird als Separation mit Finitum und Infinitiv gewertet. Bei 17 handelt es sich wie in Beispiel 1.1 um eine Selbstreparatur. Die zunächst geplante Äußerung wird abgebrochen und durch eine andere ersetzt. Das mit dem Dummy „des“ realisierte Objekt des Nicht-Mögens erschließt sich später in Segment (22). Offensichtlich kann sie diesen Sachverhalt noch nicht in einem komplexen Satzgefüge realisieren. Die zweimal verwendeten Inversionen, „Weiß ich nicht.“ (Segmente 21 und 28), sind ganzheitlich erworbene Chunks, die den Einstieg in den Erwerb der Inversion zeigen. Das Profil zeigt einen sehr großen Anteil einfacher Satzmuster, die Inversionen sind formelhaft, im Nebensatz ist die Wortstellung noch nicht standardgerecht. Mit der Erwerbsstufe 1 werden die Sprachkenntnisse zusammenfassend charakterisiert. Als Förderhorizont (Heilmann 2012: 49–51) ergibt sich daraus die Vermittlung von Separationsmustern, die noch nicht richtig beherrscht werden.

4.2 Beurteilungsrelevantes linguistisches Wissen Alle Versionen der Profilanalyse erfordern für die Erfassung und Beurteilung der Sprachkenntnisse gewisse linguistische Kenntnisse, so Clahsen (1984: 285) etwas untertreibend, „some knowledge of linguistics to enable assessment of the developmental level and the particular linguistic problems a learner has“. Bei den weiten profilanalytischen Verfahren wird ein recht breites Wissen verlangt, das von Wortartenkenntnis, der Kasus- und Pluralbildung von Substantiven, der Verbkonjugation bis zur korrekten Verwendung von Adjektiven, Artikeln und Präpositionen und bis zur Bestimmung von einfachen und komplexen Sätzen reicht. Im Grunde werden alle relevanten Bereiche der Grammatik des Deutschen benötigt. Bei dem Verfahren von Grießhaber sind für die grundlegenden vier Profilstufen einige Grundbegriffe ausreichend: Das Subjekt sowie finite und infinite Verbteile müssen bestimmt werden können. Zur sicheren Bestimmung von untergeordneten Nebensätzen sind Subjunktoren zu erkennen und generell Haupt- und Nebensätze voneinander zu unterscheiden. Allerdings tun sich zahlreiche Studierende und Lehrkräfte mit der Analyse schwer, wie die folgenden Beispiele zeigen. Bei der Separation scheint nicht klar zu sein, was genau zum Verb gehört und was das Prädikat im weiteren Sinn ist. So wird die Äußerung „Mama war sehr sauer.“ als Separation eingestuft, da „sauer“ als infiniter Verbteil von „sauer sein“ und nicht als prädikatives Adjektiv aufgefasst wird. Umgekehrt werden Separationen nicht erkannt, so z. B. in „Mags will nich essen“. In diesem Fall wird „nicht“ nicht als Negation betrachtet, sondern als Bestandteil des Prädikats „nicht essen wollen“. Partikelverben mit trennbarem Präfix werden nicht als Teile eines Verbs betrachtet, sondern als Bestandteil des Prädikats, z. B. „seine Zunge herausstecken“ in dem Satz „… steckte seine Zunge heraus“.

560

Wilhelm Grießhaber

Auch bei Inversionen zeigen sich häufig Unsicherheiten. So wird „Er hieß Maik“ mehrfach als Inversion bestimmt. Möglicherweise wurde nach semantischen Kriterien „Maik“ als nachgestelltes Subjekt betrachtet. Insgesamt zeigen sich grundlegende Schwächen bei der praktischen Sprachanalyse (vgl. Grießhaber 2015).

4.3 Schriftlichkeit, Stilistik und grammatische Analyse Bei der Beurteilung von schriftlichen Lernertexten erscheint aus didaktischer Sicht die Erfassung von bruchstückhaften Äußerungen und von direkter Rede als problematisch. Direkte Rede wird als Mittel zur Gestaltung von Emotionalität positiv gewertet, da sie den Leser in das Geschehen hineinzieht. Dagegen erscheint indirekte Rede erzählerisch weniger effektiv, auch wenn sie grammatisch komplexer ist. In Beispiel 3 wird bei der direkten Rede der abhängige Teil mit einer Separation realisiert, bei der indirekten mit einem Nebensatz. Unter diesen Gesichtspunkten könnten indirekte Konstruktionen didaktisch mehr gefördert werden. (3) Verben des Denkens, Meinens, Fühlens; 4. Klasse zum Bildimpuls Angst, L1 Türkisch „[Tobias überlegt:]1 [„Mami und Papi können es nicht sein …“]2“ „[Tobias freut sich aber]1 [weil er dann ein Horrorfilm gucken kann]4.“ Ebenfalls problematisch erscheint die durchgehende Erfassung von syntaktisch bruchstückhaften Überschriften als Bruchstücke der Profilstufe 0, da sie die Rezipienten vorgreifend in komprimierter Form auf den folgenden Text hin orientieren und gegebenenfalls auch neugierig machen. Bei dem Verfahren „Tulpenbeet“ hingegen wird eine Überschrift als literarisches Element erfasst. Das ist eine Möglichkeit zur Erfassung und Bewertung der hohen textuellen Qualität von Überschriften. Bei der strikt syntaktisch orientierten Profilanalyse wird jedoch nur die – gegebenenfalls – bruchstückhafte Struktur erfasst, stilistische Leistungen sind getrennt davon zu bewerten.

4.4 Variabler Sprachstand? Profilanalytische Verfahren stützen sich im Unterschied zu Tests auf frei formulierte Äußerungen. Deshalb beeinflussen die Bedingungen des sprachlichen Handelns die verwendeten Mittel und die auf ihrer Grundlage erstellten Profile. So können prinzipiell bspw. auch Äußerungen, die im Rahmen psycholinguistischer Tests erhoben werden, profilanalytisch beurteilt werden, auch wenn es sich durchweg nur um bruchstückhafte Äußerungen handeln sollte. Allerdings sind sie für die Ermittlung des Sprachstands mit profilanalytischen Verfahren eher ungeeignet. Für die Sprach-

Profilanalysen

561

standsermittlung haben sich vielmehr Erzählungen (vgl. Webersik in diesem Band) als besonders geeignet erwiesen, die vom Erzähler geplant und sukzessive realisiert werden. Sie enthalten komplexe Wortstellungsmuster in satzübergreifenden Äußerungen. In der Anfangsphase von Erzählungen spielen Inversionen eine wichtige Rolle bei der Etablierung von Ort, Zeit und weiteren Umständen. Bei den morgendlichen Erzählkreisen in der Grundschule unterscheiden sich die Äußerungen in den eigentlichen, selbstgeplanten und realisierten Erzählphasen von denen in den anschließenden Fragesequenzen. Bei den Fragesequenzen sind bestimmte Informationen vorgegeben, die Antwort kann sich darauf beschränken und Teile der Frage übernehmen. Deshalb sind sie in der Regel komplexer als die Erzählphasen und repräsentieren nicht unbedingt den sicher erreichten Sprachstand. Bei Äußerungen auf der Basis von Bildsequenzen bezieht sich der Sprecher häufig mit Demonstrativa (Da…) und den damit verbundenen Inversionen auf Elemente der Bildvorlage. Die dabei verwendeten Inversionen kann der Sprecher oft noch nicht sicher in den selbstgeplanten Erzählungen realisieren. Dies gilt auch für andere eingeübte formelhafte Äußerungen, deren Struktur noch nicht in ihren Bestandteilen verfügbar ist. Bei handlungsbezogenen Äußerungen, z. B. im Sachunterricht, führt die Orientierung auf die Objekte, deren Identifizierung, Eigenschaften und Handhabung systematisch zur Verwendung von Inversionen (Röhner 2009). Oft handelt es sich dabei um kurze formelhafte Äußerungen. Umgekehrt eignen sich solche Handlungssituationen auch ohne explizite grammatische Übungen deshalb auch zur Vermittlung von Inversionen. Aufgrund der gegenseitigen Abhängigkeit von Diskurs und sprachlichen Mitteln sind diese Bedingungen bei der Bestimmung des Sprachstands zu berücksichtigen. Je nach Diskurs unterscheiden sich die bei der engen Profilanalyse erhobenen Profile, so dass bei oberflächlicher Betrachtung der Sprachstand sogar nach Diskursart, Tageszeit usw. Schwankungen aufzuweisen scheint.

4.5 Orientierung: Standardgrammatik oder Erwerbssequenzen? Bei der grammatischen Analyse unterscheiden sich die profilanalytischen Verfahren. Die weiten beziehen in der Regel auch die formale Korrektheit der nominalen und verbalen Mittel mit ein. Sie sind in diesem Sinne normorientiert. Es bleibt weitgehend unklar, inwieweit damit eine Station im Zweitspracherwerb ermittelt wird und was die nächsten Schritte in der Förderung sein könnten. Generell beziehen sich weite Verfahren bei der grammatischen Analyse auf die Standardgrammatik. Sie lassen die empirisch ermittelten Erwerbsfolgen der Satzmuster unberücksichtigt. So berücksichtigt „Bärenstark“ lediglich die Zahl der korrekten Satzglieder in einem Aussagesatz, der aus Subjekt, Prädikat und Objekt bestehen kann, ohne die Wortstellung systematisch zu berücksichtigen. Entscheidend sind die Fehlerfreiheit und die Zahl der Mitspieler. „Tulpenbeet“ unterteilt die Syn-

562

Wilhelm Grießhaber

Tab. 3: Satzmuster im Vergleich: „Profilanalyse“ und „Tulpenbeet“ (Reich, Roth & Gantefort 2008: 237). Satzmuster (Grießhaber)

Satzarten (“Tulpenbeet“)

0 Bruchstücke

unvollständiger Satz

1 Finitum

einfacher Hauptsatz

2 Separation 3 Inversion koordinierte Hauptsätze 4 Nebensatz

ein Hauptsatz mit einem (abhängigen) Nebensatz mehrere Hauptsätze mit einem abhängigen Nebensatz Hauptsatz mit mehreren abhängigen Nebensätzen

5 Insertion (eines Nebensatzes) 6 Integration (eines Partizipialattributs)

tax vor allem hinsichtlich einfacher Sätze und komplexer Sätze aus Haupt- und Nebensatz (s. Tabelle 3). „Tulpenbeet“ und andere an der Standardgrammatik orientierte Verfahren lassen die Chance ungenutzt, die verwendeten Sprachmittel unter dem Gesichtspunkt ihres Erwerbs zu betrachten. Ein markantes Beispiel dafür ist die Inversion, die in sprachwissenschaftlichen Arbeiten zum Deutschen lediglich nebenbei als mögliche Stellungsvariante für Finitum und Subjekt betrachtet wird. Die Duden-Grammatik (2006: 880) verzichtet explizit auf die besondere Berücksichtigung der Stellung des Subjekts. Eisenberg (2006: 399) lehnt das Konzept der Inversion ab. Die besondere Rolle der Subjektstellung bei der Inversion wurde erst in der Zweitspracherwerbsforschung empirisch ermittelt. Hoffmann (2016: 515) behandelt die Inversion im Zusammenhang mit der Sprachstandsbestimmung und der Besetzung des Vorfelds.

5 Aktuelle Forschungsprojekte 5.1 Korrespondenzen Auch wenn die Wortstellungsmuster in einer bestimmten Reihenfolge erworben werden, ist damit noch nicht geklärt, ob und wie diese zunehmende Komplexität mit anderen Bereichen, z. B. dem Wortschatz oder der Morphologie, zusammenhängt. Das Konzept der Basisqualifikationen (Ehlich, Bredel & Reich 2008) beschreibt die Entwicklung der Bereiche weitgehend separat. Redder (2013) legt mit dem „Kompetenzgitter“ ein Konzept zur Verbindung des sprachlichen Handelns mit sprachlichen

563

Profilanalysen

Tab. 4: Korrespondenzen der Erwerbsstufe mit Textumfang, Kasus, Präteritum und C-Test; jeweils 4. Klasse. ES

∑

MSE Ø

≥3 %

DAT %

DAT √

PRÄT %

PRÄT √

C-Test

4 3 2 1 DEU MSP TÜRK

53 56 9 2 28 92 33

36,2 25,0 16,6 14,0 28,7 29,3 27,5

38 31 16 24 34 33 34

23 24 19 29 25 23 20

87,6 % 83,8 % 69,0 % 100 % 91,5 % 83,5 % 75,9 %

48 56 45 79 62 48 53

97,9 % 95,4 % 95,5 % 100 % 97,9 % 96,3 % 95,0 %

45,1 40,8 29,0 39,5 45,1 40,9 38,8

gesamt

120

29,2

33

23

85,4 %

0,51

96,8 %

41,9

Legende: ES: Erwerbsstufe; ∑: Textzahl; ≥3 %: Anteil von komplexen Mustern der Stufe 3 und höher; MSEØ: Mittelwert der MSE; DAT%: Dativanteile; DAT √: Dativ-Korrektheit; PRÄT%: Präteritumsanteile; PRÄT √: Präteritumskorrektheit; DEU: einsprachig Deutsch; MSP: mehrsprachig; TÜRK: türkischsprachig

Mitteln vor, das als Profil betrachtet werden kann. In den weiten profilanalytischen Verfahren werden die Bereiche oft getrennt erhoben und ausgewertet (s. o.). Einige Beziehungen zwischen den Profilstufen und sprachlichen Mitteln zeigen sich in empirischen Längsschnittstudien über die Grundschulzeit hinweg, die an drei Frankfurter Grundschulen im Förderprojekt „Deutsch & PC“ durchgeführt wurden. Die Korrespondenzen sind je nach Klassenstufe getrennt zu betrachten, da die Sprachkompetenz im Laufe der Schulzeit zunimmt. Tabelle 4 zeigt Daten aus Texten, die am Ende der 4. Klasse zu dem Bildimpuls „ANGST“ erhoben wurden. Zum Vergleich sind die Werte für den parallel durchgeführten C-Test aufgeführt, der als zuverlässiges Instrument der Sprachstandsermittlung betrachtet wird (vgl. Grotjahn in diesem Band). In Tabelle 4 dominieren Texte der Erwerbsstufe 3 (46,7 %) und 4 (44,2 %) gegenüber den niedrigeren Erwerbsstufen 1 und 2. Die zwei Texte auf der ES 1 können keine repräsentativen Werte liefern. Die kontinuierlich steigenden Werte für den Textumfang (MSE) zeigen eine starke Korrespondenz mit der Erwerbsstufe, während sich die Durchschnittswerte nach dem Sprachstatus des Deutschen kaum unterscheiden. Für den Anteil komplexer Muster (≥3) und die Dativkorrektheit (DAT √) zeigen sich ab der ES 2 ebenfalls Korrespondenzen mit der Erwerbsstufe. Die Präteritumskorrektheit (PRÄT √) ist insgesamt recht hoch, so dass der etwas bessere Wert auf der ES 4 wenig aussagekräftig ist. Ab der ES 2 zeigt sich eine Korrespondenz mit den kontinuierlich steigenden C-Test-Werten. Betrachtet man die Werte nach dem Sprachstatus, erzielen die mehrsprachigen SchülerInnen bei der Dativkorrektheit und dem C-Test niedrigere Werte. Die türkischsprachigen SchülerInnen liegen ungefähr auf dem Niveau der mehrsprachigen insgesamt, bei der Dativkorrektheit schneiden sie erkennbar schwächer als der Durchschnitt der mehrsprachigen ab. Nach vier Grundschuljahren unterscheiden

564

Wilhelm Grießhaber

sich mehrsprachige SchülerInnen vor allem in der Nominalmorphologie von den einsprachigen. Auch die mit dem C-Test gemessenen Werte sind etwas niedriger. Eine insgesamt recht stabile Korrespondenz besteht über die Schuljahre hinweg zwischen der Erwerbsstufe und dem Textumfang. Insgesamt sind längere Texte, gemessen in MSE, in der Regel sprachlich-formal korrekter. Der globale Sprachstatus unterscheidet sich dagegen – auch dank des effektiven Förderprogramms an den drei Förderschulen – nur gering. Beim Wortschatz können – ähnlich wie bei den weiten profilanalytischen Verfahren – nur die mit dem Bildimpuls evozierten Lexeme erfasst und verglichen werden. Bei den Verben zeigen sich für das im Bildimpuls dargestellte Verhalten eines Hundes typische Verwendungsweisen. Die deutschsprachigen SchülerInnen verwenden durchgehend passend „(an)knurren“, während fast alle mehrsprachigen abweichend vom Bildimpuls die elementaren Verben „bellen“ und „beißen“ verwenden. Lediglich zwei mehrsprachige Texte auf der Erwerbsstufe 4 enthalten „knurren“. Die Lexemwahl ist demnach sowohl mit dem Sprachstatus als auch mit der Erwerbsstufe verbunden. Ähnlich stellt sich der Gebrauch von Partikelverben mit trennbarem Präfix dar, die vor allem von einsprachigen und von mehrsprachigen SchülerInnen auf der Erwerbsstufe 4 verwendet werden. Die hier gezeigten Tendenzen sind generell auch auf den anderen Klassenstufen festzustellen. Die Profilanalyse gibt damit auch Hinweise auf einige weitere Bereiche der Sprachkenntnisse, ohne sie direkt zu messen.

5.2 Weitere Sprachen Die in den Profilanalysen erfassten sprachlichen Bereiche sind sehr sprachspezifisch auf das Deutsche bezogen und nicht unmittelbar auf andere Sprachen übertragbar. In „HAVAS 5“ werden für die berücksichtigten Familiensprachen jeweils eigene Kriterien verwendet. Die Erwerbsreihenfolgen syntaktischer Muster in den engen profilanalytischen Verfahren sind explizit mit den spezifischen deutschen Wortstellungsregeln verbunden und sind nicht übertragbar. Dennoch sollten bei Beurteilung der Sprachkenntnisse von mehrsprachigen SchülerInnen auch deren familiensprachliche Kenntnisse berücksichtigt werden. Dies ist bei vorhandenen Schriftsprachkenntnissen mit dem C-Test im Prinzip möglich. Bei den profilanalytischen Verfahren ist es dagegen aufgrund der Sprachspezifik nicht direkt möglich. Mit „HAVAS 5“, „Tulpenbeet“ und „Bumerang“ gibt es einige Ansätze, Grießhaber (2016) macht einen Vorschlag für das Türkische. Für das Türkische zeigen sich große Unterschiede schon dadurch, dass es keine untergeordneten Nebensätze gibt. Ihnen entsprechen Gerundialkonstruktionen. Deshalb wird der Vorschlag von Crystal, Fletcher & Paul (1984) aufgegriffen, die Erwerbsreihenfolge im Erstspracherwerb (s. Sırım 2008, Aksu-Koç 1994) als Grundlage zu nehmen. Der Vorschlag für das Türkische (Grießhaber 2016: 11) beginnt wie im Deutschen mit bruchstückhaften Äußerungen und einfachen satzwertigen Ein-

Profilanalysen

565

heiten. Der ES 2 werden Matrixkonstruktionen mit nachgestelltem redeindizierendem Verb und Genitiv-Possessivkonstruktionen zugeordnet. Auf der ES 3 werden -ip Partizipien erfasst, denen im Deutschen meist ein nebengeordneter Satz entspricht. Der ES 4 werden flektierte Konverbien (z. B. -diğini) zugeordnet, denen als deutsche Äquivalente untergeordnete Nebensätze entsprechen und die im Erstspracherwerb recht spät erworben werden. Mit diesem Instrument lässt sich die grammatische Komplexität von deutschen und türkischen Texten erheben und vergleichen. Die Tragfähigkeit des Vorschlags ist in weiteren Erhebungen genauer zu bestimmen.

Literatur Aksu-Koç, Ayhan A. (1994): Development of Linguistic Forms: Turkish. In Ruth A. Berman & Dan Isaac Slobin (Hrsg.), Relating Events in Narrative, 329–385. Hillsdale, NJ: Erlbaum. Bruche-Schulz, Gisela, Hans-Werner Heß & Ulrich Steinmüller (Projektleitung) (1983): Sprachstandserhebungen im Grundschulalter. Ein Projektives Linguistisches Analyseverfahren (PLAV). Berlin: der Senator für Schulwesen, Jugend und Sport. Chomsky, Noam (1965): Aspects of the Theory of Syntax. Cambridge, Massachusetts: MIT Press. Clahsen, Harald (1984): The Acquisition of German word order: A test case for cognitive approaches to L2 development. In Roger Andersen (Hrsg.), Second Languages: A Crosslinguistic Perspective, 219–242. Rowley, MA: Newbury House. Clahsen, Harald (1985): Profiling second language development: A procedure for assessing L2 proficiency. In Kenneth Hyltenstam & Manfred Pienemann (Hrsg.), Modelling and Assessing Second Language Acquisition. 283–331. Clevedon: Multilingual Matters. Clahsen, Harald (1986): Die Profilanalyse. Ein linguistisches Verfahren für die Sprachdiagnose im Vorschulalter. Berlin: Marhold. Crystal, David, Paul Fletcher & Michael Garman (1984): The Grammatical Analysis of Language Disability. A Procedure for assessment and Remediation. London: Edward Arnold. Domenech, Madeleine (2016): Schriftsprachliche Profile zu Beginn der Sekundarstufe I. Eine Analyse persuasiver Briefe von Fünftklässlern als Zusammenspiel textueller, familiärer und individueller Ressourcen. Dortmund: Technische Universität (Dissertation). Dudenredaktion (Hrsg.) (2006): Die Grammatik. Band 4. 7. Aufl. Mannheim u. a.: Dudenverlag. Ehlich, Konrad (1986): Funktional-pragmatische Kommunikationsanalyse – Ziele und Verfahren. In: Wolfdietrich Hartung (Hrsg.), Untersuchungen zur Kommunikation – Ergebnisse und Perspektiven. Internationale Arbeitstagung in Bad Stuer, Dezember 1985/ Akademie der Wissenschaften der DDR, Zentralinstitut für Sprachwissenschaft. Linguistische Studien Reihe A. Arbeitsberichte 149. 15–40. Ehlich, Konrad (2007) „So kam ich in die IBM“. Eine diskursanalytische Studie. In Konrad Ehlich (Hrsg.), Sprache und sprachliches Handeln, Band 3: Narration – Diskurs – Text – Schrift. 65–107. Berlin, New York: de Gruyter. Ehlich, Konrad, Ursula Bredel & Hans H. Reich (Hrsg.) (2008): Referenzrahmen zur altersspezifischen Sprachaneignung. Bildungsforschung Band 29/I. Berlin: Bundesministerium für Bildung und Forschung. Eisenberg, Peter (2006): Grundriss der deutschen Grammatik. Band 2: Der Satz. 3. Aufl. Stuttgart u. Weimar: Metzler. Grießhaber, Wilhelm (2006): Testen nichtdeutschsprachiger Kinder bei der Einschulung mit dem Verfahren der Profilanalyse – Konzeption und praktische Erfahrungen. In Bernt Ahrenholz &

566

Wilhelm Grießhaber

Ernst Apeltauer (Hrsg.), Zweitspracherwerb und curriculare Dimensionen. 73–90. Tübingen: Stauffenburg. Grießhaber, Wilhelm (2012): Die Profilanalyse. In Bernt Ahrenholz (Hrsg.), Wie man eine weitere Sprache erwirbt, 173–193. Berlin u. New York: de Gruyter. Grießhaber, Wilhelm (2013): Die Profilanalyse für Deutsch als Diagnoseinstrument zur Sprachförderung. http://www.uni-due.de/imperia/md/content/prodaz/griesshaber_ profilanalyse_deutsch.pdf (03. 01. 16). Grießhaber, Wilhelm (2014): Beurteilung von Texten mehrsprachiger Schülerinnen und Schüler. leseforum.ch 3. http://www.leseforum.ch/myUploadData/files/2014_3_Griesshaber.pdf (03. 01. 2016.). Grießhaber, Wilhelm (2015): Grammatische Terminologie und mehrsprachige Schülerinnen und Schüler. In Klaus-Michael Köpcke & Arne Ziegler (Hrsg.), Deutsche Grammatik im Kontakt. Deutsch als Zweitsprache in Schule und Unterricht, 85–102. Berlin u. Boston: de Gruyter. Grießhaber, Wilhelm (2016): Aspekte erst- und zweitsprachlicher Ressourcen türkischer GrundschülerInnen. In Peter Rosenberg & Christoph Schroeder (Hrsg.), Mehrsprachigkeit als Ressource in der Schriftlichkeit, 3–23. Berlin: de Gruyter. Heilmann, Beatrix (2012) Diagnostik & Förderung − leicht gemacht. Das Praxishandbuch. Stuttgart: Klett. Hoffmann, Ludger (2016): Deutsche Grammatik. Grundlagen für Lehrerausbildung, Schule, Deutsch als Zweitsprache und Deutsch als Fremdsprache. 3., neu bearbeitete und erweiterte Aufl. Berlin: ESV Schmidt. Jeuk, Stefan (Hrsg.) (2013): Sprachförderung und Förderdiagnostik in der Sekundarstufe I. Stuttgart: Fillibach bei Klett. Jeuk, Stefan (2013): der-die-das: Sprache und Lesen − Klasse 1/2. Deutsch-Lehrwerk für Grundschulkinder mit erhöhtem Sprachförderbedarf. Berlin: Cornelsen. Junk-Deppenmeier, Alexandra & Stefan Jeuk (Hrsg.) (2015): Praxismaterial Förderdiagnostik. Werkzeuge für den Sprachunterricht in der Sekundarstufe I. Stuttgart: Fillibach bei Klett. Knapp, Werner (2001): Diagnostische Leitfragen. Praxis Grundschule 3/01, 4–6. Lienert, Gustav A. & Ulrich Raatz (1998): Testaufbau und Testanalyse. 6. Aufl. Weinheim: Beltz (kindle edition). Luchtenberg, Sigrid (1984): Sprachstandsdiagnoseverfahren für ausländische Kinder und Jugendliche – ein kritischer Vergleich. Deutsch lernen 1, 25–41. Luchtenberg, Sigrid, Hans-Joachim Neumann & Manfred Wespel (1982): Informeller Test zur Sprachstandsdiagnose bei ausländischen Kindern und Jugendlichen. In Ursula CoburnStaege (Hrsg.) Türkische Kinder in unseren Schulen. Eine pädagogische Herausforderung, 134–176. Stuttgart: Klett. Meisel, Jürgen M., Harald Clahsen & Manfred Pienemann (1978): On Determining Developmental Stages in Natural Second Language Acquisition. Wuppertaler Arbeitspapiere zur Sprachwissenschaft 2, 1–53. Pienemann, Manfred (1981): Der Zweitspracherwerb ausländischer Arbeiterkinder. Bonn: Bouvier. Pienemann, Manfred (1986): Is language teachable? Psycholinguistic experiments and hypotheses. Australian Working Papers in Language Development 1.3/86 (auch in: Hamburg: Arbeiten zur Mehrsprachigkeit 21/87, 52–79). Redder, Angelika (2013): Sprachliches Kompetenzgitter. Linguistisches Konzept und evidenzbasierte Ausführung. In Angelika Redder & Sabine Weinert (Hrsg.), Sprachförderung und Sprachdiagnostik. Interdisziplinäre Perspektiven, 108–134. Münster u. a.: Waxmann. Reich, Hans (2003): Tests und Sprachstandsmessungen bei Schülern und Schülerinnen, die Deutsch nicht als Muttersprache haben. In Ursula Bredel, Hartmut Günther, Peter Klotz, Jakob Ossner & Gesa Siebert-Ott (Hrsg.), Didaktik der deutschen Sprache. Band 1, 914–923. Paderborn u. a.: Schöningh.

Profilanalysen

567

Reich, Hans H. & Roth, Hans-Joachim (2007): HAVAS 5 − das Hamburger Verfahren zur Analyse des Sprachstands bei Fünfjährigen. In Hans H. Reich, Hans-Joachim Roth & Ursula Neumann (Hrsg.), Sprachdiagnostik im Lernprozess. Verfahren zur Analyse von Sprachständen im Kontext von Zweisprachigkeit, 71–94. Münster u. New York: Waxmann. Reich, Hans H., Hans-Joachim Roth & Christoph Gantefort (2008): Auswertungshinweise ‚Der Sturz ins Tulpenbeet‘ (Deutsch). In Thorsten Klinger, Knut Schwippert & Birgit Leiblein (Hrsg.), Evaluation im Modellprogramm FÖRMIG. Planung und Realisierung eines Evaluationskonzepts, 209–237. Münster u. New York: Waxmann. Röhner, Charlotte (2009): Sprachförderung von Migrantenkindern im Kontext frühen naturwissenschaftlich-technischen Lernens. Abschlussbericht Stifterverband / Cornelsen Stiftung Lehren und Lernen. Wuppertal: Universität Fachbereich G: Bildungs- und Sozialwissenschaften. Senatsverwaltung für Bildung, Jugend und Sport (Hrsg.) (2002): Bärenstark. Berliner Sprachstandserhebung und Materialien zur Sprachförderung für Kinder in der Vorschul- und Schuleingangsphase. Berlin. Schründer-Lenzen, Agi (2012): Diagnose und Förderung der sprachlichen Entwicklung von Schülerinnen und Schülern mit Migrationshintergrund. In Michael Matzner (Hrsg.), Handbuch Migration und Bildung, 167–181. Weinheim und Basel: Beltz-Verlag. Sırım, Emran (2008): Türkisch. In Konrad Ehlich, Ursula Bredel & Hans H. Reich (Hrsg.), Referenzrahmen zur altersspezifischen Sprachaneignung. Bildungsforschung 29/1, 227–253. Berlin: Bundesministerium für Bildung und Forschung. Ulich, Michaela & Toni Mayr (2006): sismik − Sprachverhalten und Interesse an Sprache bei Migrantenkindern in Kindertageseinrichtungen. Beobachtungsbogen & Begleitheft zum Beobachtungsbogen sismik. Freiburg i. Br.: Herder & Staatsinstitut für Frühpädagogik IFP.

Marion Döll

23 Sprachdiagnose durch Beobachtung 1 2 3 4 5 6

Beobachtung Beobachtung sprachlichen Handelns Möglichkeiten und Grenzen sprachdiagnostischer Beobachtung Anforderungen an sprachdiagnostische Beobachtungsverfahren Beispiele Zum Abschluss

Der vorliegende Beitrag widmet sich Verfahren, die sprachliche Fähigkeiten im Deutschen als Zweitsprache durch Beobachtung zu erfassen beabsichtigen. Bei Beobachtungsverfahren handelt es sich im weitesten Sinne um pädagogisch-diagnostische bzw. Unterrichtsbeobachtungen, die die Wahrnehmung von sprachlichem Handeln kriteriengeleitet systematisieren. Auch wenn in den vergangenen Jahren, vor allem im Kontext des Fremdsprachenlernens, vermehrt Selbstbeobachtungen in Form von Portfolios (vgl. Ricart Brede in diesem Band) in Umlauf gekommen sind, sollen diese nicht Gegenstand der folgenden Betrachtungen sein. Der Fokus des Beitrags wird bewusst auf Fremdbeobachtungen gelenkt, die zu pädagogischen Zwecken im Sinne der Ermittlung von Anknüpfungspunkten für die sprachpädagogische Arbeit entwickelt und angewendet werden.

1 Beobachtung Die Beobachtung gilt als grundlegende Methode der pädagogischen Diagnostik und „kann von Pädagogen fast ständig eingesetzt werden“ (Ingenkamp & Lissmann 2008: 74). Diagnostisch intendierte Beobachtungen gelten als Form wissenschaftlicher Beobachtungen und dienen der besonders aufmerksamen und sorgfältigen Wahrnehmung bestimmter Ereignisse, Vorgänge und Verhaltensweisen. Im Gegensatz zu Alltags- und Gelegenheitsbeobachtungen, die überwiegend unsystematisch stattfinden und/oder nicht zwingend einer begründeten Routine folgen, sind wissenschaftliche Beobachtungen durch einen hohen Grad an Systematisierung gekennzeichnet (Greve & Wentura 1996). Wahrnehmung und Registrierung sind also auf einen konkreten Beobachtungsgegenstand gerichtet und werden methodisch kontrolliert (Mees 1977). Dies gilt auch für sprachdiagnostische Beobachtungen, die in pädagogischen Kontexten Anwendung finden. Systematische Beobachtungen werden üblicherweise nach fünf Aspekten klassifiziert (Greve & Wentura 1996; Fisseni 1997): – Zum einen wird zwischen Labor- und Feldbeobachtung, d. h. zwischen Beobachtungen in künstlicher und natürlicher Umgebung, unterschieden. Im Hinblick auf Feldbeobachtungen wird oft auch von naturalistischer Beobachtung gesprohttps://doi.org/10.1515/9783110418712-023

570

–

–

– –

Marion Döll

chen, die vorliegt, wenn das zu beobachtende Verhalten nicht nur in natürlicher bzw. gewohnter Umgebung stattfindet, sondern darüber hinaus auch durch die Beobachtenden nicht beeinflusst wird. Darüber hinaus wird zwischen offener und verdeckter Beobachtung unterschieden. Eine verdeckte Beobachtung liegt vor, wenn den Beobachteten nicht bekannt ist, dass sie beobachtet werden. Eine weitere Unterscheidung wird im Hinblick auf die Involviertheit der Beobachtenden vorgenommen. Differenziert wird hier zwischen teilnehmender und nicht-teilnehmender Beobachtung. Letztere ist beispielsweise durch den Einsatz von Einwegspiegeln oder Videographie realisierbar. Hier knüpft wiederum die Unterscheidung zwischen technisch vermittelter und unvermittelter Beobachtung an. Die fünfte Kategorie wurde von Mees (1977) eingeführt und fokussiert den Grad der Selektion der Ereignisse und Interpretation bzw. Zusammenfassung des Beobachteten. Unterschieden wird zwischen isomorpher Beschreibung, reduktiver Beschreibung und reduktiver Einschätzung. Das Ziel isomorpher Beschreibungen ist die vollständige Wiedergabe beobachteten Verhaltens, z. B. in Form detaillierter Verlaufsprotokolle. Die Selektion und Interpretation des Wahrgenommenen soll dabei weitgehend zurückgestellt sein, als Beobachtungsergebnis soll umfangreiches, möglichst ungefiltertes Datenmaterial vorliegen. Reduktivdeskriptive Beobachtungen sind durch das Festhalten vorab festgelegter Verhaltensweisen nach fixen Regeln, z. B. in Form von Index- und Kategoriensystemen, gekennzeichnet. Reduktive Einschätzungen gehen darüber noch ein Stück hinaus, indem zusätzlich Urteile über Intensität, Häufigkeit oder Qualität des beobachteten Verhaltens abgegeben werden. Die Beobachtung sprachlicher Fähigkeiten findet überwiegend reduktiv-deskriptiv und reduktiv-einschätzend statt, wobei die Verfahren in der Regel sowohl reduktiv-deskriptive als auch reduktiv-einschätzende Elemente bzw. Skalen umfassen, sodass es sich bei den Verfahren im Hinblick auf den Grad der Selektion der Ereignisse und Interpretation des Beobachteten in aller Regel um Hybriden handelt.

2 Beobachtung sprachlichen Handelns Bei zur Sprachstandsfeststellung entwickelten Beobachtungsverfahren handelt es sich in aller Regel um Instrumente der systematischen teilnehmenden Feldbeobachtung. Die Beobachtung findet zumeist technisch unvermittelt, d. h. in den Kita- oder Schulalltag eingebettet, statt. Die Dokumentation des Beobachteten erfolgt überwiegend reduktiv-beschreibend oder reduktiv-einschätzend; oft werden innerhalb eines Instruments sowohl reduktiv deskriptive als auch reduktiv einschätzende Deskriptoren und Skalen verwendet. Anzumerken ist an dieser Stelle, dass, in Anlehnung an Mees’ systematische Klassifikation von Beobachtungsverfahren, die in

Sprachdiagnose durch Beobachtung

571

verschiedenen Synopsen und Expertisen zu sprachdiagnostischen Verfahren für Deutsch als Zweitsprache (z. B. Reich 2005; Neugebauer & Becker-Mrotzek 2013) unbegründet vorgenommene Differenzierung zwischen Beobachtungs- und Schätzverfahren obsolet und im Einzelfall auch irreführend ist. So umfassen die brandenburgischen Beobachtungsbögen „Meilensteine der Sprachentwicklung“ (Häuser & Jülisch 2013) neben reduktiv einschätzenden bezüglich der Beobachtungen der grammatischen Fähigkeiten der Kinder auch konkrete deskriptive Deskriptoren (v. a.); bei der von Neugebauer & Becker-Mrotzek vorgenommenen Klassifikation als „Einschätzverfahren“ (Neugebauer & Becker-Mrotzek 2013: 13) handelt es sich daher um eine unangemessen verkürzende Beschreibung des Instruments. Für eine gegenstandsangemessene Betrachtung und Diskussion von Verfahren, die Pädagoginnen und Pädagogen zu pädagogischen Zwecken das sprachliche Handeln von Kindern und Jugendlichen beobachten lassen, sollte vor dem Hintergrund der Quantität von Instrumenten, die in variierenden Mischungsverhältnissen sowohl reduktiv deskriptive als auch reduktiv einschätzende Deskriptoren und Skalen umfassen, die pauschale Unterscheidung zwischen (Ein-) Schätzverfahren und anderen Beobachtungsformen zugunsten einer differenzierten Betrachtung der einzelnen Verfahren unter dem Oberbegriff Beobachtungsverfahren aufgegeben werden – zumal Termini wie „Schätzverfahren“ oder „Einschätzverfahren“ der Beigeschmack von Beliebigkeit anhaftet, was der diagnostischen Qualität einzelner Verfahren, vor allem jener, die auch reduktiv deskriptive Deskriptoren bzw. Skalen einsetzen, ggf. nicht gerecht wird. Bei der Beurteilung der Qualität von Beobachtungsverfahren bzw. der Feststellung ihrer Eignung für bestimmte diagnostische Anlässe gilt es vielmehr differenziert zu betrachten, inwieweit die angebotenen Deskriptoren und Skalen für den diagnostischen Anlass angemessene Angaben liefern.

2.1 Reduktiv deskriptive Beobachtungen Reduktiv deskriptive sprachdiagnostische Beobachtungen sind durch eine sehr konkrete Beschreibung bzw. Benennung sprachlicher Phänomene gekennzeichnet, die wenig Raum für Interpretationen lassen, den Anwendenden jedoch in hohem Maße sprachanalytische Fähigkeiten abverlangen. Reduktiv deskriptive Deskriptoren und Skalen finden vor allem für die Feststellung morphologisch-syntaktischer Fähigkeiten Verwendung. In Abbildung 1 ist ein Beispiel dargestellt, das der Unterrichtsbegleitenden Sprachstandsdiagnose Deutsch als Zweitsprache (Fröhlich, Döll & Dirim 2014) entnommen ist. Es handelt sich um einen Auszug aus dem Beobachtungsbereich „Verbformen“ (Fröhlich, Döll & Dirim 2014: 12–13), indem Befunde zur Reihenfolge der Aneignung der Tempusformen des Deutschen durch Deutsch-als-Zweitsprache-Sprechende (Kuhberg 1987; Landua, Maier-Lohmann & Reich 2008) in für die Anwendung von Lehrpersonen aufbereiteter und zugleich stark komprimierter Form abgebildet sind. Die Aufgabe der Beobachtenden besteht darin, das sprachliche Handeln einzelner

572

Marion Döll

Abb. 1: Auszug aus USB DaZ (Fröhlich, Döll & Dirim 2014: 13).

Schülerinnen und Schüler im Hinblick auf die genannten Formen zu untersuchen und für alle beobachteten Schülerinnen und Schüler die am höchsten gereihte beobachtete Form festzuhalten. Der Interpretationsspielraum ist dabei recht gering, die Herausforderungen für die Lehrpersonen bestehen hierbei vor allem darin, die entsprechenden Formen (z. B. in der gesprochenen Sprache) zu erkennen, was erfahrungsgemäß etwas Übung bedarf.

2.2 Reduktiv einschätzende Beobachtungen Im Vergleich zu reduktiv deskriptiven Beobachtungen des sprachlichen Handelns verlangen reduktiv einschätzende Verfahren den Beobachtenden im Hinblick auf Qualität der sprachlichen Produktion der Beobachteten und/oder Quantität spezifischer sprachlicher Phänomene interpretative Leistungen ab. Einige Beispiele für reduktiv einschätzende Beschreibungen sprachlicher Fähigkeiten im Deutschen sind in Tabelle 1 dargestellt. Es handelt sich um ausgewählte Items aus dem Beobachtungsbogen zur Erfassung der Sprachkompetenz in Deutsch von Kindern mit Deutsch als Zweitsprache 2.0. (Rössl, Stadlmair & Wanka 2011) des Bundesinstituts für Bildungsforschung, Innovation & Entwicklung des österreichischen Schulwesens (bifie). Im Beobachtungsbogen ist zu jedem Item mittels einer vier-stufigen Skala („trifft genau zu“ – „trifft eher zu“ – „trifft eher nicht zu“ – „trifft gar nicht zu“; Rössl, Stadlmair & Wanka 2011: 8) festzuhalten, inwieweit die Beschreibung auf das beobachtete Kind zutrifft. Die Schätzung ist im Beispiel jedoch nicht auf die Ratingskala beschränkt; auch die Deskriptoren enthalten mitunter Elemente, die den Beobachtenden eine Schätzung abverlangen – so obliegt es den Beobachtenden einerseits einzuschätzen, was unter „Basiswortschatz“ und „erweitertem Wortschatz“ zu verstehen ist. Andererseits bleibt offen (und damit durch die Beobachtenden einzuschätzen), ab welcher Anzahl von/an Nomen, Adjektiven und Vollverben von „verschiedenen“ Nomen, Adjektiven und Vollverben gesprochen werden kann. Inwieweit diese Kumulation von Schätzungen der testtheoretischen Güte des Verfahrens zu- oder abträglich ist, ist nicht bekannt, zumal zu BESK-DaZ keine Befunde einer etwaigen testtheoreti-

Sprachdiagnose durch Beobachtung

573

Tab. 1: Items aus BESK-DaZ 2.0 (Rossl, Stadlmair & Wanka 2011: 8; Hervorhebungen im Original). Das Kind … 5.

verwendet verschiedene Nomen des Basiswortschatzes. z. B. Bett, Zimmer, Tür / Jacke, Hose / Auge, Nase, Hand, … verwendet verschiedene Nomen des erweiterten Wortschatzes. z. B. Lampe, Spiegel, Lichtschalter, Wand / Schal, Hut, Brille / Wimpern, Locken, Haut, …

6.

verwendet verschiedene Vollverben des Basiswortschatzes. z. B. gehen, kommen, sehen, essen, schlafen, spielen, … verwendet verschiedene Vollverben des erweiterten Wortschatzes. z. B. tragen, zeigen, hüpfen, tanzen, klettern / aufheben, anklopfen / zuhören, denken, fragen, versuchen, …

7.

verwendet verschiedene Adjektive des Basiswortschatzes. z. B. groß, klein, schwarz, rot, gut, … verwendet verschiedene Adjektive des erweiterten Wortschatzes. z. B. lang, breit, rund, weich, süß, gestreift, kariert, …

schen Prüfung zugänglich sind. Zu Beobachtungsverfahren, die im Bereich der lexikalisch-semantischen Fähigkeiten ausschließlich auf Verbalskalen setzen, liegen hingegen positive Befunde vor. Ein Beispiel sind hier die Niveaubeschreibungen Deutsch als Zweitsprache für die Sekundarstufe I (Döll 2012; SBI 2013b). In diesem Instrument werden vierstufige Verbalskalen verwendet, die neben einer abstrakte(re)n Beschreibung wie z. B. „Der Schüler versteht die Begriffe des Grundwortschatzes mit einfacher Bedeutung.“ (SBI 2013b: 20, Hervorheb. i. Orig.) erläuternde Ergänzungen („Dieser Wortschatz umfasst häufig gebrauchte Nomen und Verben, die den Alltag zu Hause und in der Schule berühren.“, SBI 2013b: 20) sowie von Lehrkräften in Gruppendiskussionen erarbeitete Beispiele umfassen („Dazu gehören auch die Bezeichnung von Schulfächern und andere schulische Grundbegriffe (‚Lehrer‘, ‚Klassenzimmer‘, ‚Hausaufgabe‘), Adverbien zur Angabe von Ort und Zeit (‚dann‘ ‚da‘) sowie einige häufige Adjektive (z. B. Farben, ‚klein‘ und ‚groß‘)“, SBI 2013b: 20). Im Rahmen der empirischen Prüfung des Instruments wurden für die reduktiv schätzende Skala zu lexikalisch-semantischen Fähigkeiten hinreichende Validität, zufriedenstellende Interraterreliabilität sowie eine gute Beobachtungsgenauigkeit festgestellt (Döll 2012: 115–131).

3 Möglichkeiten und Grenzen sprachdiagnostischer Beobachtung Beobachtungsverfahren bieten grundsätzlich die Möglichkeit, ein breites Spektrum für eine Diagnose relevanten Verhaltens zu erfassen (Fisseni 1997). Dies trifft auch

574

Marion Döll

auf sprachdiagnostische Beobachtungen zu, die mit überschaubarem Zeit- und Materialaufwand einen breiten, d. h. einen alle sprachlichen Basisqualifikationen (Ehlich 2005) umfassenden, Einblick in die sprachlichen Fähigkeiten einzelner Kinder und Jugendlicher in Alltags- und/oder Schulsituationen liefern können. Die Beobachtungsverfahren zu Grunde gelegten Sprachkompetenzstrukturmodelle sind demgemäß in der Regel theoretisch-analytisch1 und weiter gefasst als die von Tests und Profilanalysen, deren Schwerpunkte nach wie vor vor allem in der Feststellung lexikalisch-semantischer, morphologisch-syntaktischer (z. B. LiSe-DaZ) sowie zum Teil pragmatischer Fähigkeiten (z. B. HAVAS 5, Tulpenbeet, Bumerang) liegen. Die Ergebnisse von Beobachtungsverfahren eignen sich daher besonders gut als Grundlage für die Planung sprachbewusster bzw. sprachförderlicher Lernarrangements. Ein weiterer Vorteil von Beobachtungverfahren ist die Möglichkeit des mehrfach wiederholenden Einsatzes, die insbesondere dann gegeben ist, wenn auf Impulsmaterial und gezielte Impulsgebung verzichtet wird (z. B. USB DaZ, Niveaubeschreibungen DaZ). Die Deutschaneignung einzelner Kinder und Jugendlicher kann so im Sinne einer diagnosegestützten durchgängigen Sprachbildung über einen Zeitraum von mehreren Jahren diagnostisch begleitet werden. Gerade Beobachtungen, die auf Impulsmaterial und gezielte Impulsgebung verzichten, sind dabei besonders gut in den Alltag pädagogischer Einrichtungen integrierbar. Die Beobachtung erfolgt dann parallel und zumeist verdeckt neben den regulären Aktivitäten, was Prüfungs- oder Testangst vermeiden hilft. Die Beobachtungszeiträume umfassen in der Regel mehrere Tage oder auch Wochen, so dass mehr als eine sog. „Momentaufnahme“ der Sprachkompetenz erfasst wird. Die Nachteile und Grenzen der sprachdiagnostischen Beobachtungen sind grundsätzlich dieselben anderer pädagogischer Beobachtungen. Greve & Wentura (1996) sowie Bortz & Döring (2006) benennen Wahrnehmungs- (z. B. Halo-Effekt, Primacy-Recency-Effekt und observer drift), Interpretations- (z. B. zentrale und persönliche Tendenzen, Leniency-Severity-Fehler), Erinnerungs- (z. B. durch Beschränkung der Gedächtniskapazität) und Wiedergabeeffekte (z. B. Konformitätsdruck), die je nach Anlage eines Verfahrens in unterschiedlichem Ausmaß wirksam werden können. Durch eine sorgfältige, anwenderInnenorientierte Konzeption der Beobachtungsysteme, Training und regelmäßige Kontrolle kann ihr Einfluss bekanntermaßen reduziert werden. Die empirische Absicherung der Niveaubeschreibungen Deutsch als Zweitsprache und der Unterrichtsbegleitenden Sprachstandsbeobachtung Deutsch als Zweitsprache hat in diesem Zusammenhang deutlich gemacht, dass die Qualität sprachdiagnostischer Beobachtungsergebnisse stark von linguistischen Kenntnissen, sprachanalytischen Fähigkeiten und damit verbunden von sorgfältigen Einführun-

1 Anders als bei Screenings geht es bei Verfahren, die Anknüpfungspunkte für konkrete Fördermaßnahmen geben sollen, ja nicht darum, Sprachkompetenz anhand möglichst weniger Indikatoren zu erfassen, sondern um ein differenziertes Bild, ein Kompetenzprofil, aus dem konkrete Stärken und Unterstützungsbedarfe in den verschiedenen sprachlichen Qualifikationsbereichen hervorgehen.

Sprachdiagnose durch Beobachtung

575

gen und aufbauenden Schulungen abhängt. Für beide Verfahren hat sich gezeigt, dass die Interraterreliabilität für konkret beschreibende Skalen in der Regel geringer (sic!) ausfällt als für schätzende Skalen, wobei die Beobachteten in der Regel unterbewertet werden, d. h., spezifische sprachliche Phänomene werden von den Beobachtenden nicht erkannt (Döll 2012: 127–132, Döll & Heller 2013: 17) – angesichts der Tatsache, dass die konkret beschreibenden Skalen vor allem für die Beobachtung morphologisch-snytaktischer Fähigkeiten Anwendung finden, ein klarer Hinweis darauf, dass linguistische Kenntnisse und linguistisch-analytische Fähigkeiten der Beobachtenden besonders intensiv geschult werden müssen, zumal die Fähigkeit, beispielsweise zwischen Haupt- und Nebensatz unterscheiden zu können, nicht nur für sprachdiagnostische Aufgaben, sondern vor allem auch für die Planung und Realisierung von Sprachbildungsmaßnahmen notwendig ist.

4 Anforderungen an sprachdiagnostische Beobachtungsverfahren An sprachdiagnostische Beobachtungsverfahren sind grundsätzlich dieselben Anforderungen zu richten wie an alle anderen Formen der Sprachdiagnose auch. Zu nennen sind hier einerseits die allgemeinen Gütekriterien Objektivität, Reliabilität und Validität. Daneben sind die sog. Nebengütekriterien der pädagogischen Diagnostik (Ingenkamp & Lissmann 2008) wie beispielsweise Ökonomie, Normierung und Fairness zu berücksichtigen und auch die spezifischen Gütekriterien, die von Ehlich (2005) und Reich (2005) nachhaltig in den sprachdiagnostischen Diskurs eingebracht wurden. Hierzu zählen die Forderung einer linguistischen Grundlage, d. h. einer idealerweise gegenstandsangemessenen Modellierung von Sprachkompetenz, die Berücksichtigung bzw. der Einbezug von Mehrsprachigkeit, eine (zweit-) spracherwerbstheoretische Fundierung sowie die Anschließbarkeit von Förderentscheidungen. Fraglich ist jedoch, ob es angemessen ist, die genannten Kriterien jeweils unhinterfragt aus dem Kontext der klassischen Testtheorie bzw. der pädagogischen Diagnostik auf die pädagogische Sprachdiagnostik und nicht-testende Verfahrenstypen zu übertragen. Die Forderung des Nachweises der psychometrischen Güte von Verhaltensbeobachtungsverfahren beispielsweise ist in den methodologischen Diskursen der psychologischen Diagnostik umstritten (Faßnacht 1995; Fisseni 1997). Auch eine Normierung von Verfahren erscheint nicht in jedem Fall zweckdienlich. So konstatiert Reich, dass es für die Bewertung der Sprachkompetenzen Mehrsprachiger keine „richtige Norm“ (Reich 2005: 148) gibt, da der Vergleich mit den Ergebnissen aller möglichen Bezugsgruppen (Einsprachige/Mehrsprachige/gemischte Gruppe) zu Verzerrungen oder Diskriminierungen führt. Kein Verfahren vermag es, die Vielzahl der geforderten Gütekriterien gleichermaßen zu erfüllen – und das ist auch nicht notwendig. Je nach Zweckbestimmung des Verfahrens und biografischer Reichweite der Entscheidungen und Urteile, die

576

Marion Döll

auf Grundlage eines diagnostischen Ergebnisses getroffen bzw. gefällt werden, ist abzuwägen, welche Kriterien besonders relevant sind und welche Kriterien ggf. milde beurteilt oder gar vollständig zurückgestellt werden können. Von Beobachtungsverfahren, die überwiegend zur Erstellung sprachbezogener pädagogischer Individualdiagnosen entwickelt und eingesetzt werden, ist vor diesem Hintergrund in erster Linie eine gegenstandsangemessen breite Modellierung von Sprachkompetenz sowie eine zweitspracherwerbstheoretische Fundierung zu fordern. Ebenso wie Ökonomie und Fairness sollten auch Objektivität, Reliabilität und Validität gegeben sein, wobei bei der Beurteilung der entsprechenden Kennzahlen berücksichtigt werden sollte, dass eine Beobachtung im Schulalltag mit Testsituationen im Labor, auf die sich die meisten Interpretationshilfen beziehen, nicht gleichzusetzen ist. Bei der Beurteilung ist gegenstandsangemessene Milde angezeigt. An Reichs Bedenken anknüpfend, ist auch die Notwendigkeit einer Normierung zu überdenken. Gerade Beobachtungsverfahren, die der aneignungsprozessbegleitenden pädagogischen Individualdiagnose dienen, können auf eine Normierung verzichten, da konkrete Befunde zum Aneignungsstand für das Finden von Anknüpfungspunkten für die sprachpädagogische Arbeit relevanter sind als die Feststellung, ob ein Kind bzw. ein/e Jugendliche/r im Vergleich zu einer nach Reich (2005) nicht stichhaltig begründbaren Bezugspopulation mehr oder weniger sprachkompetent ist. Die Frage, ob eine Sprachdiagnose im Allgemeinen oder ein sprachdiagnostisches Beobachtungsverfahren im Speziellen „gut“ oder „geeignet“ ist, kann nur vor dem Hintergrund der Anwendungsintention beantwortet werden. Daher ist es wichtig, dass EntwicklerInnen ein Höchstmaß an Transparenz bezüglich Zweckbestimmung, theoretischen und empirischen Grundlagen, Ergebnissen zur Testgüte und eventuellen Einschränkungen eines Verfahrens gewährleisten – nur auf Grundlage dieser Informationen vermögen es AnwenderInnen zu entscheiden, ob ein Verfahren ihren diagnostischen Intentionen gerecht wird. Für Beobachtungsverfahren ist in diesem Zusammenhang jedenfalls festzuhalten, dass sie in aller Regel förderdiagnostische Anliegen bedienen, für Selektionsentscheidungen jedoch ungeeignet sind.

5 Beispiele Im Folgenden sollen einige, oben zum Teil bereits angesprochene, sprachdiagnostische Beobachtungsverfahren für Deutsch als Zweitsprache knapp und beispielhaft vorgestellt werden. Bei der Auswahl der Verfahren wurde einerseits darauf geachtet, dass sie ohne Restriktionen zugänglich sind, andererseits sollten sie in der Entwicklung wissenschaftlich begleitet und nicht älter als zehn Jahre sein.2 Tabelle 2 bietet einen Überblick über die drei ausgewählten Verfahren.

2 Auf einen Überblick über alle zur Verfügung stehenden Beobachtungsverfahren für Deutsch als Zweitsprache wird an dieser Stelle bewusst verzichtet – einerseits sollen (ver)alte(te) Verfahren

Sprachdiagnose durch Beobachtung

577

Tab. 2: Ausgewählte Beobachtungsverfahren im Vergleich.

Zielgruppe

BESK-DaZ 2.0

USB DaZ

Rössl, Stadlmair & Wanka 2011

Fröhlich, Döll & Dirim 2014

Kinder im Alter zwischen 3;5 und 6;0

Schülerinnen und Schüler der ersten bis siebten Schulstufe, Sechs- bis Vierzehnjährige

Schülerinnen und Schüler der dritten bis dreizehnten Schulstufe

überwiegend reduktiv schätzende Verbalskalen

reduktiv deskriptive sowie reduktiv schätzende Verbalskalen

reduktiv deskriptive sowie reduktiv schätzende Verbalskalen

nein

nein

Impulsmaterial/ ja gezielte Impulsgebung

Niveaubeschreibungen DaZ SBI 2013a, SBI2013b, SBI 2015

erfasste Qualifikationsbereiche diskursive Fähigkeiten

ja

ja

ja

lexikalischsemantische Fähigkeiten

ja

ja

ja

literale Fähigkeiten

nein

ja

ja

morphologischsyntaktische Fähigkeiten

ja

ja

ja

phonische Fähigkeiten

nein

nein

ja

pragmatische Fähigkeiten

ja

ja

ja

Niveaumodellierung

z. T. Stufenmodelle der Zweitspracherwerbsforschung

überwiegend Stufenmodelle der Zweitspracherwerbsforschung

überwiegend Stufenmodelle der Zweitspracherwerbsforschung

testtheoretische Absicherung

nicht bekannt

ja, mit überwiegend zufriedenstellenden Befunden

ja, mit guten bis zufriedenstellenden Befunden

Praktikabilitätsprüfung nicht bekannt

ja, mit guten Befunden ja, mit guten Befunden

nicht unnötig revitalisiert werden, andererseits werden immer wieder Synopsen veröffentlicht, die einen aktuellen Überblick über zur Verfügung stehende Verfahren geben (z. B. Neugebauer & Becker-Mrotzek 2013; Redder et al. 2011).

578

Marion Döll

5.1 Elementarbereich: BESK-DaZ 2.0 (Rössl, Stadlmair & Wanka 2011) Beim Beobachtungsbogen zur Erfassung der Sprachkompetenz in Deutsch von Kindern mit Deutsch als Zweitsprache Version 2.0 (BESK-DaZ 2.0) handelt es sich um die überarbeitete Fassung des im Jahr 2009 erstmals vom Bundesinstitut für Bildungsforschung, Innovation und Entwicklung des österreichischen Schulwesens veröffentlichten Verfahrens für den Elementarbereich. Anders als die im Folgenden vorgestellten Verfahren ist BESK-DaZ nicht ausschließlich für die teilnehmende technisch-unvermittelte Beobachtung konzipiert, sondern empfiehlt im Sinne der Vereinfachung analytischer Beobachtungen die Anfertigung von Audioaufnahmen. BESK-DaZ 2.0 ist für die Beobachtung von Kindern im Alter zwischen 3;5 und 6;0 Jahren konzipiert und soll Kindergartenpädagoginnen und -pädagogen als Grundlage dafür dienen, den Spracherwerb der Kinder auf „spielerische und integrative Weise“ (Rössl, Stadlmair & Wanka 2011: 3) zu unterstützen, um sie auf den „deutschsprachlichen Unterricht” (Rössl, Stadlmair & Wanka 2011: 3) vorzubereiten. Hierzu werden überwiegend reduktiv-schätzende Beobachtungen zu diskursiven, pragmatischen, lexikalisch-semantischen sowie morphologisch-syntaktischen Fähigkeiten angestellt. Während letztere sehr differenziert und spracherwerbstheoretisch gut fundiert erfasst werden, sind die Indikatoren der anderen Bereiche eher aus institutionellen Routinen heraus denn aus spracherwerbstheoretischen Gründen ausgewählt worden. So wird z. B. die Häufigkeit der Beteiligung an Symbol- und Rollenspielen erfasst, wobei der Nachweis der Eignung als valider Sprachstandsindikator ausbleibt. Das Entwicklerinnenteam vermerkt in diesem Zusammenhang: „Schwerpunkte der Sprachstandsfeststellung liegen auf jenen sprachlichen Kompetenzen, welche im pädagogischen Setting gefördert werden können.“ (Rössl, Stadlmair & Wanka 2011: 3) – Inwieweit ein solches Vorgehen bei der Modellierung der Kompetenzstruktur eines Verfahrens zu validen Ergebnissen führen kann, ist fraglich, zumal weder zu BESKDaZ noch zu BESK-DaZ 2.0 Ergebnisse einer etwaigen Prüfung von Gütekriterien vorliegen.

5.2 USB DaZ (Fröhlich, Döll & Dirim 2014) Die Unterrichtsbegleitende Sprachstandsdiagnose Deutsch als Zweitsprache (USB DaZ) wurde im Jahr 2011 durch das österreichische Bildungsministerium in Auftrag gegeben. Ziel war, Lehrkräften für Schülerinnen und Schüler in der Phase der Pflichtschulzeit ein Instrument an die Hand zu geben, das die Beschreibung des Aneignungsstandes im Deutschen bei mehrsprachig aufwachsenden Kindern und Jugendlichen ermöglicht. Das Kompetenzstrukturmodell des Verfahrens ist an Ehlichs (2005) analytisches Modell der sprachlichen Basisqualifikationen angelehnt. Diese Basisqualifikationen sind durch Indikatoren in Form von Verbalskalen in dem Instrument abgebildet (s. Abbildung 1); lediglich auf die Indikatoren für rezeptive

Sprachdiagnose durch Beobachtung

579

morphologisch-syntaktische und literale Qualifikationen sowie rezeptive und produktive phonische Qualifikationen wird verzichtet, da diese schwer oder nur sehr ungenau durch Beobachtung erfasst werden können und/oder im Schulalltag bereits durch andere Verfahren abgedeckt sind (z. B. Lesetests). Die einzelnen Skalen in USB DaZ bilden zweitspracherwerbstheoretische Befunde in komprimierter Form ab, d. h., es liegt eine aneignungstheoretische Niveaumodellierung vor. Auf eine Normierung des Verfahrens wurde aufgrund seiner Anwendungsbestimmung als begleitende Individualdiagnose bewusst verzichtet. Darüber hinaus ist davon auszugehen, dass der Verzicht auf Normierung die Wahrscheinlichkeit des Missbrauchs des förderdiagnostisch ausgerichteten Verfahren zu Selektionszwecken reduziert. Von Beginn der Entwicklung an wurde das Ziel verfolgt, die Einhaltung der für Sprachdiagnosen formulierten allgemeinen und spezifischen Gütekriterien (vgl. Döll 2012) mit der Praktikabilität des Verfahrens in Einklang zu bringen, weshalb von den Bildungsadministrationen der österreichischen Bundesländer nominierte Lehrpersonen in den Entwicklungsprozess einbezogen wurden. Ihre Aufgabe bestand in der Erprobung der Entwürfe und Rückmeldung an das Projektteam, wodurch die sukzessive Optimierung der Beobachtungsbereiche und Skalen möglich wurde. Die Endfassung des Instrumentes wurde empirisch auf Objektivität, Reliabilität und Validität geprüft. Die Ergebnisse3 zeigen, dass es sich bei USB DaZ um ein valides und konsistentes Diagnoseinstrument für den Einsatz von der ersten bis zur siebten Schulstufe handelt (zum methodischen Vorgehen und den konkreten Ergebnissen s. Döll, Fröhlich & Dirim 2014: 70). Die Interraterreliabilitätsprüfung verdeutlichte, dass linguistische Kenntnisse alleine nicht ausreichen, um zuverlässige Beobachtungsergebnisse zu erlangen – essentiell ist nicht nur die Kenntnis der linguistischen Terminologie, sondern auch die korrekte Analyse sprachlicher Strukturen.

5.3 Niveaubeschreibungen Deutsch als Zweitsprache (SBI 2013a; SBI2013b; SBI 2015) Bei den Niveaubeschreibungen Deutsch als Zweitsprache handelt es sich um Instrumente, die ab 2006 zunächst in einer Kooperation der FörMig-Länderprojekte Sachsen und Schleswig-Holstein, später im Auftrag des sächsischen Bildungsinstituts an der Universität Wien und der Pädagogischen Hochschule Oberösterreich entwickelt wurden. Es liegen drei Fassungen vor:

3 Die Validität von USB DaZ wurde mittels Prüfung auf Korrelation mit äußeren Kriteriumswerten untersucht. In Abhängigkeit von Schulstufe und Mündlichkeit/Schriftlichkeit bewegen sich die gefundenen Zusammenhänge zwischen r = .399 (p = .048) und r = .630 (p = .000); interne Konsistenz: Cronbachs α = .863; Krippendorffs α für die einzelnen Beobachtungsbereiche zwischen α = .12 und α = .59.

580 – – –

Marion Döll

Niveaubeschreibungen Deutsch als Zweitsprache für die Primarstufe (SBI 2013a), Niveaubeschreibungen Deutsch als Zweitsprache für die Sekundarstufe I (SBI 2013b) und Niveaubeschreibungen Deutsch als Zweitsprache für die Sekundarstufe II (SBI 2015)

Die Niveaubeschreibungen sind mit dem Ziel der Ermöglichung eines strukturierten Austauschs über Sprachaneignungsstände einzelner Kinder und Jugendlicher im Kollegium im Sinne einer durchgängigen Sprachbildung entwickelt worden und richten sich daher an Lehrpersonen aller Fächer. Die verschiedenen Fassungen beinhalten 22 (Primarstufe) bzw. 24 (Sekundarstufen I und II) Beobachtungsbereiche in sieben Beobachtungsfeldern (Weite der sprachlichen Handlungs- und Verstehensfähigkeit, Wortschatz, Aussprache, Lesen, Schreiben, Grammatik und Persönlichkeitsmerkmale des Schülers), die die Bereiche des analytischen Kompetenzstrukturmodells der Basisqualifikationen (Ehlich 2005) abdecken. Für jeden Beobachtungsbereich werden in Anlehnung an Befunde zu Erwerbsfolgen des Deutschen als Zweitsprache in Form von reduktiv deskriptiven oder reduktiv schätzenden Beschreibungen vier (Primar- und Sekundarstufe I) bzw. vier bis fünf (Sekundarstufe II) Niveaustufen beschrieben (s. Beispiel in Abbildung 2), wobei die höchste Stufe jeweils mit den Zielvorgaben der Bildungsstandards für das Fach Deutsch der jeweiligen Altersstufe korrespondiert. Das strikte Durchhalten der Vier- bzw. Fünfstufigkeit hat einerseits im Vergleich zu anderen Verfahren wie z. B. USB DaZ eine höhere Übersichtlichkeit zur Folge, andererseits werden in den einzelnen Stufenbeschreibungen zum Teil zahlreiche Informationen zusammengefasst, so dass die Ergebnisse im Vergleich zu denen von Verfahren, die auf eine feste Anzahl von Stufen verzichten, weniger differenziert sind.

Abb. 2: Auszug aus den Niveaubeschreibungen Deutsch als Zweitsprache für die Sekundarstufe II (SBI 2015).

Sprachdiagnose durch Beobachtung

581

Alle drei Fassungen der Niveaubeschreibungen sind im Hinblick auf Validität, interne Konsistenz und Interraterreliabilität mit guten bis zufriedenstellenden Ergebnissen geprüft worden (Döll 2012; SBI 2013a; SBI 2013b; SBI 2015)4. Aber auch hier zeigen die Ergebnisse der Prüfung der Interraterreliabilität die Notwendigkeit einer intensiven Beobachtendenschulung an. Wie auch bei USB DaZ wurde bei den Niveaubeschreibungen aus denselben Gründen bewusst auf eine Normierung verzichtet.

6 Zum Abschluss Für pädagogische Zwecke geeignete sprachdiagnostische Beobachtungsverfahren für das Deutsche als Zweitsprache stehen für Kinder und Jugendliche aller Altersgruppen zur Verfügung. Sie sind in den pädagogischen Alltag gut integrierbar und liefern bei überschaubarem Zeit- und Materialaufwand umfassende Individualdiagnosen, die Pädagoginnen und Pädagogen konkrete Hinweise dazu geben, was sie von den Kindern und Jugendlichen im Deutschen bereits erwarten können, was nächste Schritte der Deutschaneignung sein werden und was noch außerhalb der Zone der nächsten Entwicklung des bzw. der Einzelnen liegt. Eine sorgfältige Verfahrenskonzeption vorausgesetzt, sind Beobachtungsergebnisse von passabler (Test-) Güte, nicht alle zur Verfügung stehenden Verfahren sind jedoch auf Einhaltung der Gütekriterien geprüft. Dabei sind Beobachtungsverfahren, unabhängig davon, ob es sich um deskriptive oder schätzende Beobachtungen handelt, für subjektive Verzerrungen besonders anfällig, was die Notwendigkeit einer Prüfung bzw. Absicherung und Transparenz im Umgang mit den Ergebnissen besonders dringlich macht, auch wenn bei der Bewertung der Kennwerte zweifelsohne eine gegenstandsangemessene Milde angezeigt ist. In diesem Zusammenhang ist die z. B. bei den Meilensteinen der Sprachentwicklung und USB DaZ beobachtbare Gepflogenheit, die Ergebnisse einer Prüfung aufgrund eines von den Herausgebenden angenommenen Desinteresses durch die Anwendenden nicht zusammen mit dem geprüften Instrument zu veröffentlichen, mit großer Skepsis zu betrachten.

4 Von den Niveaubeschreibungen wurde die Version für die Sekundarstufe am intensivsten untersucht: äußere Kriteriumsvalidität: r = .642 (p = .000); interne Konsistenz: Cronbachs α = .979; Krippendorffs α für die einzelnen Beobachtungsbereiche zwischen α = .6036 und α = .8122 (SBI 2013b: 14).

582

Marion Döll

Literatur Bortz, Jürgen & Nicola Döring (2006): Forschungsmethoden und Evaluation. 4. überarbeitete Auflage. Heidelberg: Springer. Döll, Marion (2012): Beobachtung der Aneignung des Deutschen bei mehrsprachigen Kindern und Jugendlichen. Modellierung und empirische Prüfung eines sprachdiagnostischen Beobachtungsverfahrens. FörMig Edition Band 8. Münster: Waxmann. Döll, Marion & Lisanne Heller (2013): Unterrichtsbegleitende Sprachstandsbeobachtung Deutsch als Zweitsprache in Österreich. Bericht. Universität Wien. Döll, Marion, Lisanne Fröhlich & İnci Dirim (2014): Sprachstandsdiagnostik in Österreich. In Ilona Feld-Knapp (Hrsg.), Mehrsprachigkeit. Cathedra Magistrorum – Lehrerforschung. Band 2, 61–80. Budapest: Typotex Kiadó – Eötvös-József-Collegium. Ehlich, Konrad (2005): Sprachaneignung und deren Feststellung bei Kindern mit und ohne Migrationshintergrund. Was man weiß, was man braucht, was man erwarten kann. In Bundesministerium für Bildung und Forschung (BMBF) (Hrsg.), Anforderungen an Verfahren der regelmäßigen Sprachstandsfeststellung als Grundlage für die frühe und individuelle Förderung von Kindern mit und ohne Migrationshintergrund, 11–75. Bildungsreform Band 11. Bonn, Berlin: BMBF. Faßnacht, Gerhard (1995): Systematische Verhaltensbeobachtung. München, Basel: Ernst Reinhardt. Fisseni, Hermann-Josef (1997): Lehrbuch der psychologischen Diagnostik. Göttingen: Hogrefe. Fröhlich, Lisanne, Marion Döll & İnci Dirim (2014): Unterrichtsbegleitende Sprachstandsbeobachtung Deutsch als Zweitsprache. Wien: bmbf. Greve, Werner & Dirk Wentura (1996): Wissenschaftliche Beobachtung. Weinheim: Beltz, Psychologie Verlags Union. Häuser, Detlef & Bernd-Rüdiger Jülisch (2013): Meilensteine der Sprachentwicklung. Sprachbeobachtungsbögen und Auswertungsschema. Berlin: Das Netz. Ingenkamp, Karlheinz & Urban Lissmann (2008): Lehrbuch der Pädagogischen Diagnostik. 6. Neu ausgestattete Auflage. Weinheim, Basel: Beltz. Kuhberg, Heinz (1987): Der Erwerb der Temporalität des Deutschen durch zwei elfjährige Kinder mit Ausgangssprache Türkisch und Polnisch: eine Longitudinaluntersuchung. Frankfurt am Main: Peter Lang. Landua, Sabine, Christa Maier-Lohmann & Hans. H. Reich (2008): Deutsch als Zweitsprache. In Konrad Ehlich, Ursula Bredel & Hans H. Reich (Hrsg.), Referenzrahmen zur altersspezifischen Sprachaneignung. Forschungsgrundlagen. Bildungsreform Band 29/II, 171–202. Bonn, Berlin: Bundesministerium für Bildung und Forschung. Mees, Ulrich. (1977): Einführung in die systematische Verhaltensbeobachtung. In Ulrich Mees & Herbert Selg (Hrsg.), Verhaltensbeobachtung und Verhaltensmodifikation, 14–32 Stuttgart: Klett. Neugebauer, Uwe & Michael Becker-Mrotzek (2013): Die Qualität von Sprachstandsverfahren im Elementarbereich. Eine Analyse und Bewertung. Herausgegeben vom Mercator-Institut für Sprachförderung und Deutsch als Zweitsprache. Köln: Mercator-Institut für Sprachförderung und Deutsch als Zweitsprache. Redder, Angelika, Knut Schwippert, Marcus Hasselhorn, Sabine Forschner, Detlef Fickermann, Konrad Ehlich, Michael Becker-Mrotzeck, Marianne Krüger-Potratz, Hans-Günther Rossbach, Petra Stanat, Sabine Weinert, Marta Kulik, Maria Worgt & Claudia Zech (2011): Bilanz und Konzeptualisierung von strukturierter Forschung zu „Sprachdiagnostik und Sprachförderung. Hamburg: Hamburger Zentrum für Unterstützung der wissenschaftlichen Begleitung und Erforschung schulischer Entwicklungsprozesse (ZUSE) (2011). Reich, Hans. H. (2005): Forschungsstand und Desideratenaufweis zu Migrationslinguistik und Migrationspädagogik. In BMBF (Hrsg.), Anforderungen an Verfahren regelmäßiger

Sprachdiagnose durch Beobachtung

583

Sprachstandsfeststellung als Grundlage für die frühe und individuelle Förderung von Kindern mit und ohne Migrationshintergrund. Bildungsreform Band 11, 121–169. Bonn, Berlin: BMBF. Rössl, Barbara, Monika Stadlmair & Rebekka Wanka (2011): Handbuch zur Erfassung der Sprachkompetenz in Deutsch von Kindern mit Deutsch als Zweitsprache (BESK-DaZ). Version 2.0. Salzburg: bifie. Sächsisches Bildungsinstitut (SBI) (Hrsg.) (2013a): Niveaubeschreibungen Deutsch als Zweitsprache für die Primarstufe. Radebeul: SBI. Sächsisches Bildungsinstitut (SBI) (Hrsg.) (2013b): Niveaubeschreibungen Deutsch als Zweitsprache für die Sekundarstufe I. Zur Beobachtung von Kompetenz und Kompetenzzuwachs im Deutschen als Zweitsprache. Radebeul: SBI. Sächsisches Bildungsinstitut (SBI) (Hrsg.) (2015): Niveaubeschreibungen Deutsch als Zweitsprache für die Sekundarstufe II. Radebeul: SBI.

Rüdiger Grotjahn

24 C-Tests 1 2 3 4 5 6 7 8 9 10 11 12 13

Einleitung Cloze Tests als Basis von C-Tests Klassische C-Tests Modifikationen des klassischen C-Test-Prinzips Testinstruktion Entwicklung von C-Tests Diskursspezifische C-Tests Kodierung und Auswertung der C-Test-Lösungen Psychometrische Analysen von C-Test-Daten Interpretation der Punktwerte der Testpersonen Vorhersage der Schwierigkeit Gütekriterien Schlussbemerkung

1 Einleitung Ein klassischer C-Test – auch als kanonischer C-Test bezeichnet – besteht aus mehreren kurzen Texten, in denen bei jedem zweiten Wort die zweite Hälfte getilgt ist. Die Aufgabe der Testperson ist, die Texte korrekt zu rekonstruieren. Seit der Einführung des C-Test-Prinzips und Anwendung auf die Sprachen Englisch und Deutsch im Jahre 1981 durch Christine Klein-Braley und Ulrich Raatz haben C-Tests bei Testspezialisten und Anwendern weltweit zunehmend Beachtung gefunden. C-Tests gelten in der Regel als ein globales Verfahren zur Messung der allgemeinen Sprachkompetenz (general language proficiency) in Fremd-, Zweit- und Erstsprachen. Allgemeine Sprachkompetenz wird dabei in Abgrenzung zu einem komplexen mehrdimensionalen Konstrukt „kommunikative Sprachkompetenz“ zumeist verstanden als (mikrostrukturell weiter unterteilbares) eindimensionales Konstrukt, das als zentrale integrative Kompetenz allen Sprachleistungen (unter Einschluss der klassischen vier Fertigkeiten) zugrunde liegt (vgl. Asano 2014; Eckes 2014; Reichert, Brunner & Martin 2014; Sumbling et al. 2014). C-Tests sind mittlerweile für mehr als 30 Sprachen entwickelt und in einer Vielzahl unterschiedlicher Kontexte eingesetzt worden (vgl. Grotjahn 1995: 43–45; 2014). Hierbei sind auch Modifikationen des klassischen C-Test-Prinzips vorgeschlagen und im Hinblick auf ihre Gütekriterien überprüft worden. C-Tests werden üblicherweise als Gruppentest durchgeführt. Der Zeitaufwand für die Testdurchführung und -auswertung ist verglichen mit vielen anderen sprachdiagnostischen Verfahren gering. Zudem verlangt die Durchführung und häufig auch die Auswertung keine spezifische psychometrische oder linguistische Expertise. Insgesamt betrachtet haben sich die erstellten Tests in den meisten Sprachen und Anwendungskontexten als sehr ökonomisch und hinreichend reliabel erwiesen. https://doi.org/10.1515/9783110418712-024

586

Rüdiger Grotjahn

C-Tests sind Gegenstand einer Fülle von Aufsätzen, einer Reihe von themenspezifischen Sammelbänden, einer Vielzahl von Qualifikationsarbeiten – unter Einschluss einer Reihe von Dissertationen und zwei Habilitationsschriften – sowie auch einer eigenen Internet-Seite (www.c-test.de). Sie gehören damit zu den am gründlichsten untersuchten Sprachtests (siehe die 602 Einträge umfassende Bibliographie von Grotjahn 2018).1 Am häufigsten werden C-Tests für eine ökonomische Feststellung allgemeiner sprachlicher Kompetenz (z. B. im Hinblick auf Einstufungsentscheidungen), als Instrument für ein schnelles Screening (z. B. vor dem Einsatz aufwändigerer Messverfahren) sowie als Instrument zur Erhebung des Sprachstandes in Spracherwerbsuntersuchungen oder auch in Studien zum Bildungsmonitoring eingesetzt (vgl. Eckes & Grotjahn 2006; Grotjahn 2014; Harsch & Hartig 2015; Kniffka & Linneman 2014; Norris 2018). In jüngerer Zeit werden C-Tests zunehmend auch auf dem PC oder Smartphone (webbasiert) implementiert (vgl. Abschnitt 6 in diesem Beitrag). Einen standardisierten und normierten C-Test im Papier-Bleistift-Format zum Einsatz im Bereich DaZ haben bereits Raatz & Klein-Braley (1992) in Form des CT-D 4 vorgelegt. Ein aktuelles Beispiel für die Verwendung des CT-D 4 ist Schaller (2018). Die Autorin untersucht u. a., inwieweit mit Hilfe des CT-D 4 Aspekte der Schreibkompetenz und metasprachlichen Kompetenz bei Kindern aus 4. und 6. Klassen vorhergesagt werden können. Angesichts der Vielfalt der Verwendungskontexte und sprachspezifischen Realisierungen kann man auch nicht in der gleichen Weise von dem C-Test sprechen, wie man etwa von dem Deutsch-Test für Zuwanderer A2-B1 spricht. Letzterer ist ein Messverfahren für eine spezifische Sprache und einen spezifischen Verwendungskontext. Der C-Test ist dagegen ein sprach- und kontextunspezifisches allgemeines Testprinzip mit folgendem zentralen Merkmal: systematische Reduzierung sprachlicher Redundanz mit dem Ziel der Messung (allgemeiner) sprachlicher Kompetenz anhand der Rekonstruktionsleistung der Testpersonen. Deshalb kann man auch nicht den C-Test validieren, sondern lediglich sprachspezifische Operationalisierungen für bestimmte Verwendungskontexte. Erweist sich allerdings eine Operationalisierung, wie z. B. ein C-Test für ein Screening der Deutsch-Kompetenz bei Lehramtsstudierenden (vgl. Abschnitt 7 in diesem Beitrag), als hinreichend valide, ist dies zugleich ein mittelbarer Beleg für die Gültigkeit des allgemeinen C-Test-Prinzips (vgl. Grotjahn 2011: 132). Wegen der Fülle der Publikationen zu C-Tests ist der folgende Überblick notwendigerweise selektiv. Der Hauptfokus liegt auf folgenden Aspekten: Konstruktionsprinzip; Modifikationen des klassischen C-Test-Prinzips; Kodierung und Auswertung; Vorhersage der Schwierigkeit; Konstruktvalidität; Einsatzmöglichkeiten insbesondere im Bereich DaZ.

1 Auf www.c-test.de findet man neben der Bibliografie allgemeine Informationen zum C-Test sowie unter „Originalia“ eine Reihe von kostenlos abrufbaren Publikationen.

C-Tests

587

2 Cloze Tests als Basis von C-Tests C-Tests beruhen auf den gleichen theoretischen Grundlagen wie Cloze Tests,2 unterscheiden sich von diesen allerdings in wesentlichen Merkmalen des Formats. Gemeinsam ist beiden Testformen, dass es sich um Textrekonstruktionsverfahren (Textergänzungsverfahren) auf der Basis des Konzepts des sogenannten reduced redundancy testing handelt (vgl. z. B. Babaii & Fatahi-Majd 2014; Janebi Enayat & Babaii 2018; Klein-Braley 1997; Sigott 2004: 15–26). Ausgangspunkt ist die Vorstellung, dass die Übertragung von Information mit Hilfe natürlicher Sprache oft gestört ist, z. B. durch eine schlecht zu lesende Handschrift oder durch Geräusche. Bei Cloze Tests und C-Tests wird die für die Kommunikation notwendige Redundanz reduziert, indem in systematischer Weise Elemente aus Texten gelöscht werden. Die Annahme lautet: Je höher die relevanten sprachlichen und thematischen Kompetenzen einer Testperson sind, desto besser kann sie im Zuge einer konstruktiven Verarbeitung des sprachlichen Inputs den jeweiligen Text rekonstruieren. Dabei wird in Übereinstimmung mit aktuellen (gebrauchsorientierten) Modellen des Spracherwerbs davon ausgegangen, dass die Testpersonen in Abhängigkeit u. a. von ihrer Lerngeschichte sowohl auf explizites Regelwissen als auch auf implizites Wissen z. B. in Form von internalisierten Auftretens- und Übergangswahrscheinlichkeiten zurückgreifen. Löscht man in einem deutschen C-Test z. B. in der Wortfolge „des Hauses“ den zweiten Teil des Nomens und reduziert so die in Form einer Doppelkodierung der grammatikalischen Information „Genitiv“ vorhandene Redundanz, ist zu erwarten, dass Testpersonen mit ausreichendem morphosyntaktischen Wissen angesichts des Artikels „des“ bei der Rekonstruktion von der Hypothese ausgehen, dass das gesuchte Wort ein Substantiv im Genitiv ist. Ähnlich werden Testpersonen mit gut ausgebildeten Kompetenzen in der deutschen Orthografie bei der Vervollständigung des Lückenwortes Masc_____ dazu tendieren, nach der Graphemfolge als nächsten Buchstabe ein einzusetzen. Auf der Basis weiteren Wissens werden sie dann möglicherweise zu der Lösung Maschine gelangen. Klassische Cloze Tests bestehen aus einem einzigen (längeren) Text, in dem z. B. jedes siebte Wort gelöscht ist. Die Gesamtzahl der korrekt rekonstruierten Wörter wird u. a. als Indikator für Lesefähigkeit oder auch als Lesbarkeitsindex interpretiert. Durch das mechanische Löschungsprinzip soll die statistische Repräsentativität der gelöschten Wörter gewährleistet werden. Zuweilen werden die Wörter aber auch nach inhaltlichen Gesichtspunkten gelöscht – z. B. kohäsionsstiftende Elemente oder spezifische fachsprachliche Lexik. Diese Testform wird häufig als rational cloze test bezeichnet (vgl. z. B. Watanabe & Koyama 2008).

2 Das im Englischen neu geschaffene Wort cloze soll verdeutlichen, dass in Cloze Tests Lücken zu schließen sind. Das C in C-Test soll wiederum an das Cloze-Prinzip als theoretische Grundlage von C-Tests erinnern.

588

Rüdiger Grotjahn

3 Klassische C-Tests C-Tests beruhen zwar wie Cloze Tests auf dem Prinzip der Reduktion von Redundanz, sie stellen jedoch zugleich eine explizite Antwort auf eine Reihe von Problemen bei der Operationalisierung dieses Prinzips durch Cloze Tests dar (vgl. die ausführlichere Darstellung z. B. in Grotjahn 1995; Grotjahn, Klein-Braley & Raatz 2002). Im Gegensatz zu einem Cloze Test werden bei der Konstruktion eines kanonischen C-Tests mehrere kurze (aus etwa 60 bis 80 Wörtern bestehende) Texte unterschiedlicher Thematik gewählt. Beginnend mit dem zweiten Wort des zweiten Satzes wird in jedem Text bei jedem zweiten Wort die zweite Hälfte getilgt (klassische Zweierregel) und die Lücke durch einen Strich mit fester Länge markiert. Durch die Wahl mehrerer Texte soll der Einfluss thematischen Wissens reduziert und damit die Testfairness erhöht werden. Die Anwendung des Tilgungsprinzips auf jedes zweite Wort soll eine hohe Zahl von Items (Lückenwörter) bei einer insgesamt kurzen Testlänge und damit zugleich eine ausreichende Reliabilität (Messgenauigkeit) als auch eine zufrieden stellende Inhaltsvalidität (im Sinne sprachstatistischer Repräsentativität) gewährleisten. Durch die Tilgung lediglich der zweiten Hälfte eines Wortes soll verglichen mit Cloze Tests die Lösung erleichtert, die Zahl möglicher akzeptabler Lösungsvarianten reduziert und damit zugleich die Auswertungsökonomie erhöht werden. Schließlich soll durch die Fixierung des Tilgungsbeginns auf das zweite Wort des zweiten Satzes und der Tilgungsrate auf jedes zweite Wort die Abhängigkeit der Messeigenschaften vom Startpunkt und der Tilgungsrate verringert werden. Bei der Tilgung bleiben Wörter mit einem einzigen Buchstaben und Eigennamen unberücksichtigt. Bei Wörtern mit einer ungeraden Zahl an Buchstaben ist die Zahl der getilgten um eins höher als die Zahl der nicht getilgten Buchstaben. An den Textenden bleibt jeweils ein kurzes unversehrtes Textstück als Kontext für die Lösungsfindung stehen. Zur Erleichterung psychometrischer Analysen (vgl. Abschnitt 9 in diesem Beitrag) wird zumeist in jedem Text die gleiche Zahl von Worthälften getilgt. Die ausgewählten Texte werden in aufsteigender Schwierigkeit angeordnet, und es wird ein Punkt für jede exakte oder auch akzeptable Rekonstruktion des Originalworts gegeben (vgl. Abschnitt 8 in diesem Beitrag). Ein entsprechend entwickelter klassischer C-Test besteht meist aus vier bis sechs Texten mit 20 bis 25 Items (Lückenwörtern). Ein Format mit 100 Lückenwörtern hat dabei den praktischen Vorteil, dass die Testergebnisse unmittelbar als Prozentwerte interpretiert werden können. Außerdem wird bei 100 Items zumeist eine ausreichende Reliabilität erreicht. Für die Bearbeitung der C-Test-Texte wird den Testpersonen ausreichend Zeit zugestanden (zumeist 4–6 Minuten pro Text). Bei klassischen, ohne stärkeren Zeitdruck administrierten C-Tests handelt es sich damit um sogenannte Niveautests (Power Tests). Auf Einsatzmöglichkeiten massiv zeitreduzierter C-Tests wird kurz in Abschnitt 4.3.2 unter dem Stichwort S-C-Test (Speeded C-Test) eingegangen. Abbildung 1 zeigt ein Beispiel für einen entsprechend dem klassischen Prinzip konstruierten C-Test-Text. In der Instruktion wird den Lernern lediglich mitgeteilt,

C-Tests

589

dass Lücken zu ergänzen sind und fünf Minuten pro Text zur Verfügung stehen. Weitere Beispiele für C-Tests finden sich z. B. unter den folgenden Links: http:// www.c-test.de; http://www.deutsch-als-fremdsprache.de/ctest/; http://www.iik-dues seldorf.de/ctest/ctestallg.txt.php3; https://www.onset.de/onset/teilnehmer/cTestBei spiel.do.

Uni-Café Ganz in der Nähe der Universität gibt es ein gern besuchtes Café. Hier tref__________ sich d__________ Studierenden zwis__________ den Vorle__________ , sitzen b__________ Tee, Kaf__________ und Bröt__________ , lesen Zei__________ , unterhalten si__________ , bereiten Semi__________ vor. Man__________ sitzen all__________ , um z__________ lesen, and__________ sitzen zusa__________ , um si__________ zu unter__________ und u__________ zu disku__________ . Jeden T__________ ist das Café geöffnet, auch spät am Abend kann man dort noch etwas trinken oder essen. Abb. 1: C-Test-Text aus Arras, Eckes & Grotjahn (2002: 208).

Anhand der Abbildung 1 lässt sich leicht in Weiterführung der Hinweise in Abschnitt 2 dieses Beitrages illustrieren, dass es zur Rekonstruktion der Lücken eines C-Tests des Rückgriffs auf eine Vielzahl sprachlicher und nicht-sprachlicher Wissensbestände bedarf. So hilft z. B. bei der korrekten Rekonstruktion der vierten Lücke als Vorlesungen sowohl thematisches als auch sprachliches Wissen. Versteht die Testperson die Textüberschrift und den Einleitungssatz und verfügt sie zudem über Wissen zum Thema Universität, erhöht dies die Wahrscheinlichkeit, dass sie das Lexem Vorlesung, sofern sie dieses kennt, als potenzielle Lösung ins Auge fasst. Verfügt sie auch über ausreichende Kenntnisse der deutschen Flexionsmorphologie und identifiziert den als Dativ-Artikel, ist eine weitere wichtige Bedingung für die korrekte Rekonstruktion erfüllt. Dabei kann es die Identifikation der korrekten Flexionsendung erleichtern, wenn die Testperson zuvor die dritte Lücke korrekt als zwischen rekonstruiert hat. Letzteres illustriert den wichtigen Sachverhalt, dass die Wahrscheinlichkeit der Lösung eines Items (Rekonstruktion eines Lückenwortes) in einem C-Test-Text in vielen Fällen von der Lösung weiterer Items im selben Text abhängt (vgl. Abschnitt 9 in diesem Beitrag).

4 Modifikationen des klassischen C-Test-Prinzips Es sind mittlerweile eine Vielzahl von Modifikationen des klassischen C-Test-Prinzips vorgeschlagen und zum großen Teil auch empirisch im Hinblick auf Gütekriterien wie Schwierigkeit, Trennschärfe, Objektivität, Reliabilität und Validität untersucht worden (zu den Gütekriterien siehe den Beitrag von Paetsch in diesem Band). Ent-

590

Rüdiger Grotjahn

sprechende Untersuchungen sind in Bezug auf den praktischen Einsatz von C-Tests von erheblicher Bedeutung, da dieser über eine Modifikation der Tilgungsregel und/ oder Form der Darbietung leichter oder schwieriger gemacht und so eine bessere Passung zwischen Testschwierigkeit und Sprachstand erreicht werden kann. Auf diese Weise lässt sich der Anwendungsbereich von C-Tests auch auf wenig leistungsstarke oder sehr weit fortgeschrittene Testpersonen erweitern. Allerdings stellt sich das Problem, dass ein entsprechender C-Test möglicherweise partiell andere Fähigkeiten misst und auch zu anderen Entscheidungen führt als ein klassischer CTest. Bei einer Modifikation kann es wie im Folgenden ausgeführt primär um die Optimierung der Messeigenschaften von C-Tests in einer bestimmten Sprache oder primär um sprachenübergreifende Möglichkeiten der psychometrischen Optimierung gehen, wobei allerdings auch im letztgenannten Fall Aspekte der Sprachspezifik stets mit zu berücksichtigen sind.

4.1 Tilgungsregel 4.1.1 Sprachspezifische Aspekte C-Tests sind ursprünglich für das Englische und Deutsche entwickelt worden. Im Zuge der Anwendung des C-Test-Prinzips auf weitere Sprachen – darunter auch (außereuropäische) Sprachen mit einer vom Englischen und Deutschen stark abweichenden Struktur – ergab sich bei Sprachen wie Chinesisch, Japanisch, Koreanisch, Neuhebräisch und Türkisch die Notwendigkeit deutlicher Veränderungen der klassischen Tilgungsregel. Insgesamt gesehen wurde zudem deutlich, dass die Praktikabilität des C-Test-Verfahrens sprachspezifisch massiv differieren kann (vgl. die Hinweise in Grotjahn 1995; 2014; Norris 2018). Es treten aber auch bei Sprachen wie Deutsch, Französisch, Italienisch oder Spanisch Probleme bei der Anwendung des klassischen Tilgungsprinzips auf. So kann z. B. bei deutschen Nominalkomposita das klassische Prinzip zur Tilgung ganzer Wörter führen – wie etwa im Fall von Fenster_____ für Fensterscheiben. Entsprechende Lückenwörter sind dann häufig nicht mehr oder nur noch in ganz spezifischen Kontexten eindeutig rekonstruierbar. Zur Erhöhung der Auswertungsobjektivität und zur Verringerung der Schwierigkeit wird deshalb im Deutschen bei Nominalkomposita zumeist lediglich die zweite Hälfte des letzten Wortes getilgt, oder es wird zumindest der erste Buchstabe des letzten Wortes unversehrt gelassen (vgl. Grotjahn 1995, 2002a). Ein Problem können auch Graphemkombinationen darstellen, die einen Einzellaut repräsentieren, wie z. B. im Deutschen . Tilgt man z. B. bei dem Wort waschen die zweite Hälfte, d. h. , entspricht die Aussprache des letzten nicht getilgten Buchstabens nicht der Aussprache der zu rekonstruierenden Graphem-

C-Tests

591

kombination . Da die Suche nach der Lösung häufig über innere Phonation oder lautes Lesen erfolgt (vgl. Babaii & Fatahi-Majd 2014; Stemmer 1991), können die Testpersonen irregeleitet werden. Dieser Effekt kann vermieden werden, wenn man entsprechende Polygraphen komplett tilgt oder komplett erhält.

4.1.2 Sprachübergreifende Aspekte Eine erste sprachübergreifende Modifikationsmöglichkeit betrifft den Abstand der Tilgungen und die Zahl der getilgten Buchstaben. Tilgt man z. B. im Deutschen oder Englischen bei jedem zweiten Wort alle Buchstaben außer dem ersten, wird der resultierende C-Test im Vergleich zu einem klassischen C-Test zumeist deutlich schwerer. Zugleich steigt die Zahl der akzeptablen Lösungsvarianten, was einen negativen Effekt auf die Objektivität und Ökonomie der Auswertung haben kann. Tilgt man dagegen lediglich die zweite Hälfte jedes dritten Wortes (sogenannte Dreierregel), wird der Test tendenziell leichter. Zudem sinkt das Ausmaß der psychometrisch problematischen Abhängigkeit zwischen den Lücken ein und desselben C-Test-Textes (siehe Abschnitt 9 in diesem Beitrag). Man benötigt aber auch längere Texte, wodurch die Bearbeitungszeit zunehmen und die Motivation der Testpersonen sinken kann. Die Dreierregel wurde in einer Reihe von Kontexten eingesetzt, um die Testschwierigkeit besser dem Kompetenzniveau der Testpersonen anzupassen – so z. B. im Bereich DaZ von Dürrstein (2013) bei der Entwicklung eines C-Tests für ein Screening zu Beginn der Sekundarstufe I oder auch von Baur, Goggin und Mitarbeitern beim Einsatz von C-Tests für Screening, Diagnose und Förderung (vgl. z. B. Baur, Goggin, Wrede-Jackes 2013: 3). Eine zweite, das Antwortformat betreffende Modifikationsmöglichkeit ergibt sich anhand der Markierung der Lücken. Neben gleich langen durchgehenden Strichen (klassisches Prinzip) findet sich vor allem eine Variante mit einem Strich pro getilgtem Buchstaben, wodurch der C-Test zumeist leichter und geringfügig reliabler wird. Allerdings kann die grafische Angabe der Zahl der gelöschten Buchstaben auch einen negativen Effekt auf die Validität haben, da die Angabe zum Buchstabenzählen verleitet und damit konstruktirrelevante Varianz verursacht (vgl. auch Abschnitt 5 in diesem Beitrag). Eine dritte Modifikationsmöglichkeit stellt die linksseitige Tilgung dar. Hier wird der für die Worterkennung und den Abruf aus dem Gedächtnis zentrale erste Teil jedes zweiten (oder auch dritten) Wortes getilgt. Diese Variante wird häufig als X-Test bezeichnet. Die linkseitige Tilgung erhöht im Englischen oder Deutschen die Zahl der möglichen Lösungskandidaten (und akzeptablen Varianten) und macht einen X-Test im Vergleich zu einem analogen klassischen C-Test deutlich schwieriger. Außerdem führt in einer flektierenden Sprache wie dem Deutschen die linksseitige Löschung dazu, dass bei der Lösung des Tests die Bedeutung (produktiver) Kennt-

592

Rüdiger Grotjahn

nisse der Flexionsmorphologie reduziert wird und im stärkeren Maße auch makrostrukturelle lexikalisch-semantische Kompetenzen erfasst werden (vgl. Beinborn 2016: 34–35, 121, 151; Mashkovskaya & Baur 2016a: 195; Sahragard, Rahmian & Rahmani Anaraki 2008). Mashkovskaya (2013) kommt vor diesem Hintergrund anhand einer eigenen empirischen Untersuchung bei erwachsenen universitären Muttersprachlern des Deutschen mit und ohne Migrationshintergrund zu dem Schluss, dass der von ihr entwickelte deutsche X-Test primär rezeptive Lesekompetenz erfasst. Sahragard, Rahmian & Rahmani Anaraki (2008: 37) sprechen sogar von einem im Vergleich zu englischen C-Tests mit rechtsseitiger Tilgung „völlig unterschiedlichen Test“. Eine weitere im Zusammenhang mit C-Tests ebenfalls diskutierte Modifikationsmöglichkeit besteht darin, die Wortteile nicht nach einem mechanischen Prinzip, sondern auf der Basis inhaltlicher Kriterien zu löschen. Die resultierende Testform wird auch als rational C-test bezeichnet (vgl. Grotjahn 1995: 52). Entsprechende Tests – Mashkovskaya & Baur (2016a: 193) sprechen hier von Teilfertigkeitstests – eignen sich zwar prinzipiell zur Diagnose spezifischen Sprachwissens. Sie messen jedoch ein deutlich anderes Konstrukt als C-Tests mit einem mechanischen Tilgungsprinzip. Dies spricht dagegen, diese Testform zur Kategorie C-Test zu rechnen. Schließlich besteht noch die Möglichkeit, das klassische Tilgungsprinzip nach der Administration des entsprechenden C-Tests bei der Zielpopulation auf der Basis einer lückenbezogenen Itemanalyse zu modifizieren (vgl. die in Grotjahn 2004 genannten Studien). Das nachträgliche Tilgen oder Hinzufügen von Buchstaben in Abhängigkeit von der empirischen Schwierigkeit der Lücken ist relativ unproblematisch und kann die psychometrischen Qualitäten des entsprechenden C-Tests erhöhen (vgl. für den DaZ-Bereich Dürrstein 2013: 61). Problematisch ist dagegen die Selektion der Lückenwörter anhand statistischer Kriterien, u. a. weil die selektierten Items (Lückenwörter) möglicherweise keine inhaltlich repräsentative Stichprobe aus dem jeweiligen Text und der jeweiligen Sprache darstellen (vgl. Grotjahn 2004: 537–538).

4.2 Antwortformat: Multiple-Choice C-Tests Bei den bisher beschriebenen C-Tests handelt es sich in allen Fällen um offene Antwortformate, bei denen die Testpersonen die Lösungen selbst produzieren müssen. Eine innovative geschlossene Variante eines (klassischen) C-Tests in Form eines computerbasierten Multiple-Choice C-Test (MC C-Test) für Erwachsene und ältere Jugendliche mit Deutsch als Zweitsprache ist an der Bundesagentur für Arbeit entwickelt worden (vgl. Jakschik, Klemmert & Klinck 2010; Klemmert 2014). Den Testpersonen werden hierbei für jede Lücke fünf Optionen zur Auswahl per Mausklick vorgegeben. Die komplexen psychometrischen Analysen ergaben u. a.: (a) Der MC C-Test ist etwas leichter als ein analoger traditioneller C-Test, zugleich jedoch ähnlich trennscharf und reliabel. (b) Die beiden Verfahren erfassen leicht unterschiedli-

C-Tests

593

che Merkmale, die diagnostischen Folgerungen stimmen jedoch weitgehend überein. Die Entwicklung eines MC C-Tests ist verglichen mit einem klassischen C-Test deutlich aufwändiger. Das MC-Format eröffnet allerdings die gerade im Zweitsprachenerwerbskontext wichtige Möglichkeit, rezeptive Kompetenzen unabhängig von produktiven Kompetenzen z. B. in Orthografie und Flexionsmorphologie zu testen (vgl. auch Abschnitt 8 in diesem Beitrag).

4.3 Darbietungsform 4.3.1 Gesamtdarbietung vs. Einzeldarbietung Beim klassischen C-Test wurden ursprünglich alle Texte gleichzeitig den Testpersonen präsentiert (sog. Gesamtdarbietung). Dabei gilt ein relativ großzügiges Zeitlimit für den Test insgesamt. Wie lange die Teilnehmer bei den einzelnen Texten verweilen, in welcher Reihenfolge sie die Texte bearbeiten und ob sie bereits bearbeitete Texte nochmals bearbeiten, bleibt freigestellt. Diese Darbietungsform findet sich auch heutzutage noch, obwohl sie dazu führen kann, dass selbst bei einer ausreichenden Gesamtbearbeitungszeit Texte gegen Ende eines C-Tests nicht oder nur oberflächlich bearbeitet werden. Als Folge können Berechnungen z. B. zu Schwierigkeiten, Trennschärfen und Reliabilität irreführend sein und es kann auch die Validität abnehmen (vgl. Grotjahn 2010). In Anbetracht der geschilderten Probleme wird empfohlen, C-Tests grundsätzlich in Form einer Einzeltextdarbietung mit einer festen oder auch variablen textspezifischen Zeitlimitierung zu administrieren (vgl. u. a. Grotjahn 2010). Bei einem C-Test als Papier-Bleistift-Test kann so vorgegangen werden, dass im Testheft für jeden Text eine einzelne Seite vorgesehen wird und die Testpersonen instruiert werden, nur nach Aufforderung mit dem nächsten Text zu beginnen (siehe Baur, Goggin & Wrede-Jackes 2013: 6). Bei einer computerbasierten Administration kann z. B. eine Uhr die zur Bearbeitung eines Textes noch zur Verfügung stehende Zeit anzeigen, und nach Ablauf der Zeit kann dann automatisch der nächste C-Test-Text eingeblendet werden. Eine computerbasierte Einzeltextdarbietung mit einer festen Zeitlimitierung pro Text ist z. B. bei den online-Einstufungstests onSET-Deutsch und onSET-English implementiert (siehe https://www.onset.de/). Eine (computerbasierte) Einzeltextdarbietung mit variabler Zeitlimitierung pro C-Test-Text beschreiben Reichert, Keller & Martin (2010: 214).

4.3.2 Einzeldarbietung mit massivem Zeitdruck: S-C-Tests Eine generelle Möglichkeit, die Schwierigkeit und Differenzierungsfähigkeit von C-Tests (unter Einschluss auch der besprochenen modifizierten Formate) zu erhö-

594

Rüdiger Grotjahn

hen, ergibt sich über den Aufbau eines deutlichen Zeitdrucks mit Hilfe einer Reduzierung der Bearbeitungszeit pro Text auf z. B. lediglich ein bis zwei Minuten. Entsprechende Niveautests mit einer zusätzlichen massiven Speed-Komponente werden von Grotjahn (2010) als S-C-Test (Speeded C-Test) bezeichnet. Neben einer Erhöhung der Schwierigkeit und Differenzierungsfähigkeit zielt das Verfahren darauf ab, im stärkeren Maße als bei einem konventionellen C-Test über den Umfang des deklarativen Wissens hinaus auch den Grad der Wissensautomatisierung und die Effizienz der Informationsverarbeitung zu messen (vgl. auch Wockenfuß 2009). Einem S-C-Test liegt damit ein partiell anderes Konstrukt zugrunde als den bisher beschriebenen C-Test-Formaten. S-C-Tests sind aufgrund ihrer sehr geringen Durchführungszeit ein äußerst ökonomisches Testinstrument und erlauben eine Differenzierung sogar zwischen Muttersprachlern. Allerdings kann die massive Zeitreduzierung zu konstruktirrelevanter Varianz z. B. aufgrund von Testangst führen. Studien mit S-C-Tests bei DaZ-/DaF-Lernenden und Muttersprachlern des Deutschen finden sich z. B. bei Wockenfuß (2009), Grotjahn, Schlak & Aguado (2010) und Heine (2017).

5 Testinstruktion Die Testinstruktion (Arbeitsanweisung) kann einen erheblichen Einfluss darauf haben, wie die Testpersonen einen C-Test bearbeiten und damit die Güte der Messung entscheidend beeinflussen. Insbesondere in multilingualen Situationen ist zu beachten, dass eine Instruktion in der Zielsprache des Tests zu Verständnisproblemen führen kann. Es ist deshalb sicherzustellen, z. B. durch Befragung im Zuge einer Vorerprobung, dass alle Testpersonen die Instruktion hinreichend verstehen (vgl. auch Baur, Goggin & Wrede-Jackes 2013: 6). Weiterhin ist zu entscheiden, ob die Instruktion Hinweise auf die Zahl der gelöschten Buchstaben enthalten soll. Eine Instruktion mit expliziten Hinweisen findet sich z. B. beim Online-C-Test „Deutsch als Fremdsprache“ (siehe http://www. iik-duesseldorf.de/ctest/ctestallg.txt.php3). Gegen Hinweise zum exakten Löschungsprinzip spricht, dass die Angabe zum Buchstabenzählen verleitet (vgl. auch Abschnitt 4.1.2 in diesem Beitrag). Grotjahn (2002a) hat deshalb vorgeschlagen, neben der Angabe der pro Text zur Verfügung stehenden Zeit lediglich darauf hinzuweisen, dass bei einer Reihe von Wörtern ein Teil fehlt und dass diese Wörter in sinnvoller Weise zu ergänzen sind. Auch eine Flexibilisierung der Zahl der gelöschten Buchstaben (vgl. Abschnitt 4.1.2 in diesem Beitrag) kann dazu beitragen, ein konstruktirrelevantes Zählen zu vermeiden. Dazu sollten die Testpersonen allerdings explizit auf die Flexibilisierung hingewiesen werden (z. B. bei der Vorbereitung auf den Test und/oder in der Instruktion).

C-Tests

595

6 Entwicklung von C-Tests Bei der Entwicklung eines (klassischen) C-Tests mit vier bis sechs Texten sollte man von einer Auswahl von mindestens sieben bis neun Texten ausgehen (siehe zum Folgenden Grotjahn 2002a). Ansonsten ist die Gefahr groß, dass nach einer Vorerprobung nicht genügend Texte für die Zusammenstellung eines hochwertigen C-Tests zur Verfügung stehen. Lässt man fachspezifische C-Tests (siehe Abschnitt 7 in diesem Beitrag) oder C-Tests für Muttersprachler oder sehr leistungsstarke Lernende unberücksichtigt, dann sollten die gewählten Texte kein spezielles thematisches Wissen verlangen, kein Spezialvokabular oder ungewöhnliche grammatikalische Strukturen enthalten, möglichst authentisch sein, eine Sinneinheit bilden sowie zielgruppenadäquat sein. Dabei kann es im Fall wenig fortgeschrittener Testpersonen notwendig sein, z. B. auf Schulbuchtexte zurückzugreifen oder auch die ausgewählten Texte zu vereinfachen. Die Auswahl und eventuelle Bearbeitung erfolgt am besten durch Lehrende, die den Sprachstand und die Lerngeschichte der Testpersonen kennen. Insbesondere Lehrende, die wenig Erfahrung mit C-Tests haben, überschätzen allerdings häufig die Schwierigkeit sowohl der Ausgangs- als auch der C-Test-Texte. Weiterhin können quantitative Verfahren zur Vorhersage der Schwierigkeit eingesetzt werden (siehe Abschnitt 11 in diesem Beitrag). Die C-Test-Texte sollten zunächst anhand einer kleineren Gruppe von kompetenten Muttersprachlern informell vorgetestet werden. Beträgt die Lösungshäufigkeit weniger als 90 %, wird in der Regel der entsprechende Text als für L2-Lernende ungeeignet verworfen. Vorerprobungen mit Muttersprachlern haben zudem den Vorteil, dass akzeptable Lösungsvarianten ermittelt werden können (zur Kodierung und zum Umgang mit akzeptablen Varianten und orthografischen Fehlern siehe Abschnitt 8 in diesem Beitrag). Soll der C-Test zur Differenzierung zwischen Muttersprachlern verwendet werden, sind natürlich auch Texte mit Lösungshäufigkeiten von deutlich weniger als 90 % in den entsprechenden Test aufzunehmen (vgl. auch Abschnitt 4.3.2 in diesem Beitrag). Im Anschluss sollten systematische Pilotstudien bei der jeweiligen Gruppe stattfinden, für die der Test bestimmt ist. Diese dienen u. a. zur empirischen Ermittlung der Schwierigkeit und Trennschärfe der einzelnen Texte sowie der Reliabilität des Gesamttests (vgl. Abschnitt 9 in diesem Beitrag). Zu schwierige oder zu leichte Texte sowie Texte mit einer zu geringen Trennschärfe und negativem oder nur geringem Beitrag zur Reliabilität werden ausgeschieden. Für eine genauere Untersuchung der Messeigenschaften von C-Tests ist das beschriebene Vorgehen allerdings nur bedingt geeignet. Eine adäquatere Basis liefern hier sog. probabilistische Testmodelle. Insgesamt gilt, dass (umfangreichere) Pilotuntersuchungen zwar in jedem Fall wünschenswert sind, dass jedoch auch erstmals eingesetzte C-Tests häufig erstaunlich gute Testkennwerte aufweisen. Einen ausführlichen Leitfaden für die Entwicklung von C-Tests enthält Grotjahn (2002a). Caprez-Krompàk (2010: 125–143) beschreibt die Konstruktion eines deut-

596

Rüdiger Grotjahn

schen, albanischen und türkischen C-Tests zur Untersuchung von Erst- und Zweitsprachenkompetenzen von Kindern in der Schweiz und diskutiert auch eine Vielzahl von sprachspezifischen Problemen bei der Anwendung des klassischen Tilgungsprinzips. Eine Darstellung der Entwicklung eines C-Tests für DaZ für Jugendliche findet sich in Dürrstein (2013). Die Entwicklung von computer- bzw. webbasierten C-Tests beschreiben Eckes (2010a), Reichert, Keller & Martin (2010) und Sumbling et al. (2014). Hinweise auf zwei aktuelle C-Test-Applikationen für Smartphones (Apple, Android) finden sich unter http://ttln.net.au.

7 Diskursspezifische C-Tests Klassische C-Tests waren ursprünglich als diskursunspezifische Tests allgemeiner Sprachkompetenz konzipiert. Es gab allerdings schon früh Versuche, C-Tests auch zur Messung fach- und berufssprachlicher oder auch alltagssprachlicher Kompetenzen einzusetzen (vgl. die Hinweise in Grotjahn 1995). Ein jüngeres Beispiel ist die Entwicklung von curriculum-spezifischen deutschen C-Tests zur Einstufung von Studierenden an der Deutschabteilung einer amerikanischen Universität – umfassend dokumentiert in Norris (2008). Aktuelle Beispiele sind die Entwicklung von C-Tests (mit linksseitiger Tilung) für ein Screening der (schrift-)sprachlichen Deutschkompetenzen von Lehramtsstudierenden an der Universität Duisburg-Essen (vgl. Mashkovskaya & Baur 2016a, 2016b) sowie die Studie von Kniffka & Linnemann (2016) zur Ermittlung der Schwierigkeit (fach-)sprachlicher Strukturen mittels fachlicher deutscher C-Tests. Die bisherigen Untersuchungen zeigen, dass C-Tests auch zur Messung diskurspezifischer Kompetenzen eingesetzt werden können.

8 Kodierung und Auswertung der C-Test-Lösungen Es gibt eine Reihe von unterschiedlich komplexen Möglichkeiten, die Rekonstruktionsversuche der Lückenwörter durch die Testpersonen zu kodieren und auszuwerten. Wie man letztendlich vorgeht, hängt von der gewünschten diagnostischen Information und der Praktikabilität und Ökonomie des Vorgehens ab. Kodierung und Auswertung haben damit auch einen erheblichen Einfluss darauf, was ein C-Test bei einer spezifischen Testpopulation genau misst. Will man lediglich eine globale Aussage über den allgemeinen Sprachstand machen und plant auch keine detaillierten statistischen Analysen der psychometrischen Eigenschaften des eingesetzten C-Tests, kann es prinzipiell ausreichen, lediglich die dem Original entsprechenden Lösungen der Testpersonen auszuzählen und die Gesamtzahl der korrekten Lösungen dann als (grobe) Schätzung der allgemeinen Sprachkompetenz der Testpersonen zu interpretieren. Sind allerdings auch

C-Tests

597

Aussagen z. B. zur Schwierigkeit und Trennschärfe der einzelnen Texte erwünscht, muss zusätzlich die Zahl der korrekten Lösungen pro Text ermittelt werden. Sind darüber hinaus Aussagen zu Kompetenzen z. B. im Bereich der Orthografie oder auch detaillierte fehleranalytische Rückmeldungen zu einzelnen Lücken vorgesehen, bedarf es eines komplexeren Kategoriensystems. Ein Beispiel mit sieben Lösungskategorien und vier Methoden der Auswertung findet sich in Eckes & Grotjahn (2006: 169–182). Ein zentraler Aspekt ist in diesem Zusammenhang die Bewertung akzeptabler Varianten und Orthografiefehler. Im Gegensatz zum Cloze Test sind bei klassischen C-Tests akzeptable Varianten zumindest im Deutschen oder Englischen zumeist selten und treten zudem in erster Linie bei weiter fortgeschrittenen Lernenden oder Muttersprachlern auf. Entscheidet man sich für eine Berücksichtigung akzeptabler Varianten, sollte man zur Erhöhung der Objektivität mit festgelegten Listen akzeptabler Lösungen arbeiten. Häufig erhöht sich bei einer Berücksichtigung akzeptabler Varianten die Reliabilität des entsprechenden C-Tests geringfügig. Im Hinblick auf Orthografiefehler stellt sich das Problem, dass die Kategorie oft mit einer erheblichen Unschärfe behaftet ist und als Folge beträchtliche Inkonsistenzen bei der Klassifikation auftreten können. Dies spricht dafür, orthografische Abweichungen zur Erhöhung der Objektivität und Reliabilität als Fehler zu werten. Dieses Vorgehen erleichtert auch die Implementation von C-Tests auf dem PC oder Smartphone. Außerdem scheint es vor allem im Fall von leistungsstärkeren Testpersonen, die z. B. Deutsch oder Englisch nicht in erster Linie als Zweitsprache, sondern vor allen im unterrichtlichen Kontext erlernt haben, im Hinblick auf die Rangfolge der Testleistungen eher unerheblich zu sein, wie die zumeist selten auftretenden orthografischen Abweichungen gewertet werden (vgl. Eckes & Grotjahn 2006: 169– 182; Grotjahn 1995: 42–43; Sahragard, Rahimian & Rahmani Anaraki 2008: 44–47). Anders stellt sich das Problem der Bewertung von Orthografiefehlern, wenn die Testpersonen die zu messenden Kompetenzen z. B. primär in alltagssprachlichen Verwendungskontexten erworben haben. In diesem Fall kann auch bei mündlich hoch kompetenten Testpersonen ein vergleichsweise hoher Anteil an Lösungen auftreten, die lediglich orthografisch fehlerhaft sind. Wertet man diese als „inkorrekt“, kann dies zu einer Unterschätzung der allgemeinen Sprachkompetenz dieser Personen führen. Ähnliches gilt im Fall nachgewiesener Legasthenie. Im Rahmen ihrer Untersuchungen zum Potenzial von C-Tests als Instrument der Diagnose und Förderung im Bereich Deutsch als Zweitsprache haben Baur & Goggin vorgeschlagen, zwischen einem sogenannten R/F-Wert (Richtig/Falsch-Wert) und einem WE-Wert (Worterkennungswert) zu unterscheiden. Der R/F-Wert entspricht der Zahl der semantisch, grammatikalisch und orthografisch korrekt ergänzten Lücken und der WE-Wert der Zahl der semantisch korrekt ergänzten Lücken mit orthografischen oder morphologischen Fehlern (siehe z. B. Baur, Goggin & Wrede-Jackes 2013: 7–8; Dürrstein 2013: 57–59). Vergleicht man bei den einzelnen Testpersonen die R/F- und WE-Werte und berechnet einen Differenzwert, dann erhält man Hin-

598

Rüdiger Grotjahn

weise u. a. zum Verhältnis zwischen rezeptiven und produktiven sprachlichen Fähigkeiten sowie zu möglichen Förderbedarfen. Das beschriebene Verfahren liegt auch der Auswertung des normierten Cornelsen C-Tests Deutsch als Zweitsprache für 5. Klassen zugrunde (Baur, Chlosta & Goggin 2011; 2012). Der jeweilige Förderbedarf wird anhand der Referenzwerte von monolingualen deutschsprachigen Schülerinnen und Schülern aus fünften Klassen von zwölf Hauptschulen bestimmt. Das Programm liefert die individuellen Förderkategorien für jeden Schüler (u. a. in grafischer Form) sowie ausführliche Erklärungen zu den Interpretationsmöglichkeiten (siehe Baur, Goggin & Wrede-Jackes 2013: 9– 13). Die Differenzierung zwischen RF- und WE-Werten eröffnet interessante diagnostische Möglichkeiten, hat aber gegenüber der üblichen Bewertung von C-Tests anhand des RF-Wertes u. a. den Nachteil, dass die Bestimmung des WE-Wertes aufgrund möglicher Zweifelsfälle weniger objektiv ist und insgesamt gesehen auch deutlich mehr Aufwand erfordert. Zudem fehlen m. W. Untersuchungen zur Reliabilität der Differenzwerte.

9 Psychometrische Analysen von C-Test-Daten Prinzipiell ist es denkbar, die Güte der Lösungen der einzelnen Lücken eines C-Tests auf einer mehrstufigen Skala zu bewerten – z. B. indem man semantisch und grammatikalisch akzeptable Rekonstruktionen, die auch orthografisch korrekt sind, höher wertet als entsprechende orthografisch nicht korrekte Rekonstruktionen. Üblicherweise wird jedoch bei den statistischen Analysen lediglich binär zwischen korrekten Lösungen (mit 1 kodiert) und nicht korrekten bzw. fehlenden Lösungen (mit 0 kodiert) unterschieden. Bei den psychometrischen Analysen ist zu beachten, dass die einzelnen Items (Lückenwörter) innerhalb eines C-Test-Textes voneinander abhängig sind (vgl. auch Abschnitt 3 in diesem Beitrag). Sowohl die klassische Testtheorie als auch die meisten probabilistischen Testmodelle setzen die lokale stochastische Unabhängigkeit der Items voraus. Ist diese Voraussetzung nicht erfüllt, kann die Verwendung entsprechender Verfahren z. B. zu einer Überschätzung der Reliabilität oder auch zu verzerrten Schätzung der Sprachkompetenz einer Person führen. Genauere Darstellungen der potenziellen Auswirkungen der Itemabhängigkeiten auf die statistischen Analysen von C-Test-Daten und von Möglichkeiten einer expliziten Modellierung der Abhängigkeiten finden sich z. B. in Eckes & Baghaei (2015), Krampen (2015) und Schroeders, Robitzsch & Schipolowski (2014). Im Rahmen statistischer Untersuchungen bei der Entwicklung von C-Tests (vgl. Abschnitt 6 und 8 in diesem Beitrag) ist es vor allem im Fall einer relativ geringen Zahl von Testpersonen und unzureichender psychometrischer Expertise sinnvoll, sich auf die Berechnung von Schwierigkeiten, Trennschärfen und Reliabilitäten an-

C-Tests

599

hand der klassischen Testtheorie zu beschränken. Wegen der Abhängigkeit der Lückenwörter wird jeder Text als ein polytomes Superitem bzw. Testlet betrachtet und die Summe (Anzahl) der korrekten Lösungen pro Text ermittelt. Anhand der Summenwerte wird dann die Schwierigkeit und Trennschärfe der einzelnen C-Test-Texte sowie die Reliabilität des Tests berechnet. Zur Abschätzung der Reliabilität wird zumeist Cronbachs Alpha verwendet (vgl. Grotjahn 2012). Wie bereits in Abschnitt 6 erwähnt, werden die Ergebnisse dann u. a. dazu benutzt, Texte mit unzureichenden Messeigenschaften auszusondern. Entsprechende Analysen können auch ohne spezielle Software mit Hilfe eines einfachen Tabellenkalkulationsprogramms schnell durchgeführt werden. Bei der Interpretation der Ergebnisse ist u. a. zu beachten, dass der Stichprobenfehler der berechneten Kennwerte im Fall einer geringen Zahl von Testpersonen sehr groß ist. Für komplexere Analysen z. B. der Dimensionalität von C-Tests sind die Verfahren auf der Basis der klassischen Testtheorie allerdings nur bedingt geeignet. Eine adäquatere Basis liefern hier probabilistische Testmodelle (vgl. z. B. Baghaei & Grotjahn 2014a, 2014b; Eckes 2010b; Eckes & Grotjahn 2006; Krampen 2015). Diese setzen allerdings eine deutlich größere Zahl von Testpersonen, spezielle Software und eine hohe psychometrische Expertise voraus.

10 Interpretation der Punktwerte der Testpersonen C-Tests werden bisher zumeist als normorientierte Verfahren eingesetzt. Die individuellen Testwerte werden dann relativ zu den Ergebnissen einer Referenzgruppe, wie z. B. den Mitlernenden in einem Sprachkurs, interpretiert. Das primäre Ziel ist, zwischen den Testpersonen verlässlich in Form einer Rangordnung zu differenzieren. Darüber hinaus werden C-Tests aber auch zunehmend kriteriumsorientiert eingesetzt, wobei sich die norm- und die kriteriumsorientierte Verwendung nicht notwendigerweise ausschließen. Im Fall einer kriteriumsorientierten Verwendung werden die C-Test-Ergebnisse dahingehend interpretiert, inwieweit eine Testperson ein spezifisches, inhaltlich beschriebenes Kriterium erreicht hat. Häufig handelt es sich um ein Kompetenzniveau des Gemeinsamen europäischen Referenzrahmens für Sprachen (GER). Im Hinblick auf die handlungs- und kompetenzbezogenen Beschreibungen des GER stellt sich allerdings das Problem, dass eine kriteriumsorientierte Interpretation von C-Test-Ergebnissen anhand eines direkten Vergleichs der jeweils involvierten Fähigkeiten und Fertigkeiten nur sehr eingeschränkt möglich ist (vgl. hierzu bereits Grotjahn 2004: 543–547). Eine Möglichkeit für eine am GER orientierte kriteriale Interpretation bietet der empirische Vergleich der C-Test-Ergebnisse mit anderen Testwerten, die ihrerseits kriteriumsorientiert im Hinblick auf den GER interpretiert werden können, oder auch ein Vergleich mit lehrerseitigen Einstufungen der Lernenden auf den Kompe-

600

Rüdiger Grotjahn

tenzniveaus des GER (vgl. Eckes 2016; Kniffka & Linnemann 2014; Schön, Johnson & Zimmermann 2014). Der bisher am besten begründete Ansatz einer Zuordnung von C-Test-Ergebnissen zu den Kompetenzniveaus des GER ist die von Thomas Eckes im Hinblick auf deutsche und englische Online-C-Tests entwickelte Prototypgruppenmethode (vgl. Eckes 2017). Die Studien von Eckes und weiteren Autoren zeigen, dass die Verortung von C-Tests und C-Test-Ergebnissen auf den Kompetenzniveaus des GER ein höchst komplexer Prozess ist. Zuordnungen zum GER ohne entsprechende Analysen können deshalb bestenfalls Augenscheingültigkeit beanspruchen.

11 Vorhersage der Schwierigkeit In einer Reihe von Untersuchungen ist der Versuch unternommen worden, die Schwierigkeit von C-Test-Texten anhand von Merkmalen der jeweiligen Texte und Lückenwörter vorherzusagen. Diese Arbeiten sind u. a. aus folgenden Gründen von erheblicher Bedeutung: (a) Sie tragen dazu bei, besser zu verstehen, was (die jeweiligen) C-Tests messen, und liefern damit einen wichtigen Beitrag zur Konstruktvalidierung von C-Tests (vgl. Khoshdel, Baghaei & Bemani 2016, Sigott 2004 sowie Abschnitt 12.2 in diesem Beitrag). (b) Sie erleichtern die Entwicklung von C-Tests für spezifische Kompetenzniveaus. (c) Informationen zu den Determinanten der Schwierigkeit von C-Tests und insb. von einzelnen Lückenwörtern ermöglichen ein (automatisiertes) Feedback an die Testpersonen z. B. mit dem Ziel einer individualisierten Förderung. Wichtige frühe Studien zu der Thematik sind u. a. von Christine Klein-Braley und Günther Sigott sowie im Rahmen des Projekts Deutsch Englisch Schülerleistungen International (DESI) durchgeführt worden (vgl. z. B. Harsch & Schröder 2007; Klein-Braley 1994; Sigott 2004). Einen kurzen Überblick über frühere Arbeiten zur Vorhersage der Schwierigkeit sowie auch eine eigene Untersuchung zur Schwierigkeit deutscher C-Test-Texte enthält Kaufmann (2016). Die umfassendsten aktuellen Beiträge zur Vorhersage und Anpassung der Schwierigkeit von C-Tests haben Svetashova (2015) und Beinborn (2016) vorgelegt. Während Svetashova sich auf englische C-Tests beschränkt, analysiert Beinborn deutsche, englische und französische C-Tests (unter Einschluss von C-Tests mit Löschung des Wortanfangs) (siehe https://www.ukp.tu-darmstadt.de/data/c-tests/ difficulty-prediction-for-language-tests/). Für ihre Analysen, die als Meilensteine der aktuellen C-Test-Forschung anzusehen sind, greifen beide Autorinnen auf Verfahren der Computerlinguistik unter Einschluss von maschinellem Lernen zurück und modellieren die Schwierigkeit der individuellen Lücken und die globale Schwierigkeit der einzelnen Texte anhand einer Vielzahl von mikrostrukturellen und makrostrukturellen Merkmalen. Beinborn berücksichtigt dabei je nach Sprache und C-Test-Format

C-Tests

601

zwischen 51 und 59 und Svetashova sogar insgesamt 175 potenziell relevante Merkmale. Weiterhin stellt Beinborn (2016: 160) unter http://spz-etest.ukp.informatik.tudarmstadt.de:9000/ctest eine nützliche kostenlose Web-Demo zur Verfügung. Diese erlaubt für die Sprachen Englisch, Deutsch und Französisch eine automatische Transformation eines Eingabetextes in einen C-Test-Text und die Vorhersage der Schwierigkeit der einzelnen Lücken anhand von drei farblich unterschiedenen Kategorien.3 Diese Information kann dann u. a. für eine die Schwierigkeit verändernde Modifikation einzelner Lückenwörter genutzt werden. Beinborn konnte u. a. zeigen, dass sich für deutsche C-Test-Texte auf der Basis von nur 15 überwiegend mikrostrukturellen Merkmalen wie Frequenz des Lückenwortes, Zahl und Attraktivität der potenziellen Lösungen sowie Verwandtschaft des Wortes mit Wörtern aus der jeweiligen L1 oder anderen Sprachen der Testpersonen (cognateness) eine kreuzvalidierte Pearson-Korrelation von 0.62 zwischen der empirischen Fehlerrate und der vorhergesagten Schwierigkeit der Texte ergibt. Mit Hilfe von 17 ebenfalls vorwiegend mikrostrukturellen Merkmalen konnte für das Französische sogar eine Korrelation von 0.71 erzielt werden (vgl. Beinborn 2016: 144–145). Dies stützt die Ansicht, dass zumindest im Deutschen, Englischen und Französischen klassische C-Tests primär lexikalische und morphologische Kompetenzen auf der Ebene des Mikrokontextes messen (vgl. auch Abschnitt 12.2 in diesem Beitrag).

12 Gütekriterien 12.1 Objektivität, Reliabilität und Ökonomie C-Tests besitzen eine hohe Durchführungsobjektivität und erlauben – zumindest dann, wenn lediglich exakte Lösungen oder vorher festgelegte akzeptable Lösungen als „korrekt“ gewertet werden – eine absolut objektive Auswertung. In den meisten Untersuchungen haben sich C-Tests als hoch reliabel im Sinne einer Messkonsistenz auf der Ebene der einzelnen Texte erwiesen (zumeist liegt die Reliabilität zwischen 0.80 und 0.90). Dies gilt häufig sogar in Bezug auf nicht gründlich vorerprobte C-Tests. Auch die ermittelten Test-Retest-Reliabilitätskoeffizienten sind mit Werten zumeist zwischen 0.70 und 0.85 angesichts von Retest-Intervallen von bis zu einem Jahr sehr hoch (vgl. die Hinweise in Eckes & Grotjahn 2006). Dies belegt sowohl die

3 Ein anderes nützliches kostenloses Internet-Werkzeug zur Erstellung von C-Test-Texten bietet das Didaktisierungstool LingoFox (siehe http://lingofox.dw.com/index.php?url=c-test). Es unterstützt diverse Wahlmöglichkeiten im Hinblick auf den Abstand der Tilgungen (2. bis 6. Wort), die Nummerierung der Lücken und die Kennzeichnung der Lückenlänge und ermöglicht damit die Erstellung unterschiedlich schwieriger C-Test-Texte anhand identischer Eingabetexte.

602

Rüdiger Grotjahn

Messgenauigkeit der eingesetzten C-Tests als auch die Stabilität der gemessenen Eigenschaft. Allerdings ist der Stichprobenfehler vieler Untersuchungen aufgrund geringer Gruppengrößen relativ hoch. Schließlich sind C-Tests – wie bereits angedeutet – ökonomische Testinstrumente. Ein Einsatz ist auch ohne technische Mittel wie Overheadprojektor oder Tonträger möglich – ein im Hinblick auf die Praxis nicht unwichtiger Aspekt. Zudem können C-Tests mit vertretbarem Aufwand als (weitgehend) messäquivalente computer- oder web-basierte Tests implementiert werden (siehe Abschnitt 6 in diesem Beitrag).

12.2 Validität Die Validität (Gültigkeit) gilt als das wichtigste Gütekriterium eines Tests. Bei der Validierung ist u. a. zu fragen, inwieweit die Testergebnisse das erfassen, was sie erfassen sollen, und inwieweit die mit Hilfe der Testergebnisse getroffenen Entscheidungen gerechtfertigt sind. Die Validität hängt damit von der Interpretation und Verwendung der Testergebnisse ab (vgl. Grotjahn & Kleppin 2017 sowie bezogen auf C-Tests Grotjahn 2011; Norris 2008; Wilmes 2007). Zur Untersuchung der verschiedenen Facetten der Validität von C-Tests sind eine Vielzahl unterschiedlicher Methoden eingesetzt worden (vgl. für einen Überblick z. B. Eckes & Grotjahn 2006, Grotjahn 1995, 2014, Sigott 2004 sowie auch Abschnitt 11 in diesem Beitrag). Am häufigsten sind korrelationsstatistische Methoden unter Einschluss von Faktorenanalysen verwendet worden. Dabei ergaben sich zumeist mittlere bis hohe Korrelationen von C-Tests mit verschiedenen Außenkriterien (z. B. Ergebnisse in anderen Sprachtests; Schulnoten; Lehrerurteile) sowie hohe Ladungen der C-Tests auf einer als allgemeine Sprachkompetenz interpretierbaren latenten Dimension (vgl. z. B. Eckes & Grotjahn 2006; Reichert, Brunner & Martin 2014; Sumbling et al. 2014). Hervorzuheben sind u. a. die hohen Korrelationen von C-Tests mit Lexik-Tests (vgl. z. B. Eckes & Grotjahn 2006; Harsch & Hartig 2015; Janebi Enayat & Babaii 2018) sowie die substanziellen Korrelationen zwischen C-Test-Leistung und komplexeren Textproduktionsleistungen (vgl. z. B. Mashkovskaya & Baur 2016b: 228–230; Schaller 2018; Vockrodt-Scholz & Zydatiß 2010). Angesichts des Aufwands einer objektiven und reliablen Bewertung von komplexen Schreibaufgaben sprechen die gefundenen Korrelationen u. a. dafür, C-Tests in bestimmten Kontexten auch für ein schnelles Screening basaler Textproduktionskompetenz einzusetzen. In einigen Untersuchungen wurden auch mittelstarke Korrelationen zwischen C-Test-Leistung und mündlicher Kompetenz festgestellt. Es stellt sich allerdings die Frage, ob dieses Resultat trotz psycholinguistischer Übereinstimmungen zwischen schriftlicher und mündlicher Sprache im Hinblick auf Rezeption und Produktion (vgl. Asano 2014) nicht in erster Linie auf die gemeinsame unterrichtliche Vermittlung schriftlicher und mündlicher Kompetenzen zurückzuführen ist. Belastbare Be-

C-Tests

603

funde zum Zusammenhang zwischen C-Test-Leistung und mündlicher Kompetenz in eindeutig zweitsprachlichen Erwerbskontexten fehlen m. W. bisher. Weiterhin sind mit Hilfe introspektiver Methoden die mentalen Prozesse analysiert worden, die beim Bearbeiten von C-Tests ablaufen (kognitive Validität als zentrale Facette der Konstruktvalidität). Dabei ging es u. a. um die wichtige Frage, inwieweit die Testpersonen auf den Makrokontext zurückgreifen (vgl. z. B. Babaii & Fatahi-Majd 2014; Stemmer 1991 sowie auch Abschnitt 11 in diesem Beitrag). In weiteren Studien wurden die von den Testpersonen produzierten (fehlerhaften) Lösungen anhand der Testskripte analysiert (vgl. z. B. Hastings 2002; KleinBraley 1994, 1996). Klein-Braley konnte u. a zeigen, dass auch zwischen relativ weit auseinanderliegenden Lückenwörtern substanzielle Korrelationen auftreten. Sie interpretiert dies als Beleg dafür, dass C-Tests auch auf der Ebene des Makrokontextes messen. In einer experimentellen Studie konnte Sigott (2004) darüber hinaus anhand einer Analyse der Lösungen von im unterschiedlichen Maße dekontextualisierten englischen C-Test-Items nachweisen, dass leistungsstärkere Testpersonen tendenziell eher in der Lage waren, Items auch ohne Rückgriff auf den Makrokontext zu lösen (vgl. hierzu auch Babaii & Fatahi-Majd 2014). Schließlich haben Germann & Grotjahn (siehe Grotjahn 1995: 47–48) die Tastatureingaben beim Lösen von C-Tests auf dem Computer analysiert, und Grotjahn (2002b) hat die Auswirkungen einer Permutation (Scrambling) der Sätze von C-TestTexten auf die Lösungsgüte untersucht. Insgesamt belegen die entsprechenden Untersuchungen, dass bei der Lösung von deutschen, englischen und französischen C-Tests der Mikrokontext von primärer Bedeutung ist, dass aber in Abhängigkeit vom Leistungsstand falls nötig auch makrokontextuelle Verarbeitungsprozesse eingesetzt werden. In einer weiteren Studie zur Konstruktvalidierung von C-Tests sind Grotjahn & Tönshoff (siehe Grotjahn 1995: 48) der Frage nachgegangen, ob C-Tests – wie zuweilen behauptet – vorwiegend Leseverständnis erfassen. Es zeigte sich, dass einige Testpersonen auch ohne ein ausreichendes Textverständnis eine hohe Lösungsrate erreichen. Die Autoren kommen zu dem Schluss, dass ein kanonischer C-Test zwar in gewissem Umfang basale Lesekompetenzen misst, jedoch kein adäquates Instrument zur Messung von textueller Verstehenskompetenz ist. Insgesamt gesehen stützen die zahlreichen Studien zur Validität die Ansicht, dass C-Tests mit rechtsseitiger Tilgung globale Verfahren zur integrierten Messung eines eher eng verstandenen Konstrukts allgemeiner sprachlicher Kompetenz darstellen (siehe auch Baghaei & Grotjahn 2014a, 2014b). Dabei scheint lexikalischen Kompetenzen eine herausragende Rolle zuzukommen (vgl. auch Abschnitt 11 in diesem Beitrag).

604

Rüdiger Grotjahn

13 Schlussbemerkung C-Tests haben sich mittlerweile auch im Bereich der Sprachdiagnostik DaZ fest etabliert. Sie sind insbesondere dann erfolgreich einsetzbar, wenn das Ziel eine vom vorangehenden Unterricht bzw. von der individuellen Lerngeschichte weitgehend unabhängige schnelle und ökonomische globale Feststellung allgemeiner sprachlicher Kompetenz ist. Für eine Diagnose spezifischer individueller Schwächen und Stärken anhand einzelner Lückenwörter eignen sich C-Tests dagegen nur mit Einschränkungen. Zum einen ist hiermit ein deutlich höherer Aufwand bei der Auswertung von C-Tests verbunden. Zum anderen erlauben C-Tests aufgrund ihres Konstruktionsprinzips nur sehr bedingt eine zielgerichtete Diagnose spezifischer Merkmale. Sie sind demnach auch kein Ersatz z. B. für spracherwerbstheoretisch fundierte Beobachtungsverfahren anhand detaillierter Kategorienraster (vgl. Döll in diesem Band). Sie sind jedoch vorzüglich geeignet z. B. für ein schnelles Screening allgemeiner Sprachkompetenz vor dem Einsatz komplexer und aufwändiger Diagnoseinstrumente. Eine potenzielle Einschränkung ergibt sich auch aus der Tatsache, dass zur Lösung klassischer C-Tests produktive Schreibkompetenzen nötig sind. Verfügen Lernende (noch) nicht über entsprechende Kompetenzen, kann dies zu einer validitätsmindernden Konfundierung bei der Interpretation der C-Test-Ergebnisse führen. Hierdurch ergeben sich auch Einschränkungen im Hinblick auf das Alter der Testpersonen. So sind vermutlich selbst im Fall von deutschen Muttersprachlern ohne Migrationshintergrund C-Test in den meisten schulischen Kontexten erst ab der vierten Klasse sinnvoll einsetzbar (siehe auch Mashkovskaya & Baur 2016a: 193). Auf die Möglichkeit der Messung allgemeiner Sprachkompetenz unabhängig von den produktiven Schreibkompetenzen anhand von C-Tests im Multiple-ChoiceFormat wurde bereits in Abschnitt 4.2 hingewiesen. Eine andere Möglichkeit ist die mündliche Administrierung eines C-Tests in Form einer Einzelprüfung. Diese ist schnell durchführbar, schon während der Durchführung auswertbar und dauert bei fünf Texten mit 20 Lücken in der Regel weniger als 15 Minuten. Die Administration kann dabei in Form einer Einzeltextdarbietung mit einer festen oder auch variablen textspezifischen Zeitlimitierung erfolgen (vgl. Abschnitt 4.3.1 in diesem Beitrag). Belastbare empirische Untersuchungen zu mündlichen C-Tests fehlen allerdings bisher. Handelt es sich bei den Testpersonen um funktionale Analphabeten, sind auch mündliche C-Tests nicht sinnvoll einsetzbar. Eine valide Alternative zu schriftlichen C-Tests – u. a. im Hinblick auf Spracherwerbsuntersuchungen – ist in diesem Fall der zur Messung nicht-literaler allgemeiner Sprachkompetenz zunehmend eingesetzte Elicited Imitation Test (vgl. Drackert 2015).

C-Tests

605

Literaturverzeichnis Arras, Ulrike, Thomas Eckes & Rüdiger Grotjahn (2002): C-Tests im Rahmen des „Test Deutsch als Fremdsprache“ (TestDaF): Erste Forschungsergebnisse. In Rüdiger Grotjahn (Hrsg.), Der C-Test: Theoretische Grundlagen und praktische Anwendungen, Bd. 4, 175–209. Bochum: AKS-Verlag. http://www.testdaf.de/html/publikationen/pdffiles/arras_eckes_grotjahn.pdf (01. 09. 2017). Asano, Yuki (2014): C-Tests und ‚allgemeine Sprachkompetenz‘: Theoretische Überlegungen und empirische Analysen. In Rüdiger Grotjahn (Hrsg.), Der C-Test: Aktuelle Tendenzen/The C-Test: Current trends, 39–52. Frankfurt am Main: Peter Lang. Babaii, Esmat & Mosayeb Fatahi-Majd (2014): Failed restorations in the C-test: Types, sources, and implications for C-test processing. In Rüdiger Grotjahn (Hrsg.), Der C-Test: Aktuelle Tendenzen/The C-Test: Current trends, 261–274. Frankfurt am Main: Peter Lang. Baghaei, Purya & Rüdiger Grotjahn (2014a): Establishing the construct validity of conversational C-Tests using a multidimensional Rasch model. Psychological Test and Assessment Modeling, 56 (1), 60–82. http://www.psychologie-aktuell.com/fileadmin/download/ptam/1-2014_ 20140324/04_Baghaei.pdf (01. 09. 2017). Baghaei, Purya & Rüdiger Grotjahn (2014b): The validity of C-Tests as measures of academic and everyday language proficiency: A multidimensional item response modeling study. In Rüdiger Grotjahn (Hrsg.), Der C-Test: Aktuelle Tendenzen/The C-Test: Current trends, 163–171. Frankfurt am Main: Peter Lang. Baur, Rupprecht S., Christoph Chlosta & Melanie Goggin (2011): Cornelsen C-Test. In Torsten Andreas et al. (Hrsg.), Fördermaterialien für Deutsch als Zweitsprache 5/6 – Mit Cornelsen C-Test, 4–22. Berlin: Cornelsen. Baur, Rupprecht S., Christoph Chlosta & Melanie Goggin (2012): Doppelklick 5. Der Cornelsen C-Test. Berlin: Cornelsen. Baur, Rupprecht S., Melanie Goggin & Jennifer Wrede-Jackes (2013): Der C-Test: Einsatzmöglichkeiten im Bereich DaZ. Universität Duisburg-Essen: proDaZ. (17 Seiten). http:// www.uni-due.de/imperia/md/content/prodaz/c_test_einsatzmoeglichkeiten_daz.pdf (01. 09. 2017). Beinborn, Lisa (2016): Predicting and manipulating the difficulty of text-completion exercises for language learning. Doctoral dissertation, Technische Universität Darmstadt, Fachbereich Informatik. http://tuprints.ulb.tu-darmstadt.de/5647/ (01. 09. 2017). Caprez-Krompàk, Edina (2010): Entwicklung der Erst- und Zweitsprache im interkulturellen Kontext. Eine empirische Untersuchung über den Einfluss des Unterrichts in heimatlicher Sprache und Kultur (HSK) auf die Sprachentwicklung. Münster: Waxmann. Drackert, Anastasia (2015): Validating language proficiency assessments in second language acquisition research: Applying an argument-based approach. Frankfurt am Main: Peter Lang. Dürrstein, Birgit (2013): Konzeption eines C-Tests als Screening. In Stefan Jeuk (Hrsg.), Sprachförderung und Förderdiagnostik in der Sekundarstufe I, 53–71. Stuttgart: Klett. Eckes, Thomas (2010a): Der Online-Einstufungstest Deutsch als Fremdsprache (onDaF): Theoretische Grundlagen, Konstruktion und Validierung. In Rüdiger Grotjahn (Hrsg.), Der C-Test: Beiträge aus der aktuellen Forschung/The C-Test: Contributions from current research, 125–192. Frankfurt am Main: Peter Lang. https://www.ondaf.de/gast/ondaf/info/ dokumente/Eckes_onDaF_2010.pdf (01. 09. 2017). Eckes, Thomas (2010b): Rasch models for C-Tests: Closing the gap on modern psychometric theory. In Annette Berndt & Karin Kleppin (Hrsg.), Sprachlehrforschung: Theorie und Empirie. Festschrift für Rüdiger Grotjahn, 39–49. Frankfurt am Main: Peter Lang. Eckes, Thomas (2014): Die onDaF–TestDaF-Vergleichsstudie: Wie gut sagen Ergebnisse im onDaF Erfolg oder Misserfolg beim TestDaF vorher? In Rüdiger Grotjahn (Hrsg.), Der C-Test: Aktuelle Tendenzen/The C-Test: Current trends, 137–162. Frankfurt am Main: Peter Lang.

606

Rüdiger Grotjahn

Eckes, Thomas (2017): Setting cut scores on an EFL placement test using the prototype group method: A receiver operating characteristic (ROC) analysis. Language Testing, 34 (3), 383– 411. Eckes, Thomas & Purya Baghaei (2015): Using testlet response theory to examine local dependency in C-Tests. Applied Measurement in Education, 28 (2), 85–98. Eckes, Thomas & Rüdiger Grotjahn (2006): A closer look at the construct validity of C-tests. Language Testing, 23 (3), 290–325. Grotjahn, Rüdiger (1995): Der C-Test: State of the Art. Zeitschrift für Fremdsprachenforschung, 6 (2), 37–60. http://www.c-test.de/deutsch/index.php?lang=de§ion=originalia (01. 09. 2017). Grotjahn, Rüdiger (2002a): Konstruktion und Einsatz von C-Tests: Ein Leitfaden für die Praxis. In Rüdiger Grotjahn (Hrsg.), Der C-Test: Theoretische Grundlagen und praktische Anwendungen, Bd. 4, 211–225. Bochum: AKS-Verlag. http:// http://www.c-test.de/deutsch/index.php?lang= de§ion=originalia (01. 09. 2017). Grotjahn, Rüdiger (2002b): ‚Scrambled‘ C-Tests: Eine Folgeuntersuchung. In Rüdiger Grotjahn (Hrsg.), Der C-Test: Theoretische Grundlagen und praktische Anwendungen, Bd. 4, 83–121. Bochum: AKS-Verlag. Grotjahn, Rüdiger (2004): Der C-Test: Aktuelle Entwicklungen. In Armin Wolff, Torsten Ostermann & Christoph Chlosta (Hrsg.), Integration durch Sprache: Beiträge der 31. Jahrestagung DaF 2003, 535–550. Regensburg: Fachverband Deutsch als Fremdsprache. Grotjahn, Rüdiger (2010): Gesamtdarbietung, Einzeltextdarbietung, Zeitbegrenzung und Zeitdruck: Auswirkungen auf Item- und Testkennwerte und C-Test-Konstrukt. In Rüdiger Grotjahn (Hrsg.), Der C-Test: Beiträge aus der aktuellen Forschung/The C-Test: Contributions from current research, 265–296. Frankfurt am Main: Peter Lang. Grotjahn, Rüdiger (2011): C-Tests – Aspekte der Validität. Deutsch als Fremdsprache, 48 (3), 131–137. Grotjahn, Rüdiger (2012): Theoretical misconceptions and misuse of statistics: A critique of Khodadady and Hashemi (2011) and some general remarks on Cronbach’s alpha. Iranian Journal of Language Testing, 2 (1), 20–27. http://ijlt.ir/portal/images/PDF/406-2012-2-1.pdf (01. 09. 2017). Grotjahn, Rüdiger (2014): Der C-Test: Aktuelle Tendenzen. Einleitung und Übersicht über den Band. In Rüdiger Grotjahn (Hrsg.), Der C-Test: Aktuelle Tendenzen/The C-Test: Current trends, 7–37. Frankfurt am Main: Peter Lang. Grotjahn, Rüdiger (2018): The electronic C-Test bibliography: version September 2018. http://www.c-test.de (erscheint). Grotjahn, Rüdiger, Christine Klein-Braley & Ulrich Raatz (2002): C-Tests: An overview. In James A. Coleman, Rüdiger Grotjahn & Ulrich Raatz (Hrsg.), University language testing and the C-test, 93–114. Bochum: AKS-Verlag. http://www.c-test.de/deutsch/index.php?lang=de§ion= originalia (01. 09. 2017). Grotjahn, Rüdiger & Karin Kleppin (2017): Gütekriterien bei der Evaluation von Schreibkompetenzen. In Bettina Akukwe, Rüdiger Grotjahn & Stefan Schipolowski (Hrsg.), Schreibkompetenzen in der Fremdsprache: Aufgabengestaltung, kriterienorientierte Bewertung und Feedback, 41–69. Tübingen: Narr. Grotjahn, Rüdiger, Torsten Schlak & Karin Aguado (2010): S-C-Tests: Messung automatisierter sprachlicher Kompetenzen anhand von C-Tests mit massiver textspezifischer Zeitlimitierung. In Rüdiger Grotjahn (Hrsg.), Der C-Test: Beiträge aus der aktuellen Forschung/The C-Test: Contributions from current research, 297–319. Frankfurt am Main: Peter Lang. Harsch, Claudia & Johannes Hartig (2015): Comparing C-tests and Yes/No vocabulary size tests as predictors of receptive language skills. Language Testing, 1–21. Harsch, Claudia & Konrad Schröder (2007): Textrekonstruktion: C-Test. In Bärbel Beck & Eckhard Klieme (Hrsg.), Sprachliche Kompetenzen: Konzepte und Messung. DESI-Studie (Deutsch

C-Tests

607

Englisch Schülerleistungen International), 212–225. Weinheim: Beltz. http://www.pedocs.de/ volltexte/2010/3140/pdf/978_3_407_25398_9_1A_D_A.pdf (01. 09. 2017). Hastings, Ashley J. (2002): Error analysis of an English C-Test: Evidence for integrated processing. In Rüdiger Grotjahn (Hrsg.), Der C-Test. Theoretische Grundlagen und praktische Anwendungen, Bd. 4, 53–66. Bochum: AKS-Verlag. Heine, Simone (2017): Fremd- und Zweitsprachenlernerfolg und seine Erklärung durch Erwerbsalter, kognitive, affektiv-motivationale und sozio-kulturelle Variablen. Eine empirische Studie. Kassel: Kassel University Press. http://www.uni-kassel.de/upress/online/OpenAccess/978-37376-0272-3.OpenAccess.pdf (01. 09. 2017). Jakschik, Gerhard, Hella Klemmert & Dorothea Klinck (2010): Computergestützter Multiple Choice C-Test in der Bundesagentur für Arbeit: Bundesweite Erprobung und Einführung. In Rüdiger Grotjahn (Hrsg.), Der C-Test: Beiträge aus der aktuellen Forschung/The C-Test: Contributions from current research, 233–264. Frankfurt am Main: Peter Lang. Janebi Enayat, Mostafa & Esmat Babaii (2018): Reliable predictors of reduced redundancy test performance: The interaction between lexical bonds and test takers’ depth and breadth of vocabulary knowledge. Language Testing, 35 (1), 121–144. Kaufmann, Nicole (2016). Die Vorhersage der Schwierigkeit deutscher C-Test-Texte: Untersuchungen am Beispiel des onDaF. Zeitschrift für Interkulturellen Fremdsprachenunterricht 21 (2), 111–126. Klein-Braley, Christine (1994): Language testing with the C-Test. A linguistic and statistical investigation into the strategies used by C-Test takers, and the prediction of C-Test difficulty. Unveröffentl. Habilitationsschrift, Universität-Gesamthochschule Duisburg: Fachbereich 3, Sprach- und Literaturwissenschaften. Klein-Braley, Christine (1996): Towards a theory of C-Test processing. In Rüdiger Grotjahn (Hrsg.), Der C-Test. Theoretische Grundlagen und praktische Anwendungen, Bd. 3, 23–94. Bochum: Brockmeyer. http://www.c-test.de/deutsch/index.php?lang=de§ion=originalia (01. 09. 2017). Klein-Braley, Christine (1997): C-Tests in the context of reduced redundancy testing: An appraisal. Language Testing, 14 (1), 47–84. Klemmert, Hella (2014): Messäquivalenz von klassischem C-Test und computergestütztem Multiple-Choice C-Test im Rasch-Modell. In Rüdiger Grotjahn (Hrsg.), Der C-Test: Aktuelle Tendenzen/The C-Test: Current trends, 173–188. Frankfurt am Main: Peter Lang. Kniffka, Gabriele & Markus Linnemann (2014): A German C-test for migrant children. In Rüdiger Grotjahn (Hrsg.), Der C-Test: Aktuelle Tendenzen/The C-Test: Current trends, 239–259. Frankfurt am Main: Peter Lang. Kniffka, Gabriele & Markus Linnemann (2016): Zur Ermittlung der Schwierigkeit (fach-)sprachlicher Strukturen mittels fachlicher C-Tests – Eine explorative Studie. In Erwin Tschirner, Olaf Bärenfänger & Jupp Möhring (Hrsg.), Deutsch als fremde Bildungssprache: Das Spannungsfeld von Fachwissen, sprachlicher Kompetenz, Diagnostik und Didaktik, 163–178. Tübingen: Stauffenburg. Koshdel, Fahimeh, Purya Baghaei & Masoumeh Bemani (2016): Investigating factors of difficulty in C-Tests: A construct identification approach. International Journal of Language Testing, 6 (2), 113–122. http://ijlt.ir/journal/images/PDF/447-2016-6-2.pdf (01. 09. 2017). Krampen, Dorothea (2015): Zur Bedeutung des Testformats für die Testauswertung: Aufgabenstamm- und Antwortabhängigkeiten im C-Test. Frankfurt am Main: Peter Lang. Mashkovskaya, Anna (2013): Der C-Test als Lesetest bei Muttersprachlern. Diss. phil., Universität Duisburg-Essen, Fachbereich Geisteswissenschaften. http://duepublico.uni-duisburgessen.de/servlets/DocumentServlet?id=32859 (01. 09. 2017). Mashkovskaya, Anna & Rupprecht S. Baur (2016a): C-Tests für erwachsene Erst- und ZweitsprachsprecherInnen. Screening der (schrift-)sprachlichen Kompetenzen von

608

Rüdiger Grotjahn

Lehramtsstudierenden. In Albert Bremerich-Vos & Dirk Scholten-Akoun (Hrsg.), Schriftsprachliche Kompetenzen von Lehramtsstudierenden in der Studieneingangsphase: Eine empirische Untersuchung, 191–211. Baltmannsweiler: Schneider Verlag Hohengehren. Mashkovskaya, Anna & Rupprecht S. Baur (2016b): Ergebnisse und Diskussion der C-Tests. In Albert Bremerich-Vos & Dirk Scholten-Akoun (Hrsg.), Schriftsprachliche Kompetenzen von Lehramtsstudierenden in der Studieneingangsphase: Eine empirische Untersuchung, 213–232. Baltmannsweiler: Schneider Verlag Hohengehren. Norris, John M. (2008): Validity evaluation in language assessment. Frankfurt am Main: Peter Lang. Norris, John M. (Hrsg.). (2018): Developing C-Tests for estimating proficiency in foreign language research. Frankfurt am Main: Peter Lang. Raatz, Ulrich & Christine Klein-Braley (1992): CT-D 4. Schulleistungstest Deutsch für 4. Klassen. Test und Beiheft mit Anleitung und Normentabellen. Weinheim: Beltz. Reichert, Monique, Martin Brunner & Romain Martin (2014): Do test takers with different language backgrounds take the same C-test? The effect of native language on the validity of C-tests. In Rüdiger Grotjahn (Hrsg.), Der C-Test: Aktuelle Tendenzen/The C-Test: Current trends, 109–135. Frankfurt am Main: Peter Lang. Reichert, Monique, Ulrich Keller & Romain Martin (2010): The C-test, the TCF and the CEFR: a validation study. In Rüdiger Grotjahn (Hrsg.), Der C-Test: Beiträge aus der aktuellen Forschung/The C-Test: Contributions from current research, 205–231. Frankfurt am Main: Peter Lang. Sahragard, Rahman, Jalal Rahimian & Reza Rahmani Anaraki (2008): The effects of changing the deletion direction and deletion ratio on the validity and reliability of the C-test. TELL [Teaching English Language and Literature], 2 (8), 23–52. http://en.journals.sid.ir/ ViewPaper.aspx?ID=162176 (01. 09. 2017). Schaller, Pascale (2018): Konstruktion von Sprache und Sprachwissen: Eine empirische Studie zur Schriftsprachaneignung sprachstarker und sprachschwacher Kinder. Berlin: De Gruyter. open access ebook: https://www.degruyter.com/view/product/491270. Schön, Almut, Natalia Johnson & Kerstin Zimmermann (2014): Schwellen erkennen – verschiedene Möglichkeiten zur Festlegung von cut scores in C-Tests. In Regina Mügge (Hrsg.), Gekonnt, verkannt, anerkannt? – Sprachen im Bologna-Prozess. Dokumentation der 27. Arbeitstagung 2012, 71–88. Bochum: AKS-Verlag. Schroeders, Ulrich, Alexander Robitzsch & Stefan Schipolowski (2014): A comparison of different psychometric approaches to modeling testlet structures: An example with C-tests. Journal of Educational Measurement, 51 (4), 400–418. Sigott, Günther (2004): Towards identifying the C-Test construct. Frankfurt am Main: Peter Lang. Stemmer, Brigitte (1991): What’s on a C-test taker’s mind: Mental processes in C-test taking. Bochum: Brockmeyer. Sumbling, Mick, Carme Viladrich, Eduardo Doval & Laura Riera (2014): C-test as an indicator of general language proficiency in the context of a CBT (SIMTEST). In Rüdiger Grotjahn (Hrsg.), Der C-Test: Aktuelle Tendenzen/The C-Test: Current trends, 53–108. Frankfurt am Main: Peter Lang. Svetashova, Yulia (2015): C-test item difficulty prediction: Exploring the linguistic characteristics of C-tests using machine learning. Master’s thesis, Eberhard Karls Universität Tübingen, Seminar für Sprachwissenschaft. Vockrodt-Scholz, Viola & Wolfgang Zydatiß (2010): Sprachproduktive Faktoren und die Konstruktvalidität von C-Tests: Kompetenzniveaus und Fehlerquotient in textsortengebundenen Schreibaufgaben. In Rüdiger Grotjahn (Hrsg.), Der C-Test: Beiträge aus der aktuellen Forschung/The C-Test: Contributions from current research, 1–40. Frankfurt am Main: Peter Lang.

C-Tests

609

Watanabe, Yukiko & Dennis Koyama (2008): A meta-analysis of second language cloze testing research. Second Language Studies, 26 (2), 103–133. Wilmes, Carsten (2007): Validation of a German language placement test based on a modified C-test procedure. Doctoral dissertation, University of Illinois at Urbana-Champaign. Wockenfuß, Verena (2009): Diagnostik von Sprache und Intelligenz bei Jugendlichen und jungen Erwachsenen. Aachen: Shaker.

Julia Ricart Brede

25 Sprachenportfolios 1 2 3 4

Darstellungsformen und Methoden reflexiver Praxis in Lehr-Lern-Kontexten Sprachenportfolios und die Geschichte des ESP Das Portfolio als Bewertungs- und Diagnoseinstrument im Unterricht Das Portfolio als Diagnoseinstrument auf dem Prüfstand

1 Darstellungsformen und Methoden reflexiver Praxis in Lehr-Lern-Kontexten Reflexive Praxis nutzt verschiedene Darstellungsformen und Methoden, um Prozesse und Produkte sichtbar und auf diese Weise evaluierbar zu machen. Das Portfolio ist eine Methode reflexiver Praxis, die in Lehr-Lern-Kontexten häufig verwendet wird; weiterhin sind insbesondere das Tagebuch und das Arbeitsjournal zu nennen (Bräuer 2016: 31–33). Die verschiedenen Methoden bilden dabei unterschiedliche Schritte bzw. Ebenen reflexiver Praxis ab: So gilt es – als Bestandteile einer sog. ‚Primärreflexion‘ – Lernprozesse bzw. -produkte zunächst zu dokumentieren, sichtbar zu machen und zu beschreiben, bevor die ‚Sekundärreflexion‘ stattfinden kann, d. h. bevor die Lernprozesse bzw. -produkte auf dieser Grundlage in einem zweiten Schritt analysiert und interpretiert und schließlich in einem dritten Schritt bewertet und evaluiert werden können; in einem vierten und letzten Schritt werden aus den so gewonnenen Erkenntnissen Ziele, Strategien und Schritte für zukünftiges Handeln abgeleitet (vgl. Bräuer 2016: 24–31). Während Tagebücher als „privates Schatzkästlein“ vor allem dokumentieren und damit eine Primärreflexion initiieren, setzt man sich in einem Arbeitsjournal alleine oder mit anderen Personen werkstattartig mit dem auseinander, was zusammengetragen oder produziert wurde; es findet also eine Analyse und Interpretation statt (vgl. Bräuer 2016: 31–33). Das Portfolio, von Bräuer (2016: 34) im Unterschied zum Tagebuch auch als „Schaufenster“ bezeichnet, kann gewissermaßen als Krönung reflexiver Praxis angesehen werden. Portfolios entstehen i. d. R. über einen längeren Zeitraum bzw. markieren den (vorläufigen) Endpunkt eines Lernprozesses (vgl. auch Häcker 2011: 35). Sie sind weit mehr als bloße „Dokumentensammlungen“, zum einen, weil die Dokumente hierfür absichtsvoll und zielgerichtet ausgewählt und gesammelt werden, zum anderen und vor allem deshalb, weil Portfolios die (Selbst-)Evaluation der Prozesse und Produkte als integralen Bestandteil reflexiver Praxis einschließen (vgl. Ballweg 2015: 27;

Anmerkung: Für kritische Lektüre und hilfreiche Anregungen danke ich Enisa Pliska und den beiden HerausgeberInnen. https://doi.org/10.1515/9783110418712-025

612

Julia Ricart Brede

Häcker 2011: 36). Aufgrund der (Selbst-)Evaluation weisen Portfolios eine Nähe zur Diagnostik auf; in Lehr-Lern-Kontexten können Portfolios daher auch als diagnostisches Tool genutzt werden.

1.1 Der Portfolio-Begriff: eine Annäherung Bei dem Begriff „Portfolio“ handelt es sich um einen sog. ‚Containerbegriff‘. Als eine Art Modebegriff gerade en vogue, findet er in zahlreichen Anwendungsgebieten und -kontexten Verwendung und wird dabei jeweils mit unterschiedlichen Konnotationen besetzt (vgl. dazu auch Häcker 2011: 33–35), was zwangsläufig zu einer gewissen Unschärfe führt. Allein die Google-Eingabe des Schlagwortes „Portfolio“ ergibt 215.000.000 Treffer (Suchanfrage am 01. 05. 2018); der Duden (vgl. Dudenredaktion 2005) führt fünf verschiedene Bedeutungen für „Portfolio“ an: In der Wirtschaft bspw. wird die Zusammenstellung einer Produktpalette zu Werbezwecken Portfolio genannt; im Kunstgewerbe versteht man unter einem Portfolio eine Mappe, in der Zeichnungen, Grafiken, Malereien und/oder Fotografien eines Künstlers bzw. einer Künstlerin gesammelt werden (vgl. auch Dudenredaktion 2005). Auch in Lehr-Lern-Kontexten wird der aus dem Lateinischen (von lateinisch „portare“ = tragen/bringen und „folium“ = das Blatt) ableitbare bzw. etymologisch aus dem romanischen Sprachraum stammende Begriff seit den 1990er Jahren gebraucht. Hier bezeichnet „Portfolio“ häufig eine „Dokumentenmappe, die sich evtl. erst nach und nach füllt“ (Oomen-Welke 2007: 115) und in der SchülerInnen resp. LernerInnen eigene Produkte (insbes. Textproduktionen) sammeln, um Ergebnisse des Unterrichts und/oder Ergebnisse ihres Lernprozesses zu dokumentieren und zu präsentieren (für eine tiefergehende Auseinandersetzung mit dem Portfoliobegriff in Lehr-Lern-Kontexten vgl. auch die verdienstvolle Gegenüberstellung verschiedener Definitionen in Ballweg 2015: 26–27). Doch ist ein Portfolio in Lehr-Lern-Kontexten, wie bereits angedeutet, weit mehr als eine bloße Dokumentensammlung: Um als gelungene Form reflexiver Praxis gelten zu können, sind die Lernenden an der Festlegung der Auswahlkriterien für die Inhalte (bzw. Produkte) sowie an der Auswahl selbst zumindest zu beteiligen; ferner umfasst ein Portfolio grundsätzlich auch die (Selbst-)Reflexion der LernerInnen und damit Aspekte der Sekundärreflexion (vgl. auch die oben bereits genannten Stufen bzw. Ebenen reflexiver Praxis). Entsprechend schlägt die Northwest Evaluation Association als Ergebnis einer Diskussion auf der „Aggregating Portfolio Data“-Konferenz in Washington bereits 1990 nachstehende Begriffsdefinition vor, um zentrale Kerngedanken des Konzeptes für LehrLern-Kontexte herauszustellen, ohne dabei „jedoch eine Stärke des Konzeptes, seine Offenheit, unnötig einzuschränken“ (Häcker 2011: 34): A portfolio is a purposeful collection of student work that exhibits the student’s efforts, progress, and achievements in one or more areas. The collection must include student participation in selecting contents, the criteria for selection, the criteria for judging merit, and evidence of student self-reflection. (Paulson, Paulson & Meyer 1991: 60)

Sprachenportfolios

613

Anders als herkömmliche Diagnoseverfahren beziehen Portfolios die Lernenden demnach aktiv in den Reflexions- und Evaluationsprozess mit ein. Insofern fördern Portfolios auch die Selbsteinschätzungskompetenz und die Autonomie der Lernenden. Lehrkräfte müssen LernerInnen an diese Form der Selbstständigkeit und Kompetenz zur Selbstreflexion über gezielte Aufgaben und Hilfestellungen allerdings erst sukzessive heranführen (vgl. Ballweg 2011: 39).

1.2 Portfolio-Arten: ein Überblick Je nachdem, ob in einem Portfolio ein (Lern-)Prozess sichtbar gemacht oder ein (Lern-)Produkt ausgestellt wird, unterscheidet man zwischen einem Prozess- oder einem Produkt-Portfolio (vgl. auch Bräuer 2016: 34–35). Grundsätzlich können mit Prozess-Portfolios alle denkbaren Arten von Prozessen in den Blick genommen werden. In Lehr-Lern-Kontexten häufig umgesetzt werden bspw. Prozess-Portfolios, die Lehrerfahrungen von (angehenden) Lehrkräften in Praktika abbilden und reflektieren (vgl. hierzu auch Bräuer 2016). Bekannt sind aus Lehr-Lern- bzw. Unterrichtskontexten ferner Prozess-Portfolios, die zum Ziel haben, einen Schreibprozess zu dokumentieren und zu reflektieren. Derartige Schreibprozess-Portfolios können neben Mindmaps und Notizen zur Textplanung auch Gliederungsentwürfe, einzelne Textbausteine, Korrekturhinweise, aber auch misslungene Textanfänge oder später verworfene Textpassagen enthalten (vgl. hierzu auch Becker-Mrotzek & Böttcher 2012: 140). Ebenso vielfältig wie das Prozess-Portfolio ist das Produkt-Portfolio. So kann mit einem Portfolio im Prinzip jegliche Art von Produkt gesammelt und zum Reflexionsgegenstand gemacht werden. Häufig sind Produkt-Portfolios in Lehr-LernKontexten auf einzelne Textsorten (wie Bildergeschichten, Elfchen, Reportagen u. a.) fokussiert, zu denen sie dann jeweils verschiedene Realisationen enthalten. Bezüglich der Form ist im Weiteren zu unterscheiden, ob es sich um ein herkömmliches Portfolio (auch: „paper-pencil-Portfolio“) oder um ein digitales Portfolio (auch: „e-Portfolio“) handelt. Denkbar sind zudem Mischformen, d. h. Portfolios, die sowohl aus handschriftlichen Dokumenten als auch aus digitalen Dateien (wie einem selbst geführten Interview oder einem selbst gedrehten Kurzfilm als Beigabe auf einer CD-ROM) bestehen. Durch entsprechende Softwarelösungen (wie „Mahara“) ist in Lehr-Lern-Kontexten jüngst eine starke Zunahme mit Blick auf die Erstellung und Nutzung von e-Portfolios zu verzeichnen. Auch inhaltlich können mit einem Portfolio unterschiedliche Aspekte aufs Tapet gebracht werden: Produkt-Portfolios zu einzelnen Textsorten (s. o.) sind ebenso möglich wie Portfolios, die einzelne Fertigkeiten (häufig das Schreiben; denkbar sind aber auch das Lesen, das Hörverstehen sowie das Sprechen) in den Blick nehmen (für eine weitere Differenzierung verschiedener Portfolioarten vgl. auch Häcker 2011: 34 sowie insbes. die Abb. in Häcker 2011: 38).

614

Julia Ricart Brede

2 Sprachenportfolios und die Geschichte des ESP Bei Sprachenportfolios liegt der inhaltliche Fokus auf „Sprache“. Es geht darum, Sprachkompetenzen und Sprach(lern)biografien, aber auch Einstellungen zu Sprache(n) abzubilden und zu reflektieren. Teilweise nehmen Sprachenportfolios auch einzelne Fertigkeiten oder sprachliche Teilkompetenzen in den Blick (vgl. bspw. die Anregungen zur Erstellung von Audioportfolios von Adamczak-Krysztofowicz & Stork 2011). Bekannt geworden sind Sprachenportfolios v. a. durch das sog. „Europäische Sprachenportfolio“ (kurz: ESP, englisch: „European Language Portfolio“, kurz: ELP). Seitdem sind sie in Lehr-Lern-Kontexten und hier v. a. im Zweit- und Fremdsprachenunterricht populär und frequent. In einem Bericht aus dem Jahre 2007 wird geschätzt, dass weltweit 584.000 LernerInnen ein ESP führen (vgl. Little, Goullier & Hughes 2011: 5). Die Geschichte des ESP hängt eng mit der Entwicklung des „Gemeinsamen Europäischen Referenzrahmen für Sprachen“ (kurz: GER, englisch: „Common European Framework of Reference for Languages“, kurz: CEFR) zusammen; beide wurden erstmals 1991 auf dem Rüschlikon-Symposium präsentiert (vgl. Little, Goullier & Hughes 2011: 5, 7–8). Nach der Durchführung von ESP-Pilotprojekten in zahlreichen Mitgliedstaaten des Europarates wurde im Jahr 2000 das „ELP Validation Committee“ eingerichtet; bis Dezember 2010 wurden durch dieses Komitee 118 verschiedene ESP-Versionen akkreditiert (vgl. Little, Goullier & Hughes 2011: 5, 10). Mittlerweile wurde die ESP-Akkreditierung eingestellt: In view of the large number and wide range of validated and registered models now available, the Council of Europe stopped registering ELPs at the end of 2014. The website will continue to provide all the necessary resources for compiling ELP models, which in future will be the sole responsibility of developers. These resources include descriptors of language proficiency at all CEFR levels and for different age groups, templates of various kinds, and step-by-step guidelines. (Council of Europe o. A.)

2.1 Das Konzept des ESP Die Vorgaben des Europarates sehen für ein ESP drei obligatorische Komponenten vor (vgl. hierzu auch Little, Goullier & Hughes 2011: 7 sowie Langner 2011): erstens einen Sprachenpass, zweitens eine Sprachlernbiografie und drittens ein Dossier. Der Sprachenpass gibt einen formalen Überblick über vorhandene Sprachkompetenzen und abgelegte Prüfungen, indem einerseits Sprachprüfungen und Zertifikate notiert und andererseits die gegenwärtigen Kompetenzen in allen erworbenen und erlernten Sprachen differenziert nach den Grundfertigkeiten anhand der GER-Stufen vom Lerner bzw. von der Lernerin selbst eingeschätzt werden. Das Dossier ist eine Sammlung von Beispielmaterialien (eigene Textproduktionen, gelesene Texte etc.), die belegen, welche Leistungen der Lerner bzw. die Lernerin in einer bestimmten

Sprachenportfolios

615

Sprache zu einem gewissen Zeitpunkt vollbracht hat. Da die einzelnen Beiträge datiert werden, erfüllt das Dossier „a process and a display function, being used to store work in progress but also to present a selection of work that in the owner’s judgement best represents his/her [… language] proficiency.“ (Little, Goullier & Hughes 2011: 7) Der dritte Bestandteil eines ESP, die Sprachlernbiografie, zeichnet die persönlichen Erfahrungen des Lerners bzw. der Lernerin mit dem Sprachenlernen nach; sie fungiert darüber hinaus als Monitorinstanz, da individuelle Sprachlernziele gesetzt und reflektiert werden (vgl. Little, Goullier & Hughes 2011: 7). Die Ergebnisse einer schriftlichen Befragung machen allerdings deutlich, dass die drei Bestandteile, die ein ESP vorsieht, in Lehr-Lern-Kontexten keinesfalls in gleichem Maße genutzt werden: Befragte Lehrpersonen hatten, wenn überhaupt, vor allem den Sprachenpass in Unterrichtskontexten genutzt (vgl. Schneider 2008: 5). Diese ungleichgewichtige Nutzung der drei Bestandteile des ESP kann in konkreten Lehr-Lern-Situationen durchaus sinnvoll sein. Geht es bspw. zunächst vor allem darum, eine neue Lerngruppe näher kennenzulernen, ist insbesondere der Sprachenpass für die Lehrkraft hilfreich. Soll das ESP jedoch als Mittel reflexiver Praxis genutzt werden, so ist es unabdingbar, alle drei Komponenten vollumfänglich zu berücksichtigen. Die drei ESP-Komponenten beziehen sich nämlich jeweils auf unterschiedliche Ebenen reflexiver Praxis. Bspw. bedient das Dossier mit seiner Dokumentationsfunktion die erste Ebene reflexiver Praxis (dokumentieren, beschreiben und sichtbar machen), während die Sprachlernbiografie die vierte Ebene reflexiver Praxis anstößt (Ziele, Strategien und Schritte für zukünftiges Handeln ableiten). Werden also nicht alle drei ESP-Komponenten genutzt bzw. umgesetzt, bleibt der Reflexionsprozess zwangsläufig unvollständig.

2.2 Vorstellung verschiedener ESPs und Sprachenportfolios Europäische Sprachenportfolios wurden für zahlreiche Sprachen, für alle Schulstufen und für sämtliche Altersgruppen entwickelt (vgl. Little, Goullier & Hughes 2011: 5). Das „Europäische Sprachenportfolio, Version für Jugendliche und Erwachsene“ (kurz: ESP III) war das erste in der Schweiz sowie in ganz Europa durch den Europarat akkreditierte ESP. Es liegt in den Sprachen Deutsch, Französisch, Englisch, Italienisch und Rätoromanisch vor und ist sowohl in einer Printfassung als auch in elektronischer Form (als e-Portfolio) erhältlich (vgl. dazu auch Hodel & Margonis-Pasinetti 2012). Über dasselbe Verlagshaus sind mittlerweile auch das ESP II (Version für Kinder und Jugendliche von 11 bis 15 Jahren), das ESP I (Version für 7bis 11-jährige Kinder) sowie das „Portfolino“ (Version für 4- bis 7-jährige Kinder) erhältlich, wobei für alle drei Versionen auch Lehrerhandreichungen vorliegen (vgl. www.sprachenportfolio.ch). Mit dem „European Language Portfolio for Deaf and Hard of Hearing People“ (kurz: Deaf Port, http://www.deafport.eu/EN/) und dem „European Language Portfolio for Blind and Visually Impaired“ (kurz: ELBPVI, http://www.icc-languages.eu/

616

Julia Ricart Brede

projects/completed-projects/137-elpbvi) liegen zwei ESPs vor, denen hinsichtlich der zu erfassenden Fertigkeiten Sonderformen des GER zugrunde liegen. Für einen inklusiven Unterricht bzw. mit Blick auf die UN-Behindertenrechtskonvention (und hier im Besonderen unter Berücksichtigung von Art. 24, „Bildung“) und das damit einhergehende Ziel der Herstellung von Chancengleichheit sind diese Sonderformen von zentraler Bedeutung. Bei dem „Sprachenportfolio: Meine, deine, unsere Sprachen“ von Anja Wildemann und Sarah Fornol (2013 a) handelt es sich um ein nicht-akkreditiertes Sprachenportfolio für die Grundschule bzw. für SchülerInnen der zweiten bis fünften Jahrgangsstufe. Der aus 33 Arbeitsblättern bestehende Ordner ist dem „languageawareness“-Ansatz verpflichtet und zielt entsprechend darauf ab, „die Sprachaufmerksamkeit […], das Sprachenselbstbewusstsein und die Sprachneugier zu erhöhen und interkulturelle Kompetenz aufzubauen“ (Wildemann & Fornol 2013 b: 6). Die in fünf Themenfeldern angeordneten Arbeitsblätter sind dahingehend mit Symbolen gekennzeichnet, ob sie eher alleine oder mit Hilfe (z. B. im Klassenverband oder durch Recherche in Büchern bzw. im Internet) bearbeitet werden können bzw. ob es sich dabei um Forscheraufgaben handelt, die komplexere kognitive Fähigkeiten erfordern (vgl. Wildemann & Fornol 2013 b: 8). Zwar enthalten einige Arbeitsblätter Fragen, die sich auf die eigene Sprachenbiografie beziehen (vgl. insbes. den Themenbereich „Meine Sprachen“, Wildemann & Fornol 2013 a: 11–19) oder die eine Reflexion bzw. eine Zielsetzung mit Blick auf weiteres Sprachlernen anbahnen (vgl. z. B. Wildemann & Fornol 2013 a: 34), doch finden sich in dem Portfolio insgesamt nicht alle drei Bestandteile eines ESP wieder. U. a. da das Dossier als Sammlung fehlt und dadurch bedingt von den LernerInnen keine eigenverantwortliche Auswahl von Inhalten für das Portfolio erfolgt, handelt es sich bei dem Material von Wildemann & Fornol (2013 a) nach einem engen Begriffsverständnis nicht um ein Portfolio. Dennoch ist das Material für die Anbahnung von Sprachbewusstheit und für ein Reflektieren über Sprache zielführend und somit ein erster wichtiger Schritt auf dem Weg zu einer reflexiven Unterrichtspraxis.

3 Das Portfolio als Bewertungs- und Diagnoseinstrument im Unterricht Die Arbeit mit Portfolios führt zwangsläufig zu einem Unterricht, der SchülerInnen in ihrer Selbstständigkeit und Eigenverantwortlichkeit für das eigene Lernen ernst nimmt (vgl. Wiater 2006: 155). Grund hierfür ist, dass Portfolios als Methode reflexiver Praxis per definitionem erstens die Beteiligung der LernerInnen an der Festlegung der Auswahlkriterien für die Portfolio-Inhalte und an der Auswahl der Inhalte selbst sowie zweitens eine (Selbst-)Reflexion durch die LernerInnen einfordern. Der Einsatz von Portfolios setzt damit eine dialogische Unterrichtspraxis voraus;

Sprachenportfolios

617

er „ist Ausdruck eines auf Schülerbeteiligung zielenden Unterrichtsverständnisses“ (Häcker 2011: 37) und befördert autonomes Lernen. Für die Lehrperson geht dies mit einer Rollenveränderung einher: Sie wird zum Lernbegleiter und Lernberater, indem sie die Lernenden durch gezielte Aufgabenstellungen an die einzelnen Ebenen reflexiver Praxis heranführt. Das große Interesse, das dem Portfolio […] entgegengebracht […] wird, ist vor allem geknüpft an die Multifunktionalität, die ihm zugeschrieben wird. Das Portfolio kann gleichzeitig als LehrLern-Instrument und als (Selbst-)Beurteilungsinstrument eingesetzt werden, d. h. es scheint dazu geeignet zu sein, das Lehren und Lernen mit dem (Selbst-)Beurteilen zu verbinden. (Häcker 2005: 4)

Jeweils vorab gilt es zu klären, ob diese Doppel- oder auch Brückenfunktion im Einzelfall genutzt werden soll, d. h. ob ein Portfolio auch der Bewertung und Benotung dienen soll oder ob es ausschließlich zu Reflexions- und Diagnosezwecken erstellt wird. Falls ersteres der Fall sein soll, so ist nach einer angemessenen Beurteilungspraxis zu fragen. In sehr verdichteter Form präsentiert Bräuer (2016: 30) eine erste Grundlage für die Bewertung von Portfolios, indem er für jede der vier Ebenen reflexiver Praxis drei Qualitätsstufen formuliert. Dabei gilt es zu beachten, dass jeweils nur die Umsetzung jener Ebenen bewertet werden sollte, die im Unterricht (über Aufgabenstellungen) auch eingefordert wurden. Darüber hinaus ist eine angemessene Beurteilungspraxis von der Art des jeweiligen Portfolios abhängig. Weiterführend sind in diesem Zusammenhang die verschiedenen Formen prozessorientierten Beurteilens. Beispielsweise eignen sich Produkt-Portfolios für ein sog. „summatives Beurteilen“ (Baurmann & Dehn 2004: 8). Hierbei werden verschiedene Realisationen eines bestimmten Produktes (wie z. B. verschiedene Haikus) einzeln benotet und zu einer Gesamtnote verrechnet. Für Prozess-Portfolios bietet sich stattdessen ein „entwicklungsorientiertes Beurteilen“ (Baurmann & Dehn 2004: 8) an, bei dem neben dem Endprodukt auch Entwicklungsfortschritte bewertet werden. In die Bewertung kann demnach auch mit einfließen, inwiefern die gegebenen Überarbeitungs- und Verbesserungshinweise in den verschiedenen Phasen der Textproduktion umgesetzt wurden. Beim „expliziten Beurteilen von Lernprozessen“ (Baurmann & Dehn 2004: 8) wird ausschließlich der Prozess an sich fokussiert; das Endprodukt fließt nicht in die Bewertung ein. Ein konkretes Beispiel für die Arbeit mit Portfolios zur Benotung von Schreibprozessen findet sich in Becker-Mrotzek & Böttcher (2012: 142–144). Positiv hervorgehoben wird, dass Portfolios zu einer stärker ressourcenorientierten Sichtweise auf die präsentierten Produkte und Leistungen der LernerInnen verhelfen (vgl. Häcker 2005: 5). Dies unterscheidet Portfolios von klassischen Formen der Leistungsfeststellung und -beurteilung (und damit auch der Diagnose), die ihr Augenmerk v. a. auf das richten, was nicht angemessen bewältigt werden konnte bzw. was falsch ist.

618

Julia Ricart Brede

Wird das Portfolio als diagnostisches Tool betrachtet, ist ferner hervorzuheben, dass Spracherwerbsprozesse und Kompetenzen mittels Portfolios i. d. R. über einen längeren Zeitraum hinweg in den Blick genommen werden. Auch dadurch unterscheiden sich Portfolios grundlegend von herkömmlichen Diagnoseverfahren, die Leistungen i. d. R. nur punktuell zu einem bestimmten Zeitpunkt (bzw. häufig maximal zu zwei verschiedenen Zeitpunkten) erfassen. Von Erfahrungen über die Arbeit mit Sprachenportfolios nicht nur zu Diagnoseund Bewertungszwecken im DaZ-Unterricht berichtet Oomen-Welke (2007); weitere Erfahrungsberichte aus der Unterrichtspraxis (verschiedener Fächer) finden sich bspw. im zweiten Teil des Handbuchs zur Portfolioarbeit von Brunner, Häcker und Winter (2011).

4 Das Portfolio als Diagnoseinstrument auf dem Prüfstand Aufgrund ihrer Flexibilität sind Portfolios zu diagnostischen Zwecken sehr vielfältig einsetzbar. So können Portfolios dank ihrer inhaltlichen Offenheit grundsätzlich für sämtliche Sprachbereiche und Fertigkeiten als diagnostisches Tool dienen. Damit unterscheiden sich Portfolios von Screenings oder Tests, die im Sinne der Teilkompetenzdiagnostik i. d. R. von vornherein auf eine bestimmte Fertigkeit oder Teilkompetenz festgelegt sind (vgl. Abschnitt III in diesem Band) und die häufig nur für eine bestimmte Altersgruppe geeignet oder sogar normiert sind. Gleichzeitig stellt die Offenheit der Methode insofern auch eine Herausforderung dar, als LehrerInnen bzw. LernerInnen entsprechend selbst festlegen müssen, wie das Portfolio angelegt und aufgebaut sein soll, welche Themen fokussiert werden sollen und nach welchen Kriterien ggf. eine Diagnose erfolgen soll (vgl. auch Ballweg 2011: 40). Dies erfordert auf Seiten der Lehrkräfte neben hohen (diagnostischen) Kompetenzen auch die ausgeprägte Bereitschaft zur intensiven Vorbereitung. Zudem lassen sich die diagnostischen Erkenntnisse, die eine Lehrkraft aus einem Portfolio ziehen kann, anders als bei Screening- oder Testverfahren nicht auf einen einfachen Kennwert reduzieren. Die offene Anlage bzw. die Individualität von Portfolios erschwert damit auch ihre Vergleichbarkeit – bspw. um im Unterricht die Leistungen einzelner LernerInnen miteinander vergleichen zu können. Aber auch an die Lernenden stellt der Einsatz von Portfolios hohe Anforderungen. Deutliche Grenzen hat der Einsatz von Portfolios bei jungen LernerInnen, für die insbesondere die Prozesse der Sekundärreflexion eine sehr hohe Herausforderung darstellen. Auf der Basis von Portfolioanalysen und Interviewdaten geht Bräuer (2009: 157–158) selbst bei 16- bis 18-jährigen noch von größeren Schwierigkeiten mit diesen kognitiv anspruchsvollen Ebenen reflexiver Praxis aus: „[…] ohne differenzierte Aufgabenstellung [wird von jungen LernerInnen] hauptsächlich dokumen-

Sprachenportfolios

619

tiert […], selten jedoch kritisch-konkret evaluiert […]. Noch seltener sind Überlegungen darüber, wie das eigene Handeln systematisch verändert bzw. optimiert werden könnte“ (Bräuer 2016: 28). Probleme können sich für LernerInnen außerdem dann ergeben, wenn Portfolios im Sprachlernkontext genutzt werden und die ohnehin anspruchsvolle Aufgabe der Reflexion damit in einer Fremd- oder Zweitsprache abverlangt wird. Bevor Portfolios zu diagnostischen Zwecken genutzt werden können, müssen Lernende (und zwar nicht nur junge LernerInnen oder solche, für die die Arbeitssprache eine Zweit- oder Fremdsprache darstellt) demnach an die verschiedenen Ebenen reflexiver Praxis herangeführt werden. Doch selbst bei LernerInnen, die mit den verschiedenen Ebenen reflexiver Praxis vertraut sind, gilt es zu berücksichtigen, dass Portfolios aufgrund der starken Involviertheit der Lernenden als Diagnoseinstrument messtheoretisch problematisch sind und dass die Güte eines Portfolios immer auch von der Reflexions- und Urteilsfähigkeit des/der jeweiligen Lernenden abhängt. An den klassischen Gütekriterien können sich Portfolios, die zu Diagnosezwecken eingesetzt werden, demnach nicht messen lassen, doch beziehen sie die LernerInnen wie kein anderes Diagnoseinstrument in den diagnostischen Prozess mit ein und befördern damit stets die Selbstreflexionskompetenz der Lernenden.

Literatur Adamczak-Krysztofowicz, Sylwia & Antje Stork (2011): Hör- und Sprechtraining mit Audioportfolios – ja, aber wie? Fremdsprache Deutsch 45, 17–20. Ballweg, Sandra (2011): Portfolioarbeit im Praxistest. Fremdsprache Deutsch 45, 36–40. Ballweg, Sandra (2015): Portfolioarbeit im Fremdsprachenunterricht. Eine empirische Studie zu Schreibportfolios im DaF-Unterricht. Tübingen: Narr Francke Attempto. Baurmann, Jürgen & Mechthild Dehn (2004): Beurteilen im Deutschunterricht. Praxis Deutsch 148, 6–13. Becker-Mrotzek, Michael & Ingrid Böttcher (2012): Schreibkompetenz entwickeln und beurteilen. 4. Aufl. Berlin: Cornelsen Scriptor. Bräuer, Gerd (2016): Das Portfolio als Reflexionsmedium für Lehrende und Studierende. Reihe: Kompetent lehren, Band 6. 2. Aufl. Opladen & Toronto: Barbara Budrich (bei UTB). Bräuer, Gerd (2009): Reflecting the practice of foreign language learning in portfolios. German as a Foreign Language, 2–3, 148–166. Brunner, Ilse, Thomas Häcker & Felix Winter (Hrsg.) (2011): Das Handbuch Portfolioarbeit. Konzepte, Anregungen, Erfahrungen aus Schule und Lehrerbildung. 4. Aufl. Seelze: Klett, Kallmeyer. Council of Europe (o. A.): History of the ELP project. http://www.coe.int/en/web/portfolio/history (01. 05. 2018). Dudenredaktion (Hrsg.) (2005): Das Fremdwörterbuch. Reihe: Duden, Band 5. 8. Aufl. Mannheim u. a. Dudenverlag: Mannheim u. a. Häcker, Thomas (2011): Vielfalt der Portfoliobegriffe. Annäherungen an ein schwer fassbares Konstrukt. In Ilse Brunner, Thomas Häcker & Felix Winter (Hrsg.), Das Handbuch

620

Julia Ricart Brede

Portfolioarbeit. Konzepte, Anregungen, Erfahrungen aus Schule und Lehrerbildung, 33–39 4. Aufl. Seelze: Klett, Kallmeyer. Häcker, Thomas (2005): Portfolio als Instrument der Kompetenzdarstellung und reflexiven Lernprozesssteuerung. http://www.bwpat.de/ausgabe8/haecker_bwpat8.pdf (01. 05. 2018). Hodel, Hans-Peter & Rosanna Margonis-Pasinetti (2012): ESP III. Europäisches Sprachenportfolio Schweiz. Anleitung für Benutzerinnen und Benutzer. Die wichtigsten Informationen auf einen Blick. Elsau: Schulverlag plus. Langner, Michael (2011): Das Europäische Sprachenportfolio. Fremdsprache Deutsch 45, 12. Little, David, Francis Goullier & Gareth Hughes (2011): The European Language Portfolio: The Story So Far (1991–2011). https://rm.coe.int/CoERMPublicCommonSearchServices/ DisplayDCTMContent?documentId=09000016804595a7 (01. 05. 2018). Oomen-Welke, Ingelore (2007): „Meine Sprachen und ich“. Inspiration aus der Portfolio-Arbeit für DaZ in Vorbereitungsklasse und Kindergarten. In Bernt Ahrenholz (Hrsg.), Kinder mit Migrationshintergrund, 115–131. 2. Aufl. Freiburg i. Br.: Fillibach. Paulson, F. Leon, Pearl R. Paulson & Carol A. Meyer (1991): What Makes a Portfolio a Portfolio? Eight thoughtful guidelines will help educators encourage self-directed learning. Educational Leadership, 48/5, 60–63. http://www.ascd.org/ASCD/pdf/journals/ed_lead/el_199102_ paulson.pdf (01. 05. 2018). Schneider, Christel (2008): The Use of the European Language Portfolio in Language Teaching Results of a Survey. http://elp.ecml.at/LinkClick.aspx?fileticket=g3ODWqJ0SEQ%3d&tabid= 2592&language=en-GB (01. 05. 2018). Wiater, Werner (2006): Schluss: Das Europäische Sprachenportfolio. In Werner Wiater (Hrsg.), Didaktik der Mehrsprachigkeit, 155–157. München: Ernst Vogel. Wildemann, Anja & Sarah Fornol (2013 a): Sprachenportfolio: Meine, deine, unsere Sprachen. Rohr Verlag: Hamburg. Wildemann, Anja & Sarah Fornol (2013 b): Sprachenportfolio: Meine, deine, unsere Sprachen. Lehrerheft. Rohr Verlag: Hamburg.

Sprachdiagnostische Verfahren 2P (Potentiale und Perspektiven) 165, 190, 191

AAST (Adaptiver Auditiver Sprachtest) 83 AAT (Aachener Aphasie Test) 319 ADST (Allgemeiner Deutscher Sprachtest) 288 AFRA (Aachener Förderdiagnostische Rechtschreibfehler-Analyse) 290, 291 AST (Allgemeiner Sprachentwicklungstest) 153 AWST-R (Aktiver Wortschatztest – Revision) 308

BAKO 1–4 (Basiskompetenzen für LeseRechtschreibleistungen) 288 Bärenstark 550, 553, 555, 556, 561 Baukasten Lesediagnose 205, 206, 452, 459, 462, 465 Bayern-Hessen-Screening 401, 403 Bergedorfer Screening zur Sprach- und Lesekompetenz 458, 459 BESK-DaZ 2.0 (Beobachtungsbogen zur Erfassung der Sprachkompetenz in Deutsch von Kindern mit Deutsch als Zweitsprache) 344, 347, 401, 402, 572, 573, 577, 578 BULATS (Business Language Testing Service) 214–217

CALS-I (Core Academic Language SkillsInstrument) 498 CDI (Communicative Development Inventories) 306, 318 CFT 20 (Grundintelligenztest) 537 Cito-Test 154, 340 Cornelsen C-Test Deutsch als Zweitsprache für 5. Klassen 598 CPM (Raven’s Coloured Progressive Matrices) 82 CT-D 4 (Schulleistungstest Deutsch für 4. Klassen) 288, 404, 586 C-Test 132, 133, 585–604

Delfin 4 (Diagnostik, Elternarbeit, Förderung der Sprachkompetenz in NordrheinWestfalen bei 4-Jährigen) 153, 154, 374– 376, 378 https://doi.org/10.1515/9783110418712-026

der-die-das Sprachstandsbeobachtung 177–179 DESK 3–6 (Dortmunder Entwicklungsscreening für den Kindergarten) 154 Deutsch für den Schulstart 174 Deutsch Plus 4 154, 167 DIALANG 490 DO-BINE (Dortmunder Beobachtungsinstrument zur Interaktion und Narrationsentwicklung) 431–433, 435 DO-RESI (Dortmunder Ratingskala zur Erfassung sprachrelevanter Interaktionen) 149 DRT (Diagnostischer Rechtschreibtest) 1–5 282, 287, 290 DSH (Deutsche Sprachprüfung für den Hochschulzugang) 236, 237 DTZ (Deutsch-Test für Zuwanderer) 236, 314, 315 EFE (Evozierendes Feldexperiment) 315 ELFE (Ein Leseverständnistest für Erst- bis Sechstklässler) 454, 460, 461, 464 ELFRA (Elternfragebögen für die Früherkennung von Risikokindern) 306 ELP (European Language Portfolio) 614 ESGRAF-MK (Evozierte Diagnostik grammatischer Fähigkeiten für mehrsprachige Kinder) 184, 340, 344 ESP (Europäisches Sprachenportfolio) 614–616 Europäisches Sprachenportfolio für den Elementarbereich 148 Fast Catch Bumerang 200, 201 Fit in Deutsch 154 FLVT (Frankfurter Leseverständnistest für 5. und 6. Klassen) 455, 461, 464 GInA (Gestaltung von Interaktionsgelegenheiten im Alltag) 149 Grundstufe Deutsch 1 234 gutschrift – Diagnostik der Schriftkompetenz 216 HAMLET (Hamburger Lesetest) 455, 460 HASE (Heidelberger Auditives Screening in der Einschulungsuntersuchung) 82, 88, 154, 260

622

Sprachdiagnostische Verfahren

HAVAS 5 (Hamburger Verfahren zur Analyse des Sprachstands Fünfjähriger) 62, 151, 152, 308 HSP (Hamburger Schreib-Probe) 5–10 281, 282, 286, 288, 289, 291 INGA 3–4 (Instrument zur Erfassung grammatischer Fähigkeiten in der 3. und 4. Jahrgangsstufe) 542 KEKS (Kompetenzerfassung in Kindergarten und Schule, Schulleistungstest Deutsch für Klassen 1–4) 288 Kenntnisse in DaZ erfassen 154 KFT 4–12 (Kognitiver Fähigkeitstests für 4. bis 12. Klassen) 537 KiSS (Kindersprachscreening) Version 2.0 154 KISTE (Kindersprachtest für das Vorschulalter) 154 KNUSPEL-L (Leseaufgaben) 453, 464 LARSP (Language Assessment, Redemiation and Screening Procedure) 552 Leben in Deutschland 236 LEMO (Lexikon modellorientiert) 319 LESEN (Lesebatterie) 6–7, 8–9 455, 456 Lex 30 313 LGVT (Lesegeschwindigkeits- und Verständnistest) 456, 461 LiSe-DaZ (Linguistische Sprachstandserhebung Deutsch als Zweitsprache) 27, 33, 34, 36– 40, 154, 155 LITMUS (Language Impairment Testing in Multilingual Settings) 82, 85, 86, 88 LTB-3 (Lesetest für Berufsschüler*innen) 207, 208, 217 MC-C-Test (Multiple-Choice C-Test) 592, 593 Mein Sprachlerntagebuch für Kindertagesstätten und die Kindertagespflege 150 MSS (Marburger Sprachscreening) 370, 372 MSVK (Marburger Sprachverständnistest für Kinder) 536 Niveaubeschreibungen Deutsch als Zweitsprache 64, 182, 185, 202 OLFA (Oldenburger Fehleranalyse) 290–292 onDaF (Oline-Einstufungstest Deutsch als Fremdsprache) 236

onSET 593 ÖSD (Österreichisches Sprachdiplom Deutsch) 234 PaBiQ (Questionnaire for Parents of Bilingual Children) 79, 82 PLAV (Ein Projektives Linguistisches Analyseverfahren) 401, 403, 549–551, 553, 554, 556 PPVT (Peabody Picture Vocabulary Test) 307, 317, 318, 537 Praxismaterial Förderdiagnostik 371, 372, 374, 377, 378, 486 ProDi-L (Prozessbezogene Diagnostik von Lesefähigkeiten in der Grundschule) 463 RaBi (Ratingskala zur Erfassung bildungssprachlicher Fähigkeiten in Kindertagesstätten) 508–510 RST (Rechtschreibtest) 287, 288 SBL I (Schultestbatterie zur Erfassung des Lernstandes in Mathematik, Lesen und Schreiben) 288 seldak (Sprachentwicklung und Literacy bei deutschsprachig aufwachsenden Kindern) 306 SET 5–10 (Sprachstandserhebungstest für Kinder im Alter zwischen 5 und 10 Jahren) 153 SETK 3–5 (Sprachentwicklungstest für drei bis fünfjährige Kinder) 154, 536 SFD (Sprachstandsüberprüfung und Förderdiagnostik) 401, 403, 537, 542 SISMIK (Sprachverhalten und Interesse an Sprache bei Migrantenkindern in Kindertageseinrichtungen) 150 SLRT-II (Salzburger Lese- und Rechtschreibtest) 453 SLS (Salzburger Lesescreening) 455, 460, 461, 464 SON-R (Snijders-Oomen non-verbaler Intelligenztest – Revidierte Fassung) 82 SOPESS (Sozialpädiatrisches Entwicklungsscreening in den Schuleingangsuntersuchungen) 154 SOPI (Simulated Oral Proficiency Interview) 256 SST (Spezieller Sprachleistungstest) 152

Sprachdiagnostische Verfahren

623

SSV (Sprachscreening für das Vorschulalter) 154, 401, 402 Start Deutsch 1 234, 235 STOLLE (Stolperwörter-Lesetest) 457, 458

VER-ES (Verfahren zur Einschätzung des Sprachförderbedarfs im Jahr vor der Einschulung) 154

telc Sprachprüfungen 214, 215, 217 TestDaF (Test Deutsch als Fremdsprache) 234, 236, 237 TexQu-A (Verfahren zur Erfassung von Textqualität) 473 Texteasy 5.0 212, 213, 217 TROG-D (Test zur Überprüfung des Grammatikverständnisses) 537 Tulpe L 483 Tulpenbeet 131, 308, 309

WLLP-R (Würzburger Leise-Lese-Probe) 453 WLST (Würzburger Lesestrategie-Wissenstest) 456, 461, 462 WRT (Weingartener Grundwortschatz Rechtschreib-Test) 1–6 288, 289 WRT 4/5 (Westermann Rechtschreibetest) 288 WST (Wortschatztest) 309 WÜRT 1–2 (Würzburger Rechtschreibtest) 288 WWT 6–10 (Wortschatz- und Wortfindungstest für 6- bis 10-Jährige) 173, 302, 308, 317, 318, 537

USB DaZ (Unterrichtsbegleitende Sprachstandsbeobachtung DaZ) 374, 572, 574, 577–581 VERA (Vergleichsarbeiten in der 3. und 8. Jahrgangsstufe) -3, -8 511

ZLT II (Züricher Lesetest) 454, 464 Züricher Textanalyseraster 472, 478, 486

Sachregister Abiturprüfung 234 Abschlussarbeiten, zentrale 234 Academic Language 498, 503 Achievementtest 398 adaptiv 83, 209, 210, 216, 217 Administration 592, 593, 604 Adressierung 484 age of onset 30 Akkusativ 329, 337, 338 Akzent 265 Allgemeinsprache 510 Alltagssprache 499, 500, 502 Alphabetisierung 280, 286, 489, 490 ALTE (Association of Language Testing) 230, 232, 234 Alternativantwort-Aufgaben 396 Altersfaktor 32, 33 Analyse 7, 8, 30, 42, 86, 102, 108, 123, 130, 151, 201, 258, 267, 303, 320, 336, 355, 423, 433, 472, 499, 507, 512, 528, 553 – auditive 258, 313 – psychometrische 598 Anamnese 123 Aneignungsstand 576, 578 Anonymisierung 232 Anschlussfrage 375, 378 Antwortformat – geschlossenes 231 – offenes 231, 232 Aphasie 307, 319 Aptitudetest 398 Arbeitsgedächtnis 330, 339 Argumentieren 355, 357–361, 368, 371, 374 Artikulation 246, 247, 249, 253, 257, 258, 260, 261, 263, 267, 270, 271 Assessment, formatives 222 Assimilation progressive/regressive 246, 247 Assoziationstest 313 Attrition 301, 303, 307 Audioaufnahme 302, 307 Audioprotokoll 308 Aufenthaltsgesetz 234, 235 Aufgabe 55, 123, 128, 201, 213, 308, 389–399, 401, 407 Aufgabenbewältigung 426, 428 Aufgabenenstellung 230, 237 Aufgabenentwicklung 231 Aufgabenformat 395 https://doi.org/10.1515/9783110418712-027

Aufgabenschwierigkeit 233 Aufgabenstellung 270, 361, 367, 395 Aufgabentyp 206, 214, 216 Außenkriterium 602 außerschulisch 417 Aussprache 21, 63, 72, 84, 132, 142, 202, 245–272, 415, 459, 480, 590 Aussprachelernberatung 263, 264, 267, 268 Ausspracheschulung 246, 247, 249, 250, 262– 265 Auswertung – sequenzanalytische 357, 370 Auswertungsobjektivität 232 Auswertungsökonomie 591 Authentizität 394, 395 Automatisierung 248, 280, 395, 443, 445, 447, 454 backsliding 22 Basiskompetenz 191, 288, 407 Basisqualifikationen 62, 63 Basiswortschatz 572 Bastelanleitung 483, 484 Baukasten 205, 206 BeFo (Bedeutung und Form) I und II 512, 513 belief 365 benchmarking 57 Benchmark-Text 489, 491 Beobachterfehler 107, 110 Beobachterschulung 575 Beobachtung 6, 7, 9, 13, 99, 101, 103, 104, 106–111, 118, 123, 125, 132, 133, 141, 147, 149–151, 155, 156, 570 – nicht-teilnehmende 570 – offene 570 – reduktiv-deskriptive 570–572, 577, 580 – reduktiv-einschätzende 570–573, 577, 578, 580 – technisch vermittelte 570 – teilnehmende 570, 578 – unvermittelte 570, 578 – verdeckte 570 Beobachtungsbogen 306 Beobachtungsinstrument 203 Beobachtungssystem, hochinferentes/ niedriginferentes 369 Beobachtungsverfahren 202

Sachregister

Berichten 358–360 Berufsausbildung 198, 200, 212 Berufsfachschule 202 Berufsfeld 198, 199, 210, 212, 213 Berufsorientiertes Deutsch 197 berufsqualifizierend 202 Berufsschule 202, 204, 207, 208 berufsspezifisch 202 Berufsvorbereitung 198, 212, 213 Beschreibung – isomorphe 570 – reduktive 570 Beurteilungsaufgabe 363–365, 367 Bewerbungsschreiben 483, 484 Bewusstheit, phonetisch-phonologische 260, 267, 279, 280 Bezugsnorm 5, 11, 99, 103, 130, 167, 232, 287, 527 bifie (Bundesinstitut für Bildungsforschung, Innovation und Entwicklung des österreichischen Schulwesens) 572 Bildbenennungstest 307, 308, 317, 318 Bildergeschichte 152 Bildimpuls 151, 154 Bildstimulus 314 Bildungsbericht 140, 141, 147, 149–154 Bildungsforschung 231, 238 Bildungsgang 199, 208 Bildungsmonitoring 61 Bildungspolitik 221, 223 Bildungssprache 77, 81, 166, 484, 497–506, 508–510, 512–515 Bildungsstandards 47, 48, 50–54, 57–64 Bilingualität 72, 75–79, 81, 83–88 BiSpra (Bildungssprachliche Kompetenzen) I und II 505, 511, 515 bottom up 388 Bruchstück 548, 560, 562 central tendency 477 Checkliste 268, 269 Chunk 36, 558, 559 Cloze Test 396 Cloze-elide-Verfahren 449 Coda 417 cognateness 601 Companion to the CEFR (Common European Framework of Reference for Languages) 252 critical age hypothesis 248

625

critical period 256 Cronbachs Alpha 510 C-Test – diskursspezifischer 596 – kanonischer 585, 588, 603 – klassischer 585, 588, 590, 604 Curriculum 479, 484 Cut-off-Wert 110 CV-Sprache 246 Datenanalyse 151 Datenaufbereitung 151, 258 Datenerhebung 6, 14, 102, 151, 326, 556 Dativ 329, 337, 338 déformation professionnelle 251 Deixis 356 Deklination 142, 328, 542, 553 Dekodiergenauigkeit 443 Dekodierung 388 Dekodierungsprozess 388 Derivation 329, 335 DESI (Deutsch Englisch Schülerleistungen International) 389, 600 Deskriptor 476, 490, 491 Detailverständnis 397, 398 Deutlichkeit 253 Diagnose – formative 4, 64 – integrierte 245, 252, 263 – pädagogische 6, 124 – psychologische 12, 120, 526 – summative 4 Diagnostische Leitfragen 181, 188 dichotomous item 449, 464 Didaktisierungsgrad 393 DIF (Differential-Item-Functioning-Analyse) 231 Differenzialdiagnose 87, 88, 198, 306 Differenzierungsprobe 260 Diktat 287, 289, 290, 294 Dimension, latente 602 Discourse Completion Task 364 Diskriminierung 286 Diskurs 315 Diskursebene 444 Diskurseinheit 418, 420 Diskurskompetenz 357–359, 415, 432, 433, 435 Diskurspraktiken 360 Diskurstyp 204 Disparität 312

626

Sachregister

Dokumentensammlung 611, 612 Dossier 148, 614–616 Dreierregel 591 Durchführungsdauer 171, 172, 174–180, 184, 186, 187 Dynamic Systems Theory 28 EASI Science-L (Early Steps Into Science and Literacy) 507 EEG (Elektroenzephalografie) 314 Ehegattennachzug 234, 235, 237 Eichstichprobe 289, 531 Einbürgerung 221 Einschätzung 342, 570–573, 577, 578, 580 Einschätzverfahren 571 Einschulungsdiagnostik 153 Einschulungsuntersuchung 147, 150, 153, 154 Einstufung 256 Einstufungstest 398 Einzeldarbietung 593 Elementarbereich 97, 98, 105, 106, 111, 139– 141, 144, 145, 147–152, 155, 156 Elicited Imitation Test 604 Elizitierung 101, 105, 110, 430, 433 Elternfragebogen 306 Engagiertheit 434 Entpersonalisierung 500 Entscheidungsfrage 328 e-Portfolio 613, 615 Erinnerungseffekte 102, 109 Erklären 355, 357–361, 371, 378 Erlebniserzählung 375, 417, 420, 422, 425, 432, 433 Erstsprache 164, 166, 169, 176 Erwartungsbruch 375 Erwartungshorizont 479 Erwerb 22, 24–26, 28, 30–35, 37, 39–41 – simultaner 331, 332 – sukzessiver 331 Erwerbsbedingungen 527, 533 Erwerbsbiographie 340, 346, 347 Erwerbsfaktoren 21, 24, 28–32, 36, 42 Erwerbsgeschwindigkeit 331, 332, 339, 340, 347 Erwerbsmodell 71–73, 75 Erwerbsreihenfolge 552, 564 Erwerbssequenz 8, 25, 34, 35, 39, 40, 103, 104, 110 Erwerbsstufe 548, 552, 553, 558, 559, 563, 564 Erwerbsverlauf 21, 24, 33, 35, 41

Erzählen 355, 358, 360, 361, 366, 368, 370, 372, 374–376, 378, 379 Erzählfähigkeit 415, 419, 421–423, 426–429, 431 Erzählfertigkeit 151 Erzählkompetenz 151, 414, 417, 419, 424, 425, 428, 430, 431, 433 Erzählstruktur 479, 487 Erzählung – Höhepunkterzählung 417–419, 435 Erziehungswissenschaft 500 ESF-BAMF-Kurse (Berufsbezogene Deutschförderung) 197 ESP (Europäisches Sprachenportfolio) 614–616 Evaluation 5, 13, 57, 121, 212, 264, 307, 398, 417, 476, 477, 482, 612 Experiment 304, 313–315 Experten 230–232 Experteneinschätzung 258 Explizitform 294 Eye Tracking 314 Fachlernen 497, 498 Fachschule 202 Fachsprache 197, 502 Faktoren, metakognitive 442, 445 Faktorenanalyse 504, 510, 511, 513, 602 Fantasiewort 261 Fehler 232, 529–532 Fehlerreduktionsstrategie 232 Feldbeobachtung 569, 570 Feldermodell 37, 328, 333 Fertigkeit 396, 400, 401, 404 Fiehler’scher Dreischritt 424 Finitheit 36, 37, 39–41, 332, 335, 339, 346 Finitum 548, 552, 559, 562 Flexion 328, 329, 335–337, 339, 343, 344, 346, 347 fluency 443 Förderbedarf 75, 106, 111 Förderdiagnostik 97, 117, 119, 125, 126, 134, 146 Förderentscheidung 143, 150–152, 154, 156, 157 Förderimpuls 308 Förderplan 5, 126, 133, 178, 193 Förderplanung 15, 83, 90, 146, 528, 535 FörMig (Förderung von Kindern und Jugendlichen mit Migrationshintergrund) 64 Formulierungskompetenz 474

Sachregister

Fossilierung 22 Fragebogen 111, 147, 294, 305, 372, 463, 475, 486 Fragestellung 119–121, 123, 126, 133, 134 Fremdbeobachtung 569 Fremdeinschätzung 342 Fremdsprache 4, 6, 117, 118 Frequenz 28 Funktionaler Ansatz 24 Gattung 420, 434 Gedächtnisleistung 388 Geflechterzählung 375, 417–419 Geflüchtete 83, 284 Gegenstandsangemessenheit 571, 575, 576 Generalisierbarkeit 225, 226 Generative Theorie 23, 40 generosity error 477 Genitiv 104, 183, 506, 507, 565, 587 Genus 329, 330, 334, 335, 337–339, 343–346 Genuserwerb 35 Genuszuweisung 330, 338 GER (Gemeinsamer europäischer Referenzrahmen für Sprachen) 5, 117, 205–207, 215, 216 Gesamtdarbietung 593 Gespräch 414, 417, 418, 431 Gesprächsforschung 415, 419, 424 Gesprächskompetenz 414–417, 424, 427, 430, 431, 435 Globalskala 65, 229 Globalverständnis 397, 398 Goethe-Institut 215, 216 Good-strategy-User-Modell 445 Grammatik 172, 180, 182, 185, 188 Graphemkombination 590, 591 Grundlagenforschung 497, 504, 515 Gruppentest 133 Guiraud-Index 311, 312 Gutachten 117–121, 123–126 Gütekriterien 99, 102, 112, 119, 123, 124 Halo-Effekt 232 Handreichung 216 Hauptsatz 73, 79, 335, 339, 340, 343, 344 Herkunftssprache 166, 168, 169, 175, 180, 283, 286 Heterogenität 47 High-Stakes-Test 221–225, 228, 230, 232, 234, 237

627

Hochschulzugangstest 223, 236 Höraufgabe 389, 395, 396, 407, 408 Hörbuch 391–393 Hören 387, 388, 390, 392, 394, 399, 401, 404, 405, 407, 408 – detailliertes 390 – extensives 390 – globales 390 – intensives 390 – selegierendes 390 – selektives 390, 397 – synthetisches 390 – totales 390 Hörsehtext 391, 392 Hörstil 387, 389, 390, 395, 397–399, 407, 408 Hörstörung 83 Hörtest 266, 267 Hörtext 387, 390–399, 407, 408 Hörverstehen 133, 289, 387 Hörverstehenskompetenz 387–389, 396, 398, 401, 402, 408 Hypothese 26, 122 Identitätshypothese 26 IGLU (Internationale Grundschul-LeseUntersuchung) 441, 447, 450 Immersionsalter 248 Implikatur 354–356 Impuls 150, 151, 154 Impulsmaterial 150 Informationsstrukturierung 356 informell 5, 6, 16, 127, 134 Inhibitory Control Model 300 Inklusion 125 Input 24, 25, 28, 30, 33, 36, 40 Insertion 480, 548, 552, 562 Instruktion 210, 588, 594 Instruktionsalter 248 Integration 235, 548, 552, 562 Integrationskurs 234–236 Intelligenz 475, 510, 529 Intelligenztest 122, 222, 310, 536 Interaktion 353, 355–357, 361–365, 367–369, 372, 378 Interaktionskompetenz 357–359 interdisziplinär 238 Interferenz 7, 32, 247, 249, 251, 264, 286, 314 Interkodereffekt 226 Interkoder-Reliabilität 232 Interlanguage 22

628

Sachregister

Interpretation 599, 602, 604 Interpretationsfehler 107 Interrater-Reliabilität 259, 510, 555, 573, 575 Interventionsstudie 257 Interview 294 Intraklassenkorrelation 513 Inversion 79, 548, 552, 553, 559–562 IPA (Internationales Phonetisches Alphabet) 267 IQB-Ländervergleich (Institut zur Qualitätsentwicklung im Bildungswesen) 499, 511 IQ-Test (Intelligenzquotient) 82 IRT (Item Response Theory) 56, 233 Item 99–101 Itemabhängigkeit 598 Itemanalyse 592 Itemformulierung 99, 100 Itemschwierigkeit 308 Ja-Nein-Aufgabe 396 judgement task 363 Jugendlicher 163, 164, 192 Kalibrierung 312 Kann-Beschreibung 252 Kasus 329, 330, 332, 334, 335, 337, 339, 341, 343, 344, 346 Kasuserwerb 35 Kerncurriculum 57 Kind 163, 164, 166, 168, 169, 174, 176–179, 181, 183, 184, 192 Klassenarbeit 222, 224 Klumpung 312 Kodieranweisung 232 Kodierleitfaden 510 Kodierung 586, 595, 596 Kognitionspsychologie 442 Kohärenz 176 Kohärenzbildung – globale 444, 445 – lokale 445 Kohäsion 179, 188 Kollokation 299, 312, 313 Kommunikationsaufgabe 305 Kommunikationskompetenz 414, 427 Kompetenz 163–166, 168, 169, 181, 186, 187, 191, 287, 356, 373, 378, 407, 414–419, 424–428, 430–433 – audiovisuelle 389

– auditive 389 – bildungssprachliche 163, 166, 169 – kommunikative 414, 415, 427, 435 – narrative 372, 374, 376 – pragmatische 353, 356, 359, 360, 369, 370, 372, 379 Kompetenzbegriff 48 Kompetenzen, erstsprachliche 497 Kompetenzerwerb 47 Kompetenzmodell 47, 48, 52, 54, 65, 66 Kompetenzmodellierung 47, 60 Kompetenzniveau 47, 53–57 Kompetenzstrukturmodell 578, 580 Komposition 329, 335 Konfidenzintervall 532 Konfundierung 604 Konjunktiv 183 Konsistenz, interne 530 Konsonantencluster 286 Konstrukt 225, 227, 229, 230 Konstruktionsleistung 442 Kontaktdauer 10, 12, 13, 130 Kontaktqualität 128, 130 Kontaktquantität 128, 130 Kontaktzeit 33 Kontext 353, 355–358, 361, 362, 365, 367– 369, 372–374 Kontextualisierung 353, 356, 359, 361, 420 Kontextualisierungshinweis 356 Kontinuum 247, 501, 514 Kontrast-/Ähnlichkeitsfehler 232 Kontrollstrategie 474 Konventionen, gesprochensprachliche/ schriftsprachliche 151 Konversion 329 konzeptionell mündlich/schriftlich 413 Kooperation 157 Korpus 511, 512 Korpusanalyse 259 Korrektheit 256, 259, 261 Korrelation 601–603 Kreuzvalidierung 601 Kriteriumssampling 230 Kriteriumsvalidität 510, 530 kritische Phase 331 Kulturspezifik 420, 533 Laborbeobachtung 569 Längsschnittstudie 552, 553, 563 late bloomer 130

Sachregister

Lautes Denken 231 Lautes Lesen 257 Lautschema 286 Lehrerurteil 602 Lemma 299, 300, 319 length of exposure 30 Leniency-Severity-Fehler 574 Lernen – fachliches 498 – sprachliches 502 Lernersprache 8, 21, 22, 24, 26, 29–33, 36, 41, 42, 481 Lernersprachenanalyse 7, 9 Lernertext 552, 560 Lernertyp 347 Lernfeld 213, 217 Lernprodukte 65 Lernstandserhebung 47, 53, 54, 56 Lernstandsmessung 51, 66 Lernstrategie 268, 269 Lesediagnostik 441, 463 Leseflüssigkeit 443, 446–448 Lesegeschwindigkeit 443, 445, 446, 453, 460, 463, 466 Lesekompetenz 55, 204–211, 216, 441, 442, 445, 446, 450, 452, 458, 459, 462–465 Lesemotivation 442, 463 Lesen 166, 169, 179, 182, 185, 188, 191, 200, 202, 204, 207, 209, 210, 212, 215, 216, 441, 443–450, 452–454, 464, 465 Leseprobe 179 Leserverstehen – detailliertes 206 – globales 206 Lesestrategie 445–447, 456, 459, 462, 463 Lexik 181 Lexikon 299, 300, 309, 313, 319 – mentales 300, 305, 313 LingoFox 601 Linguistik 500 Literacy 204, 207, 414 longitudinal 106, 110, 111 Lösungswahrscheinlichkeit 233 Low-Stakes-Test 221–224 Lückentext 211, 216, 396, 404 Lückenwort 587–590, 592, 596, 598–601, 603, 604 Mahara 613 Makrokontext 603

629

Makrostruktur 424, 428 Manual 107, 112 Map Task 257 Markierung 416, 417, 420, 421, 428, 429, 431, 432, 434 Markierungskompetenz 359 medial mündlich/schriftlich 413 Mehrfachbeobachtung 149 Mehrfachkodierung 232 Mehrsprachigkeit 148, 149, 153, 155, 169 Meilensteine 333, 341, 342, 571, 581 mentale Repräsentation 442 Merkfähigkeit, auditive 172 Merkmal, distinktives 246, 247, 251, 258, 263, 264 Merkmalsausprägung 532 Messen 529 Messfehler 529, 530, 532 Messgenauigkeit 588, 602 Messkonsistenz 601 Messwiederholungsreliabilität 530 Messwiederholungsstudie 512 Metakognition 445 Migrationshintergrund 12, 128 Mikrokontext 601 Milde-Strenge-Fehler 232 Missverständnis 251 Mittel, arithmetisches 531 Mittelwert 11, 373, 485, 531, 532 Moderatorvariable 227 Monitoring 249, 445 Morphemstudien 26 Morphologie 327–329, 334, 338, 346 Motivation 442, 463 Motivationale Faktoren 78, 442, 473 MRT (Magnetresonanztomographie) 314 Multiple-Choice-Aufgaben 216 Mündlichkeit 413, 501 Nacherzählung 366, 417, 422, 424, 430 Nachvollziehbarkeit, intersubjektive 156 Narration 368 near native proficiency 33 Nebengütekriterien 102, 105, 529–531 Nebensatz 73, 79, 327, 328, 332, 333, 339, 343, 344, 346–348, 548, 552, 559, 560, 562 Nicht-EU-Bürger 235 nicht-standardisiert 5, 99 Niveaumodell 229

630

Sachregister

Nominalisierung 502, 503, 507, 508, 511 Nominalphrase 181, 188, 328, 329, 332, 333, 337 Nominativ 329, 337 nonverbal 354, 358 Norm – idiografische 104 – individuelle 5, 102 – kriteriale 11, 103, 104 – monolinguale 97, 140, 429 – sachliche 103, 104 – soziale 5, 103 Normierung 6, 10, 12, 14, 15, 98, 99, 102, 103, 105, 110, 128, 131, 530–532, 537 Normstichprobe 5, 10, 11 Note 224, 602 noticing 363 Numerus 334, 335, 339, 343, 344, 346 Numerusflexion 338 Nützlichkeit 102, 104

Oberflächenmerkmal 501, 504, 506, 509, 514, 533 Objektivität 6, 15, 26, 102, 107, 149, 155, 167, 210, 222, 232, 343, 347, 429, 431, 434, 510, 526, 529, 537, 575, 579, 589, 597 observer drift 574 offline 314 Offline-Verfahren 353, 362, 363, 379 Ohrenphonetik 259 Ökonomie 102, 104 online 314 Online-Test 190 Online-Verfahren 353, 362, 363, 379 Operationalisierung 586, 588 Operator 203 Orientierungskurs 236 Orthographie 204, 216

Paper-Pencil-Portfolio 613 Papier-Bleistift-Test 593 paraverbal 354 Partikeln 425 Partizip 327 Partizipbildung 330, 346 Passiv 183, 335, 336, 343, 344, 346, 500, 502 Passiversatz 500 Pearson-Korrelation 601 Performanz 3, 8

Permutation 603 Perspektivenübernahme 475 Perzeption 245, 250, 251, 262 Phantasieerzählung 417, 422 Phase, sensible 331 Phonembewusstheit 260 Phoneminventar 86 Phonetik 245, 247, 249, 257, 259, 262, 271 Phonologie 245, 249, 258, 259 Pilotierung 230 Placementtest 398, 552 Planung 445, 446 Planungskompentenz 474 Plural 180 Pluralbildung 327, 328, 330, 337 Pluralmarkierung 183 Polygraph 591 Population 532, 534, 535 Portfolio 148, 342, 611–619 Praat 258, 259 Pragmatik 9, 72, 201, 249, 353, 354 – funktionale 354 Praktikabilität 577, 579 Praktiken, diskursive 358 Praktikum 483 Präsentation 413, 422 Präsupposition 356 Prävalenzrate 74, 81, 84 Praxis, reflexive 611, 612, 615–619 Primacy-Recency-Effekt 574 Primärbeeinträchtigung 73, 83 Primarbereich 104 Primärreflexion 611 Processability Theory 27 Produktebene 58 Produktorientierung 47, 54 Produktportfolio 613 Professionalisierung 221 Proficiencytest 398 Profil 547, 548, 550–556, 558–564 Profilanalyse 8, 9, 13, 99, 108–110, 131, 133, 147, 150, 151, 155, 157, 216 Profilbogen 547, 552 Prognose 11, 121 Progression 25, 396–398, 401, 408 Protokollierung 378 Prozentrang 168, 180 Prozentrangwert 289 Prozess – diagnostischer 9, 117–124, 126–128, 131, 133

Sachregister

– hierarchiehoher 442, 443 – hierarchieniedriger 442, 443 Prozessdiagnostik 118, 148 Prozessebene 58–60, 66 Prozessorientierung 47, 54 Prozess-Portfolio 613, 617 Pseudowort 266 Pseudowortdiktat 293, 294 Psychologie 117–121, 124, 126, 128, 134 Psychometrik 529, 536 Pubertät 331

Quaestio-Modell 419 Qualifikationenfächer 63 qualitativ 167, 171, 173, 176, 180, 182, 183, 185, 188, 192 quantitativ 167, 173, 180, 192 quasi-experimentelles Setting 368

Rahmenlehrplan 57, 59 Raschmodell 233 Raschskalierung 56 Rater 472 Rating 256, 258, 259 rational cloze test 587 rational C-test 592 Rechtschreibkompetenz 278, 280–282, 287, 295 Rechtschreibregel 278, 279 Rechtschreibstrategie 278 Rechtschreibung 277, 278, 283 recipient design 355 reduced redundancy testing 587 Reduktion 246, 257, 263, 265 Redundanz 586–588 – reduzierte 211 Referenzgruppe 103, 532 Reflexion 612, 613, 615–617, 619 Reflexivpronomen 181 Regelunterricht 164, 166 Regelwissen 330 Register 497, 500–502, 504, 508, 514 Regulation 445, 446 Reihungsfehler 232 Rekonstruktion 586–589, 596, 598 Relation, semantische 444, 445 Relevanz 225, 226, 233 Reliabilität 12, 15, 62, 102, 146, 152, 167, 210, 222, 232, 259, 290, 307, 433, 472, 476,

631

510, 513, 526, 529–532, 537, 554, 573, 575, 588, 593–595, 597, 599, 601 Reliabilitätskoeffizient 530 Repräsentativität 225, 226 Ressourcen-Etikettierungs-Dilemma 16, 125 RF-Wert (Richtig-Falsch-Wert) 598 Rhythmus 250 Rohwert 341, 531, 532 Rollenspiel 367, 368, 370, 372, 373 Salienz 28 Satzebene 444, 453, 455, 461 Satzgefüge 558, 559 Satzklammer 36, 37, 40, 328, 333, 334, 339, 341, 346 Satzmuster 548, 559, 561, 562 Satzverbindung 480, 482, 484 Satzverständnis 537 Schätzung 147, 148 Schätzverfahren 9, 13, 99, 108–110, 571 Schemakenntnis 388 Schreibanlass 479, 481–483, 486 Schreibdidaktik 473, 478 Schreiben 166, 169, 179, 182, 185, 188, 191, 202, 203, 212, 214, 215, 217 Schreibflüssigkeit 475 Schreibforschung 473 Schreibgespräch 487 Schreibimpuls 179, 186, 187, 479, 484 Schreibmotivation 474, 475 Schreibprobe, freie 315–317 Schreibprodukt 471, 479 Schreibprozessmodell 489 Schriftlichkeit 413, 500, 501 – konzeptionelle 500, 501, 508 Schriftspracherwerb 8, 106, 284, 290, 413, 490 Schuldeutsch 475, 478, 485 Schulentwicklung 224 schulisch 417 Schullaufbahnempfehlung 224 Schulleistungsstudien 55 Schulnote 224 Schulpraxis 497 Schulsprache 502, 512 Schwierigkeit 586, 588–590, 592–601 scrambling 603 Screening 9, 11, 13, 99, 105, 106, 110, 111, 118, 132, 133 S-C-Test 588, 593, 594

632

Sachregister

Segmentalia 246, 247 Sekundarbereich 108 Sekundärreflexion 611, 612, 618 Selbsteinschätzung 304, 310, 342 Selbstevaluation 267, 269 Selbstkonzept 442 Selbstkorrektur 257 Selbstregulation 475 Selbstwirksamkeitserwartung 442 Selektionsdiagnostik 97–99, 106, 112, 126, 145, 146 Selektionsfunktion 277, 282, 283 Selektionskriterium 277 Seltenheit 304, 312 Semantik 180, 181 Separation 548, 551, 552, 559, 560, 562 Sequenzialität 355, 357, 358, 364, 365, 367, 369 SES (Spracherwerbsstörung) 12, 13, 71–77, 82, 83, 90, 91 SEV (Sprachentwicklungsverzögerung) 72 Single-Choice-Test 236 Skalenkonstruktion 513 Sonderpädagogik 6, 119, 124 Soziolinguistik 500 soziolinguistisch 388, 395 sozioökonomischer Status 164, 166 Speed-Komponente 594 Spontansprache 319 Sprachbewusstheit 279 Sprachbildung, durchgängige 497, 504 Sprachbiographie 132, 133 Sprachdominanz 76, 82, 84, 85 Sprache der Distanz 508 Sprache der Nähe 500 Sprachenbiografie 148, 155–157 Sprachenpass 148, 614, 615 Sprachenportfolio 148 Spracherwerb 4, 8, 10, 21–31, 33, 39, 66, 72– 74, 79–81, 129–131, 142–144, 157, 164, 246, 249, 303, 327–334 Spracherwerbstypen 331, 340, 347 Spracherwerbsverzögerung 14, 71, 76, 90 Sprachförderbedarf 106, 164, 167 Sprachhandlung 199, 201, 203, 204, 217 Sprachkompetenz, allgemeine 585, 596, 597, 602, 604 Sprachkurs 235, 236 Sprachlernbiografie 614, 615 Sprachlernen 503, 505

Sprachmischung 77 Sprachniveau 389, 392, 394 Sprachprobe 308, 315 Sprachstand 97, 98, 106–109, 111 Sprachstandsindikator 478 Sprachtherapie 12, 71, 74 Sprechakt 354, 356, 363–365, 367 Sprechen 212, 215, 217 Sprechflüssigkeit 253 Sprechgeschwindigkeit 249, 250, 257, 258, 267 Sprechwirkung 249, 250, 263 Sprossvokal 286, 292 SSES (Spezifische Sprachentwicklungsstörung) 141, 143 Staatsbürgerschaft 234, 235 Stagnation 301 Stammschreibung 286 Standardabweichung 84 Standardaussprache 247, 261 standardisiert 5, 6, 9, 13, 121 Standardisierung 102, 105, 110 Standardvarietät 247 Statusdiagnostik 151 Steuerungsstrategie 474 Stichprobe 5, 10, 11, 531 Stiftung Mercator 485 Stimulus 150–152, 314 Stimulusmaterial 150 Stolpersteine 327 Störungen, phonetisch-phonologische 85 Story-Grammar-Ansatz 417, 418 Strategie 445–447 – kognitive 388 – metakognitive 388 Strategieprofil 282, 289 Streuung 531 Stroop Task 314 Strukturelement 417 Strukturmodell 229 Subjekt-Verb-Kongruenz 78, 87, 328, 329, 332, 334–336, 339–341, 343, 346 Superitem, polytomes 599 Suprasegmentalia 246, 247, 249, 262 Syntax 176, 181, 184, 186–188, 327–329, 338, 341, 343, 344, 346, 348 Tagebuch 302, 611 task 257, 314, 363, 364 TCV (Total Conceptual Vocabulary) 318, 319

Sachregister

teacher made test 222 Teilfertigkeit 199, 210–212 Teilkompetenzdiagnostik 387, 389, 392–395, 399, 407, 408 Teilkompetenzen 51, 52, 65, 165, 170, 199, 201, 206, 217, 222, 278, 408, 474–476, 484, 488, 489, 514, 530, 536, 614 Teilprozess 442–445, 459, 463 telc Gmbh 214 Tempus 334, 343 Test 4, 6, 9, 11, 13, 14, 16, 99, 101, 102, 105, 122, 123, 125, 145, 147, 152, 153, 155, 171– 175, 221–226, 230–237, 266, 307, 308, 317, 318, 398 – computerbasierter 592, 593 – Individualtest 171, 173, 175 – internetbasierter 216 – lernzielorientierter 398 – psychometrischer 525, 526, 528, 532, 533 Testentwicklung 222, 225, 230, 235 Testfairness 105, 228, 237 Testgütekriterien 62, 152, 217, 222, 482, 582 Testhalbierungsreliabilität 530 Testinstruktion 594 Testkennwert 595 Testkonstrukt 225, 226, 230 Testlet 599 Testmanual 107, 112 Testmodell 230 Testskalenwert 230 Testtheorie – klassische 56 – probabilistische 56 Testwert 341 Testwiederholung 155 Text 390–399, 407, 408, 442, 444, 445, 449– 451, 457–462, 489, 491 – diskontinuierlicher 199, 205, 208 – linearer 458, 459 – nicht-linearer 199, 210, 214, 458, 459 Textkompetenz 186, 187 Text-Leser-Interaktion 442 Textmusterwissen 475 Textqualität 472, 483, 486, 487 Textsorte 389–391, 393–395 Textstrukturmuster 394 Textumfang 309, 311, 312 Textverstehen 206, 388, 395, 397, 422, 441– 448, 454, 455, 458, 459, 462 TF-Test (Teilfertigkeitstest) 210, 211

633

Tilgungsregel 590 Token 311, 312, 512 top down 388 Topologisches Modell 37, 328, 329, 333 Transfer 24, 32 – negativer 32 – positiver 32 transfer of training 447 Transkription 174, 177, 178, 188 Transparenz 156, 478 Trauma 319 Trennschärfe 510, 589, 593, 595, 597–599 Triangulation 231 TTR (Type-Token-Ratio) 311 TV (Total Vocabulary) 318, 319 T-Wert 84 Type 311, 312, 317

Überarbeitungskompetenz 474 Übergeneralisierung 32, 34, 330, 335, 336, 338, 345 Überschätzung 598 Übersetzungsäquivalent 317 Überwachung 445, 446 U-förmige Lernentwicklung 484 ultimate attainment 33 Umgangssprache 393 Uni-Café 589 Unterschätzung 597 Unterschiede, individuelle 248, 264 Urteilsfehler 107 USES (Umschriebene Sprachentwicklungsstörung) 72, 84

Validierungsstudie 512 Validität 12–15, 62, 102, 106, 109, 146, 152– 155, 167, 210, 222, 225, 228, 237, 361, 424, 433, 462, 476, 510, 513, 526, 530– 532, 579, 581, 588, 593, 602–604 – diskriminante 227 – inhaltliche 513 – konvergente 227 – kriteriale 513 – prognostische 12, 530 Validitätsmerkmal 225, 226 Variabilität 312, 531 Varianz, konstruktirrelevante 591, 594 Variation 301, 312 Verbalflexion 334

634

Sachregister

Verbstellung 26, 34, 36–41, 328, 343, 344, 346, 347 Verbzweitstellung 73, 78, 79, 328, 329, 339 Verfahren, bildgebendes 304, 314, 319 Verfahrenstypen 140, 141, 147 Verständlichkeit 251, 252, 256, 258, 259, 261, 263 Verstehensabsicht 387–389 Verstehensprozess 445, 447, 450, 460 Verstehensstrategie 388 Vertextung 416, 420, 432, 433 Vertextungskompetenz 359, 373, 378 Vertrauensintervall 532 visible speech 267 Visualisierung 267 voice onset time 257 VOLI (Vocational Literacy) 204–207 Vorbereitungsklasse 164, 166, 190 Vorhersage der Schwierigkeit 586, 595, 600, 601 Vorläuferfähigkeiten 434 Vorläuferstruktur 333, 334 Vortrag 413 Vorwissen 442, 444, 445, 461–463, 477 Wahrnehmungsfehler 107 Weltwissen 442 Werkzeugkoffer 188 WE-Wert (Worterkennungs-Wert) 597, 598 W-Fragen 79, 88, 328, 341 Wiedergabeeffekte 574 Wiederholungsaufgabe 319 Willkommensklasse 164 Wimmelbild 178 Wissen – deklaratives 279 – prozedurales 279 Wissen-um-die-Folgen-Fehler 232 Wortbildung 328, 329, 335

Wortebene 444, 453 Wortschatz 171–174, 176, 178–180, 182, 185, 188, 191, 301–310, 314, 315, 317–319, 321, 404, 572 – produktiver/rezeptiver 301, 307, 310 Wortschatz, erweiterter 572 Wortschatzbreite 303 Wortschatzdiversität 304 Wortschatzumfang 301, 303, 304, 321 X-Test 591, 592 Zeitlimitierung 593, 604 Zentraltendenz 232 Zertifizierungstest 223 Zeugnisnote 224 Zielnorm 478 Zielsetzung 140, 145, 147 Zipf’sches Gesetz 304 ZISA (Zweitspracherwerb italienischer und spanischer Arbeiter) 479, 483, 548, 549, 552, 553 Zugriffsmechanismus 300 Zumutbarkeit 102 Zuordnungsaufgabe 214, 396, 405 Zuweisungsdiagnostik 4–6, 9, 15–17, 145, 146 Zweck – evaluativer 145 – kommunikativer 354, 358 – pädagogischer 146 – politischer 146 Zweierregel, klassische 588 Zweitsprache 3, 4, 6, 10, 12, 13, 117, 118, 127– 132 Zweitspracherwerb 25–30, 34, 39, 42, 71, 76, 81, 130, 141–144, 157, 248, 331–340, 408, 473, 479, 548, 560–562 z-Wert 84